Facilidad de descarga masiva

Q: ¿Cómo puedo abrir los archivos gz comprimidos?

Todos los archivos 'gz' pueden descomprimirse con WinZip , 7zip o con programas estadísticos como R .

El servicio de descarga masiva permite acceder a conjuntos de datos individuales o a todas las bases de datos de ILOSTAT. Las instrucciones de uso se encuentran debajo de la lista de directorios.

Directorios

Seleccione un directorio para acceder a los archivos. Los archivos de datos estánen formato csv (gz) comprimido y los archivos de diccionario están en formato csv. Consulte las directrices que figuran a continuación.

INDICADOR

Cuadros presentados por indicador y frecuencia

REF_AREA

Tablas presentadas por ref_area (por ejemplo, países y regiones) y frecuencia

DIC

Diccionarios de los códigos utilizados (es decir, listas de códigos)

Rilostat - Paquete R de ILOSTAT

El servicio de descarga masiva de ILOSTAT es la base del paquete R de ILOSTAT ("Rilostat'), que se diseñó para ofrecer a los usuarios de datos la posibilidad de acceder a las bases de datos de ILOSTAT, buscar datos, reorganizar la información según sea necesario, crear visualizaciones de datos y descargar datos en el formato deseado, todo ello de forma programática y reproducible, con la posibilidad de volver a ejecutar rápidamente las consultas según sea necesario. Para más información, visite la página web de R-ilostat.

Descripción general sobre cómo utilizar la función de descarga masiva

El servicio de descarga masiva contiene datos, metadatos y documentación. Incluye los conjuntos de datos en formato csv comprimido, "diccionarios" para los códigos utilizados en los archivos csv y una versión en PDF de estas instrucciones. Los directorios que contienen los conjuntos de datos por indicador (por ejemplo, la tasa la desocupación por sexo y edad) o por área_de_referencia (abreviatura de área de referencia, que es la unidad geográfica pertinente, como un país) presentan, además de todas las tablas de datos disponibles, un índice en el que se detalla la lista de tablas disponibles por indicador o área de referencia y el periodo de tiempo cubierto por los datos correspondientes. El siguiente cuadro resume el contenido y ofrece una breve descripción de cada elemento.

Preguntas frecuentes

¿Cómo puedo abrir los archivos gz comprimidos?

Todos los archivos 'gz' pueden descomprimirse con WinZip, 7zip o con programas estadísticos como R.

¿Cómo puedo leer los archivos csv?

Muchos programas pueden leer archivos csv, incluidos los paquetes estadísticos estándar como R y STATA. Las aplicaciones de hojas de cálculo, como Microsoft Excel, también pueden abrir archivos csv. No obstante, si se intenta abrir archivos de gran tamaño con Excel, la aplicación se bloqueará. Tenga en cuenta que puede ser necesario indicar la coma como separador de campos para leer correctamente el archivo.

¿Dónde puedo encontrar información más allá de las etiquetas?

Las listas de códigos sólo proporcionan la etiqueta correspondiente a cada código utilizado, sin incluir ninguna otra información sobre conceptos, definiciones o clasificaciones. Estos están disponibles en la página de conceptos y definiciones.

¿Cómo pueden sus datos referirse a fechas futuras?

Esto ocurrirá con los indicadores y las zonas de referencia para los que se dispone de proyecciones.

Directorios de datos [indicador] y [ref_area]

Existen dos directorios de datos diferentes, basados en dos formas distintas de presentar las tablas correspondientes: organizándolas por "indicador" (y frecuencia) o por "ref_area" (y frecuencia). El indicador se refiere al título de cada tabla específica, incluyendo la variable representada y los desgloses eventuales utilizados para ella (por ejemplo, 'población activa por sexo y edad', 'la ocupación por sexo y actividad económica' y 'la desocupación tasa por sexo, edad y zonas rurales / urbanas' son indicadores de ILOSTAT). El ref_area (de área de referencia) se refiere a las áreas geográficas para las que se dispone de datos. Dado que ILOSTAT incluye tanto datos a nivel de país como estimaciones regionales y mundiales, el área de referencia puede referirse a países, a regiones (regiones geográficas como África, América o los Estados Árabes, grupos de renta como los países de renta baja, u otros grupos como los BRICS o el G20) o al mundo en su conjunto. Sin embargo, es importante señalar que las estimaciones mundiales y regionales sólo están disponibles para algunos indicadores, por lo que la mayoría de los conjuntos de datos sólo incluirían datos a nivel de país. La frecuencia se refiere a si los distintos puntos de datos son anuales, trimestrales o mensuales.

Los directorios de datos, ya sea por indicador o por ref_area, se presentan en formato csv como archivos zip comprimidos ('gz'). Todos los archivos 'gz' pueden descomprimirse con WinZip o 7zip. Para más información sobre los archivos csv, véase la sección siguiente. Tras seleccionar uno de los dos enfoques propuestos (tablas por indicador o por ref_area) haciendo clic en el nombre del directorio, puede acceder y descargar los datos deseados haciendo clic en el nombre del código de la tabla o tablas que busca.

El directorio [dic] proporciona diccionarios de todas las listas de códigos necesarias para identificar el indicador o el área de referencia que está buscando. Como referencia, tenga en cuenta que todos los códigos siguen la misma estructura. El código del indicador incluye, en este orden

código del tema
código para identificar el indicador dentro de ese tema
averías o "NOC" para "sin clasificación" si no hay averías
unidad de medida
- NB" para valores absolutos o números
- RT" para porcentajes o tasas
frecuencia
- A" para los datos anuales
- Q" para datos trimestrales
- M" para datos mensuales

Del mismo modo, los nombres de código de los archivos por área de referencia se refieren a:

país (código de país ISO Alpha-3) o la región (códigos que empiezan por X) y
frecuencia

Las dos tablas que se presentan a continuación muestran el contenido de los directorios [indicator] y [ref_area], que contienen aproximadamente 500 y 700 conjuntos de datos respectivamente.

Contenido de [indicador]

Archivos	Contenido
tabla_de_contenidos_es	Tabla de contenidos en inglés
tabla_de_contenidos_fr	Índice en francés
tabla_de_contenidos_sp	Índice en español
EAP_TEAP_SEX_AGE_NB_A.csv	Conjunto de datos que contiene todos los datos anuales disponibles sobre la población activa por sexo y edad
EMP_DWAP_NOC_RT_A.csv	Conjunto de datos que contiene todos los datos anuales disponibles sobre la relación la ocupación-población
...	...

Contenido de [ref_area]

Archivos	Contenido
tabla_de_contenidos_es	Tabla de contenidos en inglés
tabla_de_contenidos_fr	Índice en francés
tabla_de_contenidos_sp	Índice en español
ABW_A.csv	Conjunto de datos que contiene todos los datos anuales disponibles para Aruba
ABW_M.csv	Conjunto de datos que contiene todos los datos mensuales disponibles para Aruba
...	...

Formato de los archivos de datos CSV

Los archivos en formato «csv» son archivos que almacenan información tabular (ya sean números o texto) en forma de texto sin formato, como valores separados por comas. Es decir, las columnas (o campos) de la tabla original están separadas por comas, lo que permite que cada fila o línea del archivo corresponda a un registro de datos (el registro de datos puede consistir, por lo tanto, en uno o más campos, separados por comas). Estos archivos se pueden abrir de forma fácil y sencilla en Excel. En los archivos «csv» de ILOSTAT, la primera fila contiene los encabezados (de los campos o columnas). Las filas siguientes presentan los registros de datos, que consisten en la clave del registro (los «nombres» de las dimensiones utilizadas para identificar cada registro, incluyendo el área de referencia, la fuente de los datos, las clasificaciones utilizadas, etc., refiriéndose a todos los campos desde «ref_area» hasta «time»), el valor de observación («obs_value») y cualquier otro metadato disponible (como la cobertura geográfica de la fuente o las definiciones específicas utilizadas para algunos conceptos, en referencia a todos los campos desde «obs_status» hasta «note_source»). Todas las etiquetas correspondientes a los nombres de código utilizados como encabezados de campo en los archivos csv disponibles para su descarga se presentan en el diccionario de listas de códigos (archivos [dic], véase la siguiente sección para más información). El único nombre de código que no se explica en los archivos [dic] es «obs_value», que corresponde a
el valor de observación.

No existe un diccionario (o un archivo "dic") para la dimensión tiempo. La sintaxis de los códigos utilizados para esta dimensión es la siguiente:

Datos anuales: AAAA donde AAAA es el año.
Datos trimestrales: YYYYQ donde YYYY es el año y Q es el trimestre (el número correspondiente al trimestre del 1 al 4).
Datos mensuales: YYYYMM donde YYYY es el año y MM es el mes (el número correspondiente al mes del 01 al 12).

El formato numérico aplicado en los archivos de ILOSTAT utiliza un punto como símbolo decimal ('.').

Directorio de diccionarios [dic]

Las listas de códigos son conjuntos predefinidos de términos de los que toman sus valores los conceptos estadísticos (características estadísticas de los datos) que han sido codificados. Todas las listas de códigos presentadas en ILOSTAT están disponibles en tres idiomas ('en' para el inglés, 'fr' para el francés y 'sp' para el español). Todos los archivos de listas de códigos de ILOSTAT tienen la misma estructura, que consta de tres columnas: el nombre de la variable o código ('var_name'), la etiqueta de la variable o descripción del código ('var_label') y un número utilizado para ordenar la información en el archivo ('var_sort'). La siguiente tabla proporciona un ejemplo de lista de códigos de ILOSTAT.

Extracto de "indicator_en.csv

Indicador	Indicador.label	Indicador.sort
GDP_211P_NOC_NB	Producto por trabajador (PIB internacional constante de 2011 en PPA) - Estimaciones y proyecciones de la OIT, nov. 2016 (unidades)	1
CPI_NCPI_COI_IN	Índice nacional de precios al consumo (IPC) por COICOP (unidades)	2
...	...	...

Las distintas listas de códigos disponibles en inglés, francés y español en el directorio [dic] corresponden a los campos utilizados en los archivos csv descargados descritos en la sección anterior (excepto el campo "obs_value" utilizado para el valor de la observación y que no requiere un diccionario con etiquetas). La siguiente tabla enumera las listas de códigos incluidas en el directorio [dic].

Extracto de 'indicator_en.csv' en [dic]

Nombre de la variable¹	Breve descripción
área_de_referencia	Zona de referencia: puede referirse a países, regiones geográficas, grupos de países (por nivel de renta u otros) o al mundo
fuente	La fuente específica de los datos, incluida información sobre el país o la región para los que se utilizan y el tipo principal de fuente (censo de población, encuesta de la fuerza de trabajo, registros administrativos, etc.), así como el nombre preciso de la fuente.
indicador	El indicador, incluyendo información sobre las variables representadas, las clasificaciones utilizadas (si las hay) y la unidad.
sexo	El desglose por sexo y los elementos de este desglose.
clasif1	Todas las clasificaciones utilizadas como primer desglose en los distintos indicadores disponibles (excluyendo el desglose por sexo, que se trata por separado) y las correspondientes categorías o elementos de clasificación.
clasif2	Todas las clasificaciones utilizadas como segundo desglose en los distintos indicadores disponibles (excluyendo el desglose por sexo, que se trata por separado) y las correspondientes categorías o elementos de clasificación.
obs_status	El estado de los valores o los indicadores de los valores, como las interrupciones de las series o los valores provisionales.
note_classif	Metadatos y/o notas a pie de página relacionados con las clasificaciones utilizadas y las categorías de clasificación específicas.
indicador_de_nota	Metadatos y/o notas a pie de página relacionados con el indicador.
fuente_de_notas	Metadatos y/o notas a pie de página relacionados con la fuente de datos.

Cabe señalar que estas listas de códigos presentan únicamente la etiqueta correspondiente a cada código. Para más información metodológica, incluidas las definiciones de los principales términos estadísticos utilizados en ILOSTAT, las descripciones detalladas de los indicadores y las normas estadísticas, consulte la página de conceptos y definiciones.

Los dos directorios de datos [indicator] y [ref_area] incluyen una tabla de contenidos, disponible en formato csv y en tres idiomas ('en' para el inglés, 'fr' para el francés y 'sp' para el español). Estos índices enumeran todos los archivos de datos disponibles para su descarga en el directorio correspondiente, y proporcionan información resumida sobre cada archivo de datos.

El índice del directorio [indicador] enumera todos los indicadores disponibles, con la etiqueta del indicador y la frecuencia de los datos.

El índice del directorio [ref_area] enumera todas las áreas de referencia disponibles (países, regiones, grupos de países), con la etiqueta del área de referencia y la frecuencia de los datos.

Ambas tablas indican el tamaño de cada archivo de datos, el período de tiempo cubierto por los datos del archivo y la fecha en que el archivo de datos fue actualizado por última vez. Dado que los conjuntos de datos de ILOSTAT incluyen proyecciones de los principales indicadores del mercado laboral, el período de tiempo cubierto por algunos archivos de datos puede llegar hasta 2050. Los códigos o identificadores utilizados en las tablas de contenido para los indicadores y las áreas de referencia en el primer campo o columna ("id") son únicos y permiten la identificación inequívoca del elemento correspondiente. Los dos cuadros que se presentan a continuación muestran extractos de los índices de los directorios [indicador] y [zona_de_referencia].

Extracto de 'table_of_contents_en.csv' en [indicator]

Nombre de la variable²	Breve descripción
id	Nombre del archivo del conjunto de datos
indicador	Código del indicador
indicador.etiqueta	Nombre del indicador, incluyendo información sobre las variables representadas, las clasificaciones utilizadas (si las hay) y la unidad.
frec	Código de frecuencia (A, Q, M)
etiqueta.freq.	Etiqueta de frecuencia
tamaño	Tamaño del archivo .csv.gz
data.start	Primer periodo de tiempo disponible en el conjunto de datos
datos.fin	Último período de tiempo disponible en el conjunto de datos
última.actualización	Última actualización del conjunto de datos (zona horaria de Europa/París)
n.registros	Número de registros en el conjunto de datos
colección	Código de la colección
etiqueta.de.la.colección	Recogida de datos o compilación de la que se derivan los datos, de todas las diversas compilaciones de datos realizadas por la OIT y difundidas en ILOSTAT
tema	Código de la materia
etiqueta.subject	Cómo se muestra el indicador en el sitio web de ilostat

Extracto del archivo "table_of_contents_en.csv" en [ref_area].

Nombre de la variable³	Breve descripción
id	Nombre del archivo del conjunto de datos
área_de_referencia	Código de área de referencia
ref_area.label	Nombre de la zona de referencia, puede referirse a países, regiones geográficas, grupos de países (por nivel de renta u otros) o al mundo
frec	Código de frecuencia (A, Q, M)
etiqueta.freq.	Etiqueta de frecuencia
tamaño	Tamaño del archivo
data.start	Primer periodo de tiempo disponible en el conjunto de datos
datos.fin	Último período de tiempo disponible en el conjunto de datos
última.actualización	Última actualización del conjunto de datos (zona horaria de Europa/París)
n.registros	Número de registros en el conjunto de datos
grupo_geo	Código de grupo geográfico
group_geo.label	Nombre del grupo geográfico de la zona de referencia
ingresos_del_grupo	Código del grupo de ingresos
grupo_ingresos.label	Nombre del grupo de ingresos de la zona de referencia

Actualizaciones

Toda la información almacenada en el servicio se actualiza diariamente a las 12.00 horas (huso horario Europa/París). El procedimiento de actualización sólo afecta a los conjuntos de datos para los que hay datos nuevos o que han sufrido una modificación o un cambio estructural.