La principal fuente de estadísticas laborales

Menú Cerrar

Descarga masiva

El servicio de descarga masiva permite acceder a conjuntos de datos individuales o a todas las bases de datos de ILOSTAT. Las instrucciones de uso se encuentran debajo de la lista de directorios.

Directorios

Seleccione un directorio para acceder a los archivos. Los archivos de datos estánen formato csv (gz) comprimido y los archivos de diccionario están en formato csv. Consulte las directrices que figuran a continuación.

INDICADOR

Cuadros presentados por indicador y frecuencia

REF_AREA

Tablas presentadas por ref_area (por ejemplo, países y regiones) y frecuencia

DIC

Diccionarios de los códigos utilizados (es decir, listas de códigos)

Rilostat - Paquete R de ILOSTAT

El servicio de descarga masiva de ILOSTAT es la base del paquete R de ILOSTAT ("Rilostat'), que se diseñó para ofrecer a los usuarios de datos la posibilidad de acceder a las bases de datos de ILOSTAT, buscar datos, reorganizar la información según sea necesario, crear visualizaciones de datos y descargar datos en el formato deseado, todo ello de forma programática y reproducible, con la posibilidad de volver a ejecutar rápidamente las consultas según sea necesario. Para más información, visite la página web de R-ilostat.

Índice de contenidos

Preguntas frecuentes

Todos los archivos 'gz' pueden descomprimirse con WinZip, 7zip o con programas estadísticos como R.

Muchos programas pueden leer archivos csv, incluidos los paquetes estadísticos estándar como R y STATA. Las aplicaciones de hojas de cálculo, como Microsoft Excel, también pueden abrir archivos csv. No obstante, si se intenta abrir archivos de gran tamaño con Excel, la aplicación se bloqueará. Tenga en cuenta que puede ser necesario indicar la coma como separador de campos para leer correctamente el archivo.

Las listas de códigos sólo proporcionan la etiqueta correspondiente a cada código utilizado, sin incluir ninguna otra información sobre conceptos, definiciones o clasificaciones. Estos están disponibles en la página de conceptos y definiciones

Esto ocurrirá con los indicadores y las zonas de referencia para los que se dispone de proyecciones. 

Utilizar el servicio de descarga masiva

Resumen

El servicio de descarga masiva contiene datos, metadatos y documentación. Incluye los conjuntos de datos en formato csv comprimido, "diccionarios" para los códigos utilizados en los archivos csv y una versión en PDF de estas instrucciones. Los directorios que contienen los conjuntos de datos por indicador (por ejemplo, la tasa la desocupación por sexo y edad) o por área_de_referencia (abreviatura de área de referencia, que es la unidad geográfica pertinente, como un país) presentan, además de todas las tablas de datos disponibles, un índice en el que se detalla la lista de tablas disponibles por indicador o área de referencia y el periodo de tiempo cubierto por los datos correspondientes. El siguiente cuadro resume el contenido y ofrece una breve descripción de cada elemento.

Directorios de datos [indicador] y [ref_area]

Existen dos directorios de datos diferentes, basados en dos formas distintas de presentar las tablas correspondientes: organizándolas por "indicador" (y frecuencia) o por "ref_area" (y frecuencia). El indicador se refiere al título de cada tabla específica, incluyendo la variable representada y los desgloses eventuales utilizados para ella (por ejemplo, 'población activa por sexo y edad', 'la ocupación por sexo y actividad económica' y 'la desocupación tasa por sexo, edad y zonas rurales / urbanas' son indicadores de ILOSTAT). El ref_area (de área de referencia) se refiere a las áreas geográficas para las que se dispone de datos. Dado que ILOSTAT incluye tanto datos a nivel de país como estimaciones regionales y mundiales, el área de referencia puede referirse a países, a regiones (regiones geográficas como África, América o los Estados Árabes, grupos de renta como los países de renta baja, u otros grupos como los BRICS o el G20) o al mundo en su conjunto. Sin embargo, es importante señalar que las estimaciones mundiales y regionales sólo están disponibles para algunos indicadores, por lo que la mayoría de los conjuntos de datos sólo incluirían datos a nivel de país. La frecuencia se refiere a si los distintos puntos de datos son anuales, trimestrales o mensuales.

Los directorios de datos, ya sea por indicador o por ref_area, se presentan en formato csv como archivos zip comprimidos ('gz'). Todos los archivos 'gz' pueden descomprimirse con WinZip o 7zip. Para más información sobre los archivos csv, véase la sección siguiente. Tras seleccionar uno de los dos enfoques propuestos (tablas por indicador o por ref_area) haciendo clic en el nombre del directorio, puede acceder y descargar los datos deseados haciendo clic en el nombre del código de la tabla o tablas que busca.

El directorio [dic] proporciona diccionarios de todas las listas de códigos necesarias para identificar el indicador o el área de referencia que está buscando. Como referencia, tenga en cuenta que todos los códigos siguen la misma estructura. El código del indicador incluye, en este orden

  • código del tema
  • código para identificar el indicador dentro de ese tema
  • averías o "NOC" para "sin clasificación" si no hay averías
  • unidad de medida
    • NB" para valores absolutos o números
    • RT" para porcentajes o tasas
  • frecuencia
    • A" para los datos anuales
    • Q" para datos trimestrales
    • M" para datos mensuales

Del mismo modo, los nombres de código de los archivos por área de referencia se refieren a:

  • país (código de país ISO Alpha-3) o la región (códigos que empiezan por X) y
  • frecuencia

Las dos tablas que se presentan a continuación muestran el contenido de los directorios [indicator] y [ref_area], que contienen aproximadamente 500 y 700 conjuntos de datos respectivamente.

Contenido de [indicador]

Archivos Contenido
tabla_de_contenidos_es Tabla de contenidos en inglés
tabla_de_contenidos_fr Índice en francés
tabla_de_contenidos_sp Índice en español
EAP_TEAP_SEX_AGE_NB_A.csv Conjunto de datos que contiene todos los datos anuales disponibles sobre la población activa por sexo y edad
EMP_DWAP_NOC_RT_A.csv Conjunto de datos que contiene todos los datos anuales disponibles sobre la relación la ocupación-población
... ...

Contenido de [ref_area]

Archivos Contenido
tabla_de_contenidos_es Tabla de contenidos en inglés
tabla_de_contenidos_fr Índice en francés
tabla_de_contenidos_sp Índice en español
ABW_A.csv Conjunto de datos que contiene todos los datos anuales disponibles para Aruba
ABW_M.csv Conjunto de datos que contiene todos los datos mensuales disponibles para Aruba
... ...

Formato de los archivos de datos CSV

Los archivos en formato 'csv' son archivos que almacenan información tabular (ya sean números o texto) en forma de texto plano, como valores separados por comas. Es decir, las columnas (o campos) de la tabla original están separadas por comas, lo que permite que cada fila o línea del archivo corresponda a un registro de datos (el registro de datos puede constar, por tanto, de uno o varios campos, separados por comas). Estos ficheros pueden abrirse fácil y directamente en Excel. En los ficheros "csv" de ILOSTAT, la primera fila contiene las cabeceras (de los campos o columnas). Las filas siguientes presentan los registros de datos, consistentes en la clave del registro (los "nombres" de las dimensiones utilizadas para identificar cada registro, incluida la zona de referencia, la fuente de los datos, las clasificaciones utilizadas, etc., referidos a todos los campos desde "ref_area" hasta "time"), el valor de observación ("obs_value") y cualquier otro metadato disponible (como la cobertura geográfica de la fuente o las definiciones específicas utilizadas para algunos conceptos, referidos a todos los campos desde "obs_status" hasta "note_source"). Todas las etiquetas correspondientes a los nombres de código utilizados como cabeceras de campo en los archivos csv disponibles para descarga se presentan en el diccionario de las listas de códigos (archivos [dic], véase la sección siguiente para más información). El único nombre de código que no se explica en los archivos [dic] es 'obs_value', que corresponde a
el valor de observación.

No existe un diccionario (o un archivo "dic") para la dimensión tiempo. La sintaxis de los códigos utilizados para esta dimensión es la siguiente:

  • Datos anuales: AAAA donde AAAA es el año.
  • Datos trimestrales: YYYYQ donde YYYY es el año y Q es el trimestre (el número correspondiente al trimestre del 1 al 4).
  • Datos mensuales: YYYYMM donde YYYY es el año y MM es el mes (el número correspondiente al mes del 01 al 12).

El formato numérico aplicado en los archivos de ILOSTAT utiliza un punto como símbolo decimal ('.').

Directorio de diccionarios [dic]

Las listas de códigos son conjuntos predefinidos de términos de los que toman sus valores los conceptos estadísticos (características estadísticas de los datos) que han sido codificados. Todas las listas de códigos presentadas en ILOSTAT están disponibles en tres idiomas ('en' para el inglés, 'fr' para el francés y 'sp' para el español). Todos los archivos de listas de códigos de ILOSTAT tienen la misma estructura, que consta de tres columnas: el nombre de la variable o código ('var_name'), la etiqueta de la variable o descripción del código ('var_label') y un número utilizado para ordenar la información en el archivo ('var_sort'). La siguiente tabla proporciona un ejemplo de lista de códigos de ILOSTAT.

Extracto de "indicator_en.csv

Indicador Indicador.label Indicador.sort
GDP_211P_NOC_NB Producto por trabajador (PIB internacional constante de 2011 en PPA) - Estimaciones y proyecciones de la OIT, nov. 2016 (unidades) 1
CPI_NCPI_COI_IN Índice nacional de precios al consumo (IPC) por COICOP (unidades) 2
... ... ...

Las distintas listas de códigos disponibles en inglés, francés y español en el directorio [dic] corresponden a los campos utilizados en los archivos csv descargados descritos en la sección anterior (excepto el campo "obs_value" utilizado para el valor de la observación y que no requiere un diccionario con etiquetas). La siguiente tabla enumera las listas de códigos incluidas en el directorio [dic].

Extracto de 'indicator_en.csv' en [dic]

Nombre de la variable1utilizado también como nombre de lista de códigos Breve descripción
área_de_referencia Zona de referencia: puede referirse a países, regiones geográficas, grupos de países (por nivel de renta u otros) o al mundo
fuente La fuente específica de los datos, incluida información sobre el país o la región para los que se utilizan y el tipo principal de fuente (censo de población, encuesta de la fuerza de trabajo, registros administrativos, etc.), así como el nombre preciso de la fuente.
indicador El indicador, incluyendo información sobre las variables representadas, las clasificaciones utilizadas (si las hay) y la unidad.
sexo El desglose por sexo y los elementos de este desglose.
clasif1 Todas las clasificaciones utilizadas como primer desglose en los distintos indicadores disponibles (excluyendo el desglose por sexo, que se trata por separado) y las correspondientes categorías o elementos de clasificación.
clasif2 Todas las clasificaciones utilizadas como segundo desglose en los distintos indicadores disponibles (excluyendo el desglose por sexo, que se trata por separado) y las correspondientes categorías o elementos de clasificación.
obs_status El estado de los valores o los indicadores de los valores, como las interrupciones de las series o los valores provisionales.
note_classif Metadatos y/o notas a pie de página relacionados con las clasificaciones utilizadas y las categorías de clasificación específicas.
indicador_de_nota Metadatos y/o notas a pie de página relacionados con el indicador.
fuente_de_notas Metadatos y/o notas a pie de página relacionados con la fuente de datos.

Cabe señalar que estas listas de códigos presentan únicamente la etiqueta correspondiente a cada código. Para más información metodológica, incluidas las definiciones de los principales términos estadísticos utilizados en ILOSTAT, las descripciones detalladas de los indicadores y las normas estadísticas, consulte la página de conceptos y definiciones

Los dos directorios de datos [indicator] y [ref_area] incluyen una tabla de contenidos, disponible en formato csv y en tres idiomas ('en' para el inglés, 'fr' para el francés y 'sp' para el español). Estos índices enumeran todos los archivos de datos disponibles para su descarga en el directorio correspondiente, y proporcionan información resumida sobre cada archivo de datos. 

El índice del directorio [indicador] enumera todos los indicadores disponibles, con la etiqueta del indicador y la frecuencia de los datos. 

El índice del directorio [ref_area] enumera todas las áreas de referencia disponibles (países, regiones, grupos de países), con la etiqueta del área de referencia y la frecuencia de los datos. 

Ambas tablas indican el tamaño de cada archivo de datos, el período de tiempo cubierto por los datos del archivo y la fecha en que el archivo de datos fue actualizado por última vez. Dado que los conjuntos de datos de ILOSTAT incluyen proyecciones de los principales indicadores del mercado laboral, el período de tiempo cubierto por algunos archivos de datos puede llegar hasta 2050. Los códigos o identificadores utilizados en las tablas de contenido para los indicadores y las áreas de referencia en el primer campo o columna ("id") son únicos y permiten la identificación inequívoca del elemento correspondiente. Los dos cuadros que se presentan a continuación muestran extractos de los índices de los directorios [indicador] y [zona_de_referencia].

Extracto de 'table_of_contents_en.csv' en [indicator]

Nombre de la variable2utilizado también como nombre de la lista de códigos Breve descripción
id Nombre del archivo del conjunto de datos
indicador Código del indicador
indicador.etiqueta Nombre del indicador, incluyendo información sobre las variables representadas, las clasificaciones utilizadas (si las hay) y la unidad.
frec Código de frecuencia (A, Q, M)
etiqueta.freq. Etiqueta de frecuencia
tamaño Tamaño del archivo .csv.gz
data.start Primer periodo de tiempo disponible en el conjunto de datos
datos.fin Último período de tiempo disponible en el conjunto de datos
última.actualización Última actualización del conjunto de datos (zona horaria de Europa/París)
n.registros Número de registros en el conjunto de datos
colección Código de la colección
etiqueta.de.la.colección Recogida de datos o compilación de la que se derivan los datos, de todas las diversas compilaciones de datos realizadas por la OIT y difundidas en ILOSTAT
tema Código de la materia
etiqueta.subject Cómo se muestra el indicador en el sitio web de ilostat

Extracto del archivo "table_of_contents_en.csv" en [ref_area].

Nombre de la variable3utilizado también como nombre de lista de códigos Breve descripción
id Nombre del archivo del conjunto de datos
área_de_referencia Código de área de referencia
ref_area.label Nombre de la zona de referencia, puede referirse a países, regiones geográficas, grupos de países (por nivel de renta u otros) o al mundo
frec Código de frecuencia (A, Q, M)
etiqueta.freq. Etiqueta de frecuencia
tamaño Tamaño del archivo
data.start Primer periodo de tiempo disponible en el conjunto de datos
datos.fin Último período de tiempo disponible en el conjunto de datos
última.actualización Última actualización del conjunto de datos (zona horaria de Europa/París)
n.registros Número de registros en el conjunto de datos
grupo_geo Código de grupo geográfico
group_geo.label Nombre del grupo geográfico de la zona de referencia
ingresos_del_grupo Código del grupo de ingresos
grupo_ingresos.label Nombre del grupo de ingresos de la zona de referencia

Actualizaciones

Toda la información almacenada en el servicio se actualiza diariamente a las 12.00 horas (huso horario Europa/París). El procedimiento de actualización sólo afecta a los conjuntos de datos para los que hay datos nuevos o que han sufrido una modificación o un cambio estructural.

Ir arriba
Ir al contenido