La principal fuente de estadísticas laborales

Menú Cerrar

Descarga masiva

El servicio de descarga masiva permite acceder a conjuntos de datos individuales o a todas las bases de datos de ILOSTAT. Las instrucciones de uso se encuentran debajo de la lista de directorios.

Directorios

Seleccione un directorio para acceder a los archivos. Los archivos de datos estánen formato csv (gz) comprimido y los archivos de diccionario están en formato csv. Consulte las directrices que figuran a continuación.

INDICADOR

Cuadros presentados por indicador y frecuencia

REF_AREA

Tablas presentadas por ref_area (por ejemplo, países y regiones) y frecuencia

DIC

Diccionarios de los códigos utilizados (es decir, listas de códigos)

Rilostat - Paquete R de ILOSTAT

El servicio de descarga masiva de ILOSTAT es la base del paquete R de ILOSTAT ("Rilostat'), que se diseñó para ofrecer a los usuarios de datos la posibilidad de acceder a las bases de datos de ILOSTAT, buscar datos, reorganizar la información según sea necesario, crear visualizaciones de datos y descargar datos en el formato deseado, todo ello de forma programática y reproducible, con la posibilidad de volver a ejecutar rápidamente las consultas según sea necesario. Para más información, visite la página web de R-ilostat.

Índice de contenidos

Preguntas frecuentes

Todos los archivos 'gz' pueden descomprimirse con WinZip, 7zip o con programas estadísticos como R.

Muchos programas pueden leer archivos csv, incluidos los paquetes estadísticos estándar como R y STATA. Las aplicaciones de hojas de cálculo, como Microsoft Excel, también pueden abrir archivos csv. No obstante, si se intenta abrir archivos de gran tamaño con Excel, la aplicación se bloqueará. Tenga en cuenta que puede ser necesario indicar la coma como separador de campos para leer correctamente el archivo.

Las listas de códigos sólo proporcionan la etiqueta correspondiente a cada código utilizado, sin incluir ninguna otra información sobre conceptos, definiciones o clasificaciones. Estos están disponibles en la página de conceptos y definiciones

Esto ocurrirá con los indicadores y las zonas de referencia para los que se dispone de proyecciones. 

Utilizar el servicio de descarga masiva

Resumen

El servicio de descarga masiva contiene datos, metadatos y documentación. Incluye los conjuntos de datos en formato csv comprimido, "diccionarios" para los códigos utilizados en los archivos csv y una versión en PDF de estas instrucciones. Los directorios que contienen los conjuntos de datos por indicador (por ejemplo, la tasa la desocupación por sexo y edad) o por área_de_referencia (abreviatura de área de referencia, que es la unidad geográfica pertinente, como un país) presentan, además de todas las tablas de datos disponibles, un índice en el que se detalla la lista de tablas disponibles por indicador o área de referencia y el periodo de tiempo cubierto por los datos correspondientes. El siguiente cuadro resume el contenido y ofrece una breve descripción de cada elemento.

Tabla 1. Contenido de la instalación

DirectorioContenido
[indicador]Todos los cuadros de ILOSTAT presentados por indicador y frecuencia
[ref_area]Todas las tablas de ILOSTAT presentadas por ref_area y frecuencia
[dic]Diccionarios de todos los códigos utilizados (listas de códigos)
BulkDownload_Guidelines.pdfDocumentación, incluidas las directrices e instrucciones

Directorios de datos [indicador] y [ref_area]

Existen dos directorios de datos diferentes, basados en dos formas distintas de presentar las tablas correspondientes: organizándolas por "indicador" (y frecuencia) o por "ref_area" (y frecuencia). El indicador se refiere al título de cada tabla específica, incluyendo la variable representada y los desgloses eventuales utilizados para ella (por ejemplo, 'población activa por sexo y edad', 'la ocupación por sexo y actividad económica' y 'la desocupación tasa por sexo, edad y zonas rurales / urbanas' son indicadores de ILOSTAT). El ref_area (de área de referencia) se refiere a las áreas geográficas para las que se dispone de datos. Dado que ILOSTAT incluye tanto datos a nivel de país como estimaciones regionales y mundiales, el área de referencia puede referirse a países, a regiones (regiones geográficas como África, América o los Estados Árabes, grupos de renta como los países de renta baja, u otros grupos como los BRICS o el G20) o al mundo en su conjunto. Sin embargo, es importante señalar que las estimaciones mundiales y regionales sólo están disponibles para algunos indicadores, por lo que la mayoría de los conjuntos de datos sólo incluirían datos a nivel de país. La frecuencia se refiere a si los distintos puntos de datos son anuales, trimestrales o mensuales.

Los directorios de datos, ya sea por indicador o por ref_area, se presentan en formato csv como archivos zip comprimidos ('gz'). Todos los archivos 'gz' pueden descomprimirse con WinZip o 7zip. Para más información sobre los archivos csv, véase la sección siguiente. Tras seleccionar uno de los dos enfoques propuestos (tablas por indicador o por ref_area) haciendo clic en el nombre del directorio, puede acceder y descargar los datos deseados haciendo clic en el nombre del código de la tabla o tablas que busca.

El directorio [dic] proporciona diccionarios de todas las listas de códigos necesarias para identificar el indicador o el área de referencia que está buscando. Como referencia, tenga en cuenta que todos los códigos siguen la misma estructura. El código del indicador incluye, en este orden

  • código del tema
  • código para identificar el indicador dentro de ese tema
  • averías o "NOC" para "sin clasificación" si no hay averías
  • unidad de medida
    • NB" para valores absolutos o números
    • RT" para porcentajes o tasas
  • frecuencia
    • A" para los datos anuales
    • Q" para datos trimestrales
    • M" para datos mensuales

Del mismo modo, los nombres de código de los archivos por área de referencia se refieren a:

  • país (código de país ISO Alpha-3) o la región (códigos que empiezan por X) y
  • frecuencia

Las dos tablas que se presentan a continuación muestran el contenido de los directorios [indicator] y [ref_area], que contienen aproximadamente 500 y 700 conjuntos de datos respectivamente.

Tabla 2. Contenido de [indicador]

ArchivosContenido
tabla_de_contenidos_esTabla de contenidos en inglés
tabla_de_contenidos_frÍndice en francés
tabla_de_contenidos_spÍndice en español
EAP_TEAP_SEX_NB_A.csv.gzConjunto de datos que contiene todos los datos anuales disponibles sobre la población activa por sexo y edad
EMP_DWAP_NOC_RT_A.csv.gzConjunto de datos que contiene todos los datos anuales disponibles sobre la relación la ocupación-población
......

Tabla 3. Contenido de [ref_area]

ArchivosContenido
tabla_de_contenidos_esTabla de contenidos en inglés
tabla_de_contenidos_frÍndice en francés
tabla_de_contenidos_spÍndice en español
ABW_A.csv.gzConjunto de datos que contiene todos los datos anuales disponibles para Aruba
ABW_M.csv.gzConjunto de datos que contiene todos los datos mensuales disponibles para Aruba
......

Formato de los archivos de datos CSV

Los archivos en formato "csv" son archivos que almacenan información tabular (ya sean números o texto) en forma de texto plano, como valores separados por comas. Es decir, las columnas (o campos) de la tabla original están separadas por comas, lo que permite que cada fila o línea del archivo se corresponda con un registro de datos (el registro de datos puede estar formado por uno o varios campos, separados por comas). Estos archivos pueden abrirse fácil y sencillamente en Excel. En los archivos 'csv' de ILOSTAT, la primera fila contiene las cabeceras (de los campos o columnas). Las filas siguientes presentan los registros de datos, que consisten en la clave del registro (los "nombres" de las dimensiones utilizadas para identificar cada registro, incluyendo el área de referencia, la fuente de los datos, las clasificaciones utilizadas, etc., refiriéndose a todos los campos desde "ref_area" hasta "time"), el valor de la observación ("obs_value") y cualquier otro metadato disponible (como la cobertura geográfica de la fuente o las definiciones específicas utilizadas para algunos conceptos, refiriéndose a todos los campos desde "obs_status" hasta "note_source"). Todas las etiquetas correspondientes a los nombres de los códigos utilizados como cabeceras de campo en los archivos csv disponibles para su descarga se presentan en el diccionario de las listas de códigos (archivos [dic], véase la sección siguiente para más información). El único nombre de código que no se explica en los archivos [dic] es "obs_value", que corresponde a
el valor de la observación.

No existe un diccionario (o un archivo "dic") para la dimensión tiempo. La sintaxis de los códigos utilizados para esta dimensión es la siguiente:

  • Datos anuales: AAAA donde AAAA es el año.
  • Datos trimestrales: YYYYQ donde YYYY es el año y Q es el trimestre (el número correspondiente al trimestre del 1 al 4).
  • Datos mensuales: YYYYMM donde YYYY es el año y MM es el mes (el número correspondiente al mes del 01 al 12).

El formato numérico aplicado en los archivos de ILOSTAT utiliza un punto como símbolo decimal ('.').

Directorio de diccionarios [dic]

Las listas de códigos son conjuntos predefinidos de términos de los que toman sus valores los conceptos estadísticos (características estadísticas de los datos) que han sido codificados. Todas las listas de códigos presentadas en ILOSTAT están disponibles en tres idiomas ('en' para el inglés, 'fr' para el francés y 'sp' para el español). Todos los archivos de listas de códigos de ILOSTAT tienen la misma estructura, que consta de tres columnas: el nombre de la variable o código ('var_name'), la etiqueta de la variable o descripción del código ('var_label') y un número utilizado para ordenar la información en el archivo ('var_sort'). La siguiente tabla proporciona un ejemplo de lista de códigos de ILOSTAT.

Tabla 4. Extracto de "indicator_en.csv

IndicadorIndicador.labelIndicador.sort
GDP_211P_NOC_NBProducto por trabajador (PIB internacional constante de 2011 en PPA) - Estimaciones y proyecciones de la OIT, nov. 2016 (unidades)1
CPI_NCPI_COI_INÍndice nacional de precios al consumo (IPC) por COICOP (unidades)2
.........

Las distintas listas de códigos disponibles en inglés, francés y español en el directorio [dic] corresponden a los campos utilizados en los archivos csv descargados descritos en la sección anterior (excepto el campo "obs_value" utilizado para el valor de la observación y que no requiere un diccionario con etiquetas). La siguiente tabla enumera las listas de códigos incluidas en el directorio [dic].

Tabla 5. Extracto de "indicator_en.csv" en [dic]

Nombre de la variable1utilizado también como nombre de lista de códigosBreve descripción
área_de_referenciaZona de referencia: puede referirse a países, regiones geográficas, grupos de países (por nivel de renta u otros) o al mundo
fuenteLa fuente específica de los datos, incluyendo información sobre el país o la región para la que se utilizan y el tipo principal de fuente (censo de población, encuesta de población activa, registros administrativos, etc.), así como el nombre preciso de la fuente.
indicadorEl indicador, incluyendo información sobre las variables representadas, las clasificaciones utilizadas (si las hay) y la unidad.
sexoEl desglose por sexo y los elementos de este desglose.
clasif1Todas las clasificaciones utilizadas como primer desglose en los distintos indicadores disponibles (excluyendo el desglose por sexo, que se trata por separado) y las correspondientes categorías o elementos de clasificación.
clasif2Todas las clasificaciones utilizadas como segundo desglose en los distintos indicadores disponibles (excluyendo el desglose por sexo, que se trata por separado) y las correspondientes categorías o elementos de clasificación.
obs_statusEl estado de los valores o los indicadores de los valores, como las interrupciones de las series o los valores provisionales.
note_classifMetadatos y/o notas a pie de página relacionados con las clasificaciones utilizadas y las categorías de clasificación específicas.
indicador_de_notaMetadatos y/o notas a pie de página relacionados con el indicador.
fuente_de_notasMetadatos y/o notas a pie de página relacionados con la fuente de datos.

Cabe señalar que estas listas de códigos presentan únicamente la etiqueta correspondiente a cada código. Para más información metodológica, incluidas las definiciones de los principales términos estadísticos utilizados en ILOSTAT, las descripciones detalladas de los indicadores y las normas estadísticas, consulte la página de conceptos y definiciones

Los dos directorios de datos [indicator] y [ref_area] incluyen una tabla de contenidos, disponible en formato csv y en tres idiomas ('en' para el inglés, 'fr' para el francés y 'sp' para el español). Estos índices enumeran todos los archivos de datos disponibles para su descarga en el directorio correspondiente, y proporcionan información resumida sobre cada archivo de datos. 

El índice del directorio [indicador] enumera todos los indicadores disponibles, con la etiqueta del indicador y la frecuencia de los datos. 

El índice del directorio [ref_area] enumera todas las áreas de referencia disponibles (países, regiones, grupos de países), con la etiqueta del área de referencia y la frecuencia de los datos. 

Ambas tablas indican el tamaño de cada archivo de datos, el período de tiempo cubierto por los datos del archivo y la fecha en que el archivo de datos fue actualizado por última vez. Dado que los conjuntos de datos de ILOSTAT incluyen proyecciones de los principales indicadores del mercado laboral, el período de tiempo cubierto por algunos archivos de datos puede llegar hasta 2050. Los códigos o identificadores utilizados en las tablas de contenido para los indicadores y las áreas de referencia en el primer campo o columna ("id") son únicos y permiten la identificación inequívoca del elemento correspondiente. Los dos cuadros que se presentan a continuación muestran extractos de los índices de los directorios [indicador] y [zona_de_referencia].

Tabla 6. Extracto de "table_of_contents_en.csv" en [indicador]

Nombre de la variable2utilizado también como nombre de la lista de códigosBreve descripción
idNombre del archivo del conjunto de datos
indicadorCódigo del indicador
indicador.etiquetaNombre del indicador, incluyendo información sobre las variables representadas, las clasificaciones utilizadas (si las hay) y la unidad.
frecCódigo de frecuencia (A, Q, M)
etiqueta.freq.Etiqueta de frecuencia
tamañoTamaño del archivo .csv.gz
data.startPrimer periodo de tiempo disponible en el conjunto de datos
datos.finÚltimo período de tiempo disponible en el conjunto de datos
última.actualizaciónÚltima actualización del conjunto de datos (zona horaria de Europa/París)
n.registrosNúmero de registros en el conjunto de datos
colecciónCódigo de la colección
etiqueta.de.la.colecciónRecogida de datos o compilación de la que se derivan los datos, de todas las diversas compilaciones de datos realizadas por la OIT y difundidas en ILOSTAT
temaCódigo de la materia
etiqueta.subjectCómo se muestra el indicador en el sitio web de ilostat

Tabla 7. Extracto del archivo "table_of_contents_en.csv" en [ref_area]

Nombre de la variable3utilizado también como nombre de lista de códigosBreve descripción
idNombre del archivo del conjunto de datos
área_de_referenciaCódigo de área de referencia
ref_area.labelNombre de la zona de referencia, puede referirse a países, regiones geográficas, grupos de países (por nivel de renta u otros) o al mundo
frecCódigo de frecuencia (A, Q, M)
etiqueta.freq.Etiqueta de frecuencia
tamañoTamaño del archivo .csv.gz
data.startPrimer periodo de tiempo disponible en el conjunto de datos
datos.finÚltimo período de tiempo disponible en el conjunto de datos
última.actualizaciónÚltima actualización del conjunto de datos (zona horaria de Europa/París)
n.registrosNúmero de registros en el conjunto de datos
grupo_geoCódigo de grupo geográfico
group_geo.labelNombre del grupo geográfico de la zona de referencia
ingresos_del_grupoCódigo del grupo de ingresos
grupo_ingresos.labelNombre del grupo de ingresos de la zona de referencia

Actualizaciones

Toda la información almacenada en el servicio se actualiza una vez a la semana, cada domingo a las 22:00 horas (zona horaria de Europa/París). El procedimiento de actualización sólo afecta a los conjuntos de datos para los que hay datos nuevos o que han sufrido una modificación o un cambio estructural.

Ir arriba
Ir al contenido