Facilité de téléchargement en masse

Le service de téléchargement en masse permet d'accéder à des ensembles de données individuels ou à toutes les bases de données d'ILOSTAT. Les instructions d'utilisation du service se trouvent sous la liste des répertoires.

Annuaires

Sélectionnez un répertoire pour accéder aux fichiers. Les fichiers de donnéessont au format zippé csv (gz) et les fichiers de dictionnaire sont au format csv. Voir les directives ci-dessous.

INDICATEUR

Tableaux présentés par indicateur et par fréquence

REF_AREA

Tableaux présentés par zone de référence (par exemple, pays et régions) et par fréquence.

DIC

Dictionnaires pour les codes utilisés (c'est-à-dire, listes de codes)

Rilostat - Le paquet R d'ILOSTAT

La fonction de téléchargement en masse d'ILOSTAT est la base du paquet R d'ILOSTAT ("Rilostat"), qui a été conçu pour donner aux utilisateurs de données la possibilité d'accéder aux bases de données d'ILOSTAT, de rechercher des données, de réorganiser l'information selon les besoins, de créer des visualisations de données et de télécharger des données dans le format souhaité, le tout de manière programmatique et reproductible, avec la possibilité de réexécuter rapidement les requêtes selon les besoins. Pour plus d'informations, visitez la page web de R-ilostat.

Présentation générale de l'utilisation de la fonctionnalité de téléchargement groupé

La facilité de téléchargement en masse contient des données, des métadonnées et de la documentation. Il s'agit notamment d'ensembles de données au format csv zippé, de "dictionnaires" pour les codes utilisés dans les fichiers csv et d'une version PDF de ces instructions. Les répertoires contenant les ensembles de données par indicateur (par exemple le taux de chômage par sexe et par âge) ou par zone de référence (abréviation de reference area, qui est l'unité géographique pertinente telle qu'un pays) présentent, en plus de tous les tableaux de données disponibles, une table des matières détaillant la liste des tableaux disponibles par indicateur ou zone de référence et la période couverte par les données correspondantes. Le tableau suivant résume le contenu et fournit une brève description de chaque élément.

Questions fréquemment posées

Comment puis-je ouvrir les fichiers compressés gz ?

Tous les fichiers 'gz' peuvent être décompressés à l'aide de WinZip, 7zip, ou d'un logiciel statistique tel que R.

Comment puis-je lire les fichiers csv ?

De nombreux programmes peuvent lire les fichiers csv, notamment les progiciels statistiques standard tels que R et STATA. Les applications de tableur, telles que Microsoft Excel, peuvent également ouvrir les fichiers csv. Néanmoins, essayer d'ouvrir des fichiers volumineux à l'aide d'Excel fera planter l'application. Notez que vous devrez peut-être indiquer la virgule comme séparateur de champ pour lire correctement le fichier.

Où puis-je trouver des informations au-delà des étiquettes ?

Les listes de codes ne fournissent que l'étiquette correspondant à chaque code utilisé, sans inclure d'autres informations sur les concepts, les définitions ou les classifications. Celles-ci sont disponibles sur la page des concepts et définitions.

Comment vos données peuvent-elles se référer à des dates futures ?

Cela se produira pour les indicateurs et les zones de référence pour lesquels des projections sont disponibles.

Répertoires de données [indicateur] et [zone de référence].

Il existe deux répertoires de données différents, basés sur deux manières différentes de présenter les tableaux correspondants : en les organisant par "indicateur" (et fréquence) ou par "ref_area" (et fréquence). L'indicateur fait référence au titre de chaque tableau spécifique, y compris la variable représentée et les éventuelles ventilations utilisées pour celle-ci (par exemple, "la main-d’œuvre par sexe et âge ", " emploi par sexe et activité économique " et " taux de chômage par sexe, âge et zones rurales/urbaines " sont des indicateurs de l'ILOSTAT). La zone ref_area (de reference area) fait référence aux zones géographiques pour lesquelles des données sont disponibles. Étant donné que l'ILOSTAT inclut à la fois des données au niveau des pays et des estimations régionales et mondiales, la zone de référence peut se référer soit à des pays, soit à des régions (régions géographiques telles que l'Afrique, les Amériques ou les États arabes, groupes de revenus tels que les pays à faible revenu, ou autres groupes tels que les BRICS ou le G20), soit au monde dans son ensemble. Toutefois, il est important de noter que les estimations mondiales et régionales ne sont disponibles que pour certains indicateurs et que la plupart des ensembles de données ne comprennent donc que des données au niveau national. La fréquence indique si les différents points de données sont annuels, trimestriels ou mensuels.

Les répertoires de données, que ce soit par indicateur ou par ref_area, sont présentés au format csv sous forme de fichiers zip compressés ('gz'). Tous les fichiers 'gz' peuvent être décompressés à l'aide de WinZip ou 7zip. Pour plus d'informations sur les fichiers csv, voir la section suivante. Après avoir sélectionné une des deux approches proposées (tableaux par indicateur ou par zone de référence) en cliquant sur le nom du répertoire, vous pouvez accéder et télécharger les données souhaitées en cliquant sur le(s) nom(s) de code du(des) tableau(x) recherché(s).

Le répertoire [dic] fournit des dictionnaires de toutes les listes de codes nécessaires pour identifier l'indicateur ou le domaine de référence que vous recherchez. Pour référence, veuillez noter que les codes suivent tous la même structure. Le code de l'indicateur comprend, dans cet ordre :

code du sujet
code pour identifier l'indicateur dans ce thème
pannes ou "NOC" pour "no classification" s'il n'y a pas de panne.
unité de mesure
- NB" pour les valeurs absolues ou les nombres
- RT" pour les pourcentages ou les taux
fréquence
- A pour les données annuelles
- Q" pour les données trimestrielles
- M" pour les données mensuelles

De même, les noms de code des dossiers par zone de référence font référence :

le pays (code pays ISO Alpha-3) ou la région (codes commençant par X) et
fréquence

Les deux tableaux présentés ci-après montrent le contenu des répertoires [indicator] et [ref_area], qui contiennent respectivement environ 500 et 700 jeux de données.

Contenu de [indicateur]

Fichiers	Contenu
table_des_contenus_fr	Table des matières en anglais
table_des_contenus_fr	Table des matières en français
table_des_contenus_sp	Table des matières en espagnol
EAP_TEAP_SEX_AGE_NB_A.csv	Ensemble de données contenant toutes les données annuelles disponibles sur le site la main-d’œuvre par sexe et par âge
EMP_DWAP_NOC_RT_A.csv	Ensemble de données contenant toutes les données annuelles disponibles pour le ratio emploi/population
...	...

Contenu de [ref_area]

Fichiers	Contenu
table_des_contenus_fr	Table des matières en anglais
table_des_contenus_fr	Table des matières en français
table_des_contenus_sp	Table des matières en espagnol
ABW_A.csv	Ensemble de données contenant toutes les données annuelles disponibles pour Aruba
ABW_M.csv	Ensemble de données contenant toutes les données mensuelles disponibles pour Aruba
...	...

Format des fichiers de données CSV

Les fichiers au format « csv » sont des fichiers qui stockent des informations tabulaires (qu'il s'agisse de chiffres ou de texte) sous forme de texte brut, sous forme de valeurs séparées par des virgules. Autrement dit, les colonnes (ou champs) du tableau d'origine sont séparées par des virgules, ce qui permet à chaque ligne du fichier de correspondre à un enregistrement de données (l'enregistrement de données peut donc comporter un ou plusieurs champs, séparés par des virgules). Ces fichiers peuvent être ouverts facilement et directement dans Excel. Dans les fichiers « csv » d'ILOSTAT, la première ligne contient les en-têtes (des champs ou des colonnes). Les lignes suivantes présentent les enregistrements de données, composés de la clé de l'enregistrement (les « noms » des dimensions utilisées pour identifier chaque enregistrement, y compris la zone de référence, la source des données, les classifications utilisées, etc., se référant à tous les champs de « ref_area » à « time »), la valeur d'observation («obs_value») et toute autre métadonnée disponible (telle que la couverture géographique de la source ou les définitions spécifiques utilisées pour certains concepts, se référant à tous les champs de «obs_status» à «note_source»). Toutes les étiquettes correspondant aux noms de code utilisés comme en-têtes de champ dans les fichiers csv disponibles au téléchargement sont présentées dans le dictionnaire des listes de codes (fichiers [dic], voir la section suivante pour plus d'informations). Le seul nom de code qui n'est pas expliqué dans les fichiers [dic] est « obs_value », qui correspond à
la valeur d'observation.

Il n'existe pas de dictionnaire (ou de fichier 'dic') pour la dimension temps. La syntaxe des codes utilisés pour cette dimension est la suivante :

Données annuelles : YYYY où YYYY est l'année.
Données trimestrielles : YYYYQ où YYYY est l'année et Q est le trimestre (le numéro correspondant au trimestre de 1 à 4).
Données mensuelles : YYYYMM où YYYY est l'année et MM est le mois (le numéro correspondant au mois de 01 à 12).

Le format des nombres appliqué dans les fichiers ILOSTAT utilise un point comme symbole décimal ('.').

Répertoire de dictionnaires [dic]

Les listes de codes sont des ensembles prédéfinis de termes à partir desquels les concepts statistiques (caractéristiques statistiques des données) qui ont été codés prennent leurs valeurs. Toutes les listes de codes présentées dans ILOSTAT sont disponibles en trois langues ('en' pour l'anglais, 'fr' pour le français et 'sp' pour l'espagnol). Tous les fichiers de listes de codes d'ILOSTAT ont la même structure, composée de trois colonnes : le nom de la variable ou le code ('var_name'), l'étiquette de la variable ou la description du code ('var_label') et un numéro utilisé pour trier les informations dans le fichier ('var_sort'). Le tableau suivant donne un exemple de liste de codes ILOSTAT.

Extrait de 'indicateur_fr.csv'

Indicateur	Indicateur.label	Indicateur.tri
GDP_211P_NOC_NB	Production par travailleur (PIB en dollars internationaux constants de 2011 en PPA) - Estimations et projections de l'OIT, nov. 2016 (unités)	1
CPI_NCPI_COI_IN	Indice national des prix à la consommation (IPC) par COICOP (unités)	2
...	...	...

Les différentes listes de codes disponibles en anglais, français et espagnol dans le répertoire [dic] correspondent aux champs utilisés dans les fichiers csv téléchargés décrits dans la section précédente (à l'exception du champ 'obs_value' utilisé pour la valeur de l'observation et ne nécessitant pas de dictionnaire avec des étiquettes). Le tableau suivant énumère les listes de codes incluses dans le répertoire [dic].

Extrait de 'indicator_fr.csv' dans [dic]

Nom de la variable¹	Brève description
zone de référence	Zone de référence - il peut s'agir de pays, de régions géographiques, de groupes de pays (par niveau de revenu ou autres) ou du monde entier.
source	La source spécifique des données, y compris des informations sur le pays ou la région pour lesquels elles sont utilisées et le principal type de source (recensement de la population, enquête la main-d’œuvre , dossiers administratifs, etc.
indicateur	L'indicateur, y compris les informations sur les variables représentées, les classifications utilisées (le cas échéant) et l'unité.
sexe	La répartition par sexe et les éléments de cette répartition.
class1	Toutes les classifications utilisées comme première ventilation dans les différents indicateurs disponibles (à l'exception de la ventilation par sexe, qui est traitée séparément) et les catégories ou postes de classification correspondants.
class2	Toutes les classifications utilisées comme deuxième ventilation dans les différents indicateurs disponibles (à l'exception de la ventilation par sexe, qui est traitée séparément) et les catégories ou postes de classification correspondants.
obs_status	L'état des valeurs ou les indicateurs sur les valeurs, tels que les ruptures de série ou les valeurs provisoires.
note_classique	Métadonnées et/ou notes de bas de page relatives aux classifications utilisées et aux catégories de classification spécifiques.
Indicateur de note	Métadonnées et/ou notes de bas de page relatives à l'indicateur.
note_source	Métadonnées et/ou notes de bas de page relatives à la source de données.

Il convient de noter que ces listes de codes ne présentent que l'étiquette correspondant à chaque code. Pour de plus amples informations méthodologiques, y compris les définitions des principaux termes statistiques utilisés dans ILOSTAT, les descriptions détaillées des indicateurs et les normes statistiques, veuillez vous référer à la page des concepts et définitions.

Les deux répertoires de données [indicator] et [ref_area] comprennent une table des matières, disponible au format csv et en trois langues ('en' pour l'anglais, 'fr' pour le français et 'sp' pour l'espagnol). Ces tables des matières listent tous les fichiers de données disponibles pour le téléchargement dans le répertoire correspondant, et fournissent des informations sommaires sur chaque fichier de données.

La table des matières du répertoire [indicateur] liste tous les indicateurs disponibles, avec le libellé de l'indicateur et la fréquence des données.

La table des matières du répertoire [ref_area] liste toutes les zones de référence disponibles (pays, régions, groupes de pays), avec le label de la zone de référence et la fréquence des données.

Les deux tableaux indiquent la taille de chaque fichier de données, la période couverte par les données du fichier et la date à laquelle le fichier de données a été mis à jour pour la dernière fois. Comme les ensembles de données d'ILOSTAT comprennent des projections des principaux indicateurs du marché du travail, la période couverte par certains fichiers de données peut aller jusqu'en 2050. Les codes ou identifiants utilisés dans les tables des matières pour les indicateurs et les domaines de référence dans le premier champ ou la première colonne ('id') sont uniques et permettent d'identifier sans équivoque l'élément correspondant. Les deux tableaux suivants présentent des extraits des tables des matières des répertoires [indicateur] et [zone de référence].

Extrait de 'table_of_contents_fr.csv' dans [indicateur]

Nom de la variable²	Brève description
id	Nom de fichier de l'ensemble de données
indicateur	Code indicateur
indicateur.label	Nom de l'indicateur, y compris des informations sur les variables représentées, les classifications utilisées (le cas échéant) et l'unité.
freq	Code de fréquence (A, Q, M)
étiquette freq.	Label de fréquence
taille	Taille du fichier .csv.gz
données.départ	Première période disponible dans la série de données
données.fin	Dernière période de temps disponible dans l'ensemble de données
dernière.actualisation	Dernière mise à jour du jeu de données (fuseau horaire Europe/Paris)
n.records	Nombre d'enregistrements dans l'ensemble de données
collection	Code de la collection
collection.label	Collecte ou compilation de données dont les données sont issues, à partir de l'ensemble des différentes compilations de données réalisées par le BIT et diffusées dans ILOSTAT.
sujet	Code matière
sujet.étiquette	Comment l'indicateur est affiché sur le site web d'ilostat

Extrait du fichier 'table_of_contents_fr.csv' dans [ref_area]

Nom de la variable³	Brève description
id	Nom de fichier de l'ensemble de données
zone de référence	Indicatif régional de référence
ref_area.label	Nom de la zone de référence, il peut s'agir de pays, de régions géographiques, de groupes de pays (par niveau de revenu ou autres) ou du monde entier.
freq	Code de fréquence (A, Q, M)
étiquette freq.	Label de fréquence
taille	Taille du fichier
données.départ	Première période disponible dans la série de données
données.fin	Dernière période de temps disponible dans l'ensemble de données
dernière.actualisation	Dernière mise à jour du jeu de données (fuseau horaire Europe/Paris)
n.records	Nombre d'enregistrements dans l'ensemble de données
groupe_géo	Code du groupe géographique
groupe_geo.label	Nom du groupe géographique de la zone de référence
revenu_groupe	Code du groupe de revenu
revenu_groupe.label	Nom du groupe de revenu de la zone de référence

Mises à jour

L'ensemble des informations stockées dans l'installation est mis à jour quotidiennement à 12h00 (fuseau horaire Europe/Paris). La procédure de mise à jour ne concerne que les ensembles de données pour lesquels il existe de nouvelles données ou qui ont subi une modification ou un changement structurel.