Le service de téléchargement en masse permet d'accéder à des ensembles de données individuels ou à toutes les bases de données d'ILOSTAT. Les instructions d'utilisation du service se trouvent sous la liste des répertoires.
Annuaires
Sélectionnez un répertoire pour accéder aux fichiers. Les fichiers de donnéessont au format zippé csv (gz) et les fichiers de dictionnaire sont au format csv. Voir les directives ci-dessous.
INDICATEUR
Tableaux présentés par indicateur et par fréquence
REF_AREA
Tableaux présentés par zone de référence (par exemple, pays et régions) et par fréquence.
DIC
Dictionnaires pour les codes utilisés (c'est-à-dire, listes de codes)
La fonction de téléchargement en masse d'ILOSTAT est la base du paquet R d'ILOSTAT ("Rilostat"), qui a été conçu pour donner aux utilisateurs de données la possibilité d'accéder aux bases de données d'ILOSTAT, de rechercher des données, de réorganiser l'information selon les besoins, de créer des visualisations de données et de télécharger des données dans le format souhaité, le tout de manière programmatique et reproductible, avec la possibilité de réexécuter rapidement les requêtes selon les besoins. Pour plus d'informations, visitez la page web de R-ilostat.
Table des matières
Questions fréquemment posées
Tous les fichiers 'gz' peuvent être décompressés à l'aide de WinZip, 7zip, ou d'un logiciel statistique tel que R.
De nombreux programmes peuvent lire les fichiers csv, notamment les progiciels statistiques standard tels que R et STATA. Les applications de tableur, telles que Microsoft Excel, peuvent également ouvrir les fichiers csv. Néanmoins, essayer d'ouvrir des fichiers volumineux à l'aide d'Excel fera planter l'application. Notez que vous devrez peut-être indiquer la virgule comme séparateur de champ pour lire correctement le fichier.
Les listes de codes ne fournissent que l'étiquette correspondant à chaque code utilisé, sans inclure d'autres informations sur les concepts, les définitions ou les classifications. Celles-ci sont disponibles sur la page des concepts et définitions.
Cela se produira pour les indicateurs et les zones de référence pour lesquels des projections sont disponibles.
Pages connexes
Utilisation de la fonction de téléchargement en masse
Vue d'ensemble
La facilité de téléchargement en masse contient des données, des métadonnées et de la documentation. Il s'agit notamment d'ensembles de données au format csv zippé, de "dictionnaires" pour les codes utilisés dans les fichiers csv et d'une version PDF de ces instructions. Les répertoires contenant les ensembles de données par indicateur (par exemple le taux de chômage par sexe et par âge) ou par zone de référence (abréviation de reference area, qui est l'unité géographique pertinente telle qu'un pays) présentent, en plus de tous les tableaux de données disponibles, une table des matières détaillant la liste des tableaux disponibles par indicateur ou zone de référence et la période couverte par les données correspondantes. Le tableau suivant résume le contenu et fournit une brève description de chaque élément.
Tableau 1. Contenu de l'installation
Annuaire | Contenu |
[indicateur] | Tous les tableaux d'ILOSTAT présentés par indicateur et par fréquence |
[ref_area] | Tous les tableaux d'ILOSTAT présentés par domaine de référence et par fréquence |
[dic] | Dictionnaires de tous les codes utilisés (listes de codes) |
BulkDownload_Guidelines.pdf | Documentation, y compris les directives et les instructions |
Répertoires de données [indicateur] et [zone de référence].
Il existe deux répertoires de données différents, basés sur deux manières différentes de présenter les tableaux correspondants : en les organisant par "indicateur" (et fréquence) ou par "ref_area" (et fréquence). L'indicateur fait référence au titre de chaque tableau spécifique, y compris la variable représentée et les éventuelles ventilations utilisées pour celle-ci (par exemple, "la main-d’œuvre par sexe et âge ", " emploi par sexe et activité économique " et " taux de chômage par sexe, âge et zones rurales/urbaines " sont des indicateurs de l'ILOSTAT). La zone ref_area (de reference area) fait référence aux zones géographiques pour lesquelles des données sont disponibles. Étant donné que l'ILOSTAT inclut à la fois des données au niveau des pays et des estimations régionales et mondiales, la zone de référence peut se référer soit à des pays, soit à des régions (régions géographiques telles que l'Afrique, les Amériques ou les États arabes, groupes de revenus tels que les pays à faible revenu, ou autres groupes tels que les BRICS ou le G20), soit au monde dans son ensemble. Toutefois, il est important de noter que les estimations mondiales et régionales ne sont disponibles que pour certains indicateurs et que la plupart des ensembles de données ne comprennent donc que des données au niveau national. La fréquence indique si les différents points de données sont annuels, trimestriels ou mensuels.
Les répertoires de données, que ce soit par indicateur ou par ref_area, sont présentés au format csv sous forme de fichiers zip compressés ('gz'). Tous les fichiers 'gz' peuvent être décompressés à l'aide de WinZip ou 7zip. Pour plus d'informations sur les fichiers csv, voir la section suivante. Après avoir sélectionné une des deux approches proposées (tableaux par indicateur ou par zone de référence) en cliquant sur le nom du répertoire, vous pouvez accéder et télécharger les données souhaitées en cliquant sur le(s) nom(s) de code du(des) tableau(x) recherché(s).
Le répertoire [dic] fournit des dictionnaires de toutes les listes de codes nécessaires pour identifier l'indicateur ou le domaine de référence que vous recherchez. Pour référence, veuillez noter que les codes suivent tous la même structure. Le code de l'indicateur comprend, dans cet ordre :
- code du sujet
- code pour identifier l'indicateur dans ce thème
- pannes ou "NOC" pour "no classification" s'il n'y a pas de panne.
- unité de mesure
- NB" pour les valeurs absolues ou les nombres
- RT" pour les pourcentages ou les taux
- fréquence
- A pour les données annuelles
- Q" pour les données trimestrielles
- M" pour les données mensuelles
De même, les noms de code des dossiers par zone de référence font référence :
- le pays (code pays ISO Alpha-3) ou la région (codes commençant par X) et
- fréquence
Les deux tableaux présentés ci-après montrent le contenu des répertoires [indicator] et [ref_area], qui contiennent respectivement environ 500 et 700 jeux de données.
Tableau 2. Contenu de l'[indicateur]
Fichiers | Contenu |
table_des_contenus_fr | Table des matières en anglais |
table_des_contenus_fr | Table des matières en français |
table_des_contenus_sp | Table des matières en espagnol |
EAP_TEAP_SEX_AGE_NB_A.csv.gz | Ensemble de données contenant toutes les données annuelles disponibles sur le site la main-d’œuvre par sexe et par âge |
EMP_DWAP_NOC_RT_A.csv.gz | Ensemble de données contenant toutes les données annuelles disponibles pour le ratio emploi/population |
... | ... |
Tableau 3. Contenu de [ref_area]
Fichiers | Contenu |
table_des_contenus_fr | Table des matières en anglais |
table_des_contenus_fr | Table des matières en français |
table_des_contenus_sp | Table des matières en espagnol |
ABW_A.csv.gz | Ensemble de données contenant toutes les données annuelles disponibles pour Aruba |
ABW_M.csv.gz | Ensemble de données contenant toutes les données mensuelles disponibles pour Aruba |
... | ... |
Format des fichiers de données CSV
Les fichiers au format "csv" sont des fichiers stockant des informations tabulaires (qu'il s'agisse de chiffres ou de texte) sous la forme de texte brut, en tant que valeurs séparées par des virgules. En d'autres termes, les colonnes (ou champs) du tableau original sont séparées par des virgules, ce qui permet à chaque ligne du fichier de correspondre à un enregistrement de données (l'enregistrement de données peut donc consister en un ou plusieurs champs, séparés par des virgules). Ces fichiers peuvent être facilement et directement ouverts dans Excel. Dans les fichiers 'csv' d'ILOSTAT, la première ligne contient les en-têtes (des champs ou des colonnes). Les lignes suivantes présentent les enregistrements de données, composés de la clé de l'enregistrement (les "noms" des dimensions utilisées pour identifier chaque enregistrement, y compris la zone de référence, la source des données, les classifications utilisées, etc., se référant à tous les champs de "ref_area" à "time"), la valeur de l'observation ("obs_value") et toute autre métadonnée disponible (telle que la couverture géographique de la source ou les définitions spécifiques utilisées pour certains concepts, se référant à tous les champs de "obs_status" à "note_source"). Toutes les étiquettes correspondant aux noms de code utilisés comme en-têtes de champ dans les fichiers csv disponibles pour le téléchargement sont présentées dans le dictionnaire des listes de codes (fichiers [dic], voir la section suivante pour plus d'informations). Le seul nom de code non expliqué dans les fichiers [dic] est 'obs_value', qui correspond à
la valeur de l'observation.
Il n'existe pas de dictionnaire (ou de fichier 'dic') pour la dimension temps. La syntaxe des codes utilisés pour cette dimension est la suivante :
- Données annuelles : YYYY où YYYY est l'année.
- Données trimestrielles : YYYYQ où YYYY est l'année et Q est le trimestre (le numéro correspondant au trimestre de 1 à 4).
- Données mensuelles : YYYYMM où YYYY est l'année et MM est le mois (le numéro correspondant au mois de 01 à 12).
Le format des nombres appliqué dans les fichiers ILOSTAT utilise un point comme symbole décimal ('.').
Répertoire de dictionnaires [dic]
Les listes de codes sont des ensembles prédéfinis de termes à partir desquels les concepts statistiques (caractéristiques statistiques des données) qui ont été codés prennent leurs valeurs. Toutes les listes de codes présentées dans ILOSTAT sont disponibles en trois langues ('en' pour l'anglais, 'fr' pour le français et 'sp' pour l'espagnol). Tous les fichiers de listes de codes d'ILOSTAT ont la même structure, composée de trois colonnes : le nom de la variable ou le code ('var_name'), l'étiquette de la variable ou la description du code ('var_label') et un numéro utilisé pour trier les informations dans le fichier ('var_sort'). Le tableau suivant donne un exemple de liste de codes ILOSTAT.
Tableau 4. Extrait du fichier 'indicator_fr.csv'.
Indicateur | Indicateur.label | Indicateur.tri |
GDP_211P_NOC_NB | Production par travailleur (PIB en dollars internationaux constants de 2011 en PPA) - Estimations et projections de l'OIT, nov. 2016 (unités) | 1 |
CPI_NCPI_COI_IN | Indice national des prix à la consommation (IPC) par COICOP (unités) | 2 |
... | ... | ... |
Les différentes listes de codes disponibles en anglais, français et espagnol dans le répertoire [dic] correspondent aux champs utilisés dans les fichiers csv téléchargés décrits dans la section précédente (à l'exception du champ 'obs_value' utilisé pour la valeur de l'observation et ne nécessitant pas de dictionnaire avec des étiquettes). Le tableau suivant énumère les listes de codes incluses dans le répertoire [dic].
Tableau 5. Extrait de 'indicator_fr.csv' dans [dic].
Nom de la variable1utilisé également comme nom de liste de codes | Brève description |
zone de référence | Zone de référence - il peut s'agir de pays, de régions géographiques, de groupes de pays (par niveau de revenu ou autres) ou du monde entier. |
source | La source spécifique des données, y compris des informations sur le pays ou la région pour lesquels elles sont utilisées et le principal type de source (recensement de la population, enquête la main-d’œuvre , dossiers administratifs, etc. |
indicateur | L'indicateur, y compris les informations sur les variables représentées, les classifications utilisées (le cas échéant) et l'unité. |
sexe | La répartition par sexe et les éléments de cette répartition. |
class1 | Toutes les classifications utilisées comme première ventilation dans les différents indicateurs disponibles (à l'exception de la ventilation par sexe, qui est traitée séparément) et les catégories ou postes de classification correspondants. |
class2 | Toutes les classifications utilisées comme deuxième ventilation dans les différents indicateurs disponibles (à l'exception de la ventilation par sexe, qui est traitée séparément) et les catégories ou postes de classification correspondants. |
obs_status | L'état des valeurs ou les indicateurs sur les valeurs, tels que les ruptures de série ou les valeurs provisoires. |
note_classique | Métadonnées et/ou notes de bas de page relatives aux classifications utilisées et aux catégories de classification spécifiques. |
Indicateur de note | Métadonnées et/ou notes de bas de page relatives à l'indicateur. |
note_source | Métadonnées et/ou notes de bas de page relatives à la source de données. |
Il convient de noter que ces listes de codes ne présentent que l'étiquette correspondant à chaque code. Pour de plus amples informations méthodologiques, y compris les définitions des principaux termes statistiques utilisés dans ILOSTAT, les descriptions détaillées des indicateurs et les normes statistiques, veuillez vous référer à la page des concepts et définitions.
Les deux répertoires de données [indicator] et [ref_area] comprennent une table des matières, disponible au format csv et en trois langues ('en' pour l'anglais, 'fr' pour le français et 'sp' pour l'espagnol). Ces tables des matières listent tous les fichiers de données disponibles pour le téléchargement dans le répertoire correspondant, et fournissent des informations sommaires sur chaque fichier de données.
La table des matières du répertoire [indicateur] liste tous les indicateurs disponibles, avec le libellé de l'indicateur et la fréquence des données.
La table des matières du répertoire [ref_area] liste toutes les zones de référence disponibles (pays, régions, groupes de pays), avec le label de la zone de référence et la fréquence des données.
Les deux tableaux indiquent la taille de chaque fichier de données, la période couverte par les données du fichier et la date à laquelle le fichier de données a été mis à jour pour la dernière fois. Comme les ensembles de données d'ILOSTAT comprennent des projections des principaux indicateurs du marché du travail, la période couverte par certains fichiers de données peut aller jusqu'en 2050. Les codes ou identifiants utilisés dans les tables des matières pour les indicateurs et les domaines de référence dans le premier champ ou la première colonne ('id') sont uniques et permettent d'identifier sans équivoque l'élément correspondant. Les deux tableaux suivants présentent des extraits des tables des matières des répertoires [indicateur] et [zone de référence].
Tableau 6. Extrait de 'table_of_contents_fr.csv' dans [indicateur].
Nom de la variable2utilisé également comme nom de liste de codes | Brève description |
id | Nom de fichier de l'ensemble de données |
indicateur | Code indicateur |
indicateur.label | Nom de l'indicateur, y compris des informations sur les variables représentées, les classifications utilisées (le cas échéant) et l'unité. |
freq | Code de fréquence (A, Q, M) |
étiquette freq. | Label de fréquence |
taille | Taille du fichier .csv.gz |
données.départ | Première période disponible dans la série de données |
données.fin | Dernière période de temps disponible dans l'ensemble de données |
dernière.actualisation | Dernière mise à jour du jeu de données (fuseau horaire Europe/Paris) |
n.records | Nombre d'enregistrements dans l'ensemble de données |
collection | Code de la collection |
collection.label | Collecte ou compilation de données dont les données sont issues, à partir de l'ensemble des différentes compilations de données réalisées par le BIT et diffusées dans ILOSTAT. |
sujet | Code matière |
sujet.étiquette | Comment l'indicateur est affiché sur le site web d'ilostat |
Tableau 7. Extrait du fichier "table_of_contents_fr.csv" dans [ref_area].
Nom de la variable3utilisé également comme nom de liste de codes | Brève description |
id | Nom de fichier de l'ensemble de données |
zone de référence | Indicatif régional de référence |
ref_area.label | Nom de la zone de référence, il peut s'agir de pays, de régions géographiques, de groupes de pays (par niveau de revenu ou autres) ou du monde entier. |
freq | Code de fréquence (A, Q, M) |
étiquette freq. | Label de fréquence |
taille | Taille du fichier .csv.gz |
données.départ | Première période disponible dans la série de données |
données.fin | Dernière période de temps disponible dans l'ensemble de données |
dernière.actualisation | Dernière mise à jour du jeu de données (fuseau horaire Europe/Paris) |
n.records | Nombre d'enregistrements dans l'ensemble de données |
groupe_géo | Code du groupe géographique |
groupe_geo.label | Nom du groupe géographique de la zone de référence |
revenu_groupe | Code du groupe de revenu |
revenu_groupe.label | Nom du groupe de revenu de la zone de référence |
Mises à jour
Toutes les informations stockées dans l'installation sont mises à jour une fois par semaine, chaque dimanche à 22h00 (fuseau horaire Europe/Paris). La procédure de mise à jour ne concerne que les jeux de données pour lesquels il existe de nouvelles données ou qui ont subi une modification ou un changement structurel.