© Mika Baumeister / Unsplash

Facilité de téléchargement en masse

Le service de téléchargement en masse permet d'accéder à des ensembles de données individuels ou à toutes les bases de données d'ILOSTAT. Les instructions d'utilisation du service se trouvent sous la liste des répertoires.

Annuaires

Sélectionnez un répertoire pour accéder aux fichiers. Les fichiers de donnéessont au format zippé csv (gz) et les fichiers de dictionnaire sont au format csv. Voir les directives ci-dessous.

INDICATEUR

Tableaux présentés par indicateur et par fréquence

REF_AREA

Tableaux présentés par zone de référence (par exemple, pays et régions) et par fréquence.

DIC

Dictionnaires pour les codes utilisés (c'est-à-dire, listes de codes)

Rilostat - Le paquet R d'ILOSTAT

La fonction de téléchargement en masse d'ILOSTAT est la base du paquet R d'ILOSTAT ("Rilostat"), qui a été conçu pour donner aux utilisateurs de données la possibilité d'accéder aux bases de données d'ILOSTAT, de rechercher des données, de réorganiser l'information selon les besoins, de créer des visualisations de données et de télécharger des données dans le format souhaité, le tout de manière programmatique et reproductible, avec la possibilité de réexécuter rapidement les requêtes selon les besoins. Pour plus d'informations, visitez la page web de R-ilostat.

Table des matières

Questions fréquemment posées

Tous les fichiers 'gz' peuvent être décompressés à l'aide de WinZip, 7zip, ou d'un logiciel statistique tel que R.

De nombreux programmes peuvent lire les fichiers csv, notamment les progiciels statistiques standard tels que R et STATA. Les applications de tableur, telles que Microsoft Excel, peuvent également ouvrir les fichiers csv. Néanmoins, essayer d'ouvrir des fichiers volumineux à l'aide d'Excel fera planter l'application. Notez que vous devrez peut-être indiquer la virgule comme séparateur de champ pour lire correctement le fichier.

Les listes de codes ne fournissent que l'étiquette correspondant à chaque code utilisé, sans inclure d'autres informations sur les concepts, les définitions ou les classifications. Celles-ci sont disponibles sur la page des concepts et définitions

Cela se produira pour les indicateurs et les zones de référence pour lesquels des projections sont disponibles. 

Utilisation de la fonction de téléchargement en masse

Vue d'ensemble

La facilité de téléchargement en masse contient des données, des métadonnées et de la documentation. Il s'agit notamment d'ensembles de données au format csv zippé, de "dictionnaires" pour les codes utilisés dans les fichiers csv et d'une version PDF de ces instructions. Les répertoires contenant les ensembles de données par indicateur (par exemple le taux de chômage par sexe et par âge) ou par zone de référence (abréviation de reference area, qui est l'unité géographique pertinente telle qu'un pays) présentent, en plus de tous les tableaux de données disponibles, une table des matières détaillant la liste des tableaux disponibles par indicateur ou zone de référence et la période couverte par les données correspondantes. Le tableau suivant résume le contenu et fournit une brève description de chaque élément.

Tableau 1. Contenu de l'installation

AnnuaireContenu
[indicateur]Tous les tableaux d'ILOSTAT présentés par indicateur et par fréquence
[ref_area]Tous les tableaux d'ILOSTAT présentés par domaine de référence et par fréquence
[dic]Dictionnaires de tous les codes utilisés (listes de codes)
BulkDownload_Guidelines.pdfDocumentation, y compris les directives et les instructions

Répertoires de données [indicateur] et [zone de référence].

Il existe deux répertoires de données différents, basés sur deux manières différentes de présenter les tableaux correspondants : en les organisant par "indicateur" (et fréquence) ou par "ref_area" (et fréquence). L'indicateur fait référence au titre de chaque tableau spécifique, y compris la variable représentée et les éventuelles ventilations utilisées pour celle-ci (par exemple, "la main-d’œuvre par sexe et âge ", " emploi par sexe et activité économique " et " taux de chômage par sexe, âge et zones rurales/urbaines " sont des indicateurs de l'ILOSTAT). La zone ref_area (de reference area) fait référence aux zones géographiques pour lesquelles des données sont disponibles. Étant donné que l'ILOSTAT inclut à la fois des données au niveau des pays et des estimations régionales et mondiales, la zone de référence peut se référer soit à des pays, soit à des régions (régions géographiques telles que l'Afrique, les Amériques ou les États arabes, groupes de revenus tels que les pays à faible revenu, ou autres groupes tels que les BRICS ou le G20), soit au monde dans son ensemble. Toutefois, il est important de noter que les estimations mondiales et régionales ne sont disponibles que pour certains indicateurs et que la plupart des ensembles de données ne comprennent donc que des données au niveau national. La fréquence indique si les différents points de données sont annuels, trimestriels ou mensuels.

Les répertoires de données, que ce soit par indicateur ou par ref_area, sont présentés au format csv sous forme de fichiers zip compressés ('gz'). Tous les fichiers 'gz' peuvent être décompressés à l'aide de WinZip ou 7zip. Pour plus d'informations sur les fichiers csv, voir la section suivante. Après avoir sélectionné une des deux approches proposées (tableaux par indicateur ou par zone de référence) en cliquant sur le nom du répertoire, vous pouvez accéder et télécharger les données souhaitées en cliquant sur le(s) nom(s) de code du(des) tableau(x) recherché(s).

Le répertoire [dic] fournit des dictionnaires de toutes les listes de codes nécessaires pour identifier l'indicateur ou le domaine de référence que vous recherchez. Pour référence, veuillez noter que les codes suivent tous la même structure. Le code de l'indicateur comprend, dans cet ordre :

  • code du sujet
  • code pour identifier l'indicateur dans ce thème
  • pannes ou "NOC" pour "no classification" s'il n'y a pas de panne.
  • unité de mesure
    • NB" pour les valeurs absolues ou les nombres
    • RT" pour les pourcentages ou les taux
  • fréquence
    • A pour les données annuelles
    • Q" pour les données trimestrielles
    • M" pour les données mensuelles

De même, les noms de code des dossiers par zone de référence font référence :

  • le pays (code pays ISO Alpha-3) ou la région (codes commençant par X) et
  • fréquence

Les deux tableaux présentés ci-après montrent le contenu des répertoires [indicator] et [ref_area], qui contiennent respectivement environ 500 et 700 jeux de données.

Tableau 2. Contenu de l'[indicateur]

FichiersContenu
table_des_contenus_frTable des matières en anglais
table_des_contenus_frTable des matières en français
table_des_contenus_spTable des matières en espagnol
EAP_TEAP_SEX_AGE_NB_A.csv.gzEnsemble de données contenant toutes les données annuelles disponibles sur le site la main-d’œuvre par sexe et par âge
EMP_DWAP_NOC_RT_A.csv.gzEnsemble de données contenant toutes les données annuelles disponibles pour le ratio emploi/population
......

Tableau 3. Contenu de [ref_area]

FichiersContenu
table_des_contenus_frTable des matières en anglais
table_des_contenus_frTable des matières en français
table_des_contenus_spTable des matières en espagnol
ABW_A.csv.gzEnsemble de données contenant toutes les données annuelles disponibles pour Aruba
ABW_M.csv.gzEnsemble de données contenant toutes les données mensuelles disponibles pour Aruba
......

Format des fichiers de données CSV

Les fichiers au format "csv" sont des fichiers stockant des informations tabulaires (qu'il s'agisse de chiffres ou de texte) sous la forme de texte brut, en tant que valeurs séparées par des virgules. En d'autres termes, les colonnes (ou champs) du tableau original sont séparées par des virgules, ce qui permet à chaque ligne du fichier de correspondre à un enregistrement de données (l'enregistrement de données peut donc consister en un ou plusieurs champs, séparés par des virgules). Ces fichiers peuvent être facilement et directement ouverts dans Excel. Dans les fichiers 'csv' d'ILOSTAT, la première ligne contient les en-têtes (des champs ou des colonnes). Les lignes suivantes présentent les enregistrements de données, composés de la clé de l'enregistrement (les "noms" des dimensions utilisées pour identifier chaque enregistrement, y compris la zone de référence, la source des données, les classifications utilisées, etc., se référant à tous les champs de "ref_area" à "time"), la valeur de l'observation ("obs_value") et toute autre métadonnée disponible (telle que la couverture géographique de la source ou les définitions spécifiques utilisées pour certains concepts, se référant à tous les champs de "obs_status" à "note_source"). Toutes les étiquettes correspondant aux noms de code utilisés comme en-têtes de champ dans les fichiers csv disponibles pour le téléchargement sont présentées dans le dictionnaire des listes de codes (fichiers [dic], voir la section suivante pour plus d'informations). Le seul nom de code non expliqué dans les fichiers [dic] est 'obs_value', qui correspond à
la valeur de l'observation.

Il n'existe pas de dictionnaire (ou de fichier 'dic') pour la dimension temps. La syntaxe des codes utilisés pour cette dimension est la suivante :

  • Données annuelles : YYYY où YYYY est l'année.
  • Données trimestrielles : YYYYQ où YYYY est l'année et Q est le trimestre (le numéro correspondant au trimestre de 1 à 4).
  • Données mensuelles : YYYYMM où YYYY est l'année et MM est le mois (le numéro correspondant au mois de 01 à 12).

Le format des nombres appliqué dans les fichiers ILOSTAT utilise un point comme symbole décimal ('.').

Répertoire de dictionnaires [dic]

Les listes de codes sont des ensembles prédéfinis de termes à partir desquels les concepts statistiques (caractéristiques statistiques des données) qui ont été codés prennent leurs valeurs. Toutes les listes de codes présentées dans ILOSTAT sont disponibles en trois langues ('en' pour l'anglais, 'fr' pour le français et 'sp' pour l'espagnol). Tous les fichiers de listes de codes d'ILOSTAT ont la même structure, composée de trois colonnes : le nom de la variable ou le code ('var_name'), l'étiquette de la variable ou la description du code ('var_label') et un numéro utilisé pour trier les informations dans le fichier ('var_sort'). Le tableau suivant donne un exemple de liste de codes ILOSTAT.

Tableau 4. Extrait du fichier 'indicator_fr.csv'.

IndicateurIndicateur.labelIndicateur.tri
GDP_211P_NOC_NBProduction par travailleur (PIB en dollars internationaux constants de 2011 en PPA) - Estimations et projections de l'OIT, nov. 2016 (unités)1
CPI_NCPI_COI_INIndice national des prix à la consommation (IPC) par COICOP (unités)2
.........

Les différentes listes de codes disponibles en anglais, français et espagnol dans le répertoire [dic] correspondent aux champs utilisés dans les fichiers csv téléchargés décrits dans la section précédente (à l'exception du champ 'obs_value' utilisé pour la valeur de l'observation et ne nécessitant pas de dictionnaire avec des étiquettes). Le tableau suivant énumère les listes de codes incluses dans le répertoire [dic].

Tableau 5. Extrait de 'indicator_fr.csv' dans [dic].

Nom de la variable1utilisé également comme nom de liste de codesBrève description
zone de référenceZone de référence - il peut s'agir de pays, de régions géographiques, de groupes de pays (par niveau de revenu ou autres) ou du monde entier.
sourceLa source spécifique des données, y compris des informations sur le pays ou la région pour lesquels elles sont utilisées et le principal type de source (recensement de la population, enquête la main-d’œuvre , dossiers administratifs, etc.
indicateurL'indicateur, y compris les informations sur les variables représentées, les classifications utilisées (le cas échéant) et l'unité.
sexeLa répartition par sexe et les éléments de cette répartition.
class1Toutes les classifications utilisées comme première ventilation dans les différents indicateurs disponibles (à l'exception de la ventilation par sexe, qui est traitée séparément) et les catégories ou postes de classification correspondants.
class2Toutes les classifications utilisées comme deuxième ventilation dans les différents indicateurs disponibles (à l'exception de la ventilation par sexe, qui est traitée séparément) et les catégories ou postes de classification correspondants.
obs_statusL'état des valeurs ou les indicateurs sur les valeurs, tels que les ruptures de série ou les valeurs provisoires.
note_classiqueMétadonnées et/ou notes de bas de page relatives aux classifications utilisées et aux catégories de classification spécifiques.
Indicateur de noteMétadonnées et/ou notes de bas de page relatives à l'indicateur.
note_sourceMétadonnées et/ou notes de bas de page relatives à la source de données.

Il convient de noter que ces listes de codes ne présentent que l'étiquette correspondant à chaque code. Pour de plus amples informations méthodologiques, y compris les définitions des principaux termes statistiques utilisés dans ILOSTAT, les descriptions détaillées des indicateurs et les normes statistiques, veuillez vous référer à la page des concepts et définitions

Les deux répertoires de données [indicator] et [ref_area] comprennent une table des matières, disponible au format csv et en trois langues ('en' pour l'anglais, 'fr' pour le français et 'sp' pour l'espagnol). Ces tables des matières listent tous les fichiers de données disponibles pour le téléchargement dans le répertoire correspondant, et fournissent des informations sommaires sur chaque fichier de données. 

La table des matières du répertoire [indicateur] liste tous les indicateurs disponibles, avec le libellé de l'indicateur et la fréquence des données. 

La table des matières du répertoire [ref_area] liste toutes les zones de référence disponibles (pays, régions, groupes de pays), avec le label de la zone de référence et la fréquence des données. 

Les deux tableaux indiquent la taille de chaque fichier de données, la période couverte par les données du fichier et la date à laquelle le fichier de données a été mis à jour pour la dernière fois. Comme les ensembles de données d'ILOSTAT comprennent des projections des principaux indicateurs du marché du travail, la période couverte par certains fichiers de données peut aller jusqu'en 2050. Les codes ou identifiants utilisés dans les tables des matières pour les indicateurs et les domaines de référence dans le premier champ ou la première colonne ('id') sont uniques et permettent d'identifier sans équivoque l'élément correspondant. Les deux tableaux suivants présentent des extraits des tables des matières des répertoires [indicateur] et [zone de référence].

Tableau 6. Extrait de 'table_of_contents_fr.csv' dans [indicateur].

Nom de la variable2utilisé également comme nom de liste de codesBrève description
idNom de fichier de l'ensemble de données
indicateurCode indicateur
indicateur.labelNom de l'indicateur, y compris des informations sur les variables représentées, les classifications utilisées (le cas échéant) et l'unité.
freqCode de fréquence (A, Q, M)
étiquette freq.Label de fréquence
tailleTaille du fichier .csv.gz
données.départPremière période disponible dans la série de données
données.finDernière période de temps disponible dans l'ensemble de données
dernière.actualisationDernière mise à jour du jeu de données (fuseau horaire Europe/Paris)
n.recordsNombre d'enregistrements dans l'ensemble de données
collectionCode de la collection
collection.labelCollecte ou compilation de données dont les données sont issues, à partir de l'ensemble des différentes compilations de données réalisées par le BIT et diffusées dans ILOSTAT.
sujetCode matière
sujet.étiquetteComment l'indicateur est affiché sur le site web d'ilostat

Tableau 7. Extrait du fichier "table_of_contents_fr.csv" dans [ref_area].

Nom de la variable3utilisé également comme nom de liste de codesBrève description
idNom de fichier de l'ensemble de données
zone de référenceIndicatif régional de référence
ref_area.labelNom de la zone de référence, il peut s'agir de pays, de régions géographiques, de groupes de pays (par niveau de revenu ou autres) ou du monde entier.
freqCode de fréquence (A, Q, M)
étiquette freq.Label de fréquence
tailleTaille du fichier .csv.gz
données.départPremière période disponible dans la série de données
données.finDernière période de temps disponible dans l'ensemble de données
dernière.actualisationDernière mise à jour du jeu de données (fuseau horaire Europe/Paris)
n.recordsNombre d'enregistrements dans l'ensemble de données
groupe_géoCode du groupe géographique
groupe_geo.labelNom du groupe géographique de la zone de référence
revenu_groupeCode du groupe de revenu
revenu_groupe.labelNom du groupe de revenu de la zone de référence

Mises à jour

Toutes les informations stockées dans l'installation sont mises à jour une fois par semaine, chaque dimanche à 22h00 (fuseau horaire Europe/Paris). La procédure de mise à jour ne concerne que les jeux de données pour lesquels il existe de nouvelles données ou qui ont subi une modification ou un changement structurel.

Pages connexes

Département des statistiques

A propos de nous

Découvrez le rôle du département des statistiques de l'OIT dans le domaine des statistiques du travail, et notamment ses contributions à les renforcement des capacités

Sophie Janotta / Pixabay

Blog

Découvrez les dernières tendances des statistiques du travail à l'aide des données d'ILOSTAT et obtenez un aperçu des questions méthodologiques.

Bernard Hermant / Unsplash

Sujets

Cette liste de sujets dans le domaine des statistiques du travail permet d'accéder à des informations statistiques, y compris des données, des méthodes, des publications et plus encore.

Défiler vers le haut
Skip to content