Les chiffres étonnants du chômage...

Les chiffres, on leur fait dire ce qu'on quand on veut...

Pour celles et ceux qui suivent l'activité de mon site, vous savez que l'une des données que je mets régulièrement à jour depuis plus de 2 ans sur mon site est celle du chômage.
Avant, c'était mensuel et c'est désormais trimestriel, on voit moins bien les évolutions mais c'est comme ça, alors on fait avec, on s'adapte.

Aujourd'hui est tombée la publication des chiffres pour T1 2019 (1er trimestre 2019), j'ai donc récupéré les données et j'ai commencé à les ajouter dans mes bases. Au moment où j'ai commencé à les intégrer (c'est un traitement manuel), je me suis rendu compte que les chiffres que j'avais déjà dans mes bases pour T4 2018 ne collaient pas à ceux du T4 2018 du nouveau fichier publié ce jour... Lorsque j'ajoute ces données, je m'appuie toujours d'un contrôle visuel des données précédentes pour être sûr que je ne vais pas faire d'erreur. En général rien de flagrant, il pouvait arriver qu'il y ait de légères différences surement dues à des ajustements d'après publication, mais cette fois, c'était vraiment très différent sur tous les chiffres. Suffisamment pour que cela m'interpelle et que je regarde plus en détail.

Et bien, je n'ai pas été déçu, TOUS les trimestres jusqu'en 1996 ont été "ajustés". Je veux bien que le dernier trimestre soit ajusté, et encore, normalement une publication devrait être figée dans le marbre et les ajustements devraient être pris en compte sur le dernier trimestre, mais modifier tous les trimestres depuis 1996 c'est tout de même étrange, cela me fait penser à 1984 quand ils réécrivent les chiffres dans les archives...

Sur T3 2018 (il y a 6 mois donc) entre la dernière publication et celle d'aujourd'hui, il y a carrément 10 400 chômeurs de catégorie ABC qui ont disparus (voir image ci-dessous). A la dernière publication T3 2018 c'était 5 649 600 et dans la nouvelle publication c'est 5 639 200, soit 10 400 en moins que l'on a décompté 6 mois plus tard... 6 mois pour se rendre compte qu'il y en avait en trop ?

Illustration

Pour l'exemple ci-dessous, j'ai pris le 1er onglet (DEFM cat ABC_age) et pour que l'image ne fasse pas 3km de hauteur, j'ai pris la période qui va d'aujourd'hui (2019T1) à 2005T1, mais cela fluctue jusqu'en 1996. Cet exemple fonctionne pour les 11 onglets de chiffres du fichier Excel, tous les chiffres à quelques rares exceptions ont été modifiés.

(Au moment où j'écris ce post, le fichier 2019T1 est dispo ici, en revanche celui de la précédente publication 2018T4 n'est plus dispo sur le site, mais je l'avais dans mes archives)

Si on peut ajuster 3 mois après les données officiellement publiées (et pire encore, 23 ans après), il devient alors facile de donner des chiffres bas/haut, de dire que cela a baissé/augmenté (et bien sûr, chiffres que tous les médias vont marteler à longueur de journée le jour de la publication, comme c'était encore le cas aujourd'hui) et de "discrètement" les remonter/baisser 3 mois plus tard sans publicité aucune. Tout le monde aura retenu que le chiffre a baissé/augmenté de X% alors que 3 mois après, la réalité est inverse, moins ou plus. Le pire, c'est que le chiffre de la variation d'un trimestre à l'autre est déjà erroné et faux au moment de la publication car il ne sera plus le même dans 3 mois une fois les données modifiées.

En résumé

Ce qui me gêne dans cette histoire n'est pas le fait qu'il puisse y avoir un ajustement mais le fait que ces ajustements soient rétroactifs sur tout l'historique au lieu d'être pris en compte dans la nouvelle publication du nouveau trimestre. Ces chiffres, qu'ils soient à la hausse ou à la baisse sont claironnés dès leur publication comme une vérité absolue et, en réalité, ils sont tout sauf fiables car ils changeront dans 3 mois...

La vérité d'aujourd'hui ne sera pas la même dans 3 mois, mais personne n'ira fouiller dans le passé (le passé qui n'a pas été ré-écrit dans la nouvelle publication, le vrai passé qui se trouve dans les précédentes publications) car dans sa grande bonté, la nouvelle publication est fournie avec des chiffres du passé réajustés (sans notification).

J'aime bien être factuel et afficher des données propres, mais si l'historique change tous les 3 mois, je ne peux plus proposer quelque chose de factuel car cela fausse tous mes graphiques chaque trimestre et surtout quels chiffres prendre ? Les nouveaux modifiés ou garder les anciens pour essayer de rester cohérent ?
Je pense donc que je ne mettrai plus à jour ces données si elles ne sont pas figées dans le marbre au niveau de leur historique comme c'était le cas avant.

Sur ma page Facebook, on m'a remonté que "je confondais chiffres de L’INSEE et chiffres de pole emploi". Rien à voir, la source n'est pas en cause dans mon constat (et la source c'est http://www.pole-emploi.org/opendata/). Pas la peine de m'opposer un problème de forme quand je vous parle d'un souci de fond. 
Le souci c'est qu'une source officielle réécrit l'historique sur 23 ans tous les 3 mois. Comme si un chômeur inscrit en 1996, vu depuis 2019 ne serait plus chômeur à l'époque ou bien que quelqu'un qui n'était pas chômeur serait soudainement chômeur avec les nouveaux critères... 
Si cela ne vous choque pas tant mieux pour vous, moi cela me gêne de ne pas pouvoir me fier à des données officielles et publiques.

Pour finir, tous les médias à l'unisson ont répété que le taux de chômage a baissé, un record en 10 ans il paraît... Sauf qu'en 10 ans, le nombre de chômeurs a doublé et je ne suis pas certain qu'en 10 ans on ait eu 3 ou 4 millions d'habitants actifs en plus en France pour compenser tout ça... Mais ça c'est une autre histoire... (ouais je sais, les critères ont dû changer, pas la peine de m'expliquer comment ils ont fait :) )

Quelques liens :

Les chiffres du chômage sur le site Politologue

L'évolution de la population Française

Le site open data de Pole Emploi

EDIT 18/05/2019 : On m'a démandé de partager les fichiers excel que j'avais récupéré sur le site de pole emploi, les voici :

Séries_CVS_4eme_trimestre_2018.xlsx (272,99 kb)

Séries_CVS_1er_trimestre_2019.xlsx (271,23 kb)


Partager cette page :