Calcul de la surmortalité en Avril 2020 (et tous les mois depuis 1982)
Les données des décès
Si vous suivez mes aventures depuis un moment, vous savez que l'une des données que je traite régulièrement est celle des décès. J'avais été tellement loin dans le traitement que j'en étais arrivé à proposer une calculateur d'espérance de vie.
Comme chaque mois, l'INSEE publie aux alentours du 10 du mois (avec un peu de retard ces 2 derniers mois) les données des décès du mois précédents (plus le reliquat du mois d'avant et des fois quelques lignes pour les mois précédents)
En général, à la publication, nous récupérons environ 85 à 90% des données du mois précédent, le complément sera avec la publication du mois suivant.
Chaque mois un fichier d'environ 10Mo est publié, ce mois-ci, il fait 13.5Mo. Il comprend donc le complément du mois de mars et une grosse partie du mois d'avril. Les données sont disponibles ici sur datagouv si vous voulez mettre le nez dans ces 25 millions de lignes (si vous aimez traiter des données, vous allez être servi).
La période que nous vivons actuellement avec le covid19 donne un intérêt supplémentaire à cette donnée, même si l'INSEE a ajouté un grooooooos disclaimer dans la description de sa publication sur datagouv pour expliquer que ce n'est pas une bonne idée d'utiliser ces données pour y voir clair au niveau du covid19... Ok, j'ai pris note et je tente quand même de faire quelque chose pour y voir clair à ma façon.
La publication des décès du mois d'avril 2020
70 943 lignes dans ce fichier, dont 6 373 pour le complément du mois de mars, 56 254 pour avril 2020 et le reste (8 316) sur les mois précédents (désolé je n'ai pas été voir jusqu'à ce niveau de détail pour voir où allaient ces lignes)
Le mois dernier, j'avais fait 2 nouvelles pages qui permettaient de voir l'évolution des décès (de tout un tas des façons) sur les 5 et 10 dernières années selon les graphiques.
Voici un aperçu avec la mise à jour des décès du mois d'avril :
L'évolution mois après mois des décès |
|
(La chute brutale est du au fait que nous n'avons pas encore toutes les données du mois d'avril au complet et il manque toujours massivement des données sur les derniers jours du mois précédents, c'est le temps que les données remontent à l'INSEE et qu'elles soient traitées puis partagées)
|
Avec ces graphiques, on peut déjà bien voir l'évolution que prennent les décès depuis le mois de mars comparativement aux années précédentes.
Surmortalité sur les mois de Mars et Avril
Avec cette publication, j'ai décidé de calculer moi-même les
surmortalités (on n'est jamais mieux servi que par soi même et mon côté Saint Thomas me pousse toujours à voir par moi-même)
J'ai donc eu l'idée de faire ressortir la
surmortalité par commune (Je ne crois pas me tromper en disant que l'INSEE propose ce genre de statistiques uniquement au niveau des départements, du moins publiquement)
Je ne vais pas prétendre avoir trouvé une formule magique et irréprochable dans 100% des cas, mais je pense avoir un bon équilibre qui a le mérite de voir où ça se passe.
Je suis donc parti du principe que pour avoir une bonne moyenne et une valeur propre à comparer pour à peu près toutes les communes de France, il fallait prendre un historique de 10 ans. Ne prendre que quelques années en incluant 2017 par exemple risque d'influencer de façon un peu trop biaisée la moyenne. De mon point de vue, le moyen d'avoir une valeur propre et proche de la réalité est de prendre la moyenne des 10 dernières années (si vous regardez les courbes dans les pages mentionnées dans le paragraphe précédent, je pense que vous comprendrez mieux si mon explication ne vous semble pas claire)
Voici donc à quoi ressemble le résultat par commune et département :
Les communes
Les départements
J'ai bien évidement fait la même chose pour les départements (tant qu'à faire, je n'allais pas m'arrêter en si bon chemin 😉)
Mois d'avril 2020
Mois de mars 2020
Mois de Janvier 2020
Pour vérifier que ma méthode de calcul ne fait pas n'importe quoi, voici à quoi ressemble la surmortalité en Janvier 2020 comparée aux mêmes mois des 10 dernières années. Comme vous pouvez le remarquer, aucune surmortalité en Janvier au niveau des départements. Avec un traitement manuel que j'avais fait à côté, au niveau national, j'avais un +0.87% de mortalité comparé à la moyenne des mois de janvier des 10 dernières années. CQFD
Surmortalité par département au mois de janvier 2020
Le mot de la fin
Vous l'aurez compris si vous avez lu tout ce billet, les données des décès du mois d'avril ne sont pas complètes et seront complétées avec les publications des mois suivants. Néanmoins, cela permet déjà de bien voir où les choses se passent.
Avec les prochaines publications qui contiendront des compléments de données pour le mois d'avril, certains départements en blanc en Avril 2020 pourront passer en jaune ou orange (mais aucun ne passera d'une couleur à blanc, seule certitude) et sur la carte des communes, certaines communes pourront apparaître alors qu'elles sont invisibles après mon filtrage aujourd'hui avec les données actuelles (là encore, aucune ne disparaîtra, seules de nouvelles communes pourront apparaître).
L'enseignement principal que je tire (à l'heure actuel) de mes travaux, c'est que le vrai point chaud du
Covid en France est
- surtout - en Île de France et dans l'Est.
Je pensais et espérais que ce travail m'apporterait des réponses et au final cela m'apporte d'autres questions...
Prochaine mise à jour avec les données du mois de mai 2020 vers +/- le 10 juin
A suivre...
Liens qui vous permettront de ne rien rater