Covid 19, épisode 6 : la diffusion spatiale de l’épidémie

Billet important aujourd’hui, sur la question de la diffusion spatiale de l’épidémie. Je vous propose de comparer trois pays : l’Espagne, la France et l’Italie.

Pour cela, j’ai collecté les données sur le nombre de décès par région pour la période commune aux trois bases de données, à savoir la période allant du 18 mars au 29 mars 2020. J’ai également collecté les mêmes données à l’échelle des départements, pour la France.

J’ai ensuite calculé un indicateur synthétique de concentration spatiale de la population, d’une part, et des décès, d’autre part. Les valeurs de l’indicateur varient entre 1 en cas de concentration maximale et 100 en cas de concentration minimale.

Voici un premier tableau de résultat, je vous explique ensuite comment le lire :

J’obtiens pour la population espagnole un indice de 50 : cela signifie que tous se passe comme si la population espagnole était concentré dans 50% des régions d’Espagne. Pour les décès en Espagne à la date du 18 mars, l’indice est de 12 (tout se passe comme si 12% des régions étaient concernées par les décès). Il est beaucoup plus faible, ce qui signifie que les décès sont beaucoup plus concentrés géographiquement que la population. On peut rapporter les deux indices (50/12), on obtient alors les ratios de la quatrième ligne, soit 4,2 pour l’Espagne : les décès sont en gros 4 fois plus concentrés que la population.

Qu’observe-t-on comme principaux résultats ?

  • les populations des trois pays sont répartis de manière relativement similaires entre leurs régions (indices compris entre 50 et 60),
  • toujours pour les régions, les décès à la date initiale sont entre 3 à 5 fois plus concentrés que les populations,
  • A l ‘échelle des départements français, la concentration spatiale de la population est plus faible (indice de 63), celle des décès est beaucoup plus forte (indice de 7), soit une concentration des décès près de 9 fois supérieure à celle de la population,
  • à l’échelle des régions, la concentration spatiale des décès diminue de manière assez sensible pour la France et l’Espagne, même si ils restent plus de deux fois plus concentrés que la population. L’évolution pour l’Italie est beaucoup plus faible, la diffusion spatiale des décès est donc moins marquée pour ce pays, ce qui peut s’expliquer par un confinement pus précoce et, en apparence, relativement efficace,
  • L’évolution pour les départements français est la plus marquée de toute, bien plus marquée que pour les régions françaises : cela signifie que le mouvement dominant pour la France correspond à une diffusion interdépartementale mais infra-régionale de l’épidémie.

Pour compléter l’analyse, j’ai construit un graphique qui retrace les indices de concentration spatiale des décès pour les trois pays, en prenant la date du 18/03/2020 comme indice base 100, ce qui permet de visualiser le profil d’évolution de la géographie des décès. On obtient le graphique suivant :

On retrouve logiquement les mêmes résultats (diffusion plus marquée pour l’Espagne et la France, très faible diffusion pour l’Italie), avec cependant un profil différent pour l’Espagne (hausse continue) et la France (hausse jusqu’au 23/03/2020 puis stabilité).

Pour finir, j’ai cartographié les décès à l’échelle des départements français à 3 dates (18/03, 23/03, 29/03). Sont représentés les indices qui rapportent pour chaque département le poids dans les décès au poids dans la population.

Les départements en blanc sont ceux qui n’ont connu qu’un nombre très limité de décès, leur nombre diminue fortement, signe de la diffusion de l’épidémie : pratiquement tous les département sont désormais concernés, mais de manière très hétérogène. Pour l’instant, la diffusion a surtout opéré au sein des régions Grand Est, Haut-de-France, Ile-de-France et Bourgogne Franche-Comté.

Covid 19, épisode 5 : géographie américaine et espagnole

En complément de mon billet d’hier sur les cas français et italiens, je vous propose des résultats pour l’Espagne et les Etats-Unis. j’ai trouvé et récupéré les données sur le covid 19 pour l’Espagne ici, et les données sur la population par région sur Eurostat. Pour les Etats-Unis, les données sur le Covid 19 sont disponibles ici, celles sur la population par Etat par là.

J’ai procédé de la même façon qu’hier : calcul du poids des régions dans l’ensemble de la population, dans l’ensemble des décès, puis rapport des deux indicateurs pour obtenir un indice qui se commente par rapport à la valeur de 1 : une valeur de 2, par exemple, signifie que la région considérée pèse deux fois plus dans les décès que dans la population (surmortalité), une valeur de 0,5 qu’elle pèse deux fois moins (sousmortalité). Les tableaux sont présentés plus bas.

J’ai également calculé des indicateurs synthétiques de concentration spatiale, pour pouvoir comparer les pays, je détaille un peu car il y a un petit nouveau : comme hier, j’ai calculé le poids de la première région dans l’ensemble des décès, notons le C1. J’ai également noté le poids des deux premières régions, notons le C2. Pour les comparaisons France, Italie et Espagne, cela ne pose pas de problème majeur, car le nombre de régions est à peu près le même (18 pour la France, 19 pour l’Espagne, 21 pour l’Italie). Cela change avec les 51 Etats américains. J’ai donc calculé un indicateur synthétique de concentration permettant de neutraliser le biais éventuel, dérivé de ce que l’on appelle l’indice d’Herfindahl (que je note EH), qui se lit comme suit : il varie entre 1% (concentration géographique maximale) et 100% (concentration géographique minimale).

Voilà ce que l’on obtient pour les quatre pays, à la date du 28 mars 2020 :

Etats-Unis Espagne France Italie
Nombre décès              2 026              6 528              2 314            10 023
C1 35.9% 45.2% 32.5% 59.3%
C2 45.2% 66.0% 62.2% 72.7%
EH 12% 19% 26% 13%

La concentration est relativement forte dans tous les pays, les valeurs les plus élevées sont observées pour les Etats-Unis et l’Italie, la valeur la moins élevée pour la France. Si le confinement fonctionne correctement dans les différents pays, on peut peut-être espérer maîtriser plus facilement la pandémie. On comprend également la nécessité d’une régulation nationale de l’offre de soin.

Je continue avec la présentation détaillée des résultats, pour l’Espagne d’abord :

Région

part de la région dans l’ensemble de la population

(1)

part de la région dans l’ensemble des décès

(2)

indice

(2)/(1)

Andalucía 18.0% 3.2%    0.18
Aragón 2.8% 1.4%    0.51
Principado de Asturias 2.2% 0.6%    0.29
Cantabria 1.2% 0.4%    0.32
Ceuta 0.2% 0.0%    0.08
Castilla y León 5.1% 5.8%    1.13
Castilla La Mancha 4.3% 8.3%    1.90
Canarias 4.7% 0.6%    0.13
Cataluña 16.1% 18.8%    1.17
Extremadura 2.3% 1.5%    0.67
Galicia 5.8% 0.9%    0.16
Islas Baleares 2.5% 0.4%    0.18
Región de Murcia 3.2% 0.3%    0.10
Comunidad de Madrid 14.2% 47.2%    3.34
Melilla 0.2% 0.0%    0.08
Comunidad Foral de Navarra 1.4% 1.3%    0.93
País Vasco 4.6% 4.1%    0.87
La Rioja 0.7% 1.0%    1.56
C. Valenciana 10.6% 4.1%    0.39

Comme pour la France et l’Italie, on observe une forte concentration géographique des décès, dans la région de Madrid en l’occurrence. Les deux premières régions en nombre absolu (région de Madrid et Catalogne) concentrent 66% des décès. A noter que l’indice de la Catalogne n’est pas parmi les plus élevés (Castilla la Mancha et la Rioja la devancent), mais comme cette région est très peuplée, elle pèse plus dans le nombre absolu de décès.

Pour les Etats-Unis, on obtient ce tableau :

Etat

part de l’Etat dans la population (%)

(1)

Part de l’Etat dans les décès (%)

(2)

indice

(2)/(1)

New York 5.9% 35.9%                                     6.06
Louisiana 1.4% 6.8%                                     4.77
Washington 2.3% 9.3%                                     4.00
Vermont 0.2% 0.6%                                     3.12
New Jersey 2.7% 6.9%                                     2.55
Michigan 3.0% 5.5%                                     1.80
Connecticut 1.1% 1.6%                                     1.50
Georgia 3.2% 3.4%                                     1.05
Massachusetts 2.1% 2.2%                                     1.03
District of Columbia 0.2% 0.2%                                     0.92
Colorado 1.8% 1.5%                                     0.87
Delaware 0.3% 0.2%                                     0.83
Indiana 2.1% 1.5%                                     0.75
Mississippi 0.9% 0.6%                                     0.71
Oklahoma 1.2% 0.7%                                     0.61
Illinois 3.9% 2.3%                                     0.60
Nevada 0.9% 0.5%                                     0.53
Oregon 1.3% 0.6%                                     0.50
Wisconsin 1.8% 0.8%                                     0.47
South Carolina 1.6% 0.7%                                     0.47
California 12.0% 5.4%                                     0.45
Alaska 0.2% 0.1%                                     0.44
Pennsylvania 3.9% 1.7%                                     0.43
Florida 6.5% 2.7%                                     0.41
Idaho 0.5% 0.2%                                     0.36
Ohio 3.6% 1.2%                                     0.35
Arizona 2.2% 0.7%                                     0.33
Kentucky 1.4% 0.4%                                     0.33
Rhode Island 0.3% 0.1%                                     0.31
Arkansas 0.9% 0.2%                                     0.27
Missouri 1.9% 0.5%                                     0.26
Virginia 2.6% 0.6%                                     0.25
New Hampshire 0.4% 0.1%                                     0.24
Kansas 0.9% 0.2%                                     0.22
North Dakota 0.2% 0.0%                                     0.21
South Dakota 0.3% 0.0%                                     0.18
Texas 8.8% 1.5%                                     0.17
Nebraska 0.6% 0.1%                                     0.17
Tennessee 2.1% 0.3%                                     0.17
Iowa 1.0% 0.1%                                     0.15
Montana 0.3% 0.0%                                     0.15
Minnesota 1.7% 0.2%                                     0.14
Maryland 1.8% 0.2%                                     0.13
Alabama 1.5% 0.2%                                     0.13
Maine 0.4% 0.0%                                     0.12
New Mexico 0.6% 0.0%                                     0.08
North Carolina 3.2% 0.2%                                     0.08
Utah 1.0% 0.0%                                     0.05
Hawaii 0.4% 0.0%                                          –
West Virginia 0.5% 0.0%                                          –
Wyoming 0.2% 0.0%                                          –

L’Etat de New-York concentre près de 36% des décès, soit plus de 6 fois ce qu’il pèse dans la population. Les deux premiers Etats en nombre absolu concentrent 45,2% des décès. La Californie, avec 110 décès, arrive en 6ème position en nombre absolu, mais bien en deçà pour l’indice.

Un enjeu pour les prochains jours/semaines : la concentration géographique de l’épidémie va-t-elle se maintenir ou se réduire ? Je vous présenterai quelques éléments de réponse demain je pense, pour le cas français au moins.

Covid 19, épisode 4 : une comparaison des géographies française et italienne

Petit billet pour explorer la géographie de l’épidémie de l’autre côté des Alpes, grâce à des données pour l’Italie disponibles ici.

Comme indiqué dans mon premier billet consacré au Covid 19, lorsque l’on brasse des données par territoire, il convient de rapporter le nombre de cas observés à la population pour neutraliser les différences de taille des territoires. J’ai donc récupéré les données sur les populations des régions italiennes sur Eurostat pour calculer le nombre de cas par habitant.

En rapportant les valeurs obtenues pour chaque région au résultat pour le pays dans son ensemble, on obtient un indice qui vaut 1 si la valeur de la région est la même que dans l’ensemble du pays, et une valeur supérieure à 1 si cette valeur est supérieure. Un indice de 2, par exemple, signifie que le ratio observé pour la région considérée est le double de celui observé en moyenne. Ou, dit d’une autre façon, que la région considérée pèse deux fois plus pour l’indicateur considéré que pour la population (c’est comme cela que je vais présenter les résultats). Je me concentre sur les données relatives aux décès cumulés observés à la date du 27 mars 2020.

Région part de la région dans la population nationale (%)
(1)
part de la région dans l’ensemble des décès (%)
(2)
indice

(2)/(1)

Lombardia 16.7% 59.1%                   3.5
Valle d’Aosta 0.2% 0.4%                   1.9
Emilia Romagna 7.4% 13.9%                   1.9
Marche 2.5% 3.7%                   1.5
Liguria 2.6% 3.6%                   1.4
P.A. Trento 0.9% 1.1%                   1.2
Piemonte 7.2% 6.2%                   0.9
P.A. Bolzano 0.9% 0.7%                   0.7
Veneto 8.1% 3.4%                   0.4
Friuli Venezia Giulia 2.0% 0.8%                   0.4
Abruzzo 2.2% 0.7%                   0.3
Toscana 6.2% 1.9%                   0.3
Molise 0.5% 0.1%                   0.2
Umbria 1.5% 0.2%                   0.2
Lazio 9.7% 1.3%                   0.1
Puglia 6.7% 0.8%                   0.1
Campania 9.6% 1.1%                   0.1
Sardegna 2.7% 0.2%                   0.1
Calabria 3.2% 0.2%                   0.1
Sicilia 8.3% 0.4%                   0.1
Basilicata 0.9% 0.0%                   0.0

La géographie de l’épidémie est fortement marquée, la Lombardie concentrant 59% des décès. Comme cette région concentre 17% des habitants, l’indice obtenu est de 3,5 : on observe 3,5 fois plus de décès dans cette région que ce que l’on observe pour l’Italie dans son ensemble.

L’Emilie-Romagne est dans une situation similaire (poids dans les décès supérieur au poids dans la population), mais moins marquée (indice « seulement » de 1,9). Le Piémont, en revanche, qui arrive en troisième position en termes de décès, présente un indice inférieur à 1.

En procédant de même à l’échelle des régions françaises, on obtient les résultats suivants :

Région part de la région dans la population nationale (%)
(1)
part de la région dans l’ensemble des décès

(2)

indice

(2)/(1)

Grand-Est 8.2% 32.9%                4.0
Corse 0.5% 1.0%                1.8
Bourgogne-Franche-Comté 4.1% 7.0%                1.7
Île-de-France 18.3% 29.0%                1.6
Hauts-de-France 8.9% 8.5%                0.9
Auvergne-Rhône-Alpes 12.0% 8.3%                0.7
Occitanie 8.8% 3.1%                0.3
Bretagne 5.0% 1.7%                0.3
Centre-Val de Loire 3.8% 1.3%                0.3
Provence-Alpes-Côte d’Azur 7.5% 2.4%                0.3
Pays de la Loire 5.7% 1.6%                0.3
Normandie 4.9% 1.2%                0.2
Nouvelle-Aquitaine 8.9% 2.1%                0.2
Martinique 0.5% 0.1%                0.1
Guadeloupe 0.6% 0.1%                0.1
Guyane 0.4% 0.0%                     –
La Réunion 1.3% 0.0%                     –
Mayotte 0.4% 0.0%                     –

Même si Grand Est concentre une part moins importante des décès que la Lombardie, son indice est encore supérieur. Les Hauts-de-France sont dans une situation similaire à celle du Piémont : nombre absolu de cas élevé mais, compte-tenu de la taille de cette région, l’indice reste inférieur à 1.

Dans le cas Italien comme dans le cas français, l’épidémie reste donc pour l’instant très concentrée géographiquement : 62% des décès sont situés dans les deux régions françaises les plus touchées (Grand Est et Ile-de-France), 73% dans le cas italien (Lombardie et Emilie-Romagne).

Covid 19, épisode 3 : sur la mortalité

Petit billet un peu glauque sur le nombre de morts dû à l’épidémie et sur la mortalité en général, afin de mettre en perspective et un peu à distance le décompte anxiogène assené chaque soir.

Première point sous forme de question : savez-vous combien de personnes décèdent en France, en moyenne, chaque jour ? En 2019, on comptait 612 000 décès, soit 1 676 décès par jour (source ici). Dans le même temps, on dénombrait 753 000 naissances, soit 2 063 par jour (source ici).

Deuxième point : à côté des chiffres publiés par Santé Publique France, l’Insee a décidé de publier chaque semaine le nombre de décès quotidien toutes causes confondues, et de le comparer aux mêmes chiffres de 2018 et de 2019 (voir ici). La première livraison couvre la période du 1er au 20 mars 2020 pour les annonces dématérialisées de décès (qui arrivent plus vite à l’Insee) et du 1er au 16 mars pour l’ensemble des décès (transmis par voie dématérialisée et par voie papier).

Je me concentre sur ces derniers chiffres. Ils montrent que, pour l’instant, l’épidémie ne se traduit pas, à l’échelle du pays, par une surmortalité comparativement à 2018 et à 2019 (à noter la mortalité sensiblement plus forte en 2018 qu’en 2019, ceci notamment en raison d’une épidémie de grippe plus virulente et plus longue) :

Je dis bien pour l’instant, car il semble que nous soyons encore éloignés du pic épidémique. Je dis bien, surtout, à l’échelle du pays, car les chiffres de l’Insee par département montrent que certains connaissent dès à présent un nombre de décès bien supérieur à celui des années précédentes.  Neuf départements connaissent ainsi un nombre de décès supérieur de 10% ou plus à celui de l’année passée :

Libellé

décès 2020

décès 2019 écart Ratio
Mayotte 42                    30                    12 1.4
Haut-Rhin 417                  302                  115 1.38
Corse-du-Sud 88                    67                    21 1.31
Deux-Sèvres 182                  143                    39 1.27
Creuse 82                    70                    12 1.17
Vosges 219                  189                    30 1.16
Aisne 286                  249                    37 1.15
Oise 339                  297                    42 1.14
Haute-Saône 105                    93                    12 1.13

Parmi ces départements, certains sont fortement impactés par l’épidémie, comme le Haut-Rhin (290 décès recensés par Santé publique France au 27 mars), l’Oise (66 décès) ou les Vosges (56 décès). Mais d’autres, en apparence, ne le sont pas, comme les Deux-Sèvres et la Creuse : aucun décès recensé par Santé publique France en Creuse, 2 dans les Deux-Sèvres, toujours à la date du 27 mars. Sans que l’on sache, pour ces deux derniers départements, si l’écart est dû à d’autres causes de mortalité, où à des décès liés au Covid 19 non recensés par Santé publique France.

Covid 19, épisode 2 : géographie des propriétaires de résidence secondaire

Suite à l’annonce du confinement, certains habitants de grandes villes sont allés se réfugier dans leur résidence secondaire. J’ai entendu hier sur les ondes Stéphane Richard, PDG d’Orange, indiqué que la population de Paris avait baissé de 17% suite à l’annonce, pendant que celle de l’Ile de Ré avait augmenté de 30% (chiffres obtenus à partir de données de téléphonie mobile, voir ici).

Ouest France s’en est fait l’écho hier, en indiquant que plus de 150 000 personnes sont venus se réfugier en Pays de la Loire, principalement en Loire-Atlantique et en Vendée, en précisant qu’il est “Impossible d’affirmer d’où viennent ces dizaines de milliers de personnes” (source ici).

En fait, si, on peut savoir assez bien d’où ils viennent, en ressortant une de mes cartes préférées, extraite d’un article de Berroir et al. (2017), ” les systèmes urbains français : une approche relationnelle”, Cybergéo, qui relie la localisation des résidences secondaires à la localisation des résidences principales de leurs propriétaires.

L’article présente la même carte en excluant Paris, qui montre qu’on peut croiser sur les plages vendéennes quelques touristes qui ne viennent pas d’Ile-de-France :

Il n’est donc pas exclu que la propagation du Covid 19 à venir soit en partie orientée par cette géographie des résidences secondaires…

Géographie du Covid 19

Petit billet sur la géographie régionale et départementale du Covid 19, suite à une insatisfaction avec la façon quotidienne de présenter les chiffres dans les médias, sous la forme du nombre absolu de personnes contaminées ou décédées. Ces nombres absolus ne sont pas satisfaisants, dès lors que la taille des entités analysées varient : on devrait logiquement observer un nombre plus grand de victimes dans une grande région, si l’épidémie touche de manière homogène tous les territoires.

Pour éviter ce biais, il convient de diviser le nombre de cas par la population du territoire, ce que je vous propose de faire. Plus précisément : j’ai rapporté le nombre de cas par habitant des régions au même ratio observé France entière. Dès lors, une valeur de mon indicateur de 1 signifie que le nombre de cas par habitant de la région en question est similaire au nombre de cas par habitant observé en moyenne en France ; une valeur supérieure à 1 que le ratio est supérieur, d’autant plus que la valeur est forte.

A ce “jeu”, la région Grand Est est sans surprise la plus touchée, avec un indice de 2,69 pour le nombre de personnes contaminées en date du 23 mars 2020, suivie de la Corse (1,89) et de l’Ile-de-France (1,67). La région capitale reste donc moins touchée que Grand Est, même si le nombre absolu de cas observés est plus élevé (6211 contre 4256). Les régions les moins touchées de France métropolitaines sont les Pays de la Loire (indice de 0,27) et la Nouvelle-Aquitaine (indice de 0,40).

J’ai reproduit l’exercice avec le nombre de décès, à l’échelle des départements : les plus touchés relativement à la moyenne sont le Haut-Rhin (indice de 16,04), le Territoire de Belfort (13,35) et les Vosges (6,94).

Le dernier exercice auquel je me suis livré consiste à repérer la géographie départementale des personnes de 60 ans et plus, considérées comme les plus vulnérables face à l’épidémie, car cette géographie est assez marquée : la part des 60 ans et + varie en France métropolitaine de 39,3% dans le Doubs à 19,3% dans le Val d’Oise.

La géographie des décès et la géographie des personnes de 60 ans et + diffèrent sensiblement. Il n’est pas exclu qu’elles se rapprochent à mesure que l’épidémie se propage, et que les données collectées soient de meilleure qualité (jusqu’à présent les décès en Ephad ne sont pas comptabilisés par Santé publique France, cela devrait être le cas à partir de la semaine prochaine si j’ai bien compris).