Covid 19, épisode 9 : sur la mortalité, suite

J’avais indiqué dans un billet précédent, sur la base des chiffres diffusés par l’Insee, que l’épidémie ne se traduisait pas à la date du 16 mars par une surmortalité à l’échelle du pays. L’Insee vient de livrer les mêmes chiffres à la date du 23 mars, ce qui permet d’actualiser l’analyse. Il s’avère que le nombre de décès toutes causes confondues du 1er au 23 mars 2020 a dépassé le nombre observé en 2019 (40 684 contre 39 707), mais pas encore celui de 2018 (année caractérisée par un épisode de grippe long et virulent).

A l’échelle des départements, les choses évoluent également. Pour le montrer, j’ai rapporté le nombre de décès en 2020 au même nombre en 2019, afin d’identifier les départements connaissant une surmortalité. A la date du 16 mars, 24 départements connaissaient une surmortalité (dont 9 départements une surmortalité de plus de 10%). A la date du 23 mars, ce chiffre a doublé, 48 départements connaissent une surmortalité par rapport à 2019 (dont 16 de plus de 10%).

On ne peut cependant pas dire avec certitude que ces surmortalités sont liés à l’épidémie. Pour en juger un peu mieux, j’ai comparé la surmortalité calculée sur les données Insee aux chiffres de Santé publique France sur les décès cumulés en hôpitaux à la même date du 23 mars, afin de répondre à la question suivante : est-ce que les départements connaissant une surmortalité en 2020 par rapport à 2019 de plus de 10% (données Insee) sont ceux qui ont une part dans les décès liés au Covid 19 supérieure de plus de 10% à leur poids dans la population (données Santé publique France) ?

On obtient le tableau suivant :

Sur les 16 départements connaissant une surmortalité de plus de 10% d’après les données Insee, 11 en connaissent également une d’après les données Santé publique France (Haut-Rhin, Vosges, Aisne, Moselle, Bas-Rhin, Oise, Corse-du-Sud, Paris, Côte-d’Or, Hauts-de-Seine, Aude). Pour 5 départements, on a une surmortalité d’après les données Insee, mais pas d’après les données Santé publique France : c’est le cas de Mayotte, des Deux-Sèvres, de la Manche, de la Mayenne et des Yvelines. Le cas des Yvelines est cependant limite, car l’indice pour les données Santé publique France est proche du seuil de 10% (il est en fait de 7%). On trouve enfin 13 départements qui pèsent plus dans les décès en hôpital que dans la population (de plus de 10% je rappelle), sans que cela se traduise par une surmortalité de plus de 10% par rapport à 2019 d’après les données Insee. Pour 11 d’entre eux, cependant, on n’est pas loin du seuil de 10%, deux seulement ont une mortalité inférieure en 2020 à ce qu’elle était en 2019 (la Marne et la Saône-et-Loire).

Au final, il semble que les résultats issus des deux sources tendent à se rapprocher, et que l’on s’oriente vers une surmortalité liée à l’épidémie par rapport aux années précédentes, surmortalité qui touche cependant certains départements beaucoup plus que d’autres.

Covid 19, épisode 8 : une prévision du nombre de décès dans les Ehpad

Le gouvernement a annoncé un premier bilan très provisoire des décès dans les Ehpad, qui seraient de 884 France entière. Problème : de nombreux établissements n’ont pas remonté de chiffres. L’ARS (Agence Régionale de Santé) du Grand Est a de son côté avancé des chiffres précis sur son périmètre d’intervention (le recensement fait dans cette région la plus touchée de toutes semble être de meilleure qualité) : 570 décès en Ehpad ou structure similaire à l’échelle régionale, dont 314 dans le département le plus touché, à savoir le Haut-Rhin.

Je vous propose une estimation du nombre de décès à l’échelle nationale en m’appuyant sur le poids de Grand-Est et du Haut-Rhin dans les décès recensés par les hôpitaux et en l’appliquant au décès dans les Ehpad. Ce faisant, je fais l’hypothèse que la géographie des décès en Ehpad est la même que la géographie des décès en hôpitaux, ce qui n’est pas totalement aberrant.

Sur les 4 503 décès en hôpitaux recensés par Santé Publique France, 26,2% sont localisés dans le Grand Est, et 9,3% dans le Haut-Rhin à la date du 2 avril 2020. Si le chiffre de 570 décès en Ehpad dans le Grand Est est le bon, et que cette région pèse 26,2% des décès en Ehpad, alors le chiffre que l’on devrait observé France entière est de 570/26,2% = 2 179 décès. Si je m’appuie plutôt sur le poids du Haut-Rhin, le chiffre que l’on devrait observé France entière est de 314/9,3% = 3 383 décès.

Nous serions donc plutôt dans une fourchette comprise entre deux mille et trois mille cinq cents décès supplémentaires. Mais je précise que cela me semble être une estimation basse : si la géographie des décès en Ehpad diffère de celle des décès en hôpitaux, il y a de fortes chances que Grand Est et le Haut-Rhin, moins dense en Ehpad que les régions de l’ouest et du sud, pèsent moins que ce que je suppose…

Covid 19, épisode 7 : la géographie des Ehpad

Une des limites des statistiques publiées quotidiennement par Santé Publique France est qu’elles ne recensent que les décès en hôpitaux, ce qui conduit à sous-estimer la mortalité de l’épidémie, car l’on sait qu’il existe aussi de nombreux décès en Ehpad (Établissements d’hébergement pour personnes âgées dépendantes) ou en ville. Ce biais devrait être partiellement éliminé avec la publication des chiffres des Ehpad,  même si ce n’est pas simple, vu le nombre de structures (près de 7 500).

Dans l’attente, je vous propose quelques éléments d’analyse de la géographie des personnes âgées, les plus exposées à l’épidémie, et des structures d’accueil. Pour cela, j’ai collecté des chiffres sur la population par tranches d’âge des départements en janvier 2020, ainsi que des chiffres sur les établissements d’accueil des personnes âgées (qui datent de 2017).

Premiers éléments de cadrage : on compte en France métropolitaine 26,6% de personnes de 60 ans et plus, et 9,5% de personnes de 75 ans et plus au 1er janvier 2020. Ces proportions varient cependant selon les départements, entre 6% pour le Val d’Oise ou la Seine et Marne à 15% pour le Lot ou la Creuse s’agissant des 75 ans et plus, soit un rapport de 2,5 pour 1 environ, et entre 19% et 39% (pour les mêmes départements) pour les plus de 60 ans.

J’ai construit une première carte qui représente à la fois la part des personnes de plus de 75 ans dans la population et le nombre de décès par département recensés par Santé publique France dans cette même population.

La géographie des décès et celle des personnes âgées sont pour l’instant très dissemblables, les décès se concentrant à l’est du pays, les personnes âgées étant plus présentes (en % de la population) à l’ouest et au sud.

S’agissant des structures d’accueil pour personnes âgées, l’Insee distingue les Ehpad, les maisons de retraite non Ehpad, les résidences autonomie, ainsi que le nombre de places en soins infirmiers à domicile et le nombre de lits en soin longue durée. On dénombre au total, France entière, fin 2017, plus de 600 000 places en Ehpad et près de 900 000 places toutes structures confondues. Je me concentre sur les places en Ehpad.

On constate que le nombre de places par habitant est assez bien corrélée au nombre de personnes de 75 ans et plus :

La relation est bonne, mais elle n’est pas parfaite : le « taux d’équipement » en Ehpad varie ainsi de 41 places pour mille personnes de 75 ans et plus à Paris à 169 places pour mille en Lozère. Ces différences ne sont cependant pas si simples à expliquer : certains départements, notamment dans le pourtour méditerranéen, ont des taux d’équipements en apparence faibles (74 pour mille dans le Var, 76 pour mille dans le Vaucluse), non pas parce qu’il y a peu de structures, mais parce qu’il y a une proportion encore plus forte, relativement à la moyenne, de personnes de 75 ans et plus. Dans d’autres cas, le taux d’équipement est fort car la construction d’hébergements pour personnes âgées a été vu comme un vecteur de développement économique local (en ex-Limousin par exemple).

Toujours est-il que la carte des places en Ehpad diffère un peu de la carte des personnes de 75 ans et plus (j’ai représenté sur la carte le nombre de places en Ehpad, et ce nombre pour 1000 personnes de 75 ans et plus) :

Sur la base de cette géographie des personnes âgées et des Ehpad, on peut s’interroger sur ce que vont nous apprendre les chiffres sur les décès dans ces structures : vont-ils concerner prioritairement les régions les plus touchées de l’est du pays, ce qui signifierait que l’épidémie reste principalement cantonnées dans ces régions, et qu’il convient de tout faire pour qu’elle ne s’étende pas ? Va-t-on assister à l’inverse à un « rééquilibrage » géographique, qui signifierait que la diffusion de l’épidémie vers l’ouest et le sud a été plus forte que ce que l’on imagine ? Impossible de répondre pour l’instant, mais on comprend que la réponse est essentielle.

Covid 19, épisode 6 : la diffusion spatiale de l’épidémie

Billet important aujourd’hui, sur la question de la diffusion spatiale de l’épidémie. Je vous propose de comparer trois pays : l’Espagne, la France et l’Italie.

Pour cela, j’ai collecté les données sur le nombre de décès par région pour la période commune aux trois bases de données, à savoir la période allant du 18 mars au 29 mars 2020. J’ai également collecté les mêmes données à l’échelle des départements, pour la France.

J’ai ensuite calculé un indicateur synthétique de concentration spatiale de la population, d’une part, et des décès, d’autre part. Les valeurs de l’indicateur varient entre 1 en cas de concentration maximale et 100 en cas de concentration minimale.

Voici un premier tableau de résultat, je vous explique ensuite comment le lire :

J’obtiens pour la population espagnole un indice de 50 : cela signifie que tous se passe comme si la population espagnole était concentré dans 50% des régions d’Espagne. Pour les décès en Espagne à la date du 18 mars, l’indice est de 12 (tout se passe comme si 12% des régions étaient concernées par les décès). Il est beaucoup plus faible, ce qui signifie que les décès sont beaucoup plus concentrés géographiquement que la population. On peut rapporter les deux indices (50/12), on obtient alors les ratios de la quatrième ligne, soit 4,2 pour l’Espagne : les décès sont en gros 4 fois plus concentrés que la population.

Qu’observe-t-on comme principaux résultats ?

  • les populations des trois pays sont répartis de manière relativement similaires entre leurs régions (indices compris entre 50 et 60),
  • toujours pour les régions, les décès à la date initiale sont entre 3 à 5 fois plus concentrés que les populations,
  • A l ‘échelle des départements français, la concentration spatiale de la population est plus faible (indice de 63), celle des décès est beaucoup plus forte (indice de 7), soit une concentration des décès près de 9 fois supérieure à celle de la population,
  • à l’échelle des régions, la concentration spatiale des décès diminue de manière assez sensible pour la France et l’Espagne, même si ils restent plus de deux fois plus concentrés que la population. L’évolution pour l’Italie est beaucoup plus faible, la diffusion spatiale des décès est donc moins marquée pour ce pays, ce qui peut s’expliquer par un confinement pus précoce et, en apparence, relativement efficace,
  • L’évolution pour les départements français est la plus marquée de toute, bien plus marquée que pour les régions françaises : cela signifie que le mouvement dominant pour la France correspond à une diffusion interdépartementale mais infra-régionale de l’épidémie.

Pour compléter l’analyse, j’ai construit un graphique qui retrace les indices de concentration spatiale des décès pour les trois pays, en prenant la date du 18/03/2020 comme indice base 100, ce qui permet de visualiser le profil d’évolution de la géographie des décès. On obtient le graphique suivant :

On retrouve logiquement les mêmes résultats (diffusion plus marquée pour l’Espagne et la France, très faible diffusion pour l’Italie), avec cependant un profil différent pour l’Espagne (hausse continue) et la France (hausse jusqu’au 23/03/2020 puis stabilité).

Pour finir, j’ai cartographié les décès à l’échelle des départements français à 3 dates (18/03, 23/03, 29/03). Sont représentés les indices qui rapportent pour chaque département le poids dans les décès au poids dans la population.

Les départements en blanc sont ceux qui n’ont connu qu’un nombre très limité de décès, leur nombre diminue fortement, signe de la diffusion de l’épidémie : pratiquement tous les département sont désormais concernés, mais de manière très hétérogène. Pour l’instant, la diffusion a surtout opéré au sein des régions Grand Est, Haut-de-France, Ile-de-France et Bourgogne Franche-Comté.

Covid 19, épisode 5 : géographie américaine et espagnole

En complément de mon billet d’hier sur les cas français et italiens, je vous propose des résultats pour l’Espagne et les Etats-Unis. j’ai trouvé et récupéré les données sur le covid 19 pour l’Espagne ici, et les données sur la population par région sur Eurostat. Pour les Etats-Unis, les données sur le Covid 19 sont disponibles ici, celles sur la population par Etat par là.

J’ai procédé de la même façon qu’hier : calcul du poids des régions dans l’ensemble de la population, dans l’ensemble des décès, puis rapport des deux indicateurs pour obtenir un indice qui se commente par rapport à la valeur de 1 : une valeur de 2, par exemple, signifie que la région considérée pèse deux fois plus dans les décès que dans la population (surmortalité), une valeur de 0,5 qu’elle pèse deux fois moins (sousmortalité). Les tableaux sont présentés plus bas.

J’ai également calculé des indicateurs synthétiques de concentration spatiale, pour pouvoir comparer les pays, je détaille un peu car il y a un petit nouveau : comme hier, j’ai calculé le poids de la première région dans l’ensemble des décès, notons le C1. J’ai également noté le poids des deux premières régions, notons le C2. Pour les comparaisons France, Italie et Espagne, cela ne pose pas de problème majeur, car le nombre de régions est à peu près le même (18 pour la France, 19 pour l’Espagne, 21 pour l’Italie). Cela change avec les 51 Etats américains. J’ai donc calculé un indicateur synthétique de concentration permettant de neutraliser le biais éventuel, dérivé de ce que l’on appelle l’indice d’Herfindahl (que je note EH), qui se lit comme suit : il varie entre 1% (concentration géographique maximale) et 100% (concentration géographique minimale).

Voilà ce que l’on obtient pour les quatre pays, à la date du 28 mars 2020 :

Etats-Unis Espagne France Italie
Nombre décès              2 026              6 528              2 314            10 023
C1 35.9% 45.2% 32.5% 59.3%
C2 45.2% 66.0% 62.2% 72.7%
EH 12% 19% 26% 13%

La concentration est relativement forte dans tous les pays, les valeurs les plus élevées sont observées pour les Etats-Unis et l’Italie, la valeur la moins élevée pour la France. Si le confinement fonctionne correctement dans les différents pays, on peut peut-être espérer maîtriser plus facilement la pandémie. On comprend également la nécessité d’une régulation nationale de l’offre de soin.

Je continue avec la présentation détaillée des résultats, pour l’Espagne d’abord :

Région

part de la région dans l’ensemble de la population

(1)

part de la région dans l’ensemble des décès

(2)

indice

(2)/(1)

Andalucía 18.0% 3.2%    0.18
Aragón 2.8% 1.4%    0.51
Principado de Asturias 2.2% 0.6%    0.29
Cantabria 1.2% 0.4%    0.32
Ceuta 0.2% 0.0%    0.08
Castilla y León 5.1% 5.8%    1.13
Castilla La Mancha 4.3% 8.3%    1.90
Canarias 4.7% 0.6%    0.13
Cataluña 16.1% 18.8%    1.17
Extremadura 2.3% 1.5%    0.67
Galicia 5.8% 0.9%    0.16
Islas Baleares 2.5% 0.4%    0.18
Región de Murcia 3.2% 0.3%    0.10
Comunidad de Madrid 14.2% 47.2%    3.34
Melilla 0.2% 0.0%    0.08
Comunidad Foral de Navarra 1.4% 1.3%    0.93
País Vasco 4.6% 4.1%    0.87
La Rioja 0.7% 1.0%    1.56
C. Valenciana 10.6% 4.1%    0.39

Comme pour la France et l’Italie, on observe une forte concentration géographique des décès, dans la région de Madrid en l’occurrence. Les deux premières régions en nombre absolu (région de Madrid et Catalogne) concentrent 66% des décès. A noter que l’indice de la Catalogne n’est pas parmi les plus élevés (Castilla la Mancha et la Rioja la devancent), mais comme cette région est très peuplée, elle pèse plus dans le nombre absolu de décès.

Pour les Etats-Unis, on obtient ce tableau :

Etat

part de l’Etat dans la population (%)

(1)

Part de l’Etat dans les décès (%)

(2)

indice

(2)/(1)

New York 5.9% 35.9%                                     6.06
Louisiana 1.4% 6.8%                                     4.77
Washington 2.3% 9.3%                                     4.00
Vermont 0.2% 0.6%                                     3.12
New Jersey 2.7% 6.9%                                     2.55
Michigan 3.0% 5.5%                                     1.80
Connecticut 1.1% 1.6%                                     1.50
Georgia 3.2% 3.4%                                     1.05
Massachusetts 2.1% 2.2%                                     1.03
District of Columbia 0.2% 0.2%                                     0.92
Colorado 1.8% 1.5%                                     0.87
Delaware 0.3% 0.2%                                     0.83
Indiana 2.1% 1.5%                                     0.75
Mississippi 0.9% 0.6%                                     0.71
Oklahoma 1.2% 0.7%                                     0.61
Illinois 3.9% 2.3%                                     0.60
Nevada 0.9% 0.5%                                     0.53
Oregon 1.3% 0.6%                                     0.50
Wisconsin 1.8% 0.8%                                     0.47
South Carolina 1.6% 0.7%                                     0.47
California 12.0% 5.4%                                     0.45
Alaska 0.2% 0.1%                                     0.44
Pennsylvania 3.9% 1.7%                                     0.43
Florida 6.5% 2.7%                                     0.41
Idaho 0.5% 0.2%                                     0.36
Ohio 3.6% 1.2%                                     0.35
Arizona 2.2% 0.7%                                     0.33
Kentucky 1.4% 0.4%                                     0.33
Rhode Island 0.3% 0.1%                                     0.31
Arkansas 0.9% 0.2%                                     0.27
Missouri 1.9% 0.5%                                     0.26
Virginia 2.6% 0.6%                                     0.25
New Hampshire 0.4% 0.1%                                     0.24
Kansas 0.9% 0.2%                                     0.22
North Dakota 0.2% 0.0%                                     0.21
South Dakota 0.3% 0.0%                                     0.18
Texas 8.8% 1.5%                                     0.17
Nebraska 0.6% 0.1%                                     0.17
Tennessee 2.1% 0.3%                                     0.17
Iowa 1.0% 0.1%                                     0.15
Montana 0.3% 0.0%                                     0.15
Minnesota 1.7% 0.2%                                     0.14
Maryland 1.8% 0.2%                                     0.13
Alabama 1.5% 0.2%                                     0.13
Maine 0.4% 0.0%                                     0.12
New Mexico 0.6% 0.0%                                     0.08
North Carolina 3.2% 0.2%                                     0.08
Utah 1.0% 0.0%                                     0.05
Hawaii 0.4% 0.0%                                          –
West Virginia 0.5% 0.0%                                          –
Wyoming 0.2% 0.0%                                          –

L’Etat de New-York concentre près de 36% des décès, soit plus de 6 fois ce qu’il pèse dans la population. Les deux premiers Etats en nombre absolu concentrent 45,2% des décès. La Californie, avec 110 décès, arrive en 6ème position en nombre absolu, mais bien en deçà pour l’indice.

Un enjeu pour les prochains jours/semaines : la concentration géographique de l’épidémie va-t-elle se maintenir ou se réduire ? Je vous présenterai quelques éléments de réponse demain je pense, pour le cas français au moins.

Territoires zéro chômeur : rapport intermédiaire du Comité Scientifique

J’ai remis aujourd’hui à la Ministre du travail le rapport intermédiaire du Comité Scientifique d’évaluation sur l’expérimentation Territoires zéro chômeur de longue durée (TZCLD), vous pouvez le télécharger ici. Quelques précisions/compléments.

Quand j’ai été sollicité en 2016 pour présider le comité, j’ai tenu à ce qu’il soit composé de chercheurs de disciplines différentes (économie, sociologie, droit, géographie), et une fois le comité constitué, à ce que l’évaluation combine analyses quantitatives et analyses qualitatives. Le croisement des regards et la combinaison des méthodes a donné lieu à des échanges que j’ai trouvé particulièrement riches lors des réunions du comité.

Notre rapport intermédiaire se nourrit pour une part importante des travaux de terrain confiés à trois organismes (le consortium ASDOANSA, le CLERSE, KPMG), qui ont travaillé séparément sur quatre des dix territoires d’expérimentation. Nous mettons à disposition leurs rapports intermédiaires, j’encourage vivement les personnes intéressées par l’expérimentation à les lire, c’est tout sauf superflu.

Compte-tenu des premiers retours que j’ai pu avoir sur notre travail, j’aimerais que personne ne perde de vue que l’avis général du Comité Scientifique est favorable à la poursuite de l’expérimentation, ainsi qu’à son extension à des territoires suffisamment matures. Le fait que nous insistions dans notre rapport sur certains problèmes ne signifie pas que notre avis est négatif, l’intention est de porter à la connaissance des acteurs ces problèmes (dont certains ont commencé à être réglés sur les sites) pour qu’ils ne se reproduisent pas. C’est tout l’intérêt d’une démarche expérimentation-évaluation, précisément, que de repérer ce qui ne va pas et d’y remédier. Quand nous proposons ensuite une extension à des territoires suffisamment matures, c’est pour souligner l’importance, pour la réussite de l’expérimentation, de relations fluides et de qualité entre les institutions. Nous proposons également que les futurs territoires d’expérimentation indiquent clairement quels moyens humains et financiers ils souhaitent apporter, moyens indispensables à la réussite du projet selon nous, or je ne suis pas sûr que tous les territoires candidats (près de 200) en aient pleinement conscience.

Autre précision importante : le rapport  remis aujourd’hui est un rapport intermédiaire, le rapport final devant être livré d’ici l’été 2020. D’ici là, nous allons pouvoir approfondir certains points, notamment mieux comprendre quelles sont les caractéristiques/trajectoires passées des bénéficiaires de l’expérimentation, d’une part, et quel est l’impact territorial de l’expérimentation, d’autre part. Le premier approfondissement est essentiel, car il va permettre d’éclairer le point qui va sans doute faire le plus de buzz : il semble en effet que, contrairement à ce qui avait été anticipé, l’Etat économise moins que prévu en favorisant l’embauche de chômeurs de longue durée, car une part non négligeable des bénéficiaires de l’expérimentation ne touchait pas, avant entrée dans les entreprises à but d’emploi, d’allocations chômage ou de prestations sociales. Nous ne savons cependant pas pour le moment dans quelle mesure cela s’explique par du non recours, il est donc indispensable de le mesurer avant de dire qu’il y a ou non un problème éventuel de ciblage dans l’expérimentation. S’agissant de l’impact territorial de l’expérimentation, la deuxième vague d’enquête qui va être lancée auprès des habitants des territoires devrait permettre de le mesurer en partie. Affaire à suivre, donc.

Poitiers 2020 : saison 2, épisode 1 (les centres d’appels)

Poitiers est une ville qui vit pour une part importante de la fonction publique, quelle soit hospitalière (1er employeur : le CHU), territoriale (1er employeur : la ville de Poitiers) ou d’Etat (1er employeur : l’Université).

Si l’on regarde par exemple à l’échelle de l’Aire Urbaine le poids des 15 fonctions d’emploi rapporté au poids de ces fonctions France entière, ressortent les fonctions « administration publique » (indice de 1,4, c’est-à-dire que cette fonction pèse 40% de plus sur Poitiers que France entière, avec des effectifs au recensement 2014 de 14 107), « santé, action sociale » (indice de 1,2 ; effectifs de 13 363) et « éducation, formation » (indice de 1,2 ; effectifs de 6 856). L’agriculture s’intercale cependant avec un indice de 1,3 mais des effectifs plus faibles (2 228).

L’activité privée, pour autant, n’est pas absente. Notamment les activités des centres d’appels, d’où ce billet.

Pour évaluer le poids de cette activité, j’ai exploité les données Acoss (qui recensent l’ensemble des emplois privés hors agriculture) par zones d’emploi, dans le découpage sectoriel le plus fin disponible, la NAF 732. Il s’avère que le secteur privé qui emploie le plus de personnes sur la zone d’emploi de Poitiers est précisément le secteur « activités de centres d’appels », avec, en 2017, 2 640 personnes qui y travaillent. Cela représente 3,4% de l’ensemble de l’emploi privé de la zone.

Est-ce beaucoup ? Oui : France entière, ce secteur représente 0,29% de l’ensemble de l’emploi privé, dès lors, ce secteur pèse près de 12 fois plus sur Poitiers que ce qu’il pèse France entière.

On peut même regarder en valeur absolue pour se rendre compte de son importance : la zone d’emploi qui emploie le plus dans ce secteur, c’est logiquement Paris (qui pèse 25% de l’ensemble des emplois, cela n’a donc rien de surprenant), avec 6 096 emplois recensés. En 2ème position, arrive la zone d’emploi de … Poitiers. Devant Lens-Hénin (2 584), Lille (2 152), Bordeaux (2 066) et Marseille-Aubagne (1 596).

Je signale en passant que ce chiffre de 2 640 pour Poitiers ne capture qu’une partie des emplois des centres d’appels, ceux des entreprises enregistrées dans ce secteur, qui correspondent donc à ce que l’on appelle des centres d’appels externalisés. On trouve sur la zone également des centres d’appels internalisés, comptabilisés dans les effectifs des secteurs auxquelles appartiennent les entreprises en question, et j’en connais un certain nombre.

L’essentiel des emplois de ce secteur sont localisés sur la zone du Futuroscope, à proximité immédiate de Poitiers. Un nombre non négligeable de salariés réside sur Poitiers et travaille au Futuroscope, ce qui génère un flux lui-même non négligeable de déplacement domicile-travail, matin et soir.

La zone du Futuroscope, présentée par nombre de politiques comme une technopole —une sorte de Silicon Valley picto-charentaise— est donc avant tout dominée par cette activité, ce qui n’est ni bien, ni mal : c’est un fait.

Pour ceux qui pensent que ce secteur n’a pas d’avenir en France, je signale en passant que c’est l’un des secteurs les plus dynamiques en termes de création d’emploi, avec un taux de croissance de 31% entre 2007 et 2017 (dynamique plus faible sur la zone d’emploi de Poitiers : +6%).

Or : je crois que je n’ai jamais entendu un politique, quel que soit son bord, parler de ce secteur, ni des milliers de poitevins qui y travaillent (je prends tout élément de preuve permettant de me contredire). C’est pourtant l’activité privée phare du territoire.

D’autant plus que ce secteur, à l’image plutôt calamiteuse, est beaucoup plus hétérogène et complexe qu’on l’imagine. Nous avions travaillé dessus il y a quelques années, pour montrer notamment que l’idée que cette activité allait connaître un processus massif de délocalisation ne résistait pas à l’analyse (l’article est visible ici).

Elle fait sans doute moins rêver les politiques que les activités dites de haute technologie, ou les « startups », ou que sais-je encore, mais elle est là, et fait vivre de nombreuses personnes. S’intéresser à son fonctionnement, sa dynamique, aux salariés qui y travaillent, à comment ils se sentent, à leurs pratiques de déplacements, aux problèmes éventuels qu’ils rencontrent et/ou que rencontrent les entreprises, etc., me semble donc important, pour ne pas dire indispensable.

Et si l’on regardait aussi ce qui se passe hors métropole, sans préjugé ?

Petit billet auto-centré, un brin narcissique, suite à une interview réalisée en novembre dernier, en amont d’une conférence lors du lancement d’un nouveau programme du PUCA (Plan Urbanisme, Construction, Architecture), intitulé POPSU-Territoires. Passons sur les acronymes : l’idée est de regarder ce qui se passe sur des territoires qualifiés de « petites villes », en soutenant différents programmes de recherche-action, car il s’y passe des choses intéressantes. Je vous poste la vidéo ci-dessous (pour info, j’ai créé une page sur mon blog avec quelques interviews, courtes et moins courtes, auxquelles j’ai pu me livrer, cf. l’onglet en haut de la page).

Vous trouverez les interviews d’autres intervenants ici.

Teasing : je finalise actuellement un petit livre que le PUCA devrait éditer, qui reprend et développe ce que j’ai dit lors de la conférence. Une invitation à sortir du récit métropolitain pour proposer un autre récit territorial, mieux compatible avec les faits et les chiffres dont on dispose. Car l’enjeu, me semble-t-il, est de sortir de représentations, parfois calamiteuses, potentiellement performatives, pour tenter d’approcher une forme de vérité.

Les approximations de l’Insee : nouvel épisode

Dans mon dernier billet, j’ai analysé une note de l’Insee relative à l’évolution de la population par commune de 2011 à 2016 et à la façon (erronée) dont la presse s’en est fait l’écho. Une des critiques essentielles adressées à l’Insee portait sur les limites des comparaisons de moyenne par catégorie de territoire, qui masquent l’hétérogénéité au sein de chaque catégorie.

Je découvre aujourd’hui une nouvelle note de l’Insee, sur le même jeu de données mais sur un autre découpage géographique par EPCI (Etablissements Publics de Coopération Intercommunale), parmi lesquels on distingue les métropoles (ME) au nombre de 22, les Communautés Urbaines (CU) au nombre de 11, les Communautés d’Agglomérations (CA) au nombre de 221 et les Communautés de Communes(CC) au nombre de 1005, soit 1259 EPCI au total.

Cette nouvelle note est titrée « Démographie des EPCI : la croissance se concentre dans et au plus près des métropoles ». On y trouve des choses intéressantes (notamment les cartes), mais aussi, hélas, toujours les mêmes erreurs et approximations, qui conduisent à des conclusions contestables. Comme les données utilisées par l’Insee sont mises en ligne en annexe du document, j’ai pu me livrer à quelques traitements. Je vous propose de me concentrer sur un point pour illustrer mon propos : la comparaison par catégories d’EPCI du taux de variation annuel de la population sur la période 2011-2016, résumée notamment par le graphique ci-dessous.

(Il y aurait encore une fois des choses à dire pour éviter toute mauvaise interprétation : les métropoles dont il s’agit sont les métropoles instituées par la loi, qui ont peu à voir avec les métropoles au sens des économistes ou des géographes. On notera également que pour ceux qui considèrent que la seule vraie métropole française (au sens de Saskia Sassen par exemple), Paris, ne va pas très bien si l’on en juge par l’indicateur retenu, mais cet indicateur a-t-il seulement du sens ? Je passe).

Le cœur de mon propos est le suivant : une fois encore l’Insee propose des comparaisons de moyenne, mais oublie de s’interroger sur la dispersion au sein de chaque catégorie, que l’on peut mesurer par exemple par l’écart-type. Terme étrange pour beaucoup, mais finalement assez simple, qui correspond  à la moyenne des écarts à la moyenne : un écart-type important signale que c’est un peu le bazar au sein de la catégorie, un écart-type faible que c’est plutôt homogène (exemple pédagogique : pour une classe de lycée où tous les élèves ont 10 à une épreuve, la moyenne de la classe sera de 10 et l’écart-type de 0 ; pour une classe où la moitié des élèves a zéro et l’autre moitié a 20, la moyenne sera toujours de 10, mais l’écart-type sera de 10. Vous conviendrez que ces deux classes diffèrent sensiblement, ce que la moyenne ne montre pas, puisqu’elle est identique dans les deux cas). C’est vraiment facile de calculer ces écarts-types, voilà ce que ça donne.

Tableau 1 : moyenne et écart-type des taux de croissance de la population des EPCI, 2011-2016, non pondérés

EPCI Moyenne Ecart-type Nombre
CC          0.25          0.75        1 005
CA          0.36          0.64           221
CU          0.27          0.43             11
ME          0.60          0.55             22
Total          0.27          0.73        1 259

La moyenne simple des Métropoles est effectivement sensiblement supérieure à celle des autres catégories d’EPCI, mais l’écart-type de 0,55 est loin d’être négligeable, il est notamment supérieur à celui des Communautés Urbaines, qui sont donc moins hétérogènes. Réciproquement, pour les CC et les CA, l’importance des écarts-types suggère que si, en moyenne, leur croissance est plus faible, certaines présentent des taux de croissance très forts (bien plus forts que les plus dynamiques des ME en vérité) et d’autres très faibles. Dès lors, il n’est pas possible d’avancer une proposition générale du type « les métropoles sont plus dynamiques que les autres catégories de territoires », puisque cela dépend desquelles, idem pour chacune des catégories retenues, d’ailleurs.

On peut aller plus loin dans l’analyse, en faisant un peu d’économétrie, ce que tous les statisticiens de l’Insee savent faire, et sans doute mieux que moi, si bien que je me demande pourquoi ils ne le font pas. Plutôt que de calculer des moyennes par catégorie d’EPCI, il s’agit par exemple de procéder à des comparaisons de moyenne non pas par grande catégorie, mais en régressant le taux de croissance de la population 2011-2016 de chaque EPCI sur la catégorie à laquelle elle appartient. Ceci permet de savoir si les différences de moyenne observées entre catégories sont statistiquement significatives.

Je me suis livré à cet exercice et la conclusion est implacable : les différences de moyenne ne sont pas statistiquement significatives. Par rapport à la catégorie de référence « Communautés d’Agglomération », seule la catégorie « Communautés de Communes » présente un coefficient significativement plus faible et encore, loin du seuil de 1%. Pas de différence statistiquement significative aux seuils de 1, 5 ou 10%, en revanche, entre CA, CU et ME. On note de plus que cette typologie en EPCI n’explique quasiment rien des différences géographiques de taux de croissance, le R² étant de moins de 0,5% (ce qui signifie que cette typologie explique seulement 0,5% des différences observées, que donc d’autres choses en expliquent… 99,5%).

Pour les initiés, voici le tableau de résultat :

variable expliquée : taux de croissance 2011-2016 de la population par EPCI, données Insee

Coefficient écart-type t P>t
CA référence
CC –            0.11              0.05 –            1.99              0.05
CU –            0.08              0.22 –            0.37              0.71
ME              0.25              0.16              1.53              0.13
Constante              0.36              0.05              7.28                   –

Compte-tenu des données disponibles, on peut s’amuser à procéder à d’autres estimations. Si l’on régresse les taux de croissance non plus sur les catégories d’EPCI mais sur les populations de 2011, pour identifier un éventuel effet taille initiale de la population, on aboutit à la même conclusion : le modèle global est très mauvais (R² inférieur à 0,5%) et le coefficient associé à la taille initiale n’est pas significatif au seuil de 1%.

Comme on dispose également du département d’appartenance de la commune la plus peuplée de chaque EPCI, j’ai régressé les taux de croissance des EPCI sur ces départements. Cette fois les choses s’améliorent, le R² monte à 40% environ. Je pense que si l’on agrégeait par région, cela s’améliorerait encore un peu, car, comme les cartes le montrent, on voit bien que les dynamiques de population sont macro-régionales, avec un avantage aux territoires de l’Ouest et du Sud.

Je réitère donc mon conseil à l’Insee : présentez dans vos documents les écarts-types, et procédez en amont de vos commentaires à quelques régressions. Vos documents sont « grand public », ces calculs n’ont sans doute pas vocation à y figurer, mais cela vous permettrait de ne pas dire n’importe quoi, dans vos commentaires.

Les journalistes racontent n’importe quoi (mais c’est un peu la faute de l’Insee)

L’Insee vient de publier les chiffres de la population 2016 par commune et en a profité pour mettre en ligne une étude France entière et des études par région sur l’évolution de la population 2011-2016, comparée à la période 2006-2011. L’étude France entière s’intitule « Entre 2011 et 2016, les grandes aires urbaines portent la croissance démographique française », vous la trouverez ici.

La presse s’en est fait l’écho, et le moins qu’on puisse dire, c’est que certains racontent n’importe quoi. Mon sentiment : c’est en partie la faute de l’Insee et en partie en lien avec le déficit de formation en statistique des journalistes. La prise de Came ne doit pas être totalement étrangère au problème, également.

Reuters, les métropoles et les grandes aires urbaines : un problème de vocabulaire

Premier exemple, un article de Reuters intitulé « Les métropoles polarisent la population mais Paris se vide », où l’on peut lire ceci :

En écho au mouvement des “Gilets jaunes” parfois présenté comme la confrontation entre la France rurale et des villes petites et moyennes et celle des grandes métropoles, cette étude souligne que la croissance des grandes aires urbaines a porté la croissance démographique de la France entre 2011 et 2016.

Où est le problème ? Dans le vocabulaire. L’Insee brasse des statistiques par aire urbaine (771 France entière) et distingue, parmi elles, les grandes aires urbaines, dont vous trouverez la définition, plutôt complexe, ici : « un ensemble de communes, d’un seul tenant et sans enclave, constitué par un pôle urbain (unité urbaine) de plus de 10000 emplois, et par des communes rurales ou unités urbaines (couronne périurbaine) dont au moins 40 % de la population résidente ayant un emploi travaille dans le pôle ou dans des communes attirées par celui-ci ».

Reuters considère que grande aire urbaine = métropole. Peut-on vraiment les en blâmer ? Sans doute pas, d’où mon sentiment que l’Insee, pour le coup, est fautif. En effet, les grandes aires urbaines sont au nombre de 241. On y trouve Paris, Lyon et Marseille, bien sûr, mais aussi Ancenis (10 000 habitants), les Herbiers (19 000), Figeac (26 000), etc. Bref, beaucoup de villes que la plupart d’entre vous considèrent, à juste titre, comme moyennes voire petites.

Elles concentrent 78% de la population en 2016 d’après les chiffres de l’Insee. On trouve en leur sein, comme précisé dans la définition, de nombreuses communes rurales, si bien qu’avoir choisi le terme d’aires urbaines pour parler de territoires composés en partie d’espaces à faible ou très faible densité, c’est moyen… Cela laisse penser que le « rural » se réduit à peau de chagrin (4,5% de la population hors influence des aires urbaines si l’on retient la typologie de l’Insee), ce qui est pour le moins contestable, comme expliqué en détail ici.

Les statistiques, la Croix et la bannière

Deuxième exemple, un article de la Croix intitulé « La banlieue attire de moins en moins d’habitants », où l’on peut lire en sous-titre de la photo « les périphéries des grandes villes se vident au profit des « grands pôles urbains » de plus de 300 000 habitants » et dans le corps du texte : « les villes de banlieues attirent de moins en moins, au profit des centres-villes… qui se repeuplent » [Edit 29/12 : le journaliste de la Croix m’a écrit pour m’indiquer qu’il avait modifié la légende de la photo suite à la lecture de mon billet].

Petite devinette pour comprendre l’erreur : Pierre et Jacques font la course, qui consiste à faire deux fois le tour d’un stade. Pierre va beaucoup plus vite que Jacques lors du premier tour de piste (disons 4 fois plus vite). Lors du deuxième tour, Pierre ralentit alors que Jacques maintient son allure, de telle sorte que maintenant, Pierre ne court pas 4 fois plus vite que Jacques, mais seulement deux fois plus vite. Question : lors du deuxième tour, qui va plus vite, Pierre ou Jacques ?

Question stupide, n’est-ce pas ? Pas tant : les journalistes de la Croix se sont plantés dans la réponse, en tout cas. Ce que montre l’Insee, en effet, ce n’est pas que les grands pôles urbains (les « centre-villes » pour la Croix) croissent plus vite que leur couronne (les « banlieues » pour la Croix), elles croissent toujours moins vite (0,4% pour les premières contre 0,8% pour les dernières), mais l’écart s’est réduit, le taux de croissance n’est plus que 2 fois supérieur, contre 4 fois supérieur entre 2006 et 2011 (0,3% contre 1,2%), d’où mon exemple. Donc affirmer que les périphéries se vident au profit des grands pôles urbains, comment dire…

Des commentaires moyens sur les moyennes

Le vocabulaire associé à la typologie de l’Insee me semble très critiquable, je l’ai dit. Le fait ensuite de comparer des moyennes par paquet d’aires urbaines l’est tout autant, car il masque l’hétérogénéité au sein de chaque catégorie.

Quand l’Insee affirme que les grandes aires urbaines portent la croissance de la population entre 2006 et 2011, c’est parce que cette catégorie a connu un taux de croissance de 0,5% en moyenne, contre 0,4% France entière. Sauf que les taux varient, au sein de cette catégorie, entre -1,6% et +2,6%.

Si l’on restreint aux 20 plus grandes aires urbaines, ce qui correspond sans doute mieux à ce que l’on pense être les « métropoles », idem, ça varie beaucoup, comme le montre ce graphique tiré du document :

Vous remarquerez que parmi les 20 plus grandes aires urbaines, 11 ont un taux de croissance de la population inférieur ou égal au taux de croissance France entière (0,4%)… (En complément, je me suis amusé, à partir des données mises en ligne, à tester le lien entre la taille des départements et leur taux de croissance, j’ai fait de même pour les 241 grandes aires urbaines, cela ne donne rien, on ne trouve pas d’effet taille).

Petite recommandation à l’Insee, de ce fait : quand vous présentez des moyennes dans un tableau, indiquez également l’écart-type. Faites des petits tests de comparaison de moyenne, également, pour éviter des commentaires trop rapides.

La Came, encore et toujours…

S’intéresser à la géographie des taux de croissance de la population n’est pas totalement inutile. Mais il faut toujours faire attention aux catégories et aux indicateurs que l’on utilise. A ce titre, ce que montrent avant tout les chiffres publiés par l’Insee, c’est qu’on retrouve plutôt des dynamiques macro-régionales, avec des territoires (grands, moyens et petits) dynamiques à l’Ouest et au Sud, et d’autres (grands, moyens et petits) moins dynamiques dans un grand quart Nord-Est. Quand l’Insee affirme ensuite que « la proximité d’une grande métropole favorise la croissance de population départementale », ça manque d’éléments de preuve : je ne suis pas sûr que la dynamique vendéenne soit lié à la proximité de Nantes, ni que la Haute-Savoie croisse en lien avec Lyon…

Mais même cet exercice de comparaison de taux de croissance est critiquable : plus ou moins consciemment, on considère qu’un territoire qui connaît une croissance de la population plus forte va bien, et que celui qui connaît une croissance plus faible va mal. Or, la croissance forte observée à Bordeaux, Nantes, Montpellier, …, n’est pas sans poser problème en terme d’effets de congestion et de montée du prix du foncier, je ne suis pas sûr qu’un territoire moins « dynamique » soit en plus mauvaise position et que sa situation soit moins enviable…

Comparer les taux de croissance, enfin, c’est considérer, là encore plus ou moins consciemment, que les territoires sont en concurrence les uns avec les autres dans le cadre d’une sorte de tournoi de foot. Or, ce n’est pas le cas, les territoires sont traversés par des processus socio-économiques, des interdépendances qui les dépassent, qu’il faut identifier, et s’interroger sur la façon de mieux régler les problèmes que cela pose.

Je fais le vœu que l’année 2019 soit sous le signe de la cohésion des territoires, plutôt que sous celui, calamiteux, de la concurrence entre eux. Cela passe par des réflexions sur la façon dont on les regarde, et sur les représentations qui sous-tendent notre regard.