Le saviez-vous ? Les “aires d’attraction des villes” ne sont pas des aires d’attraction des villes…

L’Insee a proposé il y a quelques mois un nouveau zonage du territoire français en “aires d’attraction des villes”, qu’il vient de remobiliser pour distinguer différents types de territoires ruraux (le rural sous l’attraction d’une ville et le rural hors attraction d’une ville en quelque sorte, j’y reviens plus loin). Or, cela pose un problème particulièrement important : les aires d’attraction des villes, en effet, ne sont pas des aires d’attraction des villes.

Je précise le problème : l’Insee s’est appuyé sur un indicateur et des procédures de calcul pour définir un nouveau zonage du territoire, suite à quoi il a décidé de donner un nom à ce zonage. Or, il y a un écart abyssal entre ce qui est mesuré et le nom attribué.

Ceci est tout sauf neutre : une fois le zonage défini, ce que vont retenir la plupart des personnes, c’est le nom retenu, pas l’indicateur sous-jacent, ni la procédure de calcul. Si je vous dis par exemple que la commune où vous résidez est dans l’aire d’attraction de telle ville, vous allez imaginez des choses, cela va contribuer à forger vos représentations des territoires et des relations qu’ils entretiennent entre eux. Tiens, prenez quelques instants avant de poursuivre la lecture de ce billet : qu’est-ce que vous imagineriez de ce qu’il pourrait y avoir comme relations entre votre commune de résidence (où celle d’une de vos connaissances si vous résidez dans une “grande” ville) et la “grande” ville d’à côté, si je vous dis que votre commune de résidence (où celle de votre connaissance)  est dans l’aire d’attraction de cette ville ? Jouez le jeu vraiment… ça y est ? Bien, poursuivons.

En fait, si l’on commence à lire la définition des aires d’attraction des villes, on se rend compte que l’objectif initial de l’Insee est ambitieux et vise en effet à identifier ce que l’on pourrait bien appeler des “aires d’attraction des villes” :

L’aire d’attraction d’une ville est un ensemble de communes (…) qui définit l’étendue de l’influence d’un pôle de population et d’emploi sur les communes environnantes

Sauf que cela n’est pas simple à mesurer, car l’influence peut être multidimensionnelle : si vous avez vraiment joué le jeu, vous vous êtes peut-être dit que si votre commune est dite dans l’aire d’attraction de la ville d’à côté, c’est sans doute parce que beaucoup de personnes de votre commune vont y faire leur courses, ou vont y travailler, ou bien c’est là qu’ils se rendent pour aller au cinéma, ou pour pratiquer telle ou telle activité sportive, ou s’impliquer dans telle ou telle association,ou pour se soigner, ce genre de choses.

En fait non, trop compliqué à mesurer et on n’a pas toutes les données. Donc l’Insee s’est appuyé sur un seul indicateur : les mobilités domicile-travail. Une commune va être considérée comme appartenant à l’aire d’attraction d’une ville si 15% au moins des habitants de cette commune en emploi travaillent dans cette ville. C’est très bien précisé dans la définition de l’Insee, bien sûr, mais je ne pense pas que les journalistes ou les politiques qui vont mobiliser les études parlant d’aire d’attraction de telle ou telle ville vont prendre le temps de revenir à la définition :

L’aire d’attraction d’une ville (…) définit l’étendue de l’influence d’un pôle de population et d’emploi sur les communes environnantes, cette influence étant mesurée par l’intensité des déplacements domicile-travail (souligné par moi)

Premier problème, donc, la méthode retenue par l’Insee ne permet au mieux de ne mesurer qu’une seule chose : l’attraction éventuelle exercée par une ville sur des communes environnantes vis-à-vis de l’emploi. Oubliez donc l’idée que cela mesure l’influence de la ville sur les lieux où les gens vont faire leurs courses, vont au cinéma, pratiquent leurs loisirs, vont se soigner, … , ce n’est pas le cas.

Mais ce n’est pas le seul problème. Ce dont dispose l’Insee, ce sont de données sur les individus en emploi, la commune où il résident et la commune où ils travaillent. Comme expliqué plus haut, dès lors que 15% des individus de telle commune travaillent dans telle ville, on va rattacher la commune à la ville. Mais on ne sait absolument rien de la trajectoire de ces individus, des raisons qui font qu’ils habitent à tel endroit et qu’ils travaillent à tel autre. Pourtant, le terme retenu par l’Insee, celui “d’attraction”, n’est pas neutre : il sous-entend que les individus qui résident dans telle commune ont été attirés par la commune où ils travaillent, pour l’emploi. Or, on n’en sait rien, derrière un fait, “monsieur ou madame X réside à tel endroit et travaille à tel autre”, peut se cacher tout un ensemble d’histoires différentes.

Prenons l’exemple d’un jeune couple en fin d’études universitaires, qui réside sur Bordeaux (ou sur Toulouse, ou sur Poitiers, …, pensez à la ville que vous souhaitez). A la fin de leurs études, ils trouvent du travail dans leur commune de résidence. Quelques années plus tard, ils ont un enfant, leur logement est trop petit, ils veulent en changer pour un logement plus grand. Problème, les prix sont trop élevés sur Bordeaux, ils décident donc de louer ou d’acheter un logement dans une commune à distance de Bordeaux mais continuent d’y travailler. Supposons qu’ils soient assez nombreux dans le même cas dans leur nouvelle commune de résidence (allez, disons au moins 15% des personnes en emploi). Cette commune sera alors dite dans l’aire d’attraction de Bordeaux. Mais si on y réfléchit, et si cette petite histoire résume la tendance dominante, on ne devrait pas parler “d’aire d’attraction de la ville”, mais “d’aire de répulsion de la ville” (“d’aire de répulsion résidentielle de la ville” si on veut être plus précis)  : la ville n’a pas attiré pour l’accès à l’emploi, elle a repoussé pour l’accès au logement, en raison de prix trop élevés. Pourquoi l’Insee n’a pas choisi de baptiser son zonage “aire de répulsion des villes” ? Cela aurait été tout aussi cohérent (donc tout aussi réducteur et tout aussi trompeur).

On peut prendre une autre petite histoire : en fait, le couple dont je viens de parler avait les moyens d’accéder à un logement sur Bordeaux, mais ils avaient envie de s’installer à la campagne, dans une commune dite rurale, pour des raisons qui leur sont propres (et qui peuvent elles-mêmes être très diverses). Ils ont donc décidé d’y louer ou d’y acheter un logement. Idem, supposons que ce type de processus domine : on ne devrait pas parler d’aire d’attraction de la ville, mais “d’aire d’attraction du rural”, plus précisément “d’aire d’attraction résidentielle du rural”.

Le terme “aire d’attraction des villes” englobe en fait tous ces phénomènes, sans que l’on sache l’importance respective de chacun. On peut sans grand risque de se tromper se dire que ces différents processus sont à l’œuvre (la ville attire, la ville repousse, la campagne attire, la campagne repousse, du point de vue de l’emploi, ou du point de vue du travail) et que leur importance relative est sans doute variable dans le temps et dans l’espace. Des études permettant de révéler et de quantifier la diversité des trajectoires à la fois géographiques, résidentielles et professionnelles des individus seraient dans cette perspective particulièrement intéressantes (si certains ont vu passer des choses, je suis preneur). En attendant, aucun des termes que j’ai proposé ne permet d’embrasser cette complexité du monde social, donc autant ne pas l’y réduire.

Quelle alternative ? L’Insee aurait dû retenir un terme plus neutre, pour ne pas biaiser les représentations des acteurs.A minima, il aurait mieux valu parler “d’aires d’influence des villes” que “d’aires d’attraction des villes”, pour signifier que l’influence peut être positive (ce que laisse penser le terme “attraction”) ou négative (“répulsion”). C’est d’ailleurs un peu ce que vient de faire l’Insee pour caractériser la diversité des mondes ruraux : l’institut a croisé la nouvelle définition du rural (qui pour le coup me semble satisfaisante, j’en parle ici) au zonage en aires d’attraction des villes, mais, curieusement, il ne parle pas de “rural sous l’attraction d’une ville”, mais de “rural sous l’influence d’un pôle”. Le terme d’attraction a disparu, remplacé par celui d’influence, et on ne parle pas de “la ville” mais “d’un pôle”, alors pourtant que c’est bien le zonage nommé “aires d’attraction des villes” qui a été utilisé. Ajouter immédiatement et systématiquement “sous l’influence d’un pôle d’emploi” aurait été encore un peu mieux. On aurait alors un zonage en “aires d’influence des pôles d’emploi” plutôt qu’en “aires d’attraction des villes”. Convenez que ce n’est déjà pas pareil quand on entend ces termes.

Ce n’est cependant pas suffisant, car cela reste urbano-centré (c’est forcément “la ville” ou “le pôle” qui influence). Si l’on veut être précis et nommer ce que mesure véritablement l’Insee, le zonage devrait s’appeler quelque chose comme “aires légèrement préférentielles domicile-travail”. Je dis “légèrement préférentielle”, car le seuil de 15% est relativement bas (en creux, en effet, cela signifie que jusqu’à 85% des personnes en emploi ne travaillent pas dans la ville d’à côté). Retenir le terme “domicile-travail” signale qu’on ne s’appuie que sur des données qui résument le lien à l’emploi, à travers des données sur les mobilités domicile-travail, pas sur d’autres liens, qui sont potentiellement nombreux, et qu’on ne sait pas si c’est le lieu d’emploi qui a été décisif, ou le lieu d’habitation. Enfin, je n’emploie pas le terme d’attraction, ni de répulsion, car on ne sait pas ce qui se cache derrière les choix de lieux de résidence et de travail des personnes concernées. S’agissant de la volonté de caractériser la diversité du monde rural, on ne devrait pas parler de “rural hors influence d’un pôle” ou de “rural sous l’influence d’un pôle”, mais de “rural situé au sein d’une aire (légèrement) préférentielle domicile-travail” et de rural situé en dehors de telles aires.

Peut-être peut-on trouver mieux comme termes, mais vous comprenez l’idée. Et j’insiste, ce n’est pas une question anecdotique : les mots ont du sens, ils influent sur les représentations des acteurs, notamment des politiques, qui vont, sur la base de leurs représentations, se forger une vision du monde et définir en conséquence des politiques publiques. Changer les mots, c’est changer les représentations et donc l’action concrète.

Covid 19, épisode 28 : fin de la première vague ?

Comme chaque semaine, l’Insee livre les chiffres sur la mortalité toutes causes confondues, du 1er mars au 20 avril cette fois. Globalement, la surmortalité par rapport à 2019 et à 2018 se confirme : 109 831 décès sur cette période, contre 86 606 en 2019 et 94 881 en 2018. La tendance est heureusement à la baisse depuis le 1er avril.

Cette évolution est conforme à celle observée à l’aide des données de Santé publique France. Pour preuve, j’ai construit le graphique des nouveaux décès quotidiens pour la période du 19 mars au 4 mai 2020 :

En complément, Baptiste Coulmont a procédé à une analyse de la mortalité en 2020 par rapport à la moyenne observée sur 2001-2019, ce qui lui a permis de produire ce graphique remarquable :

Si le pic dû à la canicule en 2003 était plus élevé que celui observé cette année, la surmortalité apparente est plus élevée pour 2020, avec plus de 30 000 décès de plus que la moyenne. Étant entendu, je le rappelle, que nous avons été sur une bonne partie de la période en confinement, ce qui a sans conteste réduit le nombre de morts.

J’avais insisté la dernière fois et les fois précédentes, cette surmortalité reste très marquée géographiquement, 4 régions payant un lourd tribut : le nombre de décès est supérieur à celui de 2019 de 95% en Ile-de-France, de 60% dans le Grand Est, de 28% en Bourgogne-Franche-Comté et de 24% dans les Hauts-de-France.

Pour illustrer autrement les différences géographiques, je reprend deux graphiques de l’Insee, le même que le premier graphique ci-dessus, mais pour deux régions aux profils différents, la Nouvelle-Aquitaine et l’Ile-de-France (tous les graphiques régionaux sont visibles ici) :

Il ne s’est rien passé de visible en Nouvelle-Aquitaine, contrairement à ce que l’on observe en Ile-de-France.

Je termine par un dernier graphique qui compare les taux de mortalité entre 2020 et 2019 par tranche d’âge et par sexe, deux autres variables très influentes.

On voit que la surmortalité s’observe et s’accroît à partir de 50 ans, et qu’à partir de 65 ans elle est bien plus forte pour les hommes que pour les femmes. On note aussi que la mortalité chez les hommes de moins de 25 ans est significativement plus faible que l’an dernier : c’est une forme d’externalité positive du confinement, qui a réduit le nombre de morts accidentelles (notamment sur la route) observée habituellement chez les jeunes hommes de cette tranche d’âge.

Covid 19, épisode 20 : la mortalité 2020 a dépassé celles de 2019 et de 2018

L’Insee a livré pour la troisième semaine consécutive les chiffres de la mortalité toutes causes confondues (voir ici pour la première livraison des chiffres et là pour la deuxième), cette fois pour la période du 1er mars au 6 avril. Jusqu’à présent, la mortalité en 2020 était inférieure à celle de 2018, année où la grippe avait été longue et virulente. Ce n’est plus le cas : on comptabilise 76 246 décès entre le 1er mars et le 6 avril 2020, contre 63 686 en 2019 (+20% entre 2019 et 2020) et 71 003 en 2018 (+7% entre 2018 et 2020). Ceci s’explique par l’accélération des décès sur la période (voir le graphique ci-dessous) : on est passé de 1830 décès par jour du 1er au 15 mars, à 2250 du 16 mars au 31 mars, puis à 2470 du 1er au 6 avril.

Pour un sous-ensemble de communes, l’Insee dispose de chiffres plus récents, jusqu’au 10 avril. Ceci permet de faire un constat un peu plus rassurant : on observe une baisse du nombre de décès du 4 au 10 avril de 9% par rapport à la semaine du 28 mars au 3 avril, le plus dur est peut-être passé.

Cette surmortalité reste très concentrée géographiquement : par rapport à 2019, la hausse des décès est particulièrement forte en Ile-de-France (+72%), dans le Grand Est (+55%) et dans une moindre mesure en Bourgogne Franche-Comté et dans les Hauts-de-France (+20%).

A l’échelle des départements, la hausse est supérieure à 50% dans tous ceux d’Ile-de-France, ainsi que dans le Haut-Rhin, le Bas-Rhin, les Vosges, la Moselle et l’Oise. Les parties ouest, centre et sud du pays sont relativement préservées, on observe même une baisse de la mortalité pour de nombreux département d’un grand quart Sud-Ouest.


Episodes précédents : Episode 1 (comparaisons régionales)|Episode  2 (résidences secondaires)|Episode 3 (sur la mortalité)|Episode 4 (comparaison France Italie)|Episode 5 (cas américain et espagnol)|Episode 6 (diffusion spatiale de l’épidémie)|Episode 7 (géographie des Ehpad)|Episode 8 (prévision décès Ehpad)|Episode 9 (sur la mortalité, suite)|Episode 10 (diffusion spatiale, suite)|Episode 11 (taux de mortalité)|Episode 12 (l’impact économique)|Episode 13 (confinement et mobilités départementales)|Episode 14 (chiffres Insee sur la mortalité)|Episode 15 (distanciation sociale)|Episode 16 (impact économique)|Episode 17 (taux de mortalité)|Episode 18 (des pneumatiques aux respirateurs)|Episode 19 (géographie des décès en Ehpad)

Covid 19, épisode 14 : actualisation des chiffres de l’Insee

Comme la semaine dernière, et comme la précédente, l’Insee vient de livrer les chiffres de la mortalité en France, toutes causes de décès confondues, cette fois pour la période du 1er au 30 mars 2020.

Voici les principaux points que je retiens :

  • France entière, la mortalité observée entre le 1er et le 30 mars 2020 est supérieure à celle observée sur la même période en 2019 (57 441 décès contre 52 011 en 2019), mais elle reste toujours inférieure à celle observée en 2018 (58 641 décès),
  • A l’échelle régionale, on observe une très forte hausse de la mortalité (plus de 39%) pour Grand Est et l’Ile-de-France et une forte hausse (plus de 10%) pour les Hauts de France et Bourgogne – Franche-Comté. Seules la Nouvelle-Aquitaine et l’Occitanie voient la mortalité baisser.
  • A l’échelle des départements, les plus touchés sont ceux des régions Grand Est et Ile-de-France. On observe cependant une augmentation du nombre de départements concernés par une hausse de la mortalité : de 24 départements il y a deux semaines, on est passé à 48 la semaine dernière et 57 cette semaine. Si on limite aux départements ayant connu une hausse de plus de 10% de la mortalité, les chiffres sont respectivement de 9, 16 et 33 (voir également la carte ci-dessous),
  • La hausse des décès ralentit dans la région Grand Est, elle reste vive en Ile-de-France.

Par rapport aux semaines passées, l’Insee a procédé à différents approfondissements, avec des indications sur les décès en fonction du sexe, de l’âge et du lieu du décès. On apprend ainsi que la moitié des décès concernent des personnes de plus de 85 ans et seulement 13% des personnes de moins de 65 ans. L’augmentation de la mortalité toutes causes confondues est plus forte pour les hommes que pour les femmes, ce qui est cohérent avec le fait que l’épidémie touche beaucoup plus les premiers. L’Insee observe enfin un excès de mortalité en établissement pour personnes âgées en Île-de-France, dans le Grand Est et dans une moindre mesure dans les Hauts-de-France.


Episode 1 (comparaisons régionales)|Episode  2 (résidences secondaires)|Episode 3 (sur la mortalité)|Episode 4 (comparaison France Italie)|Episode 5 (cas américain et espagnol)|Episode 6 (diffusion spatiale de l’épidémie)|Episode 7 (géographie des Ehpad)|Episode 8 (prévision décès Ehpad)|Episode 9 (sur la mortalité, suite)|Episode 10 (diffusion spatiale, suite)|Episode 11 (taux de mortalité)|Episode 12 (l’impact économique)|Episode 13 (confinement et mobilités départementales)

Covid 19, épisode 9 : sur la mortalité, suite

J’avais indiqué dans un billet précédent, sur la base des chiffres diffusés par l’Insee, que l’épidémie ne se traduisait pas à la date du 16 mars par une surmortalité à l’échelle du pays. L’Insee vient de livrer les mêmes chiffres à la date du 23 mars, ce qui permet d’actualiser l’analyse. Il s’avère que le nombre de décès toutes causes confondues du 1er au 23 mars 2020 a dépassé le nombre observé en 2019 (40 684 contre 39 707), mais pas encore celui de 2018 (année caractérisée par un épisode de grippe long et virulent).

A l’échelle des départements, les choses évoluent également. Pour le montrer, j’ai rapporté le nombre de décès en 2020 au même nombre en 2019, afin d’identifier les départements connaissant une surmortalité. A la date du 16 mars, 24 départements connaissaient une surmortalité (dont 9 départements une surmortalité de plus de 10%). A la date du 23 mars, ce chiffre a doublé, 48 départements connaissent une surmortalité par rapport à 2019 (dont 16 de plus de 10%).

On ne peut cependant pas dire avec certitude que ces surmortalités sont liés à l’épidémie. Pour en juger un peu mieux, j’ai comparé la surmortalité calculée sur les données Insee aux chiffres de Santé publique France sur les décès cumulés en hôpitaux à la même date du 23 mars, afin de répondre à la question suivante : est-ce que les départements connaissant une surmortalité en 2020 par rapport à 2019 de plus de 10% (données Insee) sont ceux qui ont une part dans les décès liés au Covid 19 supérieure de plus de 10% à leur poids dans la population (données Santé publique France) ?

On obtient le tableau suivant :

Sur les 16 départements connaissant une surmortalité de plus de 10% d’après les données Insee, 11 en connaissent également une d’après les données Santé publique France (Haut-Rhin, Vosges, Aisne, Moselle, Bas-Rhin, Oise, Corse-du-Sud, Paris, Côte-d’Or, Hauts-de-Seine, Aude). Pour 5 départements, on a une surmortalité d’après les données Insee, mais pas d’après les données Santé publique France : c’est le cas de Mayotte, des Deux-Sèvres, de la Manche, de la Mayenne et des Yvelines. Le cas des Yvelines est cependant limite, car l’indice pour les données Santé publique France est proche du seuil de 10% (il est en fait de 7%). On trouve enfin 13 départements qui pèsent plus dans les décès en hôpital que dans la population (de plus de 10% je rappelle), sans que cela se traduise par une surmortalité de plus de 10% par rapport à 2019 d’après les données Insee. Pour 11 d’entre eux, cependant, on n’est pas loin du seuil de 10%, deux seulement ont une mortalité inférieure en 2020 à ce qu’elle était en 2019 (la Marne et la Saône-et-Loire).

Au final, il semble que les résultats issus des deux sources tendent à se rapprocher, et que l’on s’oriente vers une surmortalité liée à l’épidémie par rapport aux années précédentes, surmortalité qui touche cependant certains départements beaucoup plus que d’autres.

Les approximations de l’Insee : nouvel épisode

Dans mon dernier billet, j’ai analysé une note de l’Insee relative à l’évolution de la population par commune de 2011 à 2016 et à la façon (erronée) dont la presse s’en est fait l’écho. Une des critiques essentielles adressées à l’Insee portait sur les limites des comparaisons de moyenne par catégorie de territoire, qui masquent l’hétérogénéité au sein de chaque catégorie.

Je découvre aujourd’hui une nouvelle note de l’Insee, sur le même jeu de données mais sur un autre découpage géographique par EPCI (Etablissements Publics de Coopération Intercommunale), parmi lesquels on distingue les métropoles (ME) au nombre de 22, les Communautés Urbaines (CU) au nombre de 11, les Communautés d’Agglomérations (CA) au nombre de 221 et les Communautés de Communes(CC) au nombre de 1005, soit 1259 EPCI au total.

Cette nouvelle note est titrée « Démographie des EPCI : la croissance se concentre dans et au plus près des métropoles ». On y trouve des choses intéressantes (notamment les cartes), mais aussi, hélas, toujours les mêmes erreurs et approximations, qui conduisent à des conclusions contestables. Comme les données utilisées par l’Insee sont mises en ligne en annexe du document, j’ai pu me livrer à quelques traitements. Je vous propose de me concentrer sur un point pour illustrer mon propos : la comparaison par catégories d’EPCI du taux de variation annuel de la population sur la période 2011-2016, résumée notamment par le graphique ci-dessous.

(Il y aurait encore une fois des choses à dire pour éviter toute mauvaise interprétation : les métropoles dont il s’agit sont les métropoles instituées par la loi, qui ont peu à voir avec les métropoles au sens des économistes ou des géographes. On notera également que pour ceux qui considèrent que la seule vraie métropole française (au sens de Saskia Sassen par exemple), Paris, ne va pas très bien si l’on en juge par l’indicateur retenu, mais cet indicateur a-t-il seulement du sens ? Je passe).

Le cœur de mon propos est le suivant : une fois encore l’Insee propose des comparaisons de moyenne, mais oublie de s’interroger sur la dispersion au sein de chaque catégorie, que l’on peut mesurer par exemple par l’écart-type. Terme étrange pour beaucoup, mais finalement assez simple, qui correspond  à la moyenne des écarts à la moyenne : un écart-type important signale que c’est un peu le bazar au sein de la catégorie, un écart-type faible que c’est plutôt homogène (exemple pédagogique : pour une classe de lycée où tous les élèves ont 10 à une épreuve, la moyenne de la classe sera de 10 et l’écart-type de 0 ; pour une classe où la moitié des élèves a zéro et l’autre moitié a 20, la moyenne sera toujours de 10, mais l’écart-type sera de 10. Vous conviendrez que ces deux classes diffèrent sensiblement, ce que la moyenne ne montre pas, puisqu’elle est identique dans les deux cas). C’est vraiment facile de calculer ces écarts-types, voilà ce que ça donne.

Tableau 1 : moyenne et écart-type des taux de croissance de la population des EPCI, 2011-2016, non pondérés

EPCI Moyenne Ecart-type Nombre
CC          0.25          0.75        1 005
CA          0.36          0.64           221
CU          0.27          0.43             11
ME          0.60          0.55             22
Total          0.27          0.73        1 259

La moyenne simple des Métropoles est effectivement sensiblement supérieure à celle des autres catégories d’EPCI, mais l’écart-type de 0,55 est loin d’être négligeable, il est notamment supérieur à celui des Communautés Urbaines, qui sont donc moins hétérogènes. Réciproquement, pour les CC et les CA, l’importance des écarts-types suggère que si, en moyenne, leur croissance est plus faible, certaines présentent des taux de croissance très forts (bien plus forts que les plus dynamiques des ME en vérité) et d’autres très faibles. Dès lors, il n’est pas possible d’avancer une proposition générale du type « les métropoles sont plus dynamiques que les autres catégories de territoires », puisque cela dépend desquelles, idem pour chacune des catégories retenues, d’ailleurs.

On peut aller plus loin dans l’analyse, en faisant un peu d’économétrie, ce que tous les statisticiens de l’Insee savent faire, et sans doute mieux que moi, si bien que je me demande pourquoi ils ne le font pas. Plutôt que de calculer des moyennes par catégorie d’EPCI, il s’agit par exemple de procéder à des comparaisons de moyenne non pas par grande catégorie, mais en régressant le taux de croissance de la population 2011-2016 de chaque EPCI sur la catégorie à laquelle elle appartient. Ceci permet de savoir si les différences de moyenne observées entre catégories sont statistiquement significatives.

Je me suis livré à cet exercice et la conclusion est implacable : les différences de moyenne ne sont pas statistiquement significatives. Par rapport à la catégorie de référence « Communautés d’Agglomération », seule la catégorie « Communautés de Communes » présente un coefficient significativement plus faible et encore, loin du seuil de 1%. Pas de différence statistiquement significative aux seuils de 1, 5 ou 10%, en revanche, entre CA, CU et ME. On note de plus que cette typologie en EPCI n’explique quasiment rien des différences géographiques de taux de croissance, le R² étant de moins de 0,5% (ce qui signifie que cette typologie explique seulement 0,5% des différences observées, que donc d’autres choses en expliquent… 99,5%).

Pour les initiés, voici le tableau de résultat :

variable expliquée : taux de croissance 2011-2016 de la population par EPCI, données Insee

Coefficient écart-type t P>t
CA référence
CC –            0.11              0.05 –            1.99              0.05
CU –            0.08              0.22 –            0.37              0.71
ME              0.25              0.16              1.53              0.13
Constante              0.36              0.05              7.28                   –

Compte-tenu des données disponibles, on peut s’amuser à procéder à d’autres estimations. Si l’on régresse les taux de croissance non plus sur les catégories d’EPCI mais sur les populations de 2011, pour identifier un éventuel effet taille initiale de la population, on aboutit à la même conclusion : le modèle global est très mauvais (R² inférieur à 0,5%) et le coefficient associé à la taille initiale n’est pas significatif au seuil de 1%.

Comme on dispose également du département d’appartenance de la commune la plus peuplée de chaque EPCI, j’ai régressé les taux de croissance des EPCI sur ces départements. Cette fois les choses s’améliorent, le R² monte à 40% environ. Je pense que si l’on agrégeait par région, cela s’améliorerait encore un peu, car, comme les cartes le montrent, on voit bien que les dynamiques de population sont macro-régionales, avec un avantage aux territoires de l’Ouest et du Sud.

Je réitère donc mon conseil à l’Insee : présentez dans vos documents les écarts-types, et procédez en amont de vos commentaires à quelques régressions. Vos documents sont « grand public », ces calculs n’ont sans doute pas vocation à y figurer, mais cela vous permettrait de ne pas dire n’importe quoi, dans vos commentaires.

Les journalistes racontent n’importe quoi (mais c’est un peu la faute de l’Insee)

L’Insee vient de publier les chiffres de la population 2016 par commune et en a profité pour mettre en ligne une étude France entière et des études par région sur l’évolution de la population 2011-2016, comparée à la période 2006-2011. L’étude France entière s’intitule “Entre 2011 et 2016, les grandes aires urbaines portent la croissance démographique française”, vous la trouverez ici.

La presse s’en est fait l’écho, et le moins qu’on puisse dire, c’est que certains racontent n’importe quoi. Mon sentiment : c’est en partie la faute de l’Insee et en partie en lien avec le déficit de formation en statistique des journalistes. La prise de Came ne doit pas être totalement étrangère au problème, également.

Reuters, les métropoles et les grandes aires urbaines : un problème de vocabulaire

Premier exemple, un article de Reuters intitulé “Les métropoles polarisent la population mais Paris se vide”, où l’on peut lire ceci :

En écho au mouvement des “Gilets jaunes” parfois présenté comme la confrontation entre la France rurale et des villes petites et moyennes et celle des grandes métropoles, cette étude souligne que la croissance des grandes aires urbaines a porté la croissance démographique de la France entre 2011 et 2016.

Où est le problème ? Dans le vocabulaire. L’Insee brasse des statistiques par aire urbaine (771 France entière) et distingue, parmi elles, les grandes aires urbaines, dont vous trouverez la définition, plutôt complexe, ici : “un ensemble de communes, d’un seul tenant et sans enclave, constitué par un pôle urbain (unité urbaine) de plus de 10000 emplois, et par des communes rurales ou unités urbaines (couronne périurbaine) dont au moins 40 % de la population résidente ayant un emploi travaille dans le pôle ou dans des communes attirées par celui-ci”.

Reuters considère que grande aire urbaine = métropole. Peut-on vraiment les en blâmer ? Sans doute pas, d’où mon sentiment que l’Insee, pour le coup, est fautif. En effet, les grandes aires urbaines sont au nombre de 241. On y trouve Paris, Lyon et Marseille, bien sûr, mais aussi Ancenis (10 000 habitants), les Herbiers (19 000), Figeac (26 000), etc. Bref, beaucoup de villes que la plupart d’entre vous considèrent, à juste titre, comme moyennes voire petites.

Elles concentrent 78% de la population en 2016 d’après les chiffres de l’Insee. On trouve en leur sein, comme précisé dans la définition, de nombreuses communes rurales, si bien qu’avoir choisi le terme d’aires urbaines pour parler de territoires composés en partie d’espaces à faible ou très faible densité, c’est moyen… Cela laisse penser que le “rural” se réduit à peau de chagrin (4,5% de la population hors influence des aires urbaines si l’on retient la typologie de l’Insee), ce qui est pour le moins contestable, comme expliqué en détail ici.

Les statistiques, la Croix et la bannière

Deuxième exemple, un article de la Croix intitulé “La banlieue attire de moins en moins d’habitants”, où l’on peut lire en sous-titre de la photo “les périphéries des grandes villes se vident au profit des « grands pôles urbains » de plus de 300 000 habitants” et dans le corps du texte : « les villes de banlieues attirent de moins en moins, au profit des centres-villes… qui se repeuplent » [Edit 29/12 : le journaliste de la Croix m’a écrit pour m’indiquer qu’il avait modifié la légende de la photo suite à la lecture de mon billet].

Petite devinette pour comprendre l’erreur : Pierre et Jacques font la course, qui consiste à faire deux fois le tour d’un stade. Pierre va beaucoup plus vite que Jacques lors du premier tour de piste (disons 4 fois plus vite). Lors du deuxième tour, Pierre ralentit alors que Jacques maintient son allure, de telle sorte que maintenant, Pierre ne court pas 4 fois plus vite que Jacques, mais seulement deux fois plus vite. Question : lors du deuxième tour, qui va plus vite, Pierre ou Jacques ?

Question stupide, n’est-ce pas ? Pas tant : les journalistes de la Croix se sont plantés dans la réponse, en tout cas. Ce que montre l’Insee, en effet, ce n’est pas que les grands pôles urbains (les “centre-villes” pour la Croix) croissent plus vite que leur couronne (les “banlieues” pour la Croix), elles croissent toujours moins vite (0,4% pour les premières contre 0,8% pour les dernières), mais l’écart s’est réduit, le taux de croissance n’est plus que 2 fois supérieur, contre 4 fois supérieur entre 2006 et 2011 (0,3% contre 1,2%), d’où mon exemple. Donc affirmer que les périphéries se vident au profit des grands pôles urbains, comment dire…

Des commentaires moyens sur les moyennes

Le vocabulaire associé à la typologie de l’Insee me semble très critiquable, je l’ai dit. Le fait ensuite de comparer des moyennes par paquet d’aires urbaines l’est tout autant, car il masque l’hétérogénéité au sein de chaque catégorie.

Quand l’Insee affirme que les grandes aires urbaines portent la croissance de la population entre 2006 et 2011, c’est parce que cette catégorie a connu un taux de croissance de 0,5% en moyenne, contre 0,4% France entière. Sauf que les taux varient, au sein de cette catégorie, entre -1,6% et +2,6%.

Si l’on restreint aux 20 plus grandes aires urbaines, ce qui correspond sans doute mieux à ce que l’on pense être les “métropoles”, idem, ça varie beaucoup, comme le montre ce graphique tiré du document :

Vous remarquerez que parmi les 20 plus grandes aires urbaines, 11 ont un taux de croissance de la population inférieur ou égal au taux de croissance France entière (0,4%)… (En complément, je me suis amusé, à partir des données mises en ligne, à tester le lien entre la taille des départements et leur taux de croissance, j’ai fait de même pour les 241 grandes aires urbaines, cela ne donne rien, on ne trouve pas d’effet taille).

Petite recommandation à l’Insee, de ce fait : quand vous présentez des moyennes dans un tableau, indiquez également l’écart-type. Faites des petits tests de comparaison de moyenne, également, pour éviter des commentaires trop rapides.

La Came, encore et toujours…

S’intéresser à la géographie des taux de croissance de la population n’est pas totalement inutile. Mais il faut toujours faire attention aux catégories et aux indicateurs que l’on utilise. A ce titre, ce que montrent avant tout les chiffres publiés par l’Insee, c’est qu’on retrouve plutôt des dynamiques macro-régionales, avec des territoires (grands, moyens et petits) dynamiques à l’Ouest et au Sud, et d’autres (grands, moyens et petits) moins dynamiques dans un grand quart Nord-Est. Quand l’Insee affirme ensuite que “la proximité d’une grande métropole favorise la croissance de population départementale”, ça manque d’éléments de preuve : je ne suis pas sûr que la dynamique vendéenne soit lié à la proximité de Nantes, ni que la Haute-Savoie croisse en lien avec Lyon…

Mais même cet exercice de comparaison de taux de croissance est critiquable : plus ou moins consciemment, on considère qu’un territoire qui connaît une croissance de la population plus forte va bien, et que celui qui connaît une croissance plus faible va mal. Or, la croissance forte observée à Bordeaux, Nantes, Montpellier, …, n’est pas sans poser problème en terme d’effets de congestion et de montée du prix du foncier, je ne suis pas sûr qu’un territoire moins “dynamique” soit en plus mauvaise position et que sa situation soit moins enviable…

Comparer les taux de croissance, enfin, c’est considérer, là encore plus ou moins consciemment, que les territoires sont en concurrence les uns avec les autres dans le cadre d’une sorte de tournoi de foot. Or, ce n’est pas le cas, les territoires sont traversés par des processus socio-économiques, des interdépendances qui les dépassent, qu’il faut identifier, et s’interroger sur la façon de mieux régler les problèmes que cela pose.

Je fais le vœu que l’année 2019 soit sous le signe de la cohésion des territoires, plutôt que sous celui, calamiteux, de la concurrence entre eux. Cela passe par des réflexions sur la façon dont on les regarde, et sur les représentations qui sous-tendent notre regard.

Les PIB régionaux par habitant sont de plus en plus souvent en état de décomposition…

J’ai critiqué à de multiples reprises sur ce blog la tendance à dire des choses sur les performances économiques des régions françaises sur la base de la comparaison des PIB régionaux par habitant, qui sont tout sauf, précisément, des indicateurs adaptés de la performance économique des territoires. Pour un petit rappel, voir cette tribune publiée par le Monde ou, pour plus de détails encore, cet article publié par la revue de l’OFCE, à chaque fois cosignés avec Michel Grossetti.

Nous pensions que l’affaire était réglée, mais en fait, à l’heure où je vous parle, le bilan est plutôt mitigé. France Stratégie a publié une note datée de début juillet plutôt énervante, ceci d’autant plus que nous avons été auditionnés dans le cadre de la préparation de cette note, que nous sommes d’ailleurs cités, mais que… comment dire… il y a pas mal d’erreurs dans cette note… Comme c’est l’été et que nous sommes plutôt sympas, on vous a d’ailleurs préparé un petit jeu intitulé “France Stratégie : le jeu des 7 erreurs” (en fait, il y en a plus, mais on bosse pour en regrouper certaines et passer à 7, parce que même l’été, oui, on bosse). On essaie de vous le proposer pour la rentrée, vous pouvez jouer à les trouver avant.

(digression : c’est marrant cette tendance de certaines institutions qui doivent répondre à une question, qu interrogent des gens qui pensent “blanc”, des gens qui pensent “noir”, et qui finalement décident de pondre une note “grise”, en se disant que la vérité doit être entre les deux. C’est un peu comme si vous interrogiez des gens qui pensent que le soleil tourne autour de la terre, d’autres gens qui pensent que la terre tourne autour du soleil, que sur la base des auditions, vous concluriez qu’il y a des trucs qui tournent autour d’autres trucs. Si c’est votre cas, un conseil : postulez à France Stratégie).

Bilan mitigé parce qu’aussi positif, malgré tout : l’INSEE vient de publier des analyses des PIB régionaux par habitant qui s’appuient sur la décomposition que nous avions proposée et qui permettent précisément de prendre un sacré recul par rapport à l’association trop rapide faite par certain, du style “gros PIB par habitant, grosse performance”. Vous pouvez consulter la publication nationale ici, ainsi que les déclinaisons par région en consultant cette page.

La qualité de vie dans les territoires

L’Insee vient de publier une étude intéressante sur la qualité de vie dans les territoires français. Exercice difficile : on cherche trop souvent, pour mesurer la “performance” de différentes entités sur un sujet donné (ici la qualité de vie dans les territoires), à identifier l’indicateur pertinent pour produire ensuite des classements. Lorsque le sujet est multidimensionnel, on s’en remet à des indicateurs composites, comme l’IDH pour le développement humain ou le classement de Shangaï pour la performance des Universités. C’est satisfaisant pour les médias qui peuvent produire des classements, trouver des titres chocs et optimiser leurs ventes, mais c’est très insatisfaisant pour cerner le sujet traité.

L’exercice proposé par l’Insee est différent : il s’agit plutôt, au travers de différents indicateurs censés capturer les différentes dimensions de la qualité de vie, de produire une typologie de territoires. Et ça change tout : impossible de hiérarchiser les territoires entre eux, on observe plutôt des profils différents, avec des atouts/faiblesses attachés à chacun d’eux. On peut imaginer que chaque individu, en fonction de son “vecteur de préférences”, comme dirait l’économiste, se sentirait mieux dans tel ou tel endroit.

Cela donne cette carte :

cartelégendePoitiers stricto sensu fait partie de la deuxième catégorie de la typologie, caractérisée ainsi par l’Insee : “Regroupant la plupart des métropoles régionales (Lyon, Marseille, Lille, Toulouse, Bordeaux, Nantes, etc.), certains territoires de plus petite taille ainsi que des zones touristiques de montagne (marron sur la carte : 15,8 millions d’habitants) conjuguent à la fois une rapide accessibilité aux équipements et services et une densité de médecins généralistes importante au regard de la population. L’adéquation des emplois par rapport aux catégories sociales des actifs est bonne et les emplois sont relativement proches du lieu de résidence. Cependant, à l’instar des autres territoires plutôt urbains, les situations sociales difficiles sont également présentes (familles monoparentales, suroccupation des logements). Les zones de montagne orientées vers le tourisme se rapprochent des métropoles régionales, par des conditions socio-économiques et d’accès aux équipements favorables. Mais les emplois y sont moins fréquemment stables.”

Elle baigne cependant dans un océan de zones orangées, des territoires autour de villes moyennes, caractérisés de cette façon : “Enfin, de nombreux territoires organisés autour de villes moyennes (orange sur la carte : 12 millions d’habitants) proposent un accès plutôt rapide aux équipements et services. Les conditions de logement sont plutôt bonnes (très peu de personnes vivant dans des logements suroccupés). La population diplômée est relativement peu importante, y compris chez les jeunes, cependant le taux d’emploi est particulièrement élevé avec des disparités femmes/hommes réduites. L’emploi est très souvent à proximité du domicile mais les salaires sont plutôt faibles et les transports en commun peu développés. Le chômage de longue durée est rare. Ces territoires se situent dans l’Ouest et le Sud-Ouest et à proximité de certains grands pôles de l’Est.”

On peut bien sûr discuter de la pertinence de tel ou tel indicateur, s’étonner de l’absence de tel ou tel autre, mais, de manière générale, je trouve la démarche beaucoup plus intelligente que la moyenne de celles que l’on nous fait subir quotidiennement…

Inversion de la courbe du chômage : Issoire et Bar-le-Duc y sont déjà !

L’Insee vient de publier les taux de chômage par zones d’emploi pour le deuxième trimestre 2013.

L’occasion de regarder autrement la situation de l’économie française : plutôt que de se focaliser sur un indicateur macro-économique (taux de chômage pour l’ensemble de l’économie française), on peut analyser la distribution des taux de chômage par zone d’emploi, car les situations sont très hétérogènes selon les territoires.

A titre d’illustration, j’ai collecté les taux de chômage pour le 2ème trimestre 2012 et pour le deuxième trimestre 2013 des 304 zones d’emplois de France métropolitaine. On peut alors construire ce graphique :

GraphTous les indicateurs augmentent : taux de chômage minimum (de 4,7% à 5,2%), taux de chômage maximum (16,8% à 17,9%), la médiane (9,6% à 10,3%).

Au deuxième trimestre 2013, les taux de chômage les plus faibles sont observés pour Houdan (5,2%), Les Herbiers (5,9%) et Wissembourg (6,1%). Les plus forts pour Agde – Pézenas (17,9%), Calais (17,7%) et Lens – Hénin (17,7%).

Certaines zones sont-elles déjà parvenues à inverser la courbe du chômage ? Sur les 304 zones, seules 2 sont dans cette situation, toutes les autres ont vu leur taux de chômage augmenter. Il s’agit de Bar-le-Duc (passage de 9% à 8,9%) et Issoire (9,6% à 9,5%). On pourrait ajouter Saint-Gaudens (12,8% aux deux dates). La dégradation la plus forte concerne Morteau, avec une hausse de plus de 21% du taux de chômage, mais ils partaient de bas (passage de 6,1% à 7,4% du taux de chômage).