Des métropoles plus performantes ? Petit bilan du monde d’avant

Je suis régulièrement interrogé sur la dynamique des territoires avant crise et après-crise, la question de la dynamique comparée des métropoles, des villes moyennes et du rural revenant régulièrement sur la table. Dans l’esprit de beaucoup des personnes qui m’interrogent, le monde d’avant était celui du triomphe des métropoles, la question étant de savoir si ce sera toujours le cas dans le monde d’après, ou bien si l’on va assister à la revanche des villes moyennes, ou du rural, etc.

Ce faisant, je commence souvent par rappeler que non, le monde d’avant n’était pas synonyme de triomphe des métropoles, que c’était plus compliqué que cela, et que cela devrait continuer à être plus compliqué que ce que certains voudraient, qu’il convient de rejeter les « modèles à une variable » censés tout expliquer du monde qui nous entoure.

Cela m’a donné envie de rédiger un petit billet, pour faire le point sur la situation relative des métropoles juste avant la crise, pour savoir d’où l’on part, sur la base de l’analyse statistique de quelques indicateurs : 1) le taux de croissance de la population, 2) la composante naturelle du taux de croissance de la population, 3) la composante migratoire du taux de croissance de la population, 4) le taux de croissance de l’emploi, 5) le taux de chômage.

J’ai utilisé à chaque fois les données du recensement, les deux derniers comparables disponibles, à savoir le recensement millésime 2018 et le recensement millésime 2013. Pour rappel, le recensement se fait au 1/5 chaque année, donc le recensement millésime 2013 couvre la période 2011-2015 et le recensement millésime 2018 couvre la période 2016-2020 (le début de l’année à chaque fois). C’est donc la période début 2011- début 2020 qui est couverte par ces données.

Chaque observation correspond à un EPCI (un Etablissement Public de Coopération Intercommunal, soit une intercommunalité en langage courant) : les 22 métropoles, les 14 communautés urbaines, les 221 communautés d’agglomération et les 992 communautés de communes, soit 1249 EPCI France entière (hors Mayotte).L’ensemble de ces données est disponible librement au téléchargement, par exemple sur le site de l’observatoire des territoires, à cette adresse.

Comment analyser la situation des métropoles ? La méthode la plus simple consiste à calculer la moyenne des indicateurs pour l’ensemble des métropoles, à la comparer à la moyenne pour l’ensemble des territoires, puis de conclure. Certes mais danger, comme expliqué à maintes reprises : la moyenne d’une catégorie peut masquer des différences fortes au sein de la catégorie, il convient donc de regarder d’une façon ou d’une autre si ces différences de moyenne ont du sens.

Commençons par calculer les moyennes :

moyenne des indicateurs pour les 22 métropoles et pour l’ensemble des EPCI

Il s’avère qu’en moyenne, les métropoles ont une croissance démographique supérieure, qui s’explique par un solde naturel plus grand, qui fait plus que compenser le solde migratoire inférieur (et même négatif). Le taux de croissance de l’emploi est également supérieur, et le taux de chômage inférieur. Tout les indicateurs semblent au vert pour les métropoles, si ce n’est le solde migratoire (ce qui n’est pas rien, soit dit en passant, les métropoles étant censées tirer leur force de leur plus grande attractivité).

Mais ces différences de moyenne ont-elles du sens ? Pour en juger, étant donné que ce qui nous intéresse, ce sont les 22 métropoles, le plus simple est de regarder les données pour chacune d’entre elles, et de voir comment elles se situent par rapport à ces moyennes. : sur les 22 métropoles, 10 ont un taux de croissance inférieur au taux de croissance moyen, 6 un solde naturel inférieur, 10 un solde migratoire inférieur, 7 un taux de croissance de l’emploi inférieur et 8 un taux de chômage supérieur.

nombre de métropoles dont la situation est moins bonne qu’en moyenne

Il ne s’agit pas d’une ou deux exceptions, mais d’un nombre importants de cas, qui font qu’on ne peut pas dire que les métropoles sont plus “performantes” que les autres territoires sur l’un de ces indicateurs. Tout ce que l’on peut dire, c’est que certaines métropoles sont plus “performantes” que la moyenne et d’autres non (et c’est vrai des autres catégories de territoires).

En complément, on peut regarder, dans l’ensemble des 22 métropoles, combien sont plus “performantes” sur tous les indicateurs : elles sont au nombre de 6, il s’agit de Bordeaux, Lyon, Nantes, Rennes, Orléans, Toulouse. Six autres métropoles ont un seul indicateur inférieur à la moyenne (Aix-Marseille, Clermont, Dijon, Montpellier, Strasbourg et Toulon). Deux métropoles sont moins “performantes” pour deux indicateurs (Brest et Paris), deux pour trois indicateurs (Grenoble et Lille), cinq pour quatre indicateurs (Metz, Nancy, Nice, Rouen, Tours) et une métropole pour tous les indicateurs (Saint-Etienne). Très difficile de parler d’avantage économique métropolitain, il n’y a plus que 6 métropoles sur les 22 qui semblent dans les clous.

Une autre façon de juger de l’effet métropolitain consiste à voir ce que cette appartenance explique dans les différences de taux de croissance ou de taux de chômage entre EPCI, en effectuant ce que l’on appelle des tests de comparaison de moyenne. J’ai réalisé ces tests, et j’ai effectué les mêmes pour juger d’un autre élément : l’effet de l’appartenance régionale. Ceci permet de voir si ce qui compte dans les “performances”, c’est plutôt d’être métropole, ou plutôt d’appartenir à telle ou telle région. Ou ni l’un ni l’autre, ou bien les deux.

variance expliquée par le fait d’avoir le statut de métropole et l’appartenance régionale, en % de la variance totale

Résultat des courses ? Le fait d’être métropole plutôt que communauté urbaine, communauté d’agglomération ou communauté de communes explique au mieux 2% des différences territoriales observées, autrement dit pratiquement rien. En revanche, l’appartenance régionale joue : très fortement sur le taux de chômage, fortement sur les soldes naturels et migratoires, et plus faiblement sur le taux de croissance de la population et de l’emploi. Dans tous les cas, les effets régionaux sont très supérieurs aux effets métropoles, comparativement négligeables. Pour le dire autrement, si vous voulez savoir quelque chose de la “performance” d’un territoire, mieux vaut savoir dans quelle région il se trouve, plutôt que de savoir s’il s’agit d’une métropole ou non.

Pour finir je vous propose ci-dessous le tableau complet pour les 22 métropoles, classées de la plus peuplée en 2013 à la moins peuplée. Les cellules surlignées correspondent aux valeurs des indicateurs inférieures à la moyenne pour l’ensemble des territoires, ce qui vous permet de visualiser les variables pour lesquelles les métropoles “sous-performent”.

valeurs de différents indicateurs pour les 22 métropoles instituées et pour l’ensemble des EPCI. En jaune les valeurs inférieures aux moyennes pour les taux de croissance et supérieures à la moyenne pour le taux de chômage

Les approximations de l’Insee : nouvel épisode

Dans mon dernier billet, j’ai analysé une note de l’Insee relative à l’évolution de la population par commune de 2011 à 2016 et à la façon (erronée) dont la presse s’en est fait l’écho. Une des critiques essentielles adressées à l’Insee portait sur les limites des comparaisons de moyenne par catégorie de territoire, qui masquent l’hétérogénéité au sein de chaque catégorie.

Je découvre aujourd’hui une nouvelle note de l’Insee, sur le même jeu de données mais sur un autre découpage géographique par EPCI (Etablissements Publics de Coopération Intercommunale), parmi lesquels on distingue les métropoles (ME) au nombre de 22, les Communautés Urbaines (CU) au nombre de 11, les Communautés d’Agglomérations (CA) au nombre de 221 et les Communautés de Communes(CC) au nombre de 1005, soit 1259 EPCI au total.

Cette nouvelle note est titrée « Démographie des EPCI : la croissance se concentre dans et au plus près des métropoles ». On y trouve des choses intéressantes (notamment les cartes), mais aussi, hélas, toujours les mêmes erreurs et approximations, qui conduisent à des conclusions contestables. Comme les données utilisées par l’Insee sont mises en ligne en annexe du document, j’ai pu me livrer à quelques traitements. Je vous propose de me concentrer sur un point pour illustrer mon propos : la comparaison par catégories d’EPCI du taux de variation annuel de la population sur la période 2011-2016, résumée notamment par le graphique ci-dessous.

(Il y aurait encore une fois des choses à dire pour éviter toute mauvaise interprétation : les métropoles dont il s’agit sont les métropoles instituées par la loi, qui ont peu à voir avec les métropoles au sens des économistes ou des géographes. On notera également que pour ceux qui considèrent que la seule vraie métropole française (au sens de Saskia Sassen par exemple), Paris, ne va pas très bien si l’on en juge par l’indicateur retenu, mais cet indicateur a-t-il seulement du sens ? Je passe).

Le cœur de mon propos est le suivant : une fois encore l’Insee propose des comparaisons de moyenne, mais oublie de s’interroger sur la dispersion au sein de chaque catégorie, que l’on peut mesurer par exemple par l’écart-type. Terme étrange pour beaucoup, mais finalement assez simple, qui correspond  à la moyenne des écarts à la moyenne : un écart-type important signale que c’est un peu le bazar au sein de la catégorie, un écart-type faible que c’est plutôt homogène (exemple pédagogique : pour une classe de lycée où tous les élèves ont 10 à une épreuve, la moyenne de la classe sera de 10 et l’écart-type de 0 ; pour une classe où la moitié des élèves a zéro et l’autre moitié a 20, la moyenne sera toujours de 10, mais l’écart-type sera de 10. Vous conviendrez que ces deux classes diffèrent sensiblement, ce que la moyenne ne montre pas, puisqu’elle est identique dans les deux cas). C’est vraiment facile de calculer ces écarts-types, voilà ce que ça donne.

Tableau 1 : moyenne et écart-type des taux de croissance de la population des EPCI, 2011-2016, non pondérés

EPCI Moyenne Ecart-type Nombre
CC          0.25          0.75        1 005
CA          0.36          0.64           221
CU          0.27          0.43             11
ME          0.60          0.55             22
Total          0.27          0.73        1 259

La moyenne simple des Métropoles est effectivement sensiblement supérieure à celle des autres catégories d’EPCI, mais l’écart-type de 0,55 est loin d’être négligeable, il est notamment supérieur à celui des Communautés Urbaines, qui sont donc moins hétérogènes. Réciproquement, pour les CC et les CA, l’importance des écarts-types suggère que si, en moyenne, leur croissance est plus faible, certaines présentent des taux de croissance très forts (bien plus forts que les plus dynamiques des ME en vérité) et d’autres très faibles. Dès lors, il n’est pas possible d’avancer une proposition générale du type « les métropoles sont plus dynamiques que les autres catégories de territoires », puisque cela dépend desquelles, idem pour chacune des catégories retenues, d’ailleurs.

On peut aller plus loin dans l’analyse, en faisant un peu d’économétrie, ce que tous les statisticiens de l’Insee savent faire, et sans doute mieux que moi, si bien que je me demande pourquoi ils ne le font pas. Plutôt que de calculer des moyennes par catégorie d’EPCI, il s’agit par exemple de procéder à des comparaisons de moyenne non pas par grande catégorie, mais en régressant le taux de croissance de la population 2011-2016 de chaque EPCI sur la catégorie à laquelle elle appartient. Ceci permet de savoir si les différences de moyenne observées entre catégories sont statistiquement significatives.

Je me suis livré à cet exercice et la conclusion est implacable : les différences de moyenne ne sont pas statistiquement significatives. Par rapport à la catégorie de référence « Communautés d’Agglomération », seule la catégorie « Communautés de Communes » présente un coefficient significativement plus faible et encore, loin du seuil de 1%. Pas de différence statistiquement significative aux seuils de 1, 5 ou 10%, en revanche, entre CA, CU et ME. On note de plus que cette typologie en EPCI n’explique quasiment rien des différences géographiques de taux de croissance, le R² étant de moins de 0,5% (ce qui signifie que cette typologie explique seulement 0,5% des différences observées, que donc d’autres choses en expliquent… 99,5%).

Pour les initiés, voici le tableau de résultat :

variable expliquée : taux de croissance 2011-2016 de la population par EPCI, données Insee

Coefficient écart-type t P>t
CA référence
CC –            0.11              0.05 –            1.99              0.05
CU –            0.08              0.22 –            0.37              0.71
ME              0.25              0.16              1.53              0.13
Constante              0.36              0.05              7.28                   –

Compte-tenu des données disponibles, on peut s’amuser à procéder à d’autres estimations. Si l’on régresse les taux de croissance non plus sur les catégories d’EPCI mais sur les populations de 2011, pour identifier un éventuel effet taille initiale de la population, on aboutit à la même conclusion : le modèle global est très mauvais (R² inférieur à 0,5%) et le coefficient associé à la taille initiale n’est pas significatif au seuil de 1%.

Comme on dispose également du département d’appartenance de la commune la plus peuplée de chaque EPCI, j’ai régressé les taux de croissance des EPCI sur ces départements. Cette fois les choses s’améliorent, le R² monte à 40% environ. Je pense que si l’on agrégeait par région, cela s’améliorerait encore un peu, car, comme les cartes le montrent, on voit bien que les dynamiques de population sont macro-régionales, avec un avantage aux territoires de l’Ouest et du Sud.

Je réitère donc mon conseil à l’Insee : présentez dans vos documents les écarts-types, et procédez en amont de vos commentaires à quelques régressions. Vos documents sont « grand public », ces calculs n’ont sans doute pas vocation à y figurer, mais cela vous permettrait de ne pas dire n’importe quoi, dans vos commentaires.