Votes et gradient d’urbanité : une relation invalidée

Jacques Lévy est intervenu lundi 25 avril 2022 sur France Culture dans Le temps du débat, puis de nouveau le 1er mai, toujours sur France Culture, dans l’émission l’Esprit Public, pour commenter les résultats des élections. Son analyse s’appuie sur un travail cartographique conséquent visible ici.

Conformément à une thèse qu’il défend depuis longtemps (vous trouverez l’essentiel de ses idées appliquées au vote du 21 avril 2002 dans ce texte), il considère que les différences géographiques de vote s’expliquent avant tout par ce qu’il appelle les gradients d’urbanité, bien plus que par les différences de catégorie sociale, de diplôme ou d’âge.

Son idée forte est la suivante : l’urbain dense est le lieu de la diversité, de l’ouverture, de la tolérance, de la connexion au monde, dès lors, baigner dans des environnements à forte urbanité conduirait à voter pour des partis “de gouvernement”, “universalistes”, alors que quand l’urbanité est faible, on est enclin à voter pour des partis “protestataires”, “populistes”, “tribunitiens”. C’est cela qui expliquerait les votes, plus que le fait d’être jeune ou vieux, d’être diplômé du supérieur ou non diplômé, ouvrier, employé ou cadre supérieur.

Pour mesurer les gradients d’urbanité, Jacques Lévy s’appuie sur les zonages d’étude de l’INSEE, et dans ses dernières analyses, sur le zonage en aires d’attraction des villes. Chaque commune peut être rattachée à l’un des 8 gradients d’urbanité, qui sont définis sur la base d’une double distinction : en fonction de la tranche d’aire d’attraction des villes, d’une part, et de la situation de la commune par rapport à la commune centre de l’aire, d’autre part.

La commune qui présente le gradient d’urbanité le plus fort, c’est Paris, elle correspond au gradient 1. Suivent les communes de la banlieue de Paris, ainsi que les communes centres des aires de plus de 700 000 habitants, toutes étant de gradient 2 : les communes de la banlieue sont moins urbaines que Paris, mais elle bénéficient en quelque sorte de son ruissellement ; les communes centres des très grandes aires, ce n’est pas Paris, mais l’urbanité y est forte. Et ainsi de suite, jusqu’aux communes hors aires d’attraction des villes, de gradient 8, à l’urbanité la plus faible.

Pour mesurer l’impact des gradients d’urbanité, il procède à des analyses cartographiques, qui permettent de visualiser la géographie des votes en fonction de ces gradients, pour conclure le plus souvent que son analyse est validée. Il va cependant un cran plus loin : conscient que d’autres éléments peuvent jouer, notamment les effets de diplôme, de catégorie sociale ou d’âge, il affirme que les gradients d’urbanité sont plus explicatifs que ces autres éléments, sur la base d’un raisonnement quelque peu opaque et pour le moins curieux (voir ici, à partir de 5’30).

L’analyse de Jacques Lévy a fait l’objet de critiques sérieuses, depuis déjà longtemps (voir par exemple l’article de Fabrice Ripoll et Jean Rivière). Mon objectif ici est d’ajouter une pierre à la critique, en montrant qu’elle est invalidée empiriquement, sur la base des résultats du vote du premier tour des élections présidentielles 2022 de l’ensemble des communes de France métropolitaine.

Pour cela, il convient de définir précisément quels résultats on devrait obtenir si la “théorie” du gradient d’urbanité était vérifiée : on devrait observer i) un score des candidats de gouvernement qui augmente quand le degré d’urbanité augmente, ii) un score des candidats protestataires qui diminue quand le degré d’urbanité augmente, iii) un pouvoir explicatif du gradient d’urbanité supérieur au pouvoir explicatif d’autres distinctions (âge, CSP, niveau de diplôme), iv) un effet du gradient d’urbanité qui est observé à caractéristiques sociales égales par ailleurs.

Pour valider ou invalider ces propositions, je considère d’abord comme candidats de gouvernement Macron, Jadot, Pécresse et Hidalgo, et comme candidats protestataires les huit autres candidats, classés à gauche pour quatre d’entre eux (Mélenchon, Roussel, Poutou, Arthaud) et à droite pour les quatre autres (Le Pen, Zemmour, Lassalle, Dupont-Aignan). Sur cette base, je procède aux traitements suivants :

  1. j’analyse les scores moyens obtenus par chaque candidat, en fonction du gradient d’urbanité : si la théorie est vérifiée, le score moyen de Macron, Jadot, Pécresse et Hidalgo doit augmenter avec le degré d’urbanité, celui des huit autres candidats doit diminuer. Le gradient d’urbanité doit en outre expliquer une part importante des différences de vote observées entre communes,
  2. j’analyse parallèlement l’influence d’une autre variable que le gradient d’urbanité : la part des diplômés du supérieur par commune. Si la théorie est validée, cette variable doit expliquer une part moins importante du vote que le gradient d’urbanité,
  3. j’analyse dans un même modèle le gradient d’urbanité et la part des diplômés du supérieur, afin d’évaluer l’impact du gradient d’urbanité à niveau de diplôme donné. Si la théorie fonctionne, le gradient d’urbanité doit exercer l’influence attendue sur les scores des candidats de gouvernement et des candidats protestataires.

Commençons par cette première proposition, en mesurant l’impact du gradient d’urbanité sur les votes des 12 candidats. Dans le tableau, vous pouvez lire le score obtenu par chaque candidat dans la commune de Paris (gradient 1), puis l’écart à ce score pour les gradients de 2 à 8. La dernière ligne renseigne sur le pourcentage des différences de votes entre communes expliquées par le gradient d’urbanité.

Scores au 1er tour de l’élection présidentielle de 2022 par gradient d’urbanité (score moyen des communes du gradient 1 et écart à ce score pour les autres gradients)

A titre d’exemple de lecture, le score d’Emmanuel Macron dans la commune de Paris est de 35,3%, celui de Yannick Jadot est de 7,3%. En moyenne, dans les communes de la banlieue de Paris et dans les communes centre des aires de plus de 700 000 habitants, le score d’Emmanuel Macron est inférieur de 6,4 points de pourcentage au score qu’il obtient sur Paris, et celui de Yannick Jadot est inférieur de 2 points de pourcentage à son score parisien. Sur la dernière ligne de ces deux candidats, on constate que les gradients d’urbanité n’expliquent que 7% des différences communales de vote Macron, et 21% des différences pour Jadot.

Globalement, s’agissant des candidats de gouvernement, on constate que les scores hors Paris sont tous inférieurs au bloc sur Paris intra-muros, ce qui va dans le sens de la théorie, mais dans sa version extrême, où l’urbanité serait réservée au cœur de la capitale, point d’urbanité en dehors. De plus, le gradient d’urbanité n’explique qu’une faible partie des différences entre communes (variance expliquée inférieure à 10%), hormis pour Jadot, candidat pour lequel la théorie « marche » un peu mieux, puisque la variance expliquée par le gradient d’urbanité est de 21% et que son score est continûment décroissant quand on va du gradient 1 à 8.

Pour les candidats protestataires, la théorie fonctionne plutôt bien pour Marine le Pen puisque son score est continûment croissant avec le gradient (à l’exception du gradient 8, son score y est inférieur aux gradients 6 et 7) et il explique 46% des différences observées. En revanche, le résultat est inverse au résultat attendu pour Mélenchon (avec un pouvoir explicatif du gradient important, mais totalement contraire à l’attendu, de 46%) et pour Zemmour (mais avec un faible pouvoir explicatif du gradient d’urbanité, qui n’explique que 2% des différences de vote entre communes). Les résultats de Mélenchon et de Zemmour constituent clairement le premier élément d’invalidation de la théorie des gradients d’urbanité.

Deuxième temps de l’analyse, l’examen de la deuxième proposition, qui consiste à étudier le jeu d’une autre variable explicative considérée comme moins déterminante par Jacques Lévy que le jeu du gradient d’urbanité. J’ai retenu la part communale des diplômés du supérieur, qui exerce une influence certaine sur les votes. Je compare simplement la part des différences expliquées par le gradient d’urbanité, d’un côté, et la part expliquée par la part des diplômés du supérieur, de l’autre.

Variance expliquée par le gradient d’urbanité et par la part des diplômés du supérieur en pourcentage de la variance totale, dans les votes au 1er de tour de 2022. Pour la variable “part des diplômés du supérieur”, l’analyse a été faite en retenant la valeur continue de la variable, et également en constituant huit groupes de communes (1/8 des communes à plus faible part, puis 1/8 des suivantes, etc.), pour avoir un nombre de classes équivalent au nombre de gradient d’urbanité.

On constate que pour sept des douze candidats, la part des diplômés explique mieux les différences communales de score que le gradient d’urbanité, pour deux l’explication est équivalente (Hidalgo et Poutou), et c’est seulement pour 3 qu’elle est moins explicative que le gradient d’urbanité (Mélenchon, Lassalle et Dupont-Aignan), mais dans un sens contraire à l’attendu pour Mélenchon rappelons-le. L’écart est particulièrement fort pour Macron (+24 points de pourcentage d’explication) et pour Jadot (+32 points). Ces résultats constituent le deuxième élément d’invalidation de la théorie.

Dernier temps essentiel de la démonstration, l’analyse intégrée des deux effets. L’erreur principale de Jacques Lévy consiste en effet à étudier gradient d’urbanité, CSP, âge et diplôme séparément, en les considérant comme indépendants. Or, la composition sociale des territoires varie fortement selon le gradient d’urbanité. De ce fait, les différences de scores par gradient peuvent résulter non pas de sa théorie (on est plus tolérant quand on vit dans un environnement urbain, donc on vote moins pour les partis protestataires), mais de différences de caractéristiques sociales (on est plus diplômés, donc on vote moins pour les partis protestataires, qu’on habite dans l’urbain ou dans le rural). C’est à cette condition qu’on pourra éventuellement identifier le jeu d’un effet géographique « pur ».

Ecarts au score de gradient 1 pour les gradients 2 à 8 à part des diplômés du supérieur égale par ailleurs. Les valeurs soulignées sont non significativement différentes de 0 au seuil de 1%.

On constate que, quand on neutralise l’effet “part des diplômés du supérieur”, les résultats pour tous les candidats des partis de gouvernement sont contraires à la théorie : leur score est supérieur dans les communes hors Paris, il est même continument croissant pour Macron quand on passe du gradient 1 au gradient 8 d’urbanité (c’est le cas également pour Pécresse).

S’agissant des candidats protestataires, les résultats de Roussel sont maintenant contraires à la théorie (coefficients tous négatifs, mais leurs valeurs sont faibles), et ceux de Mélenchon le restent. A l’inverse, quand on neutralise l’effet de diplôme, le score de Zemmour devient un peu plus conforme à la théorie, il améliore ses scores quand l’urbanité diminue, mais la part des différences expliquées reste faible (7%).

Cette troisième série d’éléments va dans le même sens que les deux séries précédentes. Dès lors, il nous semble possible de conclure que la théorie du gradient d’urbanité, qui veut que vivre dans l’urbain incite à voter pour des partis de gouvernement et que s’éloigner de l’urbain le plus dense (Paris intra-muros) conduise à voter pour des partis protestataires, d’autant plus qu’on s’en éloigne, est invalidée empiriquement.

Vote rural, vote urbain : une distinction peu opérante

Je reviens à la charge sur l’analyse des votes, suite à un message reçu sur Linkedin, qui renvoyait sur le post ci-dessous, représentatif de tout un ensemble d’interprétations du vote du premier tour (il ne s’agit donc pas de dénoncer les propos de l’auteur du post, mais de les déconstruire) :

La personne qui m’a écrit me demandait ce que je pensais de ce post, compte-tenu de ma tendance à critiquer les discours opposants métropoles, villes moyennes et monde rural. Or, le post semble interpréter les résultats à l’aune d’une fracture territoriale, qui opposerait monde urbain et monde rural (ou Métropoles et France périphérique pour reprendre le vocabulaire le plus usuel), et qui semble bien réelle. Voici des éléments d’analyse.

Le premier problème avec cette carte, c’est qu’elle donne à voir, pour chaque commune, le candidat arrivé en tête, si bien qu’on a l’impression, quand une commune est en bleue, que tous les habitants de ladite commune ont voté le Pen, et quand elle est en beige, que tous ont voté Macron, ce qui n’est pas le cas. Mieux vaut s’en remettre aux pourcentages obtenus par les candidats. En l’occurrence, je vous propose de me concentrer sur Macron et le Pen, et d’analyser les scores sur la base de la grille communale de densité, qui permet de distinguer le monde urbain (communes très denses et de densité intermédiaire) et le monde rural (communes peu denses et très peu denses).

votes obtenus par les deux premiers candidats au premier tour de la présidentielle de 2022 (%)

Les votes en France métropolitaine varient selon le degré de densité, un peu pour Macron, plus fortement pour le Pen, avec environ dix points d’écarts entre les communes très denses et les autres. Les résultats pour la Moselle sont peu différents, si ce n’est que le vote Macron y est un peu plus faible et que le vote le Pen y est plus nettement plus fort.

Le problème est que ces différences sont liées en partie aux différences de composition sociale des territoires : supposons que les ouvriers votent plus souvent le Pen que les autres catégories sociales, et qu’ils soient plus présents dans les communes peu denses et très peu denses, on s’attend à ce que le vote le Pen soit plus fort dans ces communes, non pas parce qu’elles sont « rurales », mais parce que la composition des personnes qui y vivent est différente.

Distinguer entre ces effets de composition et les effets de densité est essentiel, pour ne pas mésinterpréter les votes. Si on ne le fait pas, on s’expose à des interprétations du type : les personnes qui vivent dans le rural votent plus souvent pour le Pen, car ils sont moins tolérants, ils ne sont pas ouverts aux autres, moins ouverts à la diversité à laquelle ils ne sont pas confrontés au quotidien, ils pâtissent d’un faible degré d’urbanité, etc.

J’ai procédé ailleurs à une analyse qui permet de distinguer effets de composition et effets de densité. Méthodologiquement, il s’agit « d’expliquer » les votes en ne retenant que la densité comme variable (on obtient alors des effets bruts), puis en retenant d’autres variables à côté de la densité, pour obtenir des effets nets. Plus précisément, j’ai retenu dans mon analyse la part des personnes diplômées du supérieur, le taux de chômage, la part des plus de 65 ans, la part des 15-29 ans et la part des immigrés (j’ai également intégré une indicatrice régionale pour la France métropolitaine).

effets bruts et effets nets de la densité sur les scores des deux premiers candidats au premier tour de l’élection présidentielle de 2022 (%)

La partie haute du tableau reprend les résultats pour l’ensemble de la France métropolitaine, la partie basse pour la Moselle. Je vous explique comment lire le tableau, en prenant l’exemple de sa partie haute , le chiffre de -1,4 de Macron pour les communes de densité intermédiaire : ce qu’il signifie, c’est qu’en moyenne, en France métropolitaine, le score de Macron est inférieur de 1,4 point de pourcentage dans les communes de densité intermédiaire, par rapport à son score dans les communes très denses (qui sont prises comme modalité de référence). Quand on neutralise les effets de composition, on constate que l’effet “densité intermédiaire plutôt que forte densité” passe de -1,4 à +0,1 point de pourcentage.

Que ce soit en France métropolitaine ou dans le département de la Moselle, le résultat principal est que l’effet de la densité sur le vote le Pen est très sensiblement réduit, il passe de plus de 10 points à 1 ou deux points. De plus, en Moselle, les coefficients attachés aux communes de densité intermédiaire, peu denses et très peu denses ne sont pas significativement différents de 0 (pas de différence statistiquement significative au seuil de 1% pour le score de le Pen entre les différents types de communes).

Un autre résultat intéressant pour la Moselle est que l’effet de densité s’inverse pour Macron : il est négatif quand on analyse l’effet brut, il devient positif quand on analyse l’effet net. Ceci signifie qu’à caractéristique identique, en Moselle, les personnes vivant dans les communes moins denses ont plus voté pour Macron que celles vivant dans des communes plus denses. Ce n’est pas le cas ailleurs en France, les effets de densité restent négatifs pour Macron quand la densité diminue.

A caractéristiques identiques, les écarts de vote entre monde rural et monde urbain sont donc limités. Si l’on observe des différences, c’est, pour l’essentiel, parce que les caractéristiques des populations qui y vivent diffèrent. On peut donc en déduire que les interprétations à coup de gradient d’urbanité sont à prendre avec d’infinis précautions, pour dire le moins.

Ceci étant, il reste des effets de densité en France métropolitaine, limités mais significatifs. Comment peut-on l’expliquer ? Première hypothèse : les variables mobilisées ne capturent qu’une partie des différences de composition sociale, si je pouvais les capturer totalement, les effets de densité disparaîtraient.  Deuxième hypothèse, qui a ma préférence : en dehors des effets de composition, il existe des différences significatives entre monde rural et monde urbain, notamment en matière d’accessibilité aux services et aux équipements, qui peuvent conduire à des différences dans les votes.

Ceci me permet d’insister pour finir sur un point important : je dénonce souvent l’opposition entre métropoles, villes moyennes, petites villes et monde rural, mais c’est sur le plan de la capacité à innover ou à créer des emplois. Ceci ne signifie pas qu’il n’existe aucune différence entre ces catégories de territoires : il en existe, notamment sur ce sujet des services à la population. Ce qui me conduit à plaider pour qu’on arrête de croire que l’horizon indépassable de la création de richesse et d’emploi, ce sont les métropoles, d’une part, et qu’on se focalise sur les enjeux d’aménagement et d’équipement des territoires, en se préoccupant de ceux qui pâtissent d’un déficit en la matière, d’autre part.

Suite à des demandes, voici en complément les résultats obtenus pour Jean-Luc Mélenchon :