Votes aux législatives : explorations géographiques

Je propose dans ce billet quelques analyses géographiques des votes au 1er tour des élections législatives 2024, à partir des données par circonscription hors DROM-COM et hors français de l’étranger, soit 539 circonscriptions.

J’ai regroupé l’ensemble des listes en 5 blocs : gauche, majorité présidentielle, droite, extrême-droite et divers. Sur cette base, j’ai d’abord produit une classification ascendante hiérarchique, qui permet de distinguer 4 classes de territoires.

J’ai nommé chaque classe en fonction du ou des blocs surreprésentés. Le tableau ci-dessous reprend le score moyen non pondéré de chaque bloc, pour chaque classe.

J’ai ensuite produit une autre analyse, en récupérant un jeu de données proposé par l’INSEE, qui propose 119 indicateurs statistiques socio-démo-géo-économiques sur les circonscriptions législatives. J’ai calculé des coefficients de corrélation simple entre les scores des 4 principaux blocs (ED, NFP, MP, D) et chacune de ces variables.

Accéder aux résultats en cliquant sur ce lien (PDF)

Certains coefficients sont relativement élevés pour la gauche et pour l’extrême-droite, plus modérés pour la majorité présidentielle, faibles pour la droite. Pour l’extrême-droite, on constate que les scores sont plus élevés sur les territoires périurbains, ou sont surreprésentés les personnes peu diplômées, ouvriers ou retraités, propriétaires de leur logement, allant au travail en voiture. Pour la gauche, ressortent les circonscriptions avec une part plus forte de personnes vivant dans l’urbain, de jeunes lycéens ou étudiants, de personnes pauvres de 50 ans ou plus, se déplaçant en transport en commun, plus diplômées. Pour la majorité présentielle, ce sont les effets revenus qui dominent, les circonscriptions qui ressortent ont un niveau de vie et un premier décile de revenu plus élevé, la part des ménages aisés est plus forte, on a également une part plus importante de personnes diplômées. On n’a pas de surreprésentation d’un type de territoire. Pour la droite, les coefficients sont faibles, les plus forts correspondent à une localisation dans le rural, sur des territoires présentant des problèmes d’accessibilité un peu plus marqués.

Il s’agit de premières explorations, les données à la commune permettront de compléter l’analyse, affaire à suivre, donc.

Le vote Bardella : un vote rural ?

Très vite après la publication des résultats aux élections européennes, des cartes à la commune sont apparues, le choix majoritaire consistant à représenter la liste arrivée en tête (voir ici par exemple, ou pour une carte intégrant la répartition inégale de la population voir ici). Le Rassemblement National couvre la quasi-intégralité du territoire, à l’exception des plus grandes villes.

Il n’a pas fallu longtemps pour qu’une interprétation géographique du vote apparaisse : le rural vote Bardella, seul l’urbain le plus dense résiste, c’est lié au fait que les populations rurales se sentent abandonnées, diront certains, pendant que d’autres expliqueront que l’urbain, en exposant à la diversité, prémunit de ce vote extrême.

J’avais déjà alerté avec beaucoup d’autres chercheurs sur les limites fortes de ces interprétations géographiques du vote (voir ici et ). Oui, quand on compare vote urbain et vote rural, il y a un écart très important pour certains candidats. Mais pour l’essentiel, c’est un effet de composition sociale : lorsqu’on compare le vote rural et le vote urbain à niveau de diplôme et tranche d’âge identique, on n’observe pratiquement plus de différence.

Le tableau ci-dessus reprend les résultats des calculs que je viens de réaliser sur la base des résultats par commune au élections européennes de dimanche dernier. Je me suis concentré sur les 7 listes arrivées en tête, et j’ai regroupé les 31 autres listes dans une catégorie « autres ». J’ai ensuite calculé le score moyen selon que la commune étant rurale ou urbaine au sens de la grille communale de densité. Pour Bardella, le score dans l’urbain est en moyenne de 27,7%, il est de 38,0% dans le rural, soit un écart brut de +10,3 points. L’autre différence importante concerne la liste Aubry, avec un score sensiblement plus fort dans l’urbain (12,7%) que dans le rural (5,2%), cette fois.

J’ai ensuite analysé l’impact sur les différences urbain-rural d’effets de diplôme, d’âge et d’appartenance régionale, ce qui permet de calculer un effet rural net. Il s’avère alors que la différence rural-urbain pour le vote Bardella tombe de +10,3 points à +1,3 point. L’écart n’est pas nul, il reste statistiquement significatif, mais il est bien plus réduit. C’est également le cas pour la liste Aubry, les effets d’âge et de diplôme réduisent substantiellement l’écart rural-urbain, qui reste cependant supérieur à 2 points. Pour tous les autres candidats, l’écart devient très faible, inférieur à 1 point.

Pour l’essentiel, donc, la différence rural-urbain dans le vote Bardella est un effet de diplôme et d’âge, bien plus qu’un effet de localisation.

La répartition rural-urbain dans le temps long (1876-2021)

L’INSEE a publié une étude nationale sur l’évolution de la population entre 2015 et 2021  ainsi que des déclinaisons par région (voir ici). Le titre de l’étude nationale “la croissance démographique est deux fois plus élevée dans l’espace urbain que dans le rural”, me semble peu approprié, mais c’est malheureusement l’idée que de trop nombreuses personnes ont retenue, alors qu’en matière de dynamique de population, la répartition rural-urbain est particulièrement stable depuis 50 ans.

Pour preuve le graphique associé à ce billet, où j’ai exploité les données de l’INSEE sur les populations par commune (dans leur géographie actuelle) entre 1876 et 2021 (vous les trouverez ici. On y distingue les communes en fonction de leur degré de densité, des communes les plus denses (les grands centres urbains) aux communes les moins denses (les communes rurales à habitat dispersé).

Entre 1876 et 1975 on voit le poids de l’urbain augmenter continûment pour atteindre son maximum de près de 70% en 1975. Depuis, la part rural-urbain est particulièrement stable : 2/3 de la population environ vit dans l’urbain, 1/3 dans le rural). Ce qui ne signifie pas qu’il n’y a pas de mouvements, il y en a, mais ils obéissent à d’autres logiques. Les dynamiques macro-territoriales, au profit de l’Ouest et du Sud du pays, notamment, également évoquées dans l’étude de l’INSEE, dominent très largement les différences rural-urbain.

Taux de croissance annuel moyen de la population entre 2015 et 2021, données recensement INSEE

La carte ci-dessus permet de visualiser le jeu de ces logiques macro-territoriales, avec des taux de croissance plus élevés le long de ce qu’on appelle le U de la croissance, qui descend le long du littoral atlantique, suit le Sud du pays et remonte jusqu’en Alsace.

Composition sociale des territoires : où vivent les catégories populaires ?

Louis Maurin m’a contacté il y a quelques jours pour me demander s’il était possible d’actualiser les chiffres datant de 2010 publiés dans cet article, sur la composition sociale des territoires. L’enjeu notamment est d’interroger un discours selon lequel les catégories populaires seraient concentrées dans le rural (la “France périphérique”), qu’elles auraient été chassées des plus grandes villes, au sein desquelles on ne trouverait plus qu’une élite mondialisée ou des bobos déconnectés.

Son mail est bien tombé, pile au moment d’une petite insomnie. J’ai donc décidé d’analyser la géographie des catégories sociales, avec un focus sur les différences rural-urbain. J’ai exploité pour cela les données sur la population active occupée du recensement millésime 2020 à la commune[1]. J’ai par ailleurs retenu comme définition du rural et de l’urbain la grille communale de densité : les communes dites urbaines sont les communes très denses ou de densité intermédiaire, les communes dites rurales sont les communes peu denses[2]. J’ai également introduit une distinction importante entre lieu de résidence et lieu de travail : des actifs peuvent en effet habiter une commune rurale mais travailler dans une commune urbaine, ou inversement.

Tableau 1. Localisation des actifs occupés par catégorie sociale, RP 2020, %

Toutes catégories confondues, un tiers des actifs occupés réside dans le rural et deux tiers dans l’urbain. Quand on analyse les lieux de travail plutôt que les lieux de résidence, les proportions sont respectivement d’un cinquième dans le rural et de quatre cinquièmes dans l’urbain, signe d’une concentration géographique de l’emploi dans l’urbain plus forte que celle de la population.

L’analyse par catégorie sociale montre que, sans surprise, les agriculteurs exploitants résident et travaillent essentiellement dans des communes rurales, autour de 85% (en creux, cela signifie quand même qu’environ 15% des agriculteurs sont des urbains). Pour toutes les autres professions, c’est la localisation dans l’urbain qui est majoritaire, dans des proportions certes variables, mais avec un minimum de 58% pour les ouvriers localisés à leur résidence.

On observe également des écarts importants entre lieux de résidence et lieux de travail pour toutes les professions, d’où l’intérêt de la distinction : l’écart monte à 15 points de pourcentage pour les professions intermédiaires, qui sont 17% à travailler dans le rural mais plus de 32% à y résider, il est encore de 10 points pour les cadres et professions intellectuelles supérieures, qui sont deux fois plus nombreux à résider dans le rural (20%) qu’à y travailler (10%).

Tableau 2. Composition sociale des territoires, RP2020, %

Le Tableau 2 présente en complément, à partir des mêmes chiffres, la composition sociale des territoires, au lieu de résidence et au lieu de travail. S’il existe des différences entre rural et urbain, il convient de ne pas les exagérer : les cadres et professions intellectuelles supérieures ne sont pas absents du monde rural, puisqu’environ 1 habitant sur 10 y travaille ou y réside, et inversement, les catégories dites populaires (employés et ouvriers) sont loin d’être absentes du monde urbain, puisqu’elles représentent autour de 45% de la population et de l’emploi de ces communes.

Tableau 3. Localisation (à la résidence) des actifs occupés selon la grille de densité à 7 niveaux %

Le Tableau 3 complète les deux premiers en présentant les résultats à un niveau plus détaillé de la grille de densité, du niveau de densité le plus fort (grands centres urbains) au niveau le plus faible (rural à habitat très dispersé). Les 4 premiers niveaux correspondent à l’urbain, les 3 derniers au rural. Si on se focalise sur les catégories dites populaires, on constate que plus d’un ouvrier sur 4 et plus d’un employé sur 3 habitent dans un grand centre urbain (le tableau reprend les chiffres au lieu de résidence, pas au lieu de travail).

Tableau 4. Composition sociale des territoires (au lieu de résidence) pour les 7 niveaux de la grille de densité, %

Le tableau 4 présente à partir des même chiffres la composition sociale des territoires (lecture colonne). Les ouvriers sont sous-représentés dans les grands centres urbains et les ceintures urbaines, mais ils représentent cependant une fraction non négligeable des habitants (a minima près de 15% des habitants des grands centres urbains). C’est encore plus vrai pour les employés.

Il convient donc de ne pas caricaturer la composition sociale des territoires (« les cadres sup sont tous dans l’urbain », « les classes populaires sont toutes dans le rural »), ni assigner les personnes à un type d’espace, alors que, souvent, elles circulent de différentes façons entre rural et urbain.

[1] Source : https://www.insee.fr/fr/information/7619431

[2] Pour des éléments de définition et une discussion de l’intérêt et des limites de cette définition, voir Olivier Bouba-Olga, « Qu’est-ce que le « rural » ? Analyse des zonages de l’Insee en vigueur depuis 2020 », Géoconfluences, mai 2021 (lien).

“les métropoles sont-elles les villes les plus performantes ?” Echanges avec Denise Pumain

La revue Espaces et Sociétés nous a proposé début 2021, à Michel Grossetti et à moi, d’écrire un article relatif à notre analyse du récit métropolitain, en nous indiquant que Denise Pumain, grande dame de la géographie française, réagirait à notre texte.

Nous avons immédiatement accepté cette proposition, qui s’est traduite finalement par des allers-retours que la revue vient de publier (accès abonnés ici) sous forme d’un long article titré « les métropoles sont-elles les villes les plus performantes ? ». La première partie est composé de notre article, « métropoles : les dangers de la substantialisation d’une catégorie d’analyse », de la réaction de Denise Pumain à notre article, de notre réponse à sa réponse, puis, finalement, de sa réponse à notre réponse.

Ce fut un exercice particulièrement intéressant, qui nous a permis de clarifier différents points de notre argumentation, de constater des points de convergence entre notre analyse et la sienne (dès lors notamment qu’on s’entendait sur la définition de certains termes, les questions de définition ne sont pas les dernières dans les désaccords apparents entre chercheurs), mais aussi des points de divergence, qui demeurent.

Il me semble que le point principal de divergence concerne nos analyses respectives du processus d’innovation : Denise Pumain développe une analyse que je qualifierais d’épidémiologique, selon laquelle les métropoles seraient les lieux premiers d’apparition des innovations, qui se diffuseraient ensuite progressivement au reste du système urbain. Nous contestons ce point, sur la base, notamment mais pas seulement, de nos travaux de terrain, en considérant que les innovations naissent dans de très nombreux points de l’espace, elles ne sont pas limitées aux plus grandes villes, loin de là.

Ce n’est pas un hasard si c’est autour de cette question de la géographie de l’innovation que le débat demeure : il y a un large consensus autour de l’importance de l’innovation, mais c’est l’objet pour lequel, paradoxalement, on dispose du moins de données pertinentes. Les chercheurs approchent le phénomène pour l’essentiel en étudiant les dépenses de recherche, les brevets ou les publications, mais c’est un une façon très incomplète et très insatisfaisante de l’analyser. Difficile, donc, d’obtenir des résultats robustes sur les processus d’émergence et de diffusion des innovations, en dépit de leur importance.

De quoi le PIB par habitant de l’Ile-de-France est-il le nom ?

L’INSEE vient de publier sa dernière analyse des PIB régionaux, où l’on apprend que le PIB par habitant, qui est en moyenne de 34 100€ en France, est de 57 600€ en Ile-de-France, contre 29 175€ ailleurs en France métropolitaine, soit un rapport du simple au double. Est-ce à dire qu’on est deux fois plus performant quand on est en Ile-de-France plutôt qu’ailleurs dans le pays ? Non, le PIB par habitant, dans sa déclinaison régionale, n’est pas le nom de la performance économique, pour plusieurs raisons que je vous propose de développer [1].

La première est que tous les habitants ne contribuent pas à la création de richesses, car tous ne sont pas en âge de travailler, et pour ceux qui le sont, tous ne travaillent pas. D’où la nécessité de décomposer le PIB par habitant en deux parties : le PIB par emploi (appelé aussi la productivité apparente du travail, plus proche de l’idée de performance économique, même si nous allons avoir ensuite que pas totalement, loin de là), d’un côté, et le ratio emploi par habitant, de l’autre. Le PIB par habitant est le produit de ces deux termes.

On constate alors que le PIB par emploi de l’Ile de France (111 073€) n’est plus égal à deux fois celui du reste de la France métropolitaine (72 886€), il est 1,5 fois plus élevé. Même si elle reste très importante, la différence est divisée par deux. Le reste est dû au ratio emploi par habitant, qui est 1,3 fois plus élevé en Ile-de-France (51,9 emplois pour 100 habitants) que dans le reste de la France métropolitaine (40 emplois pour 100 habitants). Le PIB par habitant est donc le nom, en partie, de choses très éloignées de la performance économique, en lien avec le rapport observé sur un territoire donné entre le nombre d’emplois et le nombre d’habitants, rapport sur lequel je reviendrai plus loin.

La deuxième raison est liée aux effets de spécialisation : un PIB par emploi supérieur en A à ce qu’il est en B peut résulter du fait non pas qu’on est plus performant en A qu’en B, mais que la région A est plus spécialisée que B dans les secteurs à forte productivité apparente du travail. Le PIB par habitant de l’Ile-de-France est donc le nom, aussi, de la division régionale du travail, avec certains secteurs plus présents dans la région capitale, et d’autres plus présents dans les autres régions, secteurs qui comprennent des établissements qui travaillent ensemble et qui rendent donc indissociables des territoires qu’on a trop tendance à séparer. L’agriculture est environ 20 fois moins présente en Ile-de-France qu’ailleurs, l’industrie 1,6 fois moins présente (notamment l’industrie agro-alimentaire plus de 3 fois moins présente), tandis que le secteur de l’information-communication y est près de deux fois plus présent et celui de la banque, de la finance et des assurances 1,8 fois plus.  Nous avions fait le calcul dans un article pour la revue de l’OFCE, à l’époque ces effets de composition réduisaient d’un tiers environ la surperformance apparente de l’Ile-de-France, on tomberait donc avec les chiffres actuels à un rapport autour de 1,3 fois le PIB par emploi hors effets de composition (ce serait à vérifier bien sûr, ça a pu changer un peu).

La troisième raison, non évoquée par l’INSEE, est d’une importance  cruciale : en fait, il n’est pas possible de calculer un PIB régional stricto sensu, c’est-à-dire de faire la somme des valeurs ajoutées des entreprises d’une région, parce que beaucoup d’entreprises détiennent des établissements dans plusieurs régions, et qu’on ne dispose pas d’une comptabilité par établissement, mais par entreprise. Comment calculer malgré tout un PIB régional ? Ce que fait l’INSEE, et c’est la moins mauvaise solution, c’est de ventiler la valeur ajoutée localisée au siège social de l’entreprise au prorata de la masse salariale versée dans ses différents établissements.

Cette façon de faire est acceptable si on considère que les différences de salaires correspondent à des différences de productivité, mais c’est une hypothèse quelque peu héroïque, notamment quand on parle des traders de la finance, de l’état-major des grands groupes, du salaire des superstars, …, pratiquement tous localisés en France dans la région capitale : toujours dans le même article, nous avions montré que les deux-tiers des 1% des salaires les plus hauts et les quatre cinquièmes du 0,1% des salaires les plus hauts étaient localisés en Ile-de-France. Ajoutons à cela le fait que les salaires parisiens sont en moyenne plus élevés parce que le niveau des prix est également plus élevé, d’environ 9% estime l’INSEE (voir ici par exemple), sans lien, là encore, avec les niveaux de productivité des salariés.

Pour autant, comme les masses salariales sont la clé de répartition de la valeur ajoutée, la région Ile-de-France récupère beaucoup de la valeur ajoutée des entreprises, si bien que le calcul de la productivité apparente du travail (le terme « apparent » devient particulièrement important) s’appuie sur des différences de salaires censées en rendre compte, alors que, pour partie, ces différences n’ont rien à voir avec elle. On peut donc dire que le PIB par habitant de l’Ile-de-France est aussi, pour partie, le nom de la concentration géographique de l’élite du pays (élite économique, artistique, médiatique ou encore de la haute administration), qui bénéficie de salaires peu liés à une quelconque productivité et plus généralement des inégalités de revenu issu du travail non liées totalement aux différentiels de productivité.

La ventilation de la valeur ajoutée au prorata des rémunérations versées pose un autre problème quand on veut parler de productivité : elle désavantage les régions où les processus productifs sont plus intensifs en capital et, en dynamique, celles pour lesquelles l’intensité capitalistique augmente. Imaginez une entreprise qui détient deux sites, dans deux régions différentes A et B. Le site de production en B investit dans de nouvelles machines, automatise le processus, réduit ses effectifs. Le site de commandement en A est inchangé. Implication : hausse de la valeur ajoutée et de la productivité apparente en A et baisse de la valeur ajoutée et de la productivité apparente en B. Pour pallier ce problème important, il faudrait évaluer la productivité totale des facteurs, mais on ne dispose pas des données pour cela à l’échelle des régions.

Revenons à l’autre ratio qui influe sur les différences de PIB par habitant : le ratio emploi par habitant. Il dépend lui-même de plusieurs éléments (sa décomposition est précisée dans le document), notamment du rapport entre le nombre d’emplois et le nombre d’actifs occupés, et le rapport entre le nombre de personnes en âge de travailler et le nombre d’habitants, deux ratios plus élevés en Ile-de-France que dans le reste de la France métropolitaine.

S’agissant du rapport entre nombre d’emplois localisés en Ile-de-France et nombre d’actifs occupés résidant en Ile-de-France, la valeur élevée du ratio (1,05 en Ile-de-France contre 0,96 ailleurs en France métropolitaine) s’explique par le fait que de nombreuses personnes travaillent dans la région capitale mais résident dans des régions limitrophes. Mécaniquement, ceci fait monter le ratio emploi par habitant et donc le PIB par habitant. J’ai cependant un problème avec la façon dont l’INSEE en parle, en disant que Paris « attire des travailleurs résidant dans les régions voisines, notamment en Bourgogne-Franche-Comté, Centre-Val de Loire et dans les Hauts-de-France », affirmation reprise par certains médias, par exemple ici. C’est aller bien vite en besogne d’affirmer que « Paris attire », car on peut tout aussi bien dire que « Paris repousse » des personnes qui travaillaient sur Paris, qui ne peuvent plus y vivre compte-tenu du prix de l’immobilier et qui donc s’éloignent, se localisent dans les régions limitrophes, en allongeant ce faisant leurs trajets domicile-travail. On ne peut pas trancher entre les deux processus, celui d’attraction par l’emploi ou de répulsion résidentielle, les deux existent, ils conduisent tous deux à l’augmentation du ratio emploi par habitant et donc à celui du PIB par habitant, qui est pour partie le nom des mobilités interrégionales domicile-travail. A noter que ce n’est pas la première fois que la façon dont l’INSEE mobilise le terme “attractif” me pose problème, j’en avais parlé au sujet de ce que je considère comme les très mal nommées “aires d’attraction des villes”.

S’agissant du rapport entre personnes en âge de travailler et nombre d’habitants, si sa valeur est forte sur l’Ile-de-France (65,5% contre 61,3% ailleurs en France métropolitaine), c’est aussi parce que les retraités quittent la capitale lors du passage à la retraite pour couler des jours heureux ailleurs, notamment sur les littoraux de l’Ouest et du Sud. Là encore, ceci se traduit par un PIB par habitant plus élevé que pour une région qui ne connait pas une telle « fuite » de ses retraités, le PIB par habitant est cette fois, pour partie, le nom des mobilités résidentielles des personnes passant à la retraite.

Au total, le PIB par habitant de l’Ile-de-France est le nom de processus géographiques complexes, non réductibles à une question de performance économique : il est le nom d’un vaste marché du travail où exercent des personnes qui pour partie résident ailleurs, par choix ou par nécessité ; il est le nom d’une région dans laquelle on ne reste pas pour finir ses vieux jours ; il est le nom de l’éclatement géographique des processus productifs et des spécialisations territoriales associées ; il est le nom de la concentration géographique de l’élite économique, politique, médiatique, …, à très hautes rémunérations ; il est le nom des inégalités de salaires non liées aux différentiels de productivité ; il est le nom de prix à la consommation plus élevés sur Paris qu’ailleurs. Avec comme enjeu évident l’analyse fine de ces processus complexes et interdépendants, et la nécessité d’en tirer des implications en termes d’action. Je ne suis pas sûr que cela soit réellement fait.


[1] Je m’appuie pour cela sur une analyse et une décomposition du PIB par habitant que nous avions proposée avec Michel Grossetti dans un article pour la Revue de l’OFCE, décomposition que l’INSEE reprend en partie.

Votes et gradient d’urbanité : une relation invalidée

Jacques Lévy est intervenu lundi 25 avril 2022 sur France Culture dans Le temps du débat, puis de nouveau le 1er mai, toujours sur France Culture, dans l’émission l’Esprit Public, pour commenter les résultats des élections. Son analyse s’appuie sur un travail cartographique conséquent visible ici.

Conformément à une thèse qu’il défend depuis longtemps (vous trouverez l’essentiel de ses idées appliquées au vote du 21 avril 2002 dans ce texte), il considère que les différences géographiques de vote s’expliquent avant tout par ce qu’il appelle les gradients d’urbanité, bien plus que par les différences de catégorie sociale, de diplôme ou d’âge.

Son idée forte est la suivante : l’urbain dense est le lieu de la diversité, de l’ouverture, de la tolérance, de la connexion au monde, dès lors, baigner dans des environnements à forte urbanité conduirait à voter pour des partis “de gouvernement”, “universalistes”, alors que quand l’urbanité est faible, on est enclin à voter pour des partis “protestataires”, “populistes”, “tribunitiens”. C’est cela qui expliquerait les votes, plus que le fait d’être jeune ou vieux, d’être diplômé du supérieur ou non diplômé, ouvrier, employé ou cadre supérieur.

Pour mesurer les gradients d’urbanité, Jacques Lévy s’appuie sur les zonages d’étude de l’INSEE, et dans ses dernières analyses, sur le zonage en aires d’attraction des villes. Chaque commune peut être rattachée à l’un des 8 gradients d’urbanité, qui sont définis sur la base d’une double distinction : en fonction de la tranche d’aire d’attraction des villes, d’une part, et de la situation de la commune par rapport à la commune centre de l’aire, d’autre part.

La commune qui présente le gradient d’urbanité le plus fort, c’est Paris, elle correspond au gradient 1. Suivent les communes de la banlieue de Paris, ainsi que les communes centres des aires de plus de 700 000 habitants, toutes étant de gradient 2 : les communes de la banlieue sont moins urbaines que Paris, mais elle bénéficient en quelque sorte de son ruissellement ; les communes centres des très grandes aires, ce n’est pas Paris, mais l’urbanité y est forte. Et ainsi de suite, jusqu’aux communes hors aires d’attraction des villes, de gradient 8, à l’urbanité la plus faible.

Pour mesurer l’impact des gradients d’urbanité, il procède à des analyses cartographiques, qui permettent de visualiser la géographie des votes en fonction de ces gradients, pour conclure le plus souvent que son analyse est validée. Il va cependant un cran plus loin : conscient que d’autres éléments peuvent jouer, notamment les effets de diplôme, de catégorie sociale ou d’âge, il affirme que les gradients d’urbanité sont plus explicatifs que ces autres éléments, sur la base d’un raisonnement quelque peu opaque et pour le moins curieux (voir ici, à partir de 5’30).

L’analyse de Jacques Lévy a fait l’objet de critiques sérieuses, depuis déjà longtemps (voir par exemple l’article de Fabrice Ripoll et Jean Rivière). Mon objectif ici est d’ajouter une pierre à la critique, en montrant qu’elle est invalidée empiriquement, sur la base des résultats du vote du premier tour des élections présidentielles 2022 de l’ensemble des communes de France métropolitaine.

Pour cela, il convient de définir précisément quels résultats on devrait obtenir si la “théorie” du gradient d’urbanité était vérifiée : on devrait observer i) un score des candidats de gouvernement qui augmente quand le degré d’urbanité augmente, ii) un score des candidats protestataires qui diminue quand le degré d’urbanité augmente, iii) un pouvoir explicatif du gradient d’urbanité supérieur au pouvoir explicatif d’autres distinctions (âge, CSP, niveau de diplôme), iv) un effet du gradient d’urbanité qui est observé à caractéristiques sociales égales par ailleurs.

Pour valider ou invalider ces propositions, je considère d’abord comme candidats de gouvernement Macron, Jadot, Pécresse et Hidalgo, et comme candidats protestataires les huit autres candidats, classés à gauche pour quatre d’entre eux (Mélenchon, Roussel, Poutou, Arthaud) et à droite pour les quatre autres (Le Pen, Zemmour, Lassalle, Dupont-Aignan). Sur cette base, je procède aux traitements suivants :

  1. j’analyse les scores moyens obtenus par chaque candidat, en fonction du gradient d’urbanité : si la théorie est vérifiée, le score moyen de Macron, Jadot, Pécresse et Hidalgo doit augmenter avec le degré d’urbanité, celui des huit autres candidats doit diminuer. Le gradient d’urbanité doit en outre expliquer une part importante des différences de vote observées entre communes,
  2. j’analyse parallèlement l’influence d’une autre variable que le gradient d’urbanité : la part des diplômés du supérieur par commune. Si la théorie est validée, cette variable doit expliquer une part moins importante du vote que le gradient d’urbanité,
  3. j’analyse dans un même modèle le gradient d’urbanité et la part des diplômés du supérieur, afin d’évaluer l’impact du gradient d’urbanité à niveau de diplôme donné. Si la théorie fonctionne, le gradient d’urbanité doit exercer l’influence attendue sur les scores des candidats de gouvernement et des candidats protestataires.

Commençons par cette première proposition, en mesurant l’impact du gradient d’urbanité sur les votes des 12 candidats. Dans le tableau, vous pouvez lire le score obtenu par chaque candidat dans la commune de Paris (gradient 1), puis l’écart à ce score pour les gradients de 2 à 8. La dernière ligne renseigne sur le pourcentage des différences de votes entre communes expliquées par le gradient d’urbanité.

Scores au 1er tour de l’élection présidentielle de 2022 par gradient d’urbanité (score moyen des communes du gradient 1 et écart à ce score pour les autres gradients)

A titre d’exemple de lecture, le score d’Emmanuel Macron dans la commune de Paris est de 35,3%, celui de Yannick Jadot est de 7,3%. En moyenne, dans les communes de la banlieue de Paris et dans les communes centre des aires de plus de 700 000 habitants, le score d’Emmanuel Macron est inférieur de 6,4 points de pourcentage au score qu’il obtient sur Paris, et celui de Yannick Jadot est inférieur de 2 points de pourcentage à son score parisien. Sur la dernière ligne de ces deux candidats, on constate que les gradients d’urbanité n’expliquent que 7% des différences communales de vote Macron, et 21% des différences pour Jadot.

Globalement, s’agissant des candidats de gouvernement, on constate que les scores hors Paris sont tous inférieurs au bloc sur Paris intra-muros, ce qui va dans le sens de la théorie, mais dans sa version extrême, où l’urbanité serait réservée au cœur de la capitale, point d’urbanité en dehors. De plus, le gradient d’urbanité n’explique qu’une faible partie des différences entre communes (variance expliquée inférieure à 10%), hormis pour Jadot, candidat pour lequel la théorie « marche » un peu mieux, puisque la variance expliquée par le gradient d’urbanité est de 21% et que son score est continûment décroissant quand on va du gradient 1 à 8.

Pour les candidats protestataires, la théorie fonctionne plutôt bien pour Marine le Pen puisque son score est continûment croissant avec le gradient (à l’exception du gradient 8, son score y est inférieur aux gradients 6 et 7) et il explique 46% des différences observées. En revanche, le résultat est inverse au résultat attendu pour Mélenchon (avec un pouvoir explicatif du gradient important, mais totalement contraire à l’attendu, de 46%) et pour Zemmour (mais avec un faible pouvoir explicatif du gradient d’urbanité, qui n’explique que 2% des différences de vote entre communes). Les résultats de Mélenchon et de Zemmour constituent clairement le premier élément d’invalidation de la théorie des gradients d’urbanité.

Deuxième temps de l’analyse, l’examen de la deuxième proposition, qui consiste à étudier le jeu d’une autre variable explicative considérée comme moins déterminante par Jacques Lévy que le jeu du gradient d’urbanité. J’ai retenu la part communale des diplômés du supérieur, qui exerce une influence certaine sur les votes. Je compare simplement la part des différences expliquées par le gradient d’urbanité, d’un côté, et la part expliquée par la part des diplômés du supérieur, de l’autre.

Variance expliquée par le gradient d’urbanité et par la part des diplômés du supérieur en pourcentage de la variance totale, dans les votes au 1er de tour de 2022. Pour la variable “part des diplômés du supérieur”, l’analyse a été faite en retenant la valeur continue de la variable, et également en constituant huit groupes de communes (1/8 des communes à plus faible part, puis 1/8 des suivantes, etc.), pour avoir un nombre de classes équivalent au nombre de gradient d’urbanité.

On constate que pour sept des douze candidats, la part des diplômés explique mieux les différences communales de score que le gradient d’urbanité, pour deux l’explication est équivalente (Hidalgo et Poutou), et c’est seulement pour 3 qu’elle est moins explicative que le gradient d’urbanité (Mélenchon, Lassalle et Dupont-Aignan), mais dans un sens contraire à l’attendu pour Mélenchon rappelons-le. L’écart est particulièrement fort pour Macron (+24 points de pourcentage d’explication) et pour Jadot (+32 points). Ces résultats constituent le deuxième élément d’invalidation de la théorie.

Dernier temps essentiel de la démonstration, l’analyse intégrée des deux effets. L’erreur principale de Jacques Lévy consiste en effet à étudier gradient d’urbanité, CSP, âge et diplôme séparément, en les considérant comme indépendants. Or, la composition sociale des territoires varie fortement selon le gradient d’urbanité. De ce fait, les différences de scores par gradient peuvent résulter non pas de sa théorie (on est plus tolérant quand on vit dans un environnement urbain, donc on vote moins pour les partis protestataires), mais de différences de caractéristiques sociales (on est plus diplômés, donc on vote moins pour les partis protestataires, qu’on habite dans l’urbain ou dans le rural). C’est à cette condition qu’on pourra éventuellement identifier le jeu d’un effet géographique « pur ».

Ecarts au score de gradient 1 pour les gradients 2 à 8 à part des diplômés du supérieur égale par ailleurs. Les valeurs soulignées sont non significativement différentes de 0 au seuil de 1%.

On constate que, quand on neutralise l’effet “part des diplômés du supérieur”, les résultats pour tous les candidats des partis de gouvernement sont contraires à la théorie : leur score est supérieur dans les communes hors Paris, il est même continument croissant pour Macron quand on passe du gradient 1 au gradient 8 d’urbanité (c’est le cas également pour Pécresse).

S’agissant des candidats protestataires, les résultats de Roussel sont maintenant contraires à la théorie (coefficients tous négatifs, mais leurs valeurs sont faibles), et ceux de Mélenchon le restent. A l’inverse, quand on neutralise l’effet de diplôme, le score de Zemmour devient un peu plus conforme à la théorie, il améliore ses scores quand l’urbanité diminue, mais la part des différences expliquées reste faible (7%).

Cette troisième série d’éléments va dans le même sens que les deux séries précédentes. Dès lors, il nous semble possible de conclure que la théorie du gradient d’urbanité, qui veut que vivre dans l’urbain incite à voter pour des partis de gouvernement et que s’éloigner de l’urbain le plus dense (Paris intra-muros) conduise à voter pour des partis protestataires, d’autant plus qu’on s’en éloigne, est invalidée empiriquement.

Le vote le Pen, un vote rural ?

Les résultats du vote à peine tombés, les analyses se multiplient. J’ai entendu, entre autres choses, à de nombreuses reprises, des commentateurs indiquer que le vote le Pen augmentait à mesure que l’on s’éloignait des villes. Est-ce bien le cas ? La réponse peut sembler en apparence paradoxale : oui, le vote le Pen est plus important dans le monde rural, mais non, ce n’est pas parce qu’on vit dans le monde rural qu’on vote plus le Pen. Or je pense qu’au moins certains commentateurs, et sans doute certains de ceux qui les écoutent, font la confusion entre ces deux idées.

Pour bien comprendre ce que je veux dire, je vous propose d’analyser la géographie du vote, à l’échelle des communes de France métropolitaine, en me focalisant sur le cas de Marine Le Pen, donc, et en comparant les résultats aux deux tours de l’élection, pour 2017 et pour 2022.

Mon objectif étant d’identifier l’influence éventuelle du degré de ruralité sur le vote, il convient de définir ce que l’on entend par commune rurale et par commune urbaine. Le mieux est de s’appuyer sur la nouvelle définition de la ruralité définie par l’Insee, définition basée sur la grille communale de densité : une commune rurale est une commune très peu dense ou peu dense, une commune urbaine est une commune très dense ou de densité intermédiaire (voir ici pour une présentation de cette nouvelle définition).

88% des communes sont rurales, elles concentrent 33% de la population au sens du recensement millésime 2019 et 37% des inscrits au 2ème tour de l’élection présidentielle de 2022.

Fort de cette définition, on peut comparer la moyenne des scores obtenus par Marine le Pen aux deux tours des deux dernières élections présidentielles. Commençons par comparer les résultats bruts, en dehors de toute autre considération.

Le tableau se lit de la façon suivante : le fait d’être une commune rurale plutôt qu’une commune urbaine augmente le score de Marine le Pen au premier tour de l’élection présidentielle de 2017 de 6,6 points de pourcentage en moyenne.  En 2022, l’augmentation est en moyenne de 8,6 points de pourcentage. Résultats sans aucune ambiguïté : les scores de la candidate du rassemblement national sont en moyenne bien plus importants dans le monde rural que dans le monde urbain, de 7 à 9 points aux premiers tours, de plus de 10 points aux deuxièmes tours.

Il y a cependant une autre information importante contenue dans le tableau : la part expliquée par le caractère rural des communes dans l’ensemble des différences de scores que l’on observe entre ces mêmes communes. On constate alors que les différences moyennes de résultats entre communes rurales et communes urbaines sont certes importantes, mais cette caractéristique n’explique qu’une part relativement faible de l’ensemble des différences constatées, moins de 20% dans tous les cas. Dit encore autrement : entre 81% et 88% des différences de scores entre rural et urbain s’expliquent par autre chose que le caractère rural ou urbain des communes.

Par ailleurs, une analyse plus satisfaisante des différences de scores entre communes consiste à intégrer non seulement leur dimension rurale ou urbaine, mais aussi des variables permettant de saisir les différences de composition sociale des territoires. Supposons pour illustrer que le vote le Pen soit en moyenne moins important chez les jeunes. Si la part des jeunes est plus faible dans les communes rurales, on s’attendra à ce que le score de Marine le Pen y soit plus fort, toute chose égale par ailleurs, non pas en raison du caractère rural de la commune stricto sensu, mais parce que la composition par âge y est différente.

Dans cette perspective, j’ai  comparé à nouveau les moyennes de scores entre communes rurales et communes urbaines en neutralisant certains de ces effets de composition, à l’aide d’un nombre volontairement réduit de variables : la part des diplômés du supérieur, la part des personnes de 65 ans et plus, la part des personnes de 15 à 29 ans et la part des immigrés dans la population. J’ai également introduit une indicatrice régionale. La question est de savoir si, à caractéristiques sociales introduites dans le modèle égales, et à région identique, on observe encore, ou non, des différences entre communes urbaines et communes rurales.

L’introduction de ces nouvelles variables change tout : l’effet ruralité est significativement réduit, le fait d’être une commune rurale plutôt qu’une commune urbaine n’augmente le score de Marine le Pen que, au plus, d’un peu plus d’un point de pourcentage. On constate également que l’introduction de ces variables améliore considérablement l’explication des différences de vote qui atteint voire dépasse les 80%. Il s’avère donc que, à caractéristique sociale identique, le fait de vivre dans une commune rurale plutôt que dans une commune urbaine ne conduit que très peu à voter plus le Pen.

Pour mesurer plus précisément le jeu des différentes variables, vous trouverez ci-dessous le tableau complet des résultats. Le coefficient associé à chaque variable vous donne l’effet de la variable sur le score de Marine le Pen (tous les coefficients sont statistiquement significatifs).

Guide de lecture : quand la part des diplômés du supérieur augmente d’un point de pourcentage, le score de Marine le Pen diminue de 0,5 point au premier tour de 2017 et de 0,7 point au deuxième tour de 2022. Le fait d’être une commune bretonne plutôt qu’une commune d’Auvergne-Rhône-Alpes diminue en moyenne de 7,8 points de pourcentage son score au premier tour de 2017 et de 11,2 points au deuxième tour de 2022.

On constate que le vote de Marine le Pen diminue quand la part des diplômés augmente, quand la part des jeunes ou des personnes âgées augmente, et quand la part des immigrés dans la population augmente. On observe également des effets régionaux marqués : effet très négatif sur son score d’être une commune de Bretagne, des Pays de la Loire, puis de Nouvelle-Aquitaine, effet très positif sur son score d’être une commune de PACA, de Corse, des Hauts-de-France ou de Grand Est.

Au final, contrairement à ce qu’une analyse sommaire de la géographie des votes pourrait laisser penser, le fait de vivre dans le rural ne conduit pas à voter plus pour Marine le Pen, pas plus que le fait de vivre dans l’urbain ne conduit à voter moins pour elle. Si le score de Marine le Pen augmente quand on s’éloigne des villes, c’est avant tout lié à la composition sociale des territoires, ainsi qu’à des effets macro-régionaux.

Vote rural, vote urbain : une distinction peu opérante

Je reviens à la charge sur l’analyse des votes, suite à un message reçu sur Linkedin, qui renvoyait sur le post ci-dessous, représentatif de tout un ensemble d’interprétations du vote du premier tour (il ne s’agit donc pas de dénoncer les propos de l’auteur du post, mais de les déconstruire) :

La personne qui m’a écrit me demandait ce que je pensais de ce post, compte-tenu de ma tendance à critiquer les discours opposants métropoles, villes moyennes et monde rural. Or, le post semble interpréter les résultats à l’aune d’une fracture territoriale, qui opposerait monde urbain et monde rural (ou Métropoles et France périphérique pour reprendre le vocabulaire le plus usuel), et qui semble bien réelle. Voici des éléments d’analyse.

Le premier problème avec cette carte, c’est qu’elle donne à voir, pour chaque commune, le candidat arrivé en tête, si bien qu’on a l’impression, quand une commune est en bleue, que tous les habitants de ladite commune ont voté le Pen, et quand elle est en beige, que tous ont voté Macron, ce qui n’est pas le cas. Mieux vaut s’en remettre aux pourcentages obtenus par les candidats. En l’occurrence, je vous propose de me concentrer sur Macron et le Pen, et d’analyser les scores sur la base de la grille communale de densité, qui permet de distinguer le monde urbain (communes très denses et de densité intermédiaire) et le monde rural (communes peu denses et très peu denses).

votes obtenus par les deux premiers candidats au premier tour de la présidentielle de 2022 (%)

Les votes en France métropolitaine varient selon le degré de densité, un peu pour Macron, plus fortement pour le Pen, avec environ dix points d’écarts entre les communes très denses et les autres. Les résultats pour la Moselle sont peu différents, si ce n’est que le vote Macron y est un peu plus faible et que le vote le Pen y est plus nettement plus fort.

Le problème est que ces différences sont liées en partie aux différences de composition sociale des territoires : supposons que les ouvriers votent plus souvent le Pen que les autres catégories sociales, et qu’ils soient plus présents dans les communes peu denses et très peu denses, on s’attend à ce que le vote le Pen soit plus fort dans ces communes, non pas parce qu’elles sont « rurales », mais parce que la composition des personnes qui y vivent est différente.

Distinguer entre ces effets de composition et les effets de densité est essentiel, pour ne pas mésinterpréter les votes. Si on ne le fait pas, on s’expose à des interprétations du type : les personnes qui vivent dans le rural votent plus souvent pour le Pen, car ils sont moins tolérants, ils ne sont pas ouverts aux autres, moins ouverts à la diversité à laquelle ils ne sont pas confrontés au quotidien, ils pâtissent d’un faible degré d’urbanité, etc.

J’ai procédé ailleurs à une analyse qui permet de distinguer effets de composition et effets de densité. Méthodologiquement, il s’agit « d’expliquer » les votes en ne retenant que la densité comme variable (on obtient alors des effets bruts), puis en retenant d’autres variables à côté de la densité, pour obtenir des effets nets. Plus précisément, j’ai retenu dans mon analyse la part des personnes diplômées du supérieur, le taux de chômage, la part des plus de 65 ans, la part des 15-29 ans et la part des immigrés (j’ai également intégré une indicatrice régionale pour la France métropolitaine).

effets bruts et effets nets de la densité sur les scores des deux premiers candidats au premier tour de l’élection présidentielle de 2022 (%)

La partie haute du tableau reprend les résultats pour l’ensemble de la France métropolitaine, la partie basse pour la Moselle. Je vous explique comment lire le tableau, en prenant l’exemple de sa partie haute , le chiffre de -1,4 de Macron pour les communes de densité intermédiaire : ce qu’il signifie, c’est qu’en moyenne, en France métropolitaine, le score de Macron est inférieur de 1,4 point de pourcentage dans les communes de densité intermédiaire, par rapport à son score dans les communes très denses (qui sont prises comme modalité de référence). Quand on neutralise les effets de composition, on constate que l’effet “densité intermédiaire plutôt que forte densité” passe de -1,4 à +0,1 point de pourcentage.

Que ce soit en France métropolitaine ou dans le département de la Moselle, le résultat principal est que l’effet de la densité sur le vote le Pen est très sensiblement réduit, il passe de plus de 10 points à 1 ou deux points. De plus, en Moselle, les coefficients attachés aux communes de densité intermédiaire, peu denses et très peu denses ne sont pas significativement différents de 0 (pas de différence statistiquement significative au seuil de 1% pour le score de le Pen entre les différents types de communes).

Un autre résultat intéressant pour la Moselle est que l’effet de densité s’inverse pour Macron : il est négatif quand on analyse l’effet brut, il devient positif quand on analyse l’effet net. Ceci signifie qu’à caractéristique identique, en Moselle, les personnes vivant dans les communes moins denses ont plus voté pour Macron que celles vivant dans des communes plus denses. Ce n’est pas le cas ailleurs en France, les effets de densité restent négatifs pour Macron quand la densité diminue.

A caractéristiques identiques, les écarts de vote entre monde rural et monde urbain sont donc limités. Si l’on observe des différences, c’est, pour l’essentiel, parce que les caractéristiques des populations qui y vivent diffèrent. On peut donc en déduire que les interprétations à coup de gradient d’urbanité sont à prendre avec d’infinis précautions, pour dire le moins.

Ceci étant, il reste des effets de densité en France métropolitaine, limités mais significatifs. Comment peut-on l’expliquer ? Première hypothèse : les variables mobilisées ne capturent qu’une partie des différences de composition sociale, si je pouvais les capturer totalement, les effets de densité disparaîtraient.  Deuxième hypothèse, qui a ma préférence : en dehors des effets de composition, il existe des différences significatives entre monde rural et monde urbain, notamment en matière d’accessibilité aux services et aux équipements, qui peuvent conduire à des différences dans les votes.

Ceci me permet d’insister pour finir sur un point important : je dénonce souvent l’opposition entre métropoles, villes moyennes, petites villes et monde rural, mais c’est sur le plan de la capacité à innover ou à créer des emplois. Ceci ne signifie pas qu’il n’existe aucune différence entre ces catégories de territoires : il en existe, notamment sur ce sujet des services à la population. Ce qui me conduit à plaider pour qu’on arrête de croire que l’horizon indépassable de la création de richesse et d’emploi, ce sont les métropoles, d’une part, et qu’on se focalise sur les enjeux d’aménagement et d’équipement des territoires, en se préoccupant de ceux qui pâtissent d’un déficit en la matière, d’autre part.

Suite à des demandes, voici en complément les résultats obtenus pour Jean-Luc Mélenchon :

Présidentielles 2022 : quelle(s) géographie(s) du vote ?

Les résultats du premier tour de l’élection présidentielle à peine tombés, des cartes sur la géographie du vote commencent à circuler. La tendance dominante consiste à proposer des cartes des candidats arrivés en tête, à l’échelle des communes (France Info par exemple) ou des départements (Huffigton Post, France Bleu), façon très réductrice de présenter les choses. C’est que cartographier les résultats du vote est un exercice périlleux et tout sauf anodin. Sur le sujet, je recommande particulièrement la lecture de cet article d’Aurélien Delpirou, joliment titré « l’élection, la carte et le territoire : la victoire en trompe l’œil de la géographie », qui date des dernières élections mais qui reste d’actualité.

Pour ma part, j’ai décidé de ne pas faire de carte, mais de me livrer à de petits exercices statistiques, avec en tête les interrogations suivantes : le score au premier tour d’Emmanuel Macron, de Marine Le Pen ou de Jean-Luc Mélenchon est-il plus important dans les communes rurales ou dans les communes urbaines ? En Ile-de-France, en Nouvelle-Aquitaine ou dans le Grand Est ? Dans les communautés de communes ou dans les communautés d’agglomération ? Parmi ces différents effets (effet rural/urbain, effet d’appartenance régionale ou effet d’inclusion dans tel ou tel type d’intercommunalité), quel est le plus déterminant ?

Pour commencer à apporter des réponses, j’ai exploité les résultats du premier tour des présidentielles 2022 à l’échelle des communes de France métropolitaine. Or, il s’avère que si on trouve bien des effets géographiques, ils sont variables selon les candidats, et ils n’expliquent pas tout.

Prenons l’exemple du caractère rural ou urbain des communes. Pour le mesurer, je me suis appuyé sur la grille communale de densité, qui permet de distinguer les communes dites rurales, qui sont très peu denses ou peu denses, et les communes dites urbaines, qui sont de densité intermédiaire ou très denses. Pour le vote Macron, il s’avère que le degré de densité « n’explique » que 4% des différences de score : ceci signifie que Macron fait des scores élevés, moyens et faibles sur les communes des différentes catégories de densité. Pour les votes le Pen et Mélenchon, en revanche, le degré de densité est plus déterminant, il « explique » 36% des différences de scores chez le Pen, et 38% chez Mélenchon, mais dans un sens opposé : le score de Marine le Pen diminue, et celui de Jean-Luc Mélenchon augmente, avec la densité. Autrement dit encore, le vote Le Pen est surreprésenté en milieu rural, le vote Mélenchon est surreprésenté en milieu urbain. Mais attention, cela n’explique pas tout : le degré de densité explique moins de 40% des différences observées, pour l’un comme pour l’autre.

On peut faire le même type d’analyse pour d’autres effets : à côté de la densité, j’ai testé l’effet de l’appartenance régionale (13 régions de France métropolitaine) et celui de l’appartenance à tel ou tel type d’intercommunalité (en distinguant communautés de communes, communautés d’agglomération, communautés urbaines et métropoles). J’ai alors calculé, pour chaque candidat (ainsi que pour le taux d’abstention), ce que ces typologies des communes expliquaient des différences de scores. Les résultats sont repris dans le tableau ci-dessous.

Lecture : le degré de densité explique 17% des différences de taux d’abstention entre communes, l’appartenance régionale en explique 16% et le type d’EPCI 5%. Pour le vote Macron, ces trois effets expliquent respectivement 4%, 22% et 4% des différences de scores entre communes.

Il s’avère que les trois candidats pour lesquels les effets géographiques sont relativement marqués sont Le Pen, Mélenchon et Lassalle (sans surprise un effet rural pour ce dernier). Pour les autres candidats, ces effets géographiques n’expliquent qu’une petite partie des différences observées, avec quelques différences intéressantes entre effets géographiques : aucun effet rural/urbain pour Zemmour, Macron et Hidalgo, mais quelques effets régionaux, notamment pour le premier.

Je me concentre maintenant sur les candidats arrivés aux trois premières places. J’ai estimé un modèle des différences de vote avec comme variables explicatives le degré de densité des communes et leur région d’appartenance. Le tableau ci-dessous présente les résultats obtenus, voici comment il se lit : la commune de référence est une commune très dense d’Auvergne-Rhône-Alpes. Le fait d’être une commune de densité intermédiaire plutôt que d’être une commune très dense réduit le score d’Emmanuel Macron de 0,8 points de pourcentage. Le fait d’être en Bretagne plutôt qu’en Auvergne-Rhône-Alpes l’augmente de 5,3 points de pourcentage.

Ce modèle n’explique que 25% des différences de vote pour Emmanuel Macron, mais 43% pour Jean-Luc Mélenchon et jusqu’à 58% pour Marine Le Pen, candidate pour laquelle la géographie est la plus marquée.

S’agissant des effets de densité, on constate qu’ils jouent fortement dès qu’on sort des communes très denses, pour Le Pen comme pour Mélenchon, avec une variation de plus de 8 points de pourcentage entre communes très denses et communes de densité intermédiaire, à la hausse pour Le Pen, à la baisse pour Mélenchon.

S’agissant des effets régionaux, on observe un effet positif pour Macron en Bretagne et en Pays de la Loire et des effets négatifs principalement en Corse, en PACA et en Occitanie. Pour Le Pen, des effets très positifs en Hauts-de-France, PACA et Grand Est (à noter que le vote Zemmour bénéficie d’effets régionaux positifs en Corse et PACA seulement). Pour Mélenchon, enfin, les effets régionaux sont moins marqués, l’effet positif le plus important se retrouve en Ile-de-France, l’effet négatif le plus important se situe en Corse et en PACA.

Je me suis enfin amusé à analyser l’évolution de la géographie des votes pour les trois mêmes, entre le premier tour 2017 et le premier tour 2022, en me concentrant sur les effets densité et les effets régionaux.

Lecture : la densité des communes “explique” 18% des différences de vote Macron en 2017, et 4% en 2022.

Pour Macron, les effets densité et régionaux jouent encore moins en 2022 qu’en 2017. Pour Le Pen, et surtout pour Mélenchon, ils jouent en revanche sensiblement plus. En 2017, en dépit des propos avancés par certains, on n’avait pas un vote des villes pour Macron et un vote des campagnes pour Le Pen. En 2022, on n’a toujours pas de vote des villes ni des campagnes pour Macron, on a un peu plus un vote des campagnes pour Le Pen, et un peu plus un vote des villes pour Mélenchon.