La géographie des taux de chômage

L’Insee vient de publier les taux de chômage par zone d’emploi de 2003 à 2013. Les zones d’emploi (304 pour la France métropolitaine) sont un découpage géographique intéressant de l’espace français, basé sur les migrations domicile-travail.

Sur la base des chiffres publiés, on peut représenter la distribution des taux de chômage aux deux dates, en rouge la courbe pour 2003, en bleu la courbe pour 2013 :

tx_cho

Deux choses : i) la courbe se déplace vers la droite, signe d’un accroissement du taux de chômage pour la grande majorité des territoires français, ii) la distribution est plus étalée en 2013, signe d’une plus grande dispersion des taux de chômage.

Je me suis ensuite amusé (il en faut peu pour amuser un économiste) à calculer la corrélation entre le taux de chômage 2013 et le taux de chômage 2003. L’idée est la suivante : si la corrélation est très bonne, cela signifie que les zones qui avaient un plus fort taux de chômage en 2003 ont toujours un plus fort taux de chômage en 2013. Résultat des courses : la corrélation est très bonne, ce qu’on peut voir sur ce graphique.

corr

En clair, vous prenez le taux de chômage de 2003 de votre zone d’emploi, vous le multipliez par 1,07, vous ajoutez 1,58% et vous obtenez le taux de chômage 2013. Le R² est de 0,82, ce qui signifie en gros que les taux de chômage de 2003 “expliquent” 82% des différences de taux de chômage en 2013. Bref : ça ne bouge pas beaucoup…

Rien n’empêche cependant de regarder les zones pour lesquelles le taux de 2003 explique le moins bien le taux de 2013, soit en positif (elles devraient avoir un taux plus fort en 2013) ou en négatif (elles devraient avoir un taux plu faible). Je me suis concentré sur les 10% des zones les moins bien expliquées, 5% de chaque côté soit 15 zones.

Pour les zones dont le taux de chômage observé est plus fort que celui attendu, on obtient cela :

code libellé taux en 2003 taux en 2013 taux prédit
2416 Gien 6,3 11,0 8,4
2417 Montargis 8,1 12,9 10,3
9101 Carcassonne 8,6 13,1 10,8
2204 Laon 8,6 13,0 10,8
9102 Limoux 8,9 13,3 11,1
8220 Vallée de l’Arve 6,2 10,3 8,2
5307 Carhaix-Plouguer 5,7 9,7 7,7
4208 Mulhouse 7,4 11,5 9,5
2202 Tergnier 11,2 15,5 13,6
4114 Saint-Dié-des-Vosges 10,0 14,2 12,3
2203 Thiérache 12,8 17,2 15,3
4105 Commercy 8,0 12,0 10,2
7301 Foix-Pamiers 8,1 12,1 10,3
7302 Saint-Girons 8,6 12,6 10,8
4106 Verdun 7,8 11,7 10,0

Les deux premiers chiffres des codes des zones d’emploi correspondent à leur région d’appartenance. Les deux premières zones dont les scores sont les pires sont en région Centre (code 24), il s’agit de Gien et Montargis. On trouve également deux zones en Languedoc-Roussillon (code 91), deux en Picardie (code 22), deux en Lorraine (code 41) et deux en Midi-Pyrénées (code 73).

Pour les zones dont le taux de chômage est plus faible que le taux attendu, on obtient cet autre tableau :

code libellé taux en 2003 taux en 2013 taux prédit
9406 Corte 8,1 8,8 10,3
1108 Provins 8,5 9,2 10,7
8218 Annecy 6,1 6,6 8,1
2101 Charleville-Mézières 12,1 13,0 14,6
2607 Autun 9,0 9,6 11,3
2507 Cherbourg-Octeville 9,0 9,6 11,3
1109 Houdan 4,8 4,9 6,7
8305 Mauriac 5,7 5,8 7,7
9401 Ajaccio 8,3 8,5 10,5
9315 Toulon 10,5 10,7 12,9
9308 Aix-en-Provence 9,3 9,4 11,6
5303 Lannion 9,4 9,5 11,7
1101 Paris 8,7 8,7 10,9
2414 Romorantin-Lanthenay 10,3 10,0 12,6
9405 Calvi-L’Île-Rousse 11,3 10,4 13,7

Cette fois, les régions Corse (code 94) et Provence-Alpes-Côte d’Azur (code 93) dominent (5 des 15 zones), effet économie résidentielle, peut-être. L’Ile de France (code 11) suit, avec Provins, Houdan et Paris.

En résumé : la géographie de l’économie bouge assez peu. C’est un résultat récurrent des recherches sur le sujet, qu’il convient de garder en tête : si un élu vous promet qu’il va tout changer en quelques années, soyez sûr d’une chose, il se trompe… Ce qui ne signifie pas pour autant que tout soit écrit : certains territoires connaissent des évolutions relatives plus favorables, d’autres moins favorables. Reste à en comprendre les raisons, ce que le petit exercice statistique auquel je viens de me livrer ne permet pas : il faut ensuite aller sur le terrain, pour comprendre la spécificité des évolutions observées. Ce que les économistes font rarement. Mais c’est un autre sujet.

Le retour de la vengeance des relocalisations

Cet après-midi, un journaliste de Libé m’a contacté au sujet des relocalisations : il paraît que notre ministre du redressement productif (Arnaud Montebourg) souhaite mettre en place un programme confié à “l’Agence française des investissements internationaux (Afii) [qui] va offrir gratuitement aux entreprises qui le souhaitent un nouveau service en leur permettant de calculer les avantages de tous ordres à relocaliser des activités”. J’étais passé à côté de l’info, j’ai trouvé cet article du JDD daté du 18 janvier dernier et celui-ci (quasi le même) dans le Figaro (daté du 11 janvier).

Il y a près de deux ans, je m’étais fendu d’un billet pour montrer, à partir d’une des rares bases de données permettant de quantifier le phénomène (la base de l’Observatoire de l’Investissement de Trendéo), que les relocalisations ne pesaient quasiment rien dans les opérations d’investissement réalisées en France (ni dans les emplois créés à l’occasion de ces opérations). Les délocalisations pas beaucoup plus, en passant. Ceci sur données 2009. Un an plus tard, j’avais récidivé en co-écrivant un article sur données 2009 et 2010, qui arrivait au même résultat : les relocalisations ne pèsent quasiment rien, les délocalisations pas beaucoup plus.

Les politiques, qui n’aiment tant rien que de se saisir des sujets majeurs, se sont très vite emparés du sujet. J’en avais parlé un an plus tard, à la quasi-veille des élections présidentielles, pour rappeler que Nicolas Sarkozy avait confié à Yves Jégo la rédaction d’un rapport destiné à mettre fin à la mondialisation anonyme, de proposer des préconisations pour favoriser les relocalisations, tout ça, tout ça… Arnaud Montebourg, fils spirituel de Nicolas Sarkozy et d’Yves Jégo, donc, si je comprends bien.

Comme ce soir, je n’avais pas piscine, j’ai décidé d’actualiser un peu les statistiques de l’Observatoire de l’Investissement, en compilant les chiffres pour 2009, 2010, 2011 et 2012. Ce qui conduit à deux tableaux, le premier recense les opérations de délocalisation, de désinvestissement, de relocalisation et d’investissement observés en France par Trendéo ; le deuxième quantifie la même chose, en termes d’emplois créés/détruits plutôt qu’en nombre d’opérations. A chaque fois, on peut calculer le ratio délocalisation/désinvestissement (ça pèse lourd dans les emplois détruits les délocalisations?) et le ratio relocalisation/investissement (ça pèse lourd dans les emplois créés les relocalisations?).

Tableau 1, en nombre d’opérations :

année délocalisation désinvestissement ratio relocalisation investissement ratio
2009 106 2728 3,9% 12 3011 0,4%
2010 37 2712 1,4% 13 5261 0,2%
2011 30 2279 1,3% 8 4106 0,2%
2012 52 2067 2,5% 12 2961 0,4%
Total 261 10161 2,6% 45 15577 0,3%

Tableau 2, en nombre d’emplois

année délocalisation désinvestissement ratio relocalisation investissement ratio
2009 -12688 -285884 4,4% 406 169511 0,2%
2010 -3022 -172810 1,7% 205 194900 0,1%
2011 -2477 -119858 2,1% 108 165199 0,1%
2012 -3296 -117225 2,8% 245 132328 0,2%
Total -25495 -747487 3,4% 964 691130 0,1%

Les délocalisations pèsent 2,6% des opérations de désinvestissement et 3,4% des emplois détruits. Côté relocalisation, c’est 0,3% des opérations d’investissement et 0,1% des emplois créés.

Bon, on peut toujours se dire que, justement, il faudrait fissa mettre en place des politiques pour booster la dynamique. Pour preuve les cas de relocalisations aux Etats-Unis. Sauf qu’en pourcentage des emplois créés et détruits, aux Etats-Unis comme en France, ça doit pas peser lourd. Sauf qu’en plus, aux Etats-Unis, l’hétérogénéité des conditions de travail et de rémunération entre Etats est sans aucune mesure avec l’hétérogénéité des conditions de travail et de rémunération entre régions françaises : en forçant un peu le trait, certains Etats du Nord feraient palir d’envie la Suède, certains Etats du Sud feraient s’enfuir les travailleurs chinois. Et ça relocalise pas mal au Sud, quand même.

Voilà, voilà… Bon, sinon, en creux, les emplois détruits pour d’autres motifs que les délocalisations, ça pèsent 96,6% de l’ensemble des emplois détruits en France. Et les emplois créés pour d’autres motifs que pour des relocalisations, ça pèse 99,9% des emplois créés en France. Je me demande si le Ministère du Redressement Productif ne devrait pas se pencher un peu plus sur ces autres chiffres. Question idiote d’un chercheur qui n’a pas piscine, sans doute…

Et le cumul des mandats, au fait?

Nouveau petit travail sur les données par député du site NosDéputés.fr (épisode 1 ici, épisode 2 là), en se focalisant cette fois sur la question du cumul des mandats. L’idée est la suivante : quelles sont les caractéristiques des députés qui influent sur leur tendance à cumuler plusieurs mandats?

Pour répondre à cette question, j’ai d’abord fusionné la base des députés actuels et celle des députés de la législature précédente, afin d’avoir plus d’observations et de mettre en évidence d’éventuelles différences (j’ai bien sûr repéré les doublons, c’est-à-dire les députés présents sur les deux périodes, pour ne pas les compter deux fois). J’ai ensuite construit une variable “cumulard”, égale à 1 si le député en question détient plus d’un mandat et à 0 sinon.

D’où ce premier petit tableau :

(%) 2007-2012 2012- Total
non cumulard 14.5 16.6 15.5
cumulard 85.5 83.5 84.5
Total 100.0 100.0 100.0

En moyenne, 84,5% de cumulards… Très légère baisse pour la “promo” en cours…

J’ai ensuite testé un petit modèle (modèle probit binaire), avec, comme variable explicatives : i) le sexe, ii) l’âge (et l’âge au carré en cas de relation non linéaire), iii) une variable “député 2012” pour différencier la législature actuelle de la précédente, iv) une variable “sortant” pour identifier les députés réélus, v) une variable “Ile de France”, pour différencier les députés de la capitale des autres députés, vi) le groupe d’appartenance, avec comme groupe de référence le groupe SRC.

L’enjeu est de voir si certaines variables influent sur la probabilité de cumuler. Résultats :

effet marginal
homme 5.80% **
age 2.74% ***
age² -0.02% ***
député 2012 1.53%
sortant 4.90% *
idf 0.17%
src modalité de référence
ecolo -26.84% ***
gdr -2.10%
nc 7.77%
rrdp 9.03%
udi -3.51%
ump 2.80%
autres -35.29% ***
nb. Obs 903
LR Chi2(13) 65.33 ***

Commentaires (seules les variables étoilées sont significatives, d’autant plus qu’il y a d’étoiles) :

* le fait d’être un homme plutôt qu’une femme augmente la probabilité de cumuler de 5,8 points de pourcentage. Effet de genre, donc,

* l’âge joue également, mais de manière non linéaire : le signe négatif devant la variable “age au carré” signifie qu’on a une courbe en cloche, autrement dit que la probabilité de cumuler augmente avec l’âge jusqu’à un certain seuil, puis diminue ensuite. Compte-tenu de la valeur des coefficients, on peut calculer le point de retournement : en l’occurrence, 57,4 ans (j’ai arrondi les coefficients dans le tableau, on trouve ce point de retournement avec les valeurs exactes),

* pas de différence significative entre nouvelle promo et ancienne promo. En revanche, le fait d’être sortant augmente de près de 5 points de pourcentage la probabilité de cumuler,

* pas d’effet géographique Ile de France. J’ai en revanche testé une autre version du modèle avec une variable par région, deux “régions” ressortent, avec un effet négatif sur la probabilité de cumuler : les députés “Français hors de France”, qui réduisent de plus de 60% la probabilité de cumuler (hypothèse d’interprétation politiquement incorrecte : on a casé là des gens inéligibles ailleurs) et les députés de Poitou-Charentes, qui réduisent cette même probabilité de plus de 20% (hypothèse d’interprétation évidente : les picto-charentais sont des gens biens),

* s’agissant des groupes d’appartenance, effet significatif d’appartenir à un “autre groupe”, qui est un groupe hétérogène, composé des non inscrits et de députés dont l’appartenance à un groupe n’est pas renseignée dans la base. Difficile à interpréter, donc. En revanche, un autre effet très significatif est le fait d’appartenir au groupe écolo, avec une baisse de près de 27 points de pourcentage de la probabilité de cumuler. Aucune différence significative entre les autres groupes.

Conclusion définitive : ça manque de jeunes femmes écolos picto-charentaises, dans l’hémicycle…

PS : sur le sujet du cumul des mandats, lecture incontournable découverte via un commentaire d’un précédent billet (merci Gabriel!), cet Opus de Laurent Bach.

Le travail des députés : des compléments

Complément à mon billet d’hier, sur la base d’autres statistiques disponibles sur le site NosDéputés.fr (merci à Philippe Bonnet pour le lien). Certains m’ont fait remarqué à juste titre que l’activité des députés ne se limitait pas à participer aux votes publics, ils participent à des commissions, posent des questions écrites ou orales, interviennent dans l’hémicycle, déposent des propositions de lois, amendements, etc.

Le site NosDéputés.fr permet très facilement de récupérer des éléments statistiques, par député, pour la législature en cours, comme pour la précédente (2007-2012). On ne peut pas faire de statistiques par jour, mais on peut calculer le nombre de semaines de présence des députés dans l’hémicycle, ou encore le nombre de présence en commission, etc. Voici quelques premiers résultats :

(par mois) moyenne médiane
semaines de présence 2.8 2.9
présence en commission 5.1 4.8
questions écrites ou orales 4.6 1.9
interventions en hémicycle 16.1 3.4

Précisions sur les statistiques “semaines de présence” : pour qu’une semaine soit comptabilisée ainsi, il suffit que le député soit présent au moins l’un des jours de cette semaine. Comptabilisation large, donc. A contrario, la seule présence physique ne suffit pas, il faut avoir été en commission, ou être intervenu dans l’hémicycle, etc. Au total, il s’avère que les députés sont grosso modo à mi-temps. On note également le décalage entre moyenne et médiane pour les deux derniers items, signe de distributions asymétriques : quelques députés trustent les questions et les interventions.

Pour approfondir l’analyse, je me suis concentré sur les semaines de présence et les présences en commission, en distinguant selon le groupe d’appartenance des députés. Résultats en image, d’abord :

Les écolos semblent les plus assidus, notamment en semaine. Pour confirmer et approfondir encore, j’ai testé deux petits modèles, avec comme variable expliquée les semaines de présence par mois et les présences en commission par mois, et comme variables explicatives : i) le sexe, ii) l’âge, iii) le fait d’être un nouveau député non cumulard, iv) le groupe d’appartenance. Résultats :

semaines par mois commission par mois
Coef. p-value Coef. p-value
homme -0.02 0.80 -0.11 0.64
age -0.01 0.00 *** -0.02 0.09 *
non cumulard 0.09 0.19 0.30 0.25
src modalité de référence
ecolo 0.32 0.04 ** 0.60 0.30
gdr -0.36 0.03 ** -2.01 0.00 ***
ni -0.32 0.21 -2.49 0.01 ***
rrdp -0.29 0.06 * -1.27 0.03 **
rump -0.33 0.00 *** -1.41 0.00 ***
udi -0.32 0.01 *** -1.38 0.00 ***
ump -0.21 0.00 *** -1.25 0.00 ***
constante 3.39 0.00 *** 6.77 0.00 ***
0,0951 0,1103
nb obs. 573 573

L’âge des députés joue négativement sur leur présence en semaine, comme en commission. Plus on est vieux, moins on est là. Pas d’effet de genre. Pas d’effet “cumul des mandats”. Pas mal d’effets de groupe d’appartenance : par rapport au groupe SRC (qui comprend notamment tous les députés PS), les écolos sont significativement plus présents en semaine, tous les autres groupes sont significativement moins présents. Pour la présence en commission, les écolos ne sont pas plus présents que les SRC, tous les autres groupes sont moins présents. Pour finir : les résultats pour UMP et RUMP sont très proches…

Présidentielle 2012 : le poids des mots

Article très intéressant de François Guillem (trouvé via un tweet de Baptiste Coulmont).

Prenez les discours des candidats à l’élection présidentielle 2012. Faites une analyse statistique des mots qu’ils utilisent. Classez alors les candidats par groupe, en fonction de leur proximité. Vous obtiendrez cela :

Cette classification résulte de la proximité entre candidats que l’on retrouve dans cet espace à deux dimensions :

Notez la proximité entre François, François et Eva… et celle entre Marine et Nicolas… Pourquoi cette proximité? Comme dit initialement, ce sont les mots qu’ils utilisent qui explique cela :

L’axe horizontal oppose des termes plutôt de gauche à des termes plutôt de droite. L’axe vertical des termes relevant plutôt du registre de l’émotion à des termes relevant d’un registre plus technique.