Covid 19, épisode 25 : variations régionales et départementales

Petit billet pour faire un point sur l’évolution régionale et départementale de l’épidémie, à partir des chiffres de Santé publique France datés du 26 avril 2020. Je commence par deux graphiques à l’échelle des régions, sur le nombre de personnes hospitalisées et le nombre de décès.

On observe, comme je l’ai indiqué à de multiples reprises, une forte concentration géographique de l’épidémie : l’Ile-de-France, où réside 19% de la population, concentre 38% des hospitalisations et 39% des décès. Le taux de mortalité y est de 460 décès par million d’habitants. Seul Grand Est a un taux de mortalité plus élevé (507), cette région, où réside 8% de la population, concentre 16% des hospitalisations et 19% des décès. A elles deux, ces régions concentrent 54% des hospitalisations et 59% des décès. Deux autres régions présentent des taux de mortalité proches ou supérieurs à la moyenne (221) : la Bourgogne Franche-Comté (taux de mortalité de 287) et les Hauts-de-France (220). A elles quatre, ces régions concentrent 67% des hospitalisations et 74% des décès (alors qu’elles ne représentent que 41% de la population).

L’autre constat important est que l’évolution des hospitalisations comme des décès semble suivre une courbe en cloche : après un accroissement des indicateurs jusque début avril, la tendance, fort heureusement, est à la baisse. Pour le confirmer, j’ai procédé à un peu d’économétrie, qui montrent que la tendance s’est inversée le 29 mars pour les hospitalisations dans le Grand Est et le 4 avril pour les décès ; les dates sont respectivement le 4 avril et le 9 avril pour l’Ile-de-France.

J’ai reproduit les deux séries de graphique précédents pour les départements des deux régions les plus touchées (le Grand Est et l’Ile-de-France).

On constate là encore une forte concentration spatiale, à une échelle plus fine, de l’épidémie. Les taux de mortalité varient pour ce sous-ensemble de départements de 166 pour les Ardennes à 922 pour le Haut-Rhin.

Si l’on raisonne sur l’ensemble des départements de France métropolitaine, on constate que le Territoire de Belfort reste le plus touché, avec un taux de mortalité de 1 042 décès par million d’habitants. On constate également que les 10 départements comptant le plus grand nombre de décès (Paris, Val-de-Marne, Hauts-de-Seine, Seine-Saint-Denis, Haut-Rhin, Moselle, Val-d’Oise, Bas-Rhin, Rhône, Seine-et-Marne – tous sauf un dans les deux régions les plus touchées), concentrent 50% de l’ensemble des décès, pour seulement 21% de la population.

Compte-tenu de ces résultats, l’hypothèse d’un déconfinement par région ne m’aurait pas semblé totalement farfelue…

Covid 19, épisode 22 : le positionnement des régions françaises dans le concert des pays de l’Union

Petit billet pour présenter autrement les taux de mortalité : j’ai construit un tableau avec les taux de mortalité des 28 pays de l’Union, du taux de mortalité le plus élevé (509 décès par million d’habitants en Belgique) au plus faible (2 décès par million d’habitants en Slovaquie), et j’ai intercalé les régions de France métropolitaine.

source des données sur la population : Eurostat ; source des données sur les décès : John Hopkins University et Santé publique France

La région Grand Est, la plus touchée, se situe ainsi entre la Belgique et l’Espagne. La Nouvelle-Aquitaine, région la moins touchée, pâtit d’un taux de mortalité inférieur à ce que l’on observe en Allemagne et en Autriche.

Covid 19, épisode 10 : la diffusion spatiale de l’épidémie, suite

J’ai actualisé les chiffres d’un billet précédent, pour voir si la diffusion spatiale de l’épidémie se développait ou non, en France, en Espagne et en Italie.

J’ai de nouveau calculé un indicateur synthétique de concentration spatiale de la population, d’une part, et des décès, d’autre part. Les valeurs de l’indicateur varient entre 1 en cas de concentration géographique maximale et 100 en cas de concentration minimale.

Voici le nouveau tableau de résultats :

Je vous redonne le mode de lecture : l’indice de 58 pour la population en France signifie que tout se passe comme si la population française était répartie de manière homogène entre 58% des régions. Le même indice, pour les décès à la date du 4 avril est de 26, il est plus de deux fois plus faible, ce qui signifie que la concentration spatiale des décès est 2,2 fois plus forte que celle de la population.

Le résultat principal de cette actualisation est que les valeurs des indicateurs ont peu bougé depuis le 29/3, la concentration spatiale des décès reste relativement élevé. Elle se réduit un peu quand même en Espagne et à l’échelle des départements français,elle est remarquablement stable en Italie et à l’échelle des régions françaises.

Pour compléter, j’ai représenté l’évolution du nombre de décès par région, car un indice de concentration stable ne signifie pas qu’il n’y a pas de changement dans les positions des régions, on va le voir pour le cas de la France.

J’ai représenté la courbe de chaque région dès lors que le nombre de décès passe la barre des 10, toutes les courbes n’ont donc pas autant de points, ce qui permet de voir d’une certaine manière quand l’épidémie démarre ou plutôt s’accélère à chaque endroit. Pour l’Espagne et l’Italie, je dispose des chiffres par région depuis fin février, les graphiques sont donc complets. Pour la France, je ne dispose des chiffres par région que depuis le 18 mars, le graphique est donc incomplet.

L’échelle logarithmique de l’axe des ordonnées permet de visualiser le rythme d’évolution de l’épidémie pour chaque région. L’axe des abscisses représente le nombre de jours depuis que la région a dépassé le seuil de 10 décès.

On retrouve sur les graphiques l’idée d’une assez forte concentration géographique de l’épidémie, puisqu’à chaque fois deux régions ressortent et dépassent le seuil des 1000 décès : la région de Madrid et la Catalogne concentrent 61% des décès au 4 avril, l’Ile-de-France et Grand Est la même part de 61%, la Lombardie et l’Emilie Romagne montent à 69%.

On constate également pour l’Espagne que si l’épidémie a débuté plus tard en Catalogne que dans la région de Madrid, elle suit la même dynamique d’évolution. Pour la France, on constate la dynamique très forte en Ile-de-France, la région capitale dépassant sur la période le nombre de décès observé en Grand Est. Comme signalé plus haut, l’indice de concentration géographique stable ne signifie donc pas qu’il n’y a pas eu d’évolution.

Dans les trois cas, on observe enfin, globalement, un léger infléchissement des courbes, signe d’une réduction du rythme des décès, sans que l’on puisse dire que des régions soient arrivés à un plateau, ce qui serait le signe de l’arrêt de l’épidémie.

Géographie du Covid 19

Petit billet sur la géographie régionale et départementale du Covid 19, suite à une insatisfaction avec la façon quotidienne de présenter les chiffres dans les médias, sous la forme du nombre absolu de personnes contaminées ou décédées. Ces nombres absolus ne sont pas satisfaisants, dès lors que la taille des entités analysées varient : on devrait logiquement observer un nombre plus grand de victimes dans une grande région, si l’épidémie touche de manière homogène tous les territoires.

Pour éviter ce biais, il convient de diviser le nombre de cas par la population du territoire, ce que je vous propose de faire. Plus précisément : j’ai rapporté le nombre de cas par habitant des régions au même ratio observé France entière. Dès lors, une valeur de mon indicateur de 1 signifie que le nombre de cas par habitant de la région en question est similaire au nombre de cas par habitant observé en moyenne en France ; une valeur supérieure à 1 que le ratio est supérieur, d’autant plus que la valeur est forte.

A ce “jeu”, la région Grand Est est sans surprise la plus touchée, avec un indice de 2,69 pour le nombre de personnes contaminées en date du 23 mars 2020, suivie de la Corse (1,89) et de l’Ile-de-France (1,67). La région capitale reste donc moins touchée que Grand Est, même si le nombre absolu de cas observés est plus élevé (6211 contre 4256). Les régions les moins touchées de France métropolitaines sont les Pays de la Loire (indice de 0,27) et la Nouvelle-Aquitaine (indice de 0,40).

J’ai reproduit l’exercice avec le nombre de décès, à l’échelle des départements : les plus touchés relativement à la moyenne sont le Haut-Rhin (indice de 16,04), le Territoire de Belfort (13,35) et les Vosges (6,94).

Le dernier exercice auquel je me suis livré consiste à repérer la géographie départementale des personnes de 60 ans et plus, considérées comme les plus vulnérables face à l’épidémie, car cette géographie est assez marquée : la part des 60 ans et + varie en France métropolitaine de 39,3% dans le Doubs à 19,3% dans le Val d’Oise.

La géographie des décès et la géographie des personnes de 60 ans et + diffèrent sensiblement. Il n’est pas exclu qu’elles se rapprochent à mesure que l’épidémie se propage, et que les données collectées soient de meilleure qualité (jusqu’à présent les décès en Ephad ne sont pas comptabilisés par Santé publique France, cela devrait être le cas à partir de la semaine prochaine si j’ai bien compris).

Penser ce qui relie

C’est la conclusion de mon livre, son fil conducteur, aussi : plutôt que de considérer les territoires comme des entités en concurrence les unes avec les autres, il faut les voir comme des parties prenantes de systèmes interdépendants.

Le problème, c’est qu’on dispose de quantité de données par territoire, on est donc vite tenté de produire des classements sur tel ou tel indicateur de performance, se comparer à l’autre. A contrario, on dispose de peu de données sur les flux, sur tout ce qui traverse les territoires.

On dispose de peu de données, mais cela ne signifie pas qu’il n’en existe aucune. Il en existe sur les mobilités domicile-travail, sur les flux touristiques, sur les liens entre sièges sociaux et établissements, etc.

Parmi les chercheurs qui travaillent sur ce type de données, Nadine Catan. Le Monde vient de consacrer un article très bien fait relatif à une étude à laquelle elle a participé pour la Datar. L’article est visible ici (€), une synthèse de l’étude là.

Je souscris totalement à ce passage :

Passer de ville à système urbain permet de changer nos grilles de lecture des dynamiques territoriales et ainsi de modifier nos politiques publiques. Elus et développeurs sont appelés à mettre l’accent, non plus sur l’accumulation des populations et des emplois à un endroit donné, mais sur les connexions entre les différents lieux (…). Il faut aujourd’hui penser les villes, les métropoles, en termes de complémentarités et non plus se focaliser sur leurs avantages concurrentiels.

Je souscris et je me désole, dans le même temps, du peu de connaissance que les acteurs en charge de tel ou tel territoire ont de ces flux, de leur difficulté à comprendre que c’est ce qui importe. Au risque d’être lourd, j’insiste : l’enjeu n’est pas de penser ce qui sépare, mais de comprendre ce qui relie.

Le graphique du jour (le piège de nos croyances)

Le graphique, trouvé ici, reprend en abscisse la part effective des immigrés dans la population de différents pays et, en ordonnée, la part estimée par les citoyens de ces mêmes pays. La ligne rouge rassemble les points où parts estimées et parts effectives sont égales. Tous les pays sont au-dessus, signe que tout le monde surévalue la part des immigrés dans la population.

immigrationTous sont au-dessus, mais certains plus que d’autres. A ce petit jeu, ce sont les français qui se trompent le plus : la part des immigrés dans la population est de 10%, les français la déclarent en moyenne comprise entre 25 et 30%.

Je m’interroge sur une causalité : est-ce parce que nos politiques sont incapables de parler sérieusement d’immigration que les citoyens surestiment autant les chiffres, où est-ce parce que les citoyens surestiment autant ces chiffres que les politiques sont incapables d’en parler sérieusement ? Causalité circulaire, peut-être.

On pourrait élargir à bien d’autres sujets : piégés par nos croyances, nous avons tous du mal à voir les évidences et à agir en conséquence…

Taille des villes et performances économiques : une légende urbaine

city-35002_960_720Mondes Sociaux vient de mettre en ligne un article co-écrit par Michel Grossetti, Benoît Tudoux et moi-même, qui synthétise certains de nos travaux récents sur la question. Vous pouvez le lire en cliquant ici, allez y jeter un œil ne serait-ce que pour les illustrations !

J’aurai l’occasion d’en parler et d’en débattre au Printemps de l’Economie, lors d’une table ronde organisée par l’OFCE, jeudi 14 avril prochain, à laquelle participeront Guillaume Allègre, Xavier Timbeau et Laurent Davezies. Tous les détails sont ici. (Je participe également à deux autres tables rondes : mardi 12 matin sur le thème “quel territoire économique en dehors des périmètres institutionnels?” et mardi 12 après-midi sur le thème “comment favoriser l’innovation sur les territoires?”).

On voit des métropoles partout, sauf dans les statistiques

Nouvelle livraison pour alimenter le débat sur la métropolisation ! L’article co-écrit avec Michel Grossetti a en effet plutôt bien diffusé, il nous semble que notre critique de l’indicateur PIB régional par habitant est globalement acceptée, mais certains chercheurs nous opposent d’autres arguments. Pierre Veltz, par exemple, dans un entretien pour la revue L’Economie Politique (€), reconnaît dans un premier temps le problème :

le PIB régional est un concept qui soulève de nombreux problèmes, qui s’ajoutent à ceux du PIB en général. Où situer, par exemple, la valeur ajoutée produite par une entreprise comme Renault ? Le Technocentre, avec ses salaires élevés, contribue évidemment au PIB de l’Ile-de-France ; mais cette valeur ajoutée n’existerait pas sans les usines de production situées en province ou à l’étranger. La notion de PIB local, dans une économie aussi interconnectée que la nôtre, est artificielle. Par ailleurs, PIB élevé veut dire surtout, en pratique, salaires élevés. Les économistes orthodoxes diront que le salaire élevé récompense une productivité marginale élevée ! Mais le raisonnement est circulaire. On sait bien que la formation des salaires obéit à des normes et des rapports sociaux autres qu’une « productivité marginale » impossible à mesurer. Au total, la valeur ajoutée n’est pas localisable : elle est dans le réseau (pp. 17-18).

Il renvoie cependant, dans le même entretien, à d’autres arguments avancés par Davezies et Pech (2014) résultant de l’exploitation des données sur l’emploi salarié de l’Acoss, pour la période 2008-2012, par Aire Urbaine et par commune et affirme :

Cela dit, et c’est l’essentiel, il y a bien d’autres indicateurs de la force et des effets positifs de la métropolisation que le PIB : la concentration de la qualification, celle de l’emploi… La dynamique récente est à la concentration des créations d’emplois dans les zones métropolitaines (p. 18)

Dans une interview pour Xerfi Canal, il reprend le même argument.

Nous avions pour notre part montré l’absence d’effet taille à l’échelle des zones d’emploi, sur la période 1999-2011, mais le problème est que la comparaison de nos résultats avec ceux de Davezies et Pech (2014) est rendu difficile pour trois raisons : i) le zonage géographique n’est pas le même (zones d’emploi vs. aires urbaines), ii) la variable retenue n’est pas la même (ensemble des actifs occupés vs. emplois salariés privés), iii) la période d’étude n’est pas la même (1999-2011 vs. 2008-2012).

Nous avons donc décidé de mobiliser les mêmes données que ces auteurs, sur la période la plus récente disponible (2009-2014) pour éprouver la validité de leurs conclusions. Résultat? Leurs conclusions sont invalidées, ce qui s’explique notamment par un sévère problème de méthode dans l’analyse déployée. Une analyse rigoureuse montre qu’on ne peut conclure à un avantage général des métropoles en matière de création d’emplois sur la période d’étude.

Notre article vient d’être publié sur Hal, vous pouvez le télécharger en cliquant sur ce lien. As usual, toute remarque est la bienvenue !

Les taux de réussite à l’Université

Le ministère a publié en juillet dernier différentes statistiques sur la réussite dans les Universités françaises.  Avec des chiffres qui font peur : 27% des étudiants obtiennent leur licence en 3 ans, proportion qui monte à 39% pour les licences obtenues en 3 ou 4 ans. Le Monde vient de relayer l’information. L’objectif de ce billet est d’y voir un peu plus clair en évoquant différents points décisifs.

Premier point essentiel, ce taux de réussite varie très fortement selon la filière de bac des étudiants : plus du tiers des bacs généraux obtiennent leur licence en 3 ans et ils sont près de 50% à obtenir leur licence en 3 ou 4 ans, contre 15% pour les bacs technologiques et 5% pour les bacs professionnels. Raisonner sur un taux global n’a donc pas de sens, autant désagréger et s’interroger sur les moyens d’améliorer les choses pour chacun de ces sous-ensembles.

Deuxième point, il faut toujours faire attention quand on manipule ce genre de données, on a souvent du mal à appréhender les effets multiplicatifs. Je m’explique : supposons que le taux de réussite d’une licence soit de 70% en L1, 70% en L2 et 70% en L3, scores assez élevés. Devinette : quelle est la proportion d’étudiants qui obtiendront leur licence en 3 ans précisément ? Réponse : un tout petit plus d’un tiers… (0,7*0,7*0,7 = 34,3% très précisément). C’est ce que l’on observe pour les bacs généraux. Dans les faits, le taux n’est pas le même pour les trois années : pour Sciences Eco Poitiers, l’an dernier, ils sont respectivement de 50% en L1, 80% en L2 et 95% en L3, soit une probabilité d’obtenir sa licence en 3 ans de 38% et en 3 ou 4 ans de 66,5%. La problématique de l’échec à l’Université est massivement une problématique L1, qui concerne prioritairement les bacheliers technologiques et professionnels.

Troisième point, il faut également toujours s’interroger sur les données de base : en l’occurrence, le Ministère peut suivre la trajectoire des étudiants inscrits dans les Universités, mais ils perdent leur trace s’ils vont, après une L1, en BTS, en classe préparatoire ou en école. Ces étudiants qu’on ne peut plus suivre seront comptés comme ayant échoué dans leurs études, alors qu’en fait ils se sont réorientés et ont peut-être très bien réussi. Quelle est l’ampleur de ce phénomène ? Toutes universités, la proportion d’étudiants inscrits en L1 une année et non inscrits dans un établissement supérieur public l’année suivante est de 30,6%. On pourrait donc calculer un autre taux de réussite en retranchant ces étudiants du dénominateur, le taux d’obtention de la licence en 3 ans passerait en gros de 27% à 38% et le taux d’obtention en 3 ou 4 ans de 39% à 56%.

Une question importante reste cependant celui du devenir de ces non réinscrits. Le service statistique de l’Université de Poitiers (le SEEP) a enquêté les étudiants inscrits en 2012-2013, qui ne se sont pas réinscrits l’année suivante. Les résultats sont visibles ici. On y apprend que 27% des L1 ne se sont pas réinscrits l’année suivante, mais que ceci n’est pas synonyme d’arrêt des études. 71% sont en formation, massivement hors université : 34% en BTS, 23% en école, 6% en classe prépa, 10% en “autres formations”, soit un total de 73%. Autre chiffre intéressant : 61% des non réinscrits se disent satisfaits de leur année de formation, certains se sont inscrits dans une stratégie d’attente d’être pris dans la formation de leurs choix, d’autres avaient fait le voeu prioritaire d’aller à l’Université et se sont rendus compte que ce système ne leur convenait pas (je vous laisse découvrir les nombreux verbatims, très instructifs).

Dernier point, on observe des différences fortes de taux de réussite : une réussite en 3 ou 4 ans, en moyenne de 39%, varie en France métropolitaine entre 13% à Paris 8 et 53% à Angers. Une partie de l’explication tient aux caractéristiques différentes des entrants : imaginons qu’une Université accueille plus de bacheliers technologiques que la moyenne, son taux de réussite attendu (“taux simulé” dans le document du Ministère) sera logiquement plus faible. A Paris 8, ce taux attendu est de 29,8 et à Angers, il est de 42,5. La différence entre taux observé et taux simulé permet de calculer ensuite la valeur ajoutée de chaque établissement : elle est de 10,5 à Angers et de -8,6 à Paris 8. L’écart sur les taux de réussite entre ces deux Universités est donc pour partie lié à la différence de caractéristiques des entrants, mais pour partie seulement, Angers “performe” plus qu’attendu, Paris 8 moins qu’attendu. Poitiers est plutôt bien placé également, avec un taux de réussite de 46,9 et une valeur ajoutée de 6 (7ème université selon ce critère).

Attention cependant à ne pas aller trop vite en besogne : le Ministère ne dispose pas de toutes les informations sur les étudiants, le taux attendu est donc calculé sur la base des caractéristiques observables. A titre d’illustration, on n’a pas l’information sur la part des mentions au bac, si une Université en accueille plus que la moyenne, le calcul du taux simulé ne prendra pas en compte cela, on l’attribuera avec erreur à la “valeur ajoutée” de l’établissement.

Il n’en reste pas moins que la production de ces statistiques est particulièrement intéressante, à condition de ne pas se contenter de regarder le classement des Universités, mais de les analyser en détail, plus pour mieux se connaître que pour se mesurer aux autres. Les services statistiques des Universités produisent également tout un ensemble d’études particulièrement utiles, celui de Poitiers en tout cas (voir ici), mais j’imagine que ce n’est pas le seul. Mon sentiment : elles sont sous-utilisées dans les Universités, leur mobilisation permettrait d’améliorer le diagnostic sur ce qui va, sur ce qui ne va pas, et donc de prendre ensuite de meilleures décisions en termes d’évolution des formations et d’accompagnement des étudiants.

Hausse de la triche au bac en 2014 ? Pas sûr du tout (les journalistes, je te jure…)

[Petite séquence : j’en ai marre de défaire mes cartons après déménagement…]

Le Parisien a publié un article intitulé “le plagiat, nouvelle plaie des examens”. Le Monde a relayé l’information en indiquant que “la triche aux examens est en forte hausse” : +10% (+9,8% très précisément) . Dans l’ensemble de ces fraudes, la part des tricheries au téléphone portable et calculatrice arrive en première position, avec 30,9% des cas détectés. Bigre, que se passe-t-il dans la tête de nos chers bambins ?

Bon, peut-être faut-il relativiser.

Premier point, calculer la hausse des fraudes sans s’interroger sur la hausse du nombre de candidats n’a pas trop de sens. Imaginez que le nombre de candidats ait augmenté de 10% et que le nombre de fraudes ait augmenté de 10%, vous en déduirez logiquement que la hausse de la fraude a été de 0%… En l’occurrence, ce n’est pas le cas, mais ceci conduit à réduire la hausse relative, puisque le nombre de candidats a augmenté de 3,3% d’après cet article : il est passé de 664 709 candidats à 686 907 candidats. L’augmentation de +9,8% tombe mécaniquement à +6,3%.

Deuxième point, quand un phénomène augmente, quel qu’il soit, demandez-vous toujours si l’augmentation n’est pas lié au fait qu’on le regarde plus attentivement qu’auparavant. On apprend par exemple dans cet article daté de mai 2014 que “l’imagination des prétendants au baccalauréat n’a pas de limites. Une évolution technologique qui a forcé le ministère de l’Education nationale à utiliser par exemple des détecteurs de téléphones portables dans les salles d’examens” . Difficile de quantifier l’impact d’une telle mesure, mais on peut penser qu’une partie de la hausse des tricheries détectées n’est pas liée à une hausse des tricheries, mais à une hausse des détections…

Dernier point, c’est gentil de raisonner en taux de croissance de la fraude, mais en nombre absolu, je signale qu’on est passé de 469 tricheries détectées à 515. Pendant ce temps, les candidats sont passés de 664 709 à 686 907. Alors on peut aussi s’amuser à calculer la part des fraudeurs dans l’ensemble. Elle est passée de 0,071% à 0,075% sans neutralisation de l’effet d’augmentation des candidats, et de 0,071% à 0,073% en neutralisant cette augmentation. Soit une hausse du taux de fraude de 0,002 points de pourcentage.

Sûr que ça méritait des billets alarmistes dans la presse nationale…

[Fin de la séquence, je retourne à mes cartons].