Présidentielle 2012 : le poids des mots

Article très intéressant de François Guillem (trouvé via un tweet de Baptiste Coulmont).

Prenez les discours des candidats à l’élection présidentielle 2012. Faites une analyse statistique des mots qu’ils utilisent. Classez alors les candidats par groupe, en fonction de leur proximité. Vous obtiendrez cela :

Cette classification résulte de la proximité entre candidats que l’on retrouve dans cet espace à deux dimensions :

Notez la proximité entre François, François et Eva… et celle entre Marine et Nicolas… Pourquoi cette proximité? Comme dit initialement, ce sont les mots qu’ils utilisent qui explique cela :

L’axe horizontal oppose des termes plutôt de gauche à des termes plutôt de droite. L’axe vertical des termes relevant plutôt du registre de l’émotion à des termes relevant d’un registre plus technique.

2 commentaires sur “Présidentielle 2012 : le poids des mots

  1. Bonjour,
    C’est très bien vu, et semble bien correspondre aux différences de lignes politiques.
    Une question cependant: quels discours ont été pris en compte? tous depuis le début de la campagne? Les interviews ou émissions télé y compris? Car certains candidats ont fait des discours “à thème” donc le choix du corpus de discours peut avoir un effet sur le résultat, non?

    • vous avez l’essentiel de l’info dans le billet que je cite au départ. Les discours mobilisés sont d’ailleurs téléchargeables au format txt.

Répondre à obouba Annuler la réponse

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *