«

»

Oct 01

Un problème de cryptographie

Le temps me manque pour publier de nouveaux billets sur ce blog. Toutefois, j’ai un problème intéressant à soumettre aux lecteurs potentiels. Il est possible que la solution soit évidente. Vous la trouverez peut être aussi quelque part sur le net. En ce qui me concerne, j’ai pour l’instant fait choux blanc.

Le problème dont je vais vous parler apparaît dans un texte de Balzac : Physiologie du mariage, dont la première édition date de 1829.

Une des méditations, la 25, comporte un passage pour le moins cryptique, qui curieusement varie selon les éditions.

Voici le début du passage en question, dans une édition qui est une reproduction de l’édition de Furne de 1846 (cliquez sur l’image pour agrandir) :

scan_furne

En recherchant sur le net ce qu’on raconte sur ce passage, vous trouverez peut être les explications suivantes :

  • Balzac aime faire des blagues ;
  • Balzac a chiffré un texte, mais l’imprimeur n’a pas compris et a mis des caractères au hasard pensant que l’effet serait le même ;
  • Le texte a été composé (nous parlons d’imprimerie traditionnelle), puis les caractères mélangées au hasard dans la galée avant d’êtres placés sur la forme ;
  • C’est un vrai cryptogramme qu’il faut déchiffrer ;

J’aimerais croire que cette page imprimée ne contient pas n’importe quoi. L’analyse fréquentielle (comptage de la fréquence d’apparition des caractères, voir Déchiffrer automatiquement le chiffre de Vigénère sur ce blog) révèle une très bonne correspondance avec l’alphabet Français (juste une petite pénurie de i). Voici les courbes obtenues, en réalisant l’analyse fréquentielle pour les 6 premières lignes du texte :

freq

Le texte utilisé (saisi à la main, il y a peut être des erreurs) est :

annersnsu
s,aemolefiéaedaienétnntedvnrasimech'eeaêl,dltaolmlpedcquaehs-éiœ
evéheuuradimernuon:stpacruetrdvet'nqdeepexmasuoopLuampoem
gecpulineeeruouatvadqq'taeereasttusnnooutCenraeeittoutsrtaAlaèe,laa
eeehet,coeneocmhmurpd'néromtriulasssreq'lurtaneprteehjsteneeues
oeiluuplgtioraetvness.veréa'tndsolelàsoi.eodustsfm'uirrueddemedom
nllt.'ttaeasnndlecievpslueepod,tieceeapeniteseuuvmeseae,samenpead

Il a été capitalisé, et la ponctuation a été retirée avant l’analyse :

ANNERSNSUSAEMOLEFIEAEDAIENETNNTEDVNRASIMECHEEAELDLTAOLMLPEDC
QUAEHSEIEVEHEUURADIMERNUONSTPACRUETRDVETNQDEEPEXMASUOOPLUAMP
OEMGECPULINEEERUOUATVADQQTAEEREASTTUSNNOOUTCENRAEEITTOUTSRTA
ALAEELAAEEEHETCOENEOCMHMURPDNEROMTRIULASSSREQLURTANEPRTEEHJS
TENEEUESOEILUUPLGTIORAETVNESSVEREATNDSOLELASOIEODUSTSFMUIRRU
EDDEMEDOMNLLTTTAEASNNDLECIEVPSLUEEPODTIECEEAPENITESEUUVMESEA
ESAMENPEAD

L’analyse fréquentielle révèle donc que dans ces 6 premières lignes, la fréquence d’apparition des lettres est très similaire à celle d’un texte français moyen :

  • Soit les lettres ont été tirées au hasard avec une probabilité correspondant à un texte français, dans le but de brouiller les pistes des lecteurs de ce blog : c’est possible, l’analyse fréquentielle datant du 9e siècle, Balzac en connaissait probablement le principe.

  • Soit les lettres sont issues d’un vrai texte, et elles ont été mélangées,

    • au hasard (bonne blague),

    • ou suivant une certaine méthode (chiffrement par transposition).

En faisant un tour sur l’excellent Ars Cryptographica, vous trouverez une référence à ce texte, et à un ouvrage de cryptographie du début du siècle dernier qui le traite. Par chance, l’Université de Poitiers (Pub!)  possède un exemplaire de cet ouvrage. Il s’agit du Traité de Cryptographie de Lange et Soudard, qui existe en deux éditions (1925 et 1935).

Voici les pages qui traitent de ce problème dans l’édition de 1925 (cliquez sur l’image pour agrandir, l’essentiel se trouve dans la note en bas de la dernière page) :

lange

La fin est pour le moins évasive : Bien plus, l’édition Furne […] révélait un système de transposition relativement facile à décrypter, avec quelques passages substitués. Nous renvoyons le lecteur à ce dernier texte, en lui laissant le plaisir d’en rechercher lui-même la traduction.

Je n’ai malheureusement pas accès à l’édition de 1935, qui contient peut-être un peu plus d’informations.

Quoi qu’il en soit, d’après A. Lange, il y a une transposition et une substitution (les lettres à l’envers ?)… et en plus c’est évident… Mais je ne trouve pas l’astuce. Pire, vers la fin du texte, on peut reconnaître certaines portions de mots. Par exemple, sur la dernière ligne, si on lit 3 lettres, qu’on en saute une, qu’on en lit 3, qu’on en saute une… on obtient :

Nature second

En cherchant un peu, on trouve d’autres zones du texte qui présentent les mêmes caractéristiques.

J’en appelle donc aux bonnes volontés, et à votre inspiration.  Je n’ai pas retranscrit tout le texte, mais juste les premières lignes. Ça ne suffit pas si la transposition est globale sur tout le texte (ce qui conserverait probablement les propriétés relevées à l’analyse fréquentielle).

Un autre accès au texte (toutefois un peu différent, bien qu’il semble présenter les mêmes propriétés) est possible par Wikisource : Physiologie du Mariage

Pour autant que je puisse en juger, la transcription de gauche ne correspond toutefois pas exactement au texte de droite (pb d’OCR chez Wikisource ?).

[important]Je suis impatient de savoir si l’un d’entre vous parviendra à trouver ce qui se cache derrière le cryptogramme de Balzac.[/important]

Sur le même thème :

(4 commentaires)

1 ping

Passer au formulaire de commentaire

  1. Nath

    Selon ce livre
    http://books.google.ca/books?id=lXkOAQAAIAAJ&pg=RA1-PA28&lpg=RA1-PA28&dq=balzac+cryptogramme&source=bl&ots=8RDyllr1Rq&sig=wI7zySwq4ixnoCFjX0Z17YRDbRc&hl=fr&sa=X&ei=A38sVO-qJJGWyASd9oCgDQ&ved=0CC0Q6AEwAg#v=onepage&q=balzac%20cryptogramme&f=false
    Il semblerait que l’édition Furne reprenne des morceaux du reste du texte brouillé ce qui expliquerait que l’analyse de la fréquence des caractères soit celle du Français.

    1. Laurent Signac

      Ça semble le plus probable en effet… j’aurais dû penser à aller regarder dans les transcriptions et notes en fin d’ouvrage 🙂 … Je vérifierai à l’occasion que tout le texte a été pris sur une autre page. On peut ensuite imaginer que seuls les caractères supplémentaires (non issus des autres pages) constituent le message, ou bien que c’est la manière dont les lettres ont été mélangées qui constituent le message… ou bien qu’il n’y a pas de message.
      Merci pour les informations.

  2. Gilles Chartrand

    Ceci pourrait vous intéresser :

    http://typolitterature.wordpress.com/2014/09/12/balzac-physiologie-du-mariage/

    1. Laurent Signac

      C’est intéressant en effet.
      Toutefois, il ne s’agit pas de la même édition. A. Lange a étudié l’édition Calmann-Lévy (et a conclu que le texte était sans signification). L’article que vous citez traite de l’édition Charpentier. Et dans ce billet j’ai déposé une copie de l’édition Furne. Les 3 textes sont différents…
      Toutefois, je n’ai pas pensé à regarder si l’édition Furne contenait un erratum qui donnerait quelques pistes. Je le ferai à la première occasion.

  1. Un problème de cryptographie | C@f&eacut...

    […] Le temps me manque pour publier de nouveaux billets sur ce blog. Toutefois, j’ai un problème intéressant à soumettre aux lecteurs potentiels. Il est possible que la solution soit évidente. Vous la trouverez peut être aussi quelque part sur le net.  […]

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong> <pre lang="" line="" escaped="" cssfile="">


*

Featuring WPMU Bloglist Widget by YD WordPress Developer