Ce billet est initialement paru sur le blog DMI (Divertissements mathématiques mais (surtout) informatiques)

J’ai un problème intéressant à soumettre aux lecteurs potentiels. Il est possible que la solution soit évidente. Vous la trouverez peut être aussi quelque part sur le net. En ce qui me concerne, j’ai pour l’instant fait choux blanc.

Le problème dont je vais vous parler apparaît dans un texte de Balzac : Physiologie du mariage, dont la première édition date de 1829.

Une des méditations, la 25, comporte un passage pour le moins cryptique, qui curieusement varie selon les éditions.

Voici le début du passage en question, dans une édition qui est une reproduction de l’édition de Furne de 1846 (clic droit, ouvrir dans un nouvel onglet pour agrandir) :

En recherchant sur le net ce qu’on raconte sur ce passage, vous trouverez peut être les explications suivantes :

J’aimerais croire que cette page imprimée ne contient pas n’importe quoi. L’analyse fréquentielle (comptage de la fréquence d’apparition des caractères, voir Déchiffrer automatiquement le chiffre de Vigénère révèle une très bonne correspondance avec l’alphabet Français (juste une petite pénurie de i). Voici les courbes obtenues, en réalisant l’analyse fréquentielle pour les 6 premières lignes du texte :

Analyse fréquentielle de la page mystérieuse

Le texte utilisé (saisi à la main, il y a peut être des erreurs) est :

`annersnsu
s,aemolefiéaedaienétnntedvnrasimech'eeaêl,dltaolmlpedcquaehs-éiœ
evéheuuradimernuon:stpacruetrdvet'nqdeepexmasuoopLuampoem
gecpulineeeruouatvadqq'taeereasttusnnooutCenraeeittoutsrtaAlaèe,laa
eeehet,coeneocmhmurpd'néromtriulasssreq'lurtaneprteehjsteneeues
oeiluuplgtioraetvness.veréa'tndsolelàsoi.eodustsfm'uirrueddemedom
nllt.'ttaeasnndlecievpslueepod,tieceeapeniteseuuvmeseae,samenpead`

Il a été capitalisé, et la ponctuation a été retirée avant l’analyse :

ANNERSNSUSAEMOLEFIEAEDAIENETNNTEDVNRASIMECHEEAELDLTAOLMLPEDC
QUAEHSEIEVEHEUURADIMERNUONSTPACRUETRDVETNQDEEPEXMASUOOPLUAMP
OEMGECPULINEEERUOUATVADQQTAEEREASTTUSNNOOUTCENRAEEITTOUTSRTA
ALAEELAAEEEHETCOENEOCMHMURPDNEROMTRIULASSSREQLURTANEPRTEEHJS
TENEEUESOEILUUPLGTIORAETVNESSVEREATNDSOLELASOIEODUSTSFMUIRRU
EDDEMEDOMNLLTTTAEASNNDLECIEVPSLUEEPODTIECEEAPENITESEUUVMESEA
ESAMENPEAD

L’analyse fréquentielle révèle donc que dans ces 6 premières lignes, la fréquence d’apparition des lettres est très similaire à celle d’un texte français moyen :

Soit les lettres ont été tirées au hasard avec une probabilité correspondant à un texte français, dans le but de brouiller les pistes des lecteurs de ce blog : c’est possible, l’analyse fréquentielle datant du 9e siècle, Balzac en connaissait probablement le principe.

Soit les lettres sont issues d’un vrai texte, et elles ont été mélangées,

En faisant un tour sur l’excellent Ars Cryptographica, vous trouverez une référence à ce texte, et à un ouvrage de cryptographie du début du siècle dernier qui le traite. Par chance, l’Université de Poitiers (Pub!) possède un exemplaire de cet ouvrage. Il s’agit du Traité de Cryptographie de Lange et Soudard, qui existe en deux éditions (1925 et 1935).

Voici les pages qui traitent de ce problème dans l’édition de 1925 (clic droit, ouvrir dans un nouvel onglet pour agrandir l’image, l’essentiel se trouve dans la note en bas de la dernière page) :

La fin est pour le moins évasive : Bien plus, l’édition Furne révélait un système de transposition relativement facile à décrypter, avec quelques passages substitués. Nous renvoyons le lecteur à ce dernier texte, en lui laissant le plaisir d’en rechercher lui-même la traduction.

Je n’ai malheureusement pas accès à l’édition de 1935, mais on m’a affirmé qu’elle ne contenait pas plus d’information.

Quoi qu’il en soit, d’après A. Lange, il y a une transposition et une substitution (les lettres à l’envers ?)… et en plus c’est évident… Mais je ne trouve pas l’astuce. Pire, vers la fin du texte, on peut reconnaître certaines portions de mots. Par exemple, sur la dernière ligne, si on lit 3 lettres, qu’on en saute une, qu’on en lit 3, qu’on en saute une… on obtient :

Nature second

En cherchant un peu, on trouve d’autres zones du texte qui présentent les mêmes caractéristiques.

J’en appelle donc aux bonnes volontés, et à votre inspiration. Je n’ai pas retranscrit tout le texte, mais juste les premières lignes. Ça ne suffit pas si la transposition est globale sur tout le texte (ce qui conserverait probablement les propriétés relevées à l’analyse fréquentielle).

Un autre accès au texte (toutefois un peu différent, bien qu’il semble présenter les mêmes propriétés) est possible par Wikisource : Physiologie du mariage

Pour autant que je puisse en juger, la transcription de gauche ne correspond toutefois pas exactement au texte de droite (pb d’OCR chez Wikisource ?).

Je suis impatient de savoir si l'un d'entre vous parviendra à trouver ce qui se cache derrière le cryptogramme de Balzac.