続・暗号の話
1843年に発表されたエドガー・アラン・ポーの「黄金虫」は、暗号の教科書とも呼ばれている古典小説。頻度分析による解読は、テキストマイニングに通じるところがあります。シンプルな換字式暗号なので、対応表さえあれば簡単に作成可能。・・・と言いたいところだが、実は小説中には出てこない足りない文字がある・・・
a | b | c | d | e | f | g | h | i | j | k | l | m |
5 | 2 | ― | † | 8 | 1 | 3 | 4 | 6 | 0 | 9 |
n | o | p | q | r | s | t | u | v | w | x | y | z |
* | ‡ | . | ( | ) | ; | ? | ¶ | : |
ちなみに小説中では、アルファベットの出現頻度は「eaoidhnrstuycfglmwbkpqxz」の順らしい。古英語の話なのか、jとvが抜け落ちているが。いずれにしても、小説に従うならば、jkqwxzの6文字は出てこないため、20種類のアルファベットで表現できる文章に限定されることになります。
(References)
エドガー・アラン・ポー(佐々木直次郎訳)「黄金虫」, 青空文庫
エドガー・アラン・ポー(佐々木直次郎訳)「黄金虫」, 青空文庫