18世紀のCopiale Cipher暗号 統計的機械翻訳を使用して復号化

60年以上前、機械翻訳の先駆者であるウォーレン・ウィーバーは、外国語のテキストを解釈するための暗号解読技術の使用を最初に提案しました。



数学者のNorbert Wienerへの有名な1947年の手紙の中で、彼は次のように書いています。「翻訳の問題を暗号の問題とみなすことができるかどうかを尋ねることは非常に自然です。 ロシア語のテキストを見たとき、「実際には英語で書かれていますが、奇妙な文字でエンコードされています。 今すぐ復号化を試みます。」



この推測は最終的に、Google翻訳などの統計的機械翻訳プログラムの全世代の開発につながりました。また、偶然ではなく、歴史的な暗号を分析するための新しいツールが登場しました。



現在、スウェーデンとアメリカの言語学者のグループが統計的機械翻訳技術を使用して、最も難しい暗号の1つであるCopiale Cipherを解読しています。これは、18世紀後半の手書きの105ページの原稿です。 科学者は、Portland Computer Linguistics Associationカンファレンスに先立って研究成果を発表しています。







東ドイツの科学アーカイブで発見された、巧妙に作成された金と緑のブロケードの本には、神秘的な文字とラテン文字の不可解な組み合わせで、75,000文字のテキストが含まれています。 Copiale Cipher原稿の名前は、ドキュメントに存在する2つの暗号化されていないラベルの1つに割り当てられます。



南カリフォルニア大学情報科学研究所のスペシャリストであるケビンナイトは、ウプサラ大学(スウェーデン)の同僚であるBeata MegyesiとChristiana Schaeferと共に、最初の16ページを解読できました。 彼らは、目の手術と眼科に興味を持っていた秘密結社の儀式の詳細な説明を含んでいます。





原稿の最初のページ





原稿の2ページ目と3ページ目



今年の仕事は週末の趣味として始まり、ナイト博士はインタビューの中で次のように述べています。「私は暗号の経験があまりありません。 私の研究は主にコンピューター言語学と機械翻訳に関連しています。」



元の言語を知らず、研究者は推測をテストする前にいくつかの盲目的な仮定をしました。 まず、すべての情報はラテン文字( 図では)、つまり、彼らは抽象的なシンボルを無視しようとしました。 彼らはラテン文字を取り、世界の80言語でテキストをチェックしました。



このアプローチが失敗したとき、科学者はテキストが実際に置換暗号によって作成されたことを発見しました。これは、オリジナルの各文字が異なる文字に置き換えられる暗号です。 そして、原稿がドイツで発見されたため、彼らは元の言語がドイツ語であることを示唆しました。



最終的に、彼らはラテン文字は実際にはデコーダーを誤解させることを意図したいわゆる「空の値」であり、いくつかの特殊文字は単語間のスペースを示すという結論に達しました。 2番目のブレークスルーは、コロンが前の子音を2倍にすることを意味するという発見でした。



その後、研究者は、予想される文字の頻度を分析するなどの有名な機械翻訳技術を使用して、どの文字がドイツ語のアルファベットの文字に相当するかを提案しました。 まず、彼らはどの文字の組み合わせがドイツ語でよく見られるchの組み合わせに対応するかを計算しました。







これが判明したとき、頻度分析は、文字tに対応する文字を示唆しました。これは、ドイツ語ではchの組み合わせに最もよく従っています。 など、ステップバイステップで、他のすべての文字が一致しました。 科学者は、大きな文字( )、おそらく分類された名前と組織のコードです。







「暗号解読に多くの言語的手法を適用できることが判明しました」とナイト博士は言います。



結果は他の専門家から称賛されました:「コピアレ暗号の解読は、ケビンナイトと彼の同僚の優雅な仕事です」と、暗号のニュースに関するCipher Mysteriesブログを運営する英国のソフトウェア開発者およびセキュリティスペシャリストのNick Pellingは述べました。



しかし、この暗号は注目に値する成功になりましたが、ナイト博士と彼の同僚は栄光に頼ることができません。 彼らは失望しながら、これまで多くの古代の本や歴史上の価値のある言語全体が解読されていないままだったと言います。



Copiale Cipherは、政治的アイデアの広がりを研究する歴史家だけに興味深いものです。 秘密結社は18世紀に流行していたとナイト博士は言います、そして彼らはフランス革命とアメリカ独立戦争の出来事にある程度影響を与えました。 最近、Kevin Knightは、暗号化されたテキストをCopialeに、秘密社会の専門家であるLend University(スウェーデン)の歴史家であるAndreas Onnerforsに送りました。



「本と解読されたバージョンを見たとき、彼は非常に興奮していました」とナイト博士は言います。 -彼は、本文の最後に政治的解説を見つけました。それは、譲渡できない人権について話しました。 そのようなことが初期のドキュメントで発見されたことは非常に興味深いことです。」



まだ明らかにされていない暗号の最近の例は、1960年代と1970年代にゾディアックがカリフォルニア警察に送った連続殺人犯からの手紙と、ラングレーにあるCIAの中央オフィスの前にある暗号化されたテキストを持つクリプトスの彫刻です。



しかし、暗号化コミュニティの主要な謎、暗号化の世界の真の聖杯は、 ヴォイニッチの原稿です -約600年前に未知の著者が未知のアルファベットを使用して未知の言語で書いた神秘的な本です。 それは、世界の最高の暗号作成者に挑戦するテキストで、豊かに図解された240ページから成ります。 長い間、専門家はこれをデマだと考えていましたが、最近の放射性炭素分析により、この文書は15世紀初頭に作成されたことが確認されました。



ナイト博士はシカゴ大学の同僚と一緒に、原稿の詳細な分析を発表しました。そこでは、神秘化の問題には答えませんが、ヴォイニッチ原稿には自然言語の構造が含まれているという証拠を提供します。



「これは世界で最も神秘的な原稿です」とケビン・ナイトは言います。 -彼女はパターンがぎっしり詰まっていて、そのようなものを作成した人はそれに膨大な時間を費やしました。 ですから、これはおそらく暗号であるように思えます。」



All Articles