コンピューターアルゴリズムは、320,000の原稿の断片を接続しようとします





1896年、カイロシナゴーグの天才で原稿の残骸が発見されました。32万枚の細断紙と羊皮紙です。 過去117年間で、見つかった4,000個のフラグメントが手動で接続されました。 受け取った情報に基づいて何千もの科学論文が書かれましたが、現在は応用プログラマーが働き始めています。



2013年5月16日に、フラグメントのコンピューター処理プロジェクトが開始されました。 テルアビブ大学の専門家は、シュレッダーコンテスト後のDARPA文書回復以来知られていた画像認識技術を使用します。 すべてのフラグメントがスキャンされ、背景から消去されて位置合わせされ、境界線が強調表示され、プログラムは断片、紙の上の線、インク跡のタッチポイントなどの形で一致を探します。 オペレーターはフラグメントの接続が正しいことを確認し、最終的な組み立てはグラフィカルエディターで実行されます。



カイロ写本の場合、過去1世紀にわたって断片が世界中に散らばっている67の図書館と私的コレクションに広がっているという事実によって状況は複雑です: ケンブリッジからサンクトペテルブルクまで。



さらに、この山の残骸の中で、さまざまな文書の断片がいくつ発見されたかは、当初は不明でした。 このような問題を解決するには、各フラグメントを特定のドキュメントに関連付けるために、各ドキュメントのテキストが記述されている言語、使用される文字の正確なセット、行間の距離を決定することが重要です。 見つかった数十万の断片の中で-ヘブライ語、アラム語、ユダヤアラビア語で書かれた数千の異なる文書。



すでに文書が9〜19世紀のものであることがわかりました。 文書の中には、12世紀のエジプトモーセの手紙、トーラーの一部、祈りの本、詩のあるリーフレット、個人的な手紙、契約書、錬金術マニュアル、裁判所の抜粋、羊皮紙と紙に関するレシピやその他の文書があり、エジプトのユダヤ人社会の生活について語っています。 歴史家は、ユダヤ人がシチリアから亜麻、織物、羊のチーズの輸入に関与していることを知った。 さらに、蜂蜜ワインのかなり厄介なレシピが見つかりました、とニューヨークタイムズは書いています



とりわけ、婚約前の合意が見つかり、ファイザ・バット・ソロモンという名前の花嫁は婚約者トビアスの前に「愚かさと愚かさを放棄する」条件と「悪い人を台無しにしない」条件をつけ、さもなければ10金の罰金を支払うことになった。 裁判所の文書には、市民のシット・イナサブと夫のソロモンとの間の法的紛争があり、妻は義母と娘が彼女の部屋に入ることを禁止し、一般的に彼女に訴えている。



断片の山全体で、約15,000は、950〜1250の家庭用、毎日の非宗教的記録に関連しています。 たとえば、当時の貿易ルートの「シャトル」の中で、最も収益性の高い商品は金や香辛料ではなく、布地や石鹸でした。





エジプトのモーセの手紙の復元された断片



ここでのフラグメントの数は、前述のDARPAコンテストよりもはるかに多かった。 パズルを組み立てるには、断片の124億の比較を行う必要があります。現在、約33億の比較が行われています。 1時間で、テルアビブ大学の100台のコンピューターのクラスターは1,000万ペアしか比較できないため、このプロセスはさらに数週間続きます(終了予定時刻:6月26日、午前9時46分)。 作業の進行状況は、 公式Webサイトで監視できます。



断片の比較は、原稿の断片を収集してデジタル化するための大規模プログラムの最後のステップです。 このプロジェクトは1997年に始まりました。GenizahProjectの Webサイトに登録することで、誰もが試合を見つけるのに役立ちました。



2,000万ドルのプログラムの実施のための資金は、カナダの投資家アルバートフリードバーグによって割り当てられました。



All Articles