長期のアーカイブデータストレージ、またはgreat祖母の自撮りの見方

おそらく、コンピュータ技術には一般的な注意を引く領域はほとんどありませんが、同時に、長期のアーカイブデータストレージという非常に多くの神話や誤解に囲まれています。 彼の専門的な実践において、何年も前のデータの更新や長期アーカイブの編成に直面した人として、私はこのテーマについても発言することを試みます。



記事全体を読むのが面倒な人のための簡単な要約:特効薬はありません。



問題のより詳細な議論に興味がある人のために、さらなるテキストが意図されています。



それで、ボルシェビキがこれほど多く語った必要性についてのペーパーレス・コンピューター・サイエンスへの移行が起こりました。 デジタルメディアのデータ量は2年ごとに2倍になります。 興味深いテキストや画像を印刷することを気にする現代の若者はほとんどいません(私は中年の男性として、紙もおろそかにしているため、紙のバージョンのためにクローゼットに行くよりも、インターネットライブラリからスマートフォンに本をダウンロードすることを好みます。隣の部屋で)。 しかし、残念なことに、デジタルの利便性には裏返しがあり、これは長期保存の問題です。



長期保管と言えば、私は25年から100年の計画期間、つまり現代人が若者の個人情報を保持し、それを彼の生涯を通して返すことができる期間を意味します。子孫(great祖母の自撮りの例の問題について)。 ビジネスでは、そのような期間のデータを処理するビジネスプロセスはほとんどないため(このようなプロセスを持つ組織は確かに存在し、通常はその詳細を明確に理解していますが)、そのような長期保存はより重要です。



最初の近似では、この問題の考慮には3つのレベルがあり、リストの最初から最後まで一般の人々が注意を引きます。



1.メディアの物理的安全性とストレージの単価。



これは最も広く知られている検討レベルであり、多くの出版物に限定されています。 空から空にあふれることはなく、よく知られていることを繰り返しますが、今日の日常のユーザープラクティスには、アーカイブメディアの3つのカテゴリがあることを簡単に要約します。



-光学ディスク(CD、DVD、BDなど)およびフラッシュドライブ。 一般に、このようなメディア上のデータは数年後に破壊されると考えられており、いずれにしても、25年後にはほとんど読まれそうにない。



-磁気メディア(ハードドライブとテープ)。 ディスクとテープの支持者の間で大きな炎へのアクセスがあり、要するに、ディスクは異国情緒、低ランダムアクセス速度と読み書きデバイスの高コストのためにテープドライブを非難し、テープドライブはメディアの脆弱性、高電力消費と高単価のためにディスクドライブを非難します大量のデータのストレージ。 ディスコテープ戦争での議論や反論の妥当性に入ることなく、アーカイブ磁気メディアはしばしば、少なくとも30年の有効期限を持っていることが多いことに注意してください。もちろん、この数は、集中的なテストの結果ではなく、 30年間の野外観察による。



-ネットワークアーカイブ。 ここでのアイデアは、データのストレージを特別に認可された企業の特別に訓練された人々に委任し、そのようなネットワークストレージをインターネットサービスの形式のインターフェースを備えたブラックボックスと見なすことです。 このソリューションの利点は、疑いもなく、そのようなサービスを専門的に提供する企業が、通常のユーザーよりもデータの安全性に優れている(そして潜在的に無期限にそれを行う)と同時に、大規模な効果により低いストレージコストを提供できることです。 欠点は、ユーザーに依存しないリスクです。 ネットワークアーカイブへの情報の長期保存の主なリスクは、サービス会社のビジネスの突然の清算であり、残念ながら誰も安全ではありません。 追加のリスクは、さまざまな国の当局やインターネットプロバイダーがインターネット経由で情報を送信する際の境界、コンテンツ、フォーマット、またはその他の制限を将来確立する可能性であり、リモートアーカイブへのアクセスが不可能になる場合があります。



したがって、中程度に悲観的であると考えると、データの物理的な整合性は、約30年前から制御されたリスクで達成できると結論付けることができます。



2.メディアの技術的な互換性。



この問題はそれほど頻繁には考慮されません。 物理的安全性に関する以前の評価を活用し、思考実験を実施して、30年前に祖母と30歳前の母だけがデジタルデータを書き込める媒体を見つけましょう。



ですから、30年前は1986年でした。 当時のユーザーは、技術的な好みに応じて、データを保存するための最も信頼性の高いメディアを検討する場合があります。大型コンピューターの9トラックの磁気テープ。 スタッフで広く使用されている5インチまたは8インチのフロッピーディスク。 または、SonyのMacintoshフロッピーディスクドライブ用の最新の800キロバイト3インチフロッピーディスク(後の3インチ1.44メガバイトドライブと互換性がありません)。 メディアが完全に物理的に安全であると仮定したとしても、もちろん最近はそれらのいずれかからの読み取りは可能ですが、時間とお金のかなりの投資が必要になります。 さらに30年後、これらのメディアの読み取り技術は完全に失われる可能性があります。



たぶん、コンピューター技術の初期のせいで、すべてがひどいのはたった30年前だったのかもしれませんが、今日はこの問題から解放されていますか? 最新のストレージメディアを見てみましょう。



長期的なアーカイブ情報担体として、LTO標準の磁気テープは現在明確に配置されています。 LTOの世界は、2〜3年ごとに標準の新世代がリリースされるように設計されており、容量は約2倍になり、この世代の機器が生産されています(現在の標準はLTO-7です)。 ただし、LTO標準は、LTOテープドライブと2世代前の読み取りおよび1世代の記録のメディアとの互換性を管理します(メーカーの一般的な慣行により保証されます)。 つまり、最新のLTO-7テープドライブはLTO-7、LTO-6、またはLTO-5テープのみを読み取ることができ、現在記録されている最新のLTO-7テープは、LTO-10テープドライブと互換性がなくなります。 2022年。 10年後(2026年)、最新のカセットは、市場で入手可能なデバイスで読み取られることはありません。 この点で、カセット自体の30年間の保存に対する保証はいくぶんロマンチックです。



ドライブの側面を取り、最新のSATAまたはSASハードドライブに情報を書き込むとします。 これらのインターフェース標準はすでに10年以上前のものであり、少なくとも10年も続くことはほとんどありません。同じことが現代のUSBにも当てはまります。 実際の土壌の欠如は、物理インターフェースの遠い未来についてのすべての議論を非常に推測しますが、例えば、10-20年後にディスクデバイスのインターフェースは光学的になる可能性があり、この場合、それらはすでにデータ転送媒体のレベルにある最新のデバイスと互換性がないと仮定できます。



上記に基づいて、30年後に現代の磁気媒体が通常のコンピューターデバイスで認識されることはほとんどありません。



ネットワークアーカイブにデータを保存すると、これらの問題を特別に訓練された人に転送できますが、前のセクションで示したリスクは残ります。 30年前のコンピューター市場のリーダーのほとんどは、IBM、Apple、Microsoftなどの少数の例外を除き、現在清算されていることを思い出してください。ただし、その後、活動範囲が変更されました。



3.データ形式の互換性。



彼らはめったにこの問題について書いていない。



30年前からデジタル自撮りはまったくありませんでした。1986年から簡単なテキストの電子文書を入手し、すべての技術的な問題を解決して現代のコンピューターのファイルに書き込むことができたと想像してください。



1986年のコンピューターの世界は多種多様であるため、ここには多くのオプションが存在する可能性があるため、ごく少数を検討します。



-1986年のメインフレームユーザーから、EBCDIC(DKOI)でエンコードされた80文字の固定レコードを持つパンチカードの仮想デッキのイメージをディスクに取得できます。



-MacintoshユーザーからClarisWorksドキュメントを取得します。



-PCユーザーから、たとえば、ChiWriterまたはWordPerfect dosテキストエディターからドキュメントを受け取りますが、成功した場合はプレーンテキストファイルである可能性があります。



-そして、Unixユーザーの場合のみ、ほぼ確実に幸運であり、通常の読み取り可能なテキストファイル(ロシア語エンコーディングkoi8-r以降)を入手する可能性があります。



これは、最も一般的なタイプのドキュメントであるプレーンテキストの状況です。 たとえば、1986年の図面が私たちに届いたと想像すると、ほぼ100%の確実性を持って、このファイルを今はまったく解釈できないと言えます。



アルツハイマー病の腕を30分間破壊した後、2016年の休暇で退屈した孫の不鮮明な写真を見せることができるという暗黙の信念は何ですか? ある楽観的な見方をすれば、jpeg形式は、現代生活における膨大な普及を考慮して、明るいアルツハイマーの将来に採用される画像形式に何らかの形で変換できると想像できます(ただし、このような形式の長い寿命には歴史的な先例はありませんでした)。 しかし、確かにこれは、未加工のカメラ形式、doc / docxなどのオフィス文書形式、fb2 / epub電子書籍などには適用されません。この形式の無制限の互換性を提供する機能。



4.何をする?



デジタルアーカイブを最新の状態に保つことは、その目的や使用される技術的手段に関係なく、かなり複雑で時間のかかる作業です。 このアクティビティには、アーカイブのすべての内容を新しいストレージメディアに転送するとともに、必要に応じて古いドキュメントを新しい最新の形式に変換する、数年ごとのアーカイブの完全なレビューが含まれます。



私たちは、個人ユーザーや法人がそのようなことをするのに苦労することはほとんどないので、人間社会の発展の新しい段階の危機にonしていると仮定することができます。個人や社会の過去に関する信頼できるデータが1世代の生涯でほとんど失われ、残りのいくつかの関連するデジタルアーカイブが改ざんされやすくなる場合 私は主に中央集権を行きます。



これについて、叙情的な余談は完了することができますが、実際の結論としては、アーカイブを維持するには、データの関連性を維持するための積極的な調査が必要であり、ファイルを情報ヒープに受動的にダンプするだけではありません。 私生活を含め、このような意識的なアーカイブに携わっている人々は存在し、非常に有名であり、彼らが彼らの実践に参加することを妨げるものは何もありません。



また、写真用紙に印刷する場合に備えて、great孫の自撮りの方が優れています。



All Articles