この記事は、OfficeRecovery Onlineシステムで修復された20万の破損ファイルの配列で収集された固有の統計に基づいています。
問題とその発生理由
情報インフラストラクチャの計画と実装における最も重要なタスクの1つは、データの安全性を確保することです。 蓄積された情報の破損または消失は、ビジネスに重大な損害を与える可能性があります。 したがって、データの信頼性と安全性を確保することは、多様でマルチレベルであり、可能な限り多くのデータ損失から保護する必要があります。
データの安全性を確保する主な方法を検討するために、データの損傷の主な原因を検討します。
- ハードウェア障害。 物理的なメディア障害の結果としてのデータの損失。 このような損傷により、ファイルの任意の部分が無意味なデータに置き換えられます。 深刻な場合、損傷はファイルにとどまらず、ファイルシステム全体に影響を与える可能性があり、ファイルを読み取るだけでなくファイルを見つけることでも問題を引き起こす可能性があります。
- ソフトウェアのクラッシュ。 変更をファイルに保存するときなど、アプリケーションの処理でエラーが発生した後のデータの損失。 このタイプの典型的な問題は、メモリ不足、アプリケーションのエラー、オペレーティングシステムの誤動作です。 この場合、ファイル内のデータは完全ではない可能性がありますが、うまく復元できます。
- 人的要因。 たとえば、ファイルの誤った削除による重要なデータの損失。 ディスクから削除されたデータを回復する最新の手段は、特殊なアルゴリズムを使用しますが、これは常に望ましい結果をもたらすとは限りません。 その結果、ファイルの一部がディスクの任意のゴミによって「消去」される場合があります。
上記のデータ破損の理由の結果に対処する主な方法として、バックアップが使用されます。大規模な組織では、いわゆる災害復旧計画、緊急時計画(以下-DR戦略とDR計画)が使用されます。
破損したデータの問題に対するソリューションとしてのバックアップおよびDR計画
西DRでは長年にわたってDR計画がホットな話題であったが、ロシア語のIT用語集ではこの用語は存在しないことに注意してください。いずれの場合でも、対応するWikipediaの記事にはロシア語版がありません。
バックアップ戦略とDR計画の違いは、2つ目は、壊滅的なイベント後のITビジネスインフラストラクチャの復元に関するすべての質問に答える包括的なテクノロジと手順のセットであることです。 バックアップタスクが完全なデータセットをユーザーに返すことである場合、DR計画のタスクは、稼働中のITインフラストラクチャを運用に戻すことです。これは、多くの場合、ビジネス全体を運用に戻すことと同等です。
したがって、フォールトトレラントデータストレージ(たとえば、RAIDディスクアレイ)を使用したバックアップは、DR戦略の開発に使用される技術的な方法にすぎません。
DR計画の最終目標は、破損したファイルやデータベースに対処する必要がある状況を完全に排除することです。 この分野のソリューションプロバイダーは、不可抗力が発生した場合にデータがどのように返されるかを、いくつかのボタンをクリックするだけで自信を持って教えてくれます。
残念ながら、これは完全に真実ではありません。 真実に直面した場合、数十億ドル相当のデータ保護投資を行っている組織であっても、破損したファイルが依然として存在することを認めなければなりません。
この主な理由は次のとおりです。
- バックアップシステムの不適切な使用と実装されたプラクティスの不適切な実装。 展開したデータ保護ソリューションが実装の3日後に機能する可能性は99%であり、ほとんどの場合、さらに高くなります。 しかし、時間が経ち、ストレージが混雑し、従業員が出入りします。 2年後、解決策が長い間機能しなくなったことが判明するかもしれませんが、彼らはこれを追跡していません。
- バックアップシステムによってカバーされないゾーンの避けられない存在。 従業員は、ビジネスに重要な機密文書をUSBフラッシュドライブで直接編集する習慣がありますか? 編集中にコンピュータからUSBフラッシュドライブを不用意に取り外すと、破損したファイルがもう1つ得られます。
- バックアップの頻度。 通常の頻度は24時間ですが、バックアップの保存に割り当てることができるリソースの数に応じて、72時間または12時間になる場合があります。 問題は、不可抗力が発生した場合、24時間(または72時間、12時間)前に完全なデータが保証されることです。 最後のバックアップ以降に蓄積されたデータを復元することを約束する人はいません。 そして、これは最新で、多くの場合、最も価値のあるデータです。
- 運用サーバー上のデータを台無しにしたのと同じ障害に対するバックアップシステムの影響を受けやすい。 もちろん、これはDR計画の不利な点を指しますが、バックアップRAIDは、それによって保護されている稼働中のサーバー(近くにある)よりも少し早くフラッディングすることがよくあります。
ファイルが破損し、それを使用するアプリケーションがファイルを開くことを拒否し、バックアップシステムが必要なデータを含むコピーを提供できない場合はどうすればよいですか? 破損したファイル自体のデータを回復することは可能ですか? これができる確率はどのくらいですか? 組織のDR計画を改善することはどういう意味ですか?
OfficeRecovery Online:200,000個の破損したファイルの回復の分析
2011年8月、OfficeRecoveryは、破損したファイルをオンラインで回復するためのクラウドサービスを開始しました( https://online.officerecovery.com/ru/ )。 2012年9月までに20万個のファイルがシステムを通過し、人為的な不可抗力の状況に対するビジネスの回復力を高める方法を探している組織のDR計画の観点から重要な統計が収集されました。
収集されたデータを処理し、損傷の典型的な原因を特定するのに約1か月かかりました。 一般的なファイルの種類を回復するための成功統計は次のとおりです。
- Corel WordPerfectファイル-93.1%が正常に復元されました
- ZIPアーカイブ-79.0%
- Microsoft Wordドキュメント-75.9%
- Microsoft Projectファイル-66.2%
- Adobe Photoshop画像-66.1%
- Microsoft Excelスプレッドシート-63.2%
- Microsoft Accessデータベース-55.4%
- Microsoft PowerPointプレゼンテーション-52.1%
- グラフィック形式(写真、写真)-46.4%
注:データの少なくとも一部をファイルから取得できる場合、回復は成功したと見なされます。 データの損失は通常避けられませんが、多くの場合、回収された小さな断片であっても顧客にとって大きな価値があります。
回復の主な困難はグラフィック形式で表されます。 これは、多くの場合、画像コンテンツが圧縮された形式で保存され、損傷部位に続く写真の一部を許容可能な形式で復元することがほとんど不可能なためです。 これは主にJPEG、TIFFおよびRAW形式に適用されます。
オフィスアプリケーション形式の状況は著しく改善されています。 OfficeRecoveryは14年以上にわたってオフィスアプリケーション形式で作業しており、この分野で豊富な経験を持っています。
Microsoft Wordファイルは回復の点で簡単と見なされます。ファイルが非常に深刻な損傷を受けた場合でも、フォーマットが失われたとしても、少なくともファイルに保存されているすべてのテキストを取得する機能があるためです。 多くの場合、これがユーザーを支援する唯一の方法です。
次に復元するのが最も簡単なのはMicrosoft Excelです。ファイルの内部構造がひどく破損していて、ブック内のシートセットを完全に読み取ることができない場合、1ページのすべてのセルの内容を抽出することは可能です。
平均して、半分以上のケースで回復が成功しました! つまり、OfficeRecovery Onlineは、失われたと見なされた10万個のファイルの完全または部分的なコンテンツをユーザーに返しました。
データセキュリティ戦略の一環として破損したファイルを回復する
この記事が示すように、壊れたファイルはa)一般的な問題であり、b)ほとんどの場合、さまざまな程度の成功の「治療」の対象となります。
結論:DR戦略を開発するときは、ITインフラストラクチャの障害に起因する破損データを回復するためのソフトウェア製品と手順をすぐに含めてください。 バックアップシステムの導入により、このような状況が「原則的に不可能」であるという事実に頼らないでください。
OfficeRecoveryは、従来のDR計画ソリューションを補完するさまざまな製品を提供しており、何らかの理由でバックアップシステムの範囲を超えているデータを回復できます。
ビジネス電子文書管理の基礎を形成するWord、Excel、PowerPointなどの「ライト」形式には、 OfficeRecovery Onlineオンラインサービスが適しています。 このサービスを使用すると、従業員は特別なスキルがなく、ブラウザのみを使用して破損したファイルを修復できます。 リカバリ後すぐにデモ結果が利用可能になり、リカバリ日から2〜4週間で無料の結果が得られる可能性もあります。 追加料金で、資格のある専門家による問題ファイルの分析と処理が可能です。
大量のデータを回復するために(たとえば、データベース、仮想ディスクイメージ、Exchangeメールデータベースが破損した場合)、 OfficeRecoveryメインサイト( www.officerecovery.com )は、最も一般的な形式からデータを回復するための一連の従来の「オフライン」ソフトウェア製品を提供します。 これらの製品は、プライバシー上の理由でオンライン復旧が不可能な場合にも推奨されます。 破損したデータをオンラインサービスにアップロードする代わりに、クライアントは適切なソフトウェア製品を購入し、会社から提供せずにデータを復元できます。