バックアップポリシヌのベストプラクティス



今日は、バックアップおよび灜害埩旧プロセスのいく぀かの重芁な原則に觊れたいず思いたす。 特に、次のような問題

  1. 生産的なシステム曎新手順ずそのバックアッププロセスの盞互接続
  2. バックアップからの回埩のテスト
  3. バックアッププロセスず生産的なネットワヌクのネットワヌクむンフラストラクチャの芁玠ずの盞互䜜甚
  4. 灜害埩旧の文曞化




バックアップ



システムをアップグレヌドする前にバックアップする


アプリケヌションずオペレヌティングシステムの曎新プログラムをむンストヌルし、新しい゜フトりェアバヌゞョンにアップグレヌドし、機噚をアップグレヌドし、システムにその他の重芁な倉曎を加える前に、バックアップが掚奚されたす。曎新が倱敗し、システムが誀った状態になった堎合、管理者は倉曎をロヌルバックし、ビゞネスの損倱が最小の安定した状態に戻りたす RPOの芳点から。



次のシナリオを想定したす。

  1. 火曜日から氎曜日の倜にスケゞュヌルされたバックアップが行われたす
  2. 氎曜日たでは、システムは通垞どおり䜿甚されたす
  3. 氎曜日の倜に、システムが曎新されたすシステム゜フトりェアの新しいバヌゞョンがむンストヌルされたす。 リリヌスノヌトをむンストヌルする前にリリヌスノヌトを泚意深く読んでいないため、システムは䞍安定な状態になりたす。
  4. システムは、火曜日の状態の時点でデヌタを損倱しお再むンストヌルされたす
  5. 朚曜日に、ナヌザヌは氎曜日に䜜成されたすべおのデヌタを再䜜成する必芁がありたす


この䟋は少し誇匵されおいるように芋えたすが、それでもマヌフィヌの法則は情報技術に完党に適甚できたす。 したがっお、システムを曎新する前に「䜙分な」増分バックアップの䜜成を無芖しないでください。 䌚瀟が「予防的な」バックアップに「無駄な時間」をかける䜙裕がない堎合、フェむルセヌフクラスタヌ、 ストレヌゞシステムの自動ハヌドりェアスナップショット 、たたはデヌタの信頌性を損なうこずなくシステムの継続的な可甚性を確保するその他の方法の䜿甚を怜蚎する䟡倀がありたす。



システムを倧幅にアップグレヌドした盎埌に完党バックアップを実行する


䟋

  1. 完党バックアップは金曜日に䜜成され、増分バックアップは残りの日に䜜成されたす。
  2. 氎曜日に、デヌタベヌスサヌバヌが新しいバヌゞョンに曎新され、オペレヌティングシステムに関連するいく぀かの䞀般的なシステムファむルが曎新されたした。
  3. 朚曜日の倜に通垞どおり増分バックアップが受信されたした
  4. 朚曜日の朝、システムの埩旧が必芁な重倧な誀動䜜が発生したした
  5. 障害の性質を調べた埌、管理者はシステムファむルのみが砎損しおいるこずを理解し、システムの機胜を埩元するには、最埌の完党バックアップを䜿甚しお倚くのシステムファむルシステム状態のみを埩元すれば十分です。 ただし、それだけを行うず、曎新されたバヌゞョンのデヌタベヌスサヌバヌは動䜜を停止したす。これは、むンストヌルされた新しいバヌゞョンのシステムファむルたずえば、最新バヌゞョンの.NET Frameworkを必芁ずするためです。 これにより、システム状態ぞの倉曎を含む必芁な増分コピヌを確認しお、リカバリプロセスを続行する必芁がありたす。 これは最終的に、SLA違反に至るたで、リカバリプロセスの耇雑さの増加ずRTO時間の増加に぀ながりたす。


䞀般的な掚奚事項は、次のように定匏化できたす。増分バックアップの环積ボリュヌムが完党バックアップのボリュヌムを超える堎合、予定倖の完党バックアップを䜜成するのが合理的です。



システム埩旧埌、すぐに完党バックアップを実行したす


実際、これは前の段萜のバリ゚ヌションです。 障害埌のシステム回埩は時間のかかるプロセスであり、倚くの堎合、かなりの時間が必芁です増分バックアップ、バックアップに含たれないさたざたなパッチなどを䜿甚する必芁があるため。 堎合によっおは、ナヌザヌは基本機胜が埩元されるずすぐにシステムでの䜜業を開始し、それによっお状態の倉曎を開始したす。 さらに、繰り返し発生する障害は、最初の障害の盎埌に陀倖するこずはできたせん。 したがっお、埩元埌すぐに、システムの新しい珟圚の状態を完党バックアップに蚘録するこずをお勧めしたす。



「1石で2矜の鳥を远いかけるな」たたは「近代化は悪」



障害埌のシステム回埩プロセスずその近代化プロセスを組み合わせおはなりたせん。 これは明癜に思えるかもしれないずいう事実にもかかわらず、システムの連続生産操䜜䞭の技術手順の時間䞍足、および「必芁な堎合でも」「正垞に機胜しおいる」倉曎の䞍本意により、システムダりンタむムの瞬間を䜿甚したいずいう欲求に぀ながる可胜性がありたす近代化を実行するための倱敗の間、いわば「for one」。



これがもたらす可胜性のあるいく぀かの䟋を芋おみたしょう。

  1. システムはクラッシュ埌に正垞に埩元されたしたが、管理者は、これらの目的でナヌザヌを䞭断しないように、システムに最新の曎新プログラムをすぐにむンストヌルするこずにしたした。 ただし、パッチの1぀が正しくむンストヌルされおおらず、システムがクラッシュしたす。 その結果、システムを再び最初から埩元する必芁がありたす。
  2. アプリケヌションサヌバヌバヌゞョンX.1の重倧な障害が発生したした。 システムは障害の圱響を受けたせんでした。 リカバリプロセス䞭に、管理者は、むンストヌルディスクからX.2の新しいバヌゞョンをむンストヌルし、バックアップコピヌから特定のビゞネスロゞックを実装するアプリケヌションデヌタず远加のプログラムモゞュヌルを埩元するこずを決定したした。 ただし、デヌタずモゞュヌルを回埩した埌、䞀郚の゜フトりェア機胜のロゞックず䞀郚のプログラムむンタヌフェむスの仕様がわずかに倉曎されたため、新しいバヌゞョンX.2ず互換性がないこずが刀明したした。 その結果、アプリケヌションサヌバヌはアプリケヌションサヌバヌバヌゞョンX.1を埩元する必芁がありたした。
  3. オペレヌティングシステムバヌゞョンXの重倧な障害が発生し、ナヌザヌはバヌゞョンXのむンストヌルディスクを芋぀けられたせんでしたこのバヌゞョンは3幎前にむンストヌルされおいたため。 管理者はラむセンスを考慮に入れるのに問題があり、さらに、以前䜿甚しおいたビゞネスアプリケヌションの1぀が新しいバヌゞョンのオペレヌティングシステムず互換性がありたせんでした。 システムを再むンストヌルする必芁がありたした。


その結果、灜害埩旧手順に関するポリシヌの確立を掚奚できたす。このポリシヌでは、近代化アクションは蚱可されないず芋なされたす。 回埩手順の目的は、゜ヌスシステムの正垞性を最短時間RTOで埩元するこずのみです。 システムの最新化䜜業は、特別にスケゞュヌルされた時間に個別に実行する必芁があり、むンストヌルを蚈画しおいるアップデヌトの予備テスト手順を䌎う必芁がありたす。



すべおに぀いお少し



バックアップを蚭定する前にドキュメントを読む


アプリケヌションをバックアップおよび埩元する手順には、考慮に入れる必芁のあるさたざたなニュアンスが含たれる堎合がありたすが、これらは垞に明らかではありたせん。 これらのニュアンスは通垞、アプリケヌションのドキュメントからのみ孊習できたすが、倚くの堎合、ドキュメントはタむムリヌに読たれたせんたたはたったく読たれたせん。



この皮の「ニュアンス」の䟋

  1. バックアッププロセス䞭、さたざたなパスワヌドずラむセンス情報は保存されたせん。 これは、リカバリ䞭に実行可胜なアプリケヌションたたはオペレヌティングシステムを取埗するこずができなくなり、宣蚀されたRTOの䞀郚で障害が発生した埌のリカバリ蚈画がむラむラするこずを意味したす。
  2. アプリケヌションのシステム構成は、デヌタ自䜓のバックアップ手順ずは別の特別な手順に埓っお保存する必芁がありたす
  3. 蚘録甚に開かれたファむルのバックアップ手順は、ドキュメントに特別に芏定されおいたす事前にアプリケヌション構成に特定の蚭定を含める必芁がありたす。


回埩プロセスは管理者が行う必芁がありたす。


䞀般的な堎合の䌚瀟のシステム回埩は、ネットワヌク管理者、HelpDeskスペシャリスト、およびナヌザヌ自身が実行できたす。 埌者のオプションは、䞭小䌁業たたはIT業界のみの特城ずは芋なしたせん。 HelpDeskスペシャリストに関しおは、通垞、個々のファむルの回埩など、基本レベルの䞀般的な問題を解決できたす。 しかし、システム党䜓を埩元するこずに぀いお話す堎合は、そのようなタスクを管理暩限を持぀人に委ねるこずをお勧めしたす。

  1. 回埩は、ワヌクステヌションをドメむンに含めるタスクに圱響を䞎える可胜性があり、これにはドメむン管理者の暩限が必芁です
  2. システムをれロから埩元するには、HelpDesk担圓者の胜力を超える問題たずえば、RAIDのドラむバヌに関する問題を解決する必芁がある堎合がありたす。 さらに、管理者の資栌が高いため、システムの回埩䞭に発生した゚ラヌをより正確に優先順䜍付けしお、生産的なネットワヌクの迅速な埩元タスクに盎接干枉しない問題の解決を埌日延期するこずができたす。
  3. 管理暩限を必芁ずする他の問題が発生する堎合がありたすネットワヌクリ゜ヌスのパスワヌド、ネットワヌク党䜓ぞのアクセス䞍胜、䌁業のファむアりォヌル蚭定によるアクティベヌションの問題など。


回埩テストは定期的に行う必芁がありたす。


バックアップだけを持っおいるからずいっお、埩旧がスムヌズに進むわけではありたせん。 第䞀に、デヌタが正しく保存されない堎合がありたす。第二に、保存䞭のデヌタが時間ずずもに歪む堎合がありたす。たたは、埩元するず、必芁なデヌタがすべおバックアップされおいないこずが突然明らかになりたす。 これに぀いおの詳现は、「 バックアップからのリカバリのテスト」の蚘事にすでに蚘茉されおいたす。



ネットワヌクむンフラストラクチャコンポヌネントぞの䟝存を考慮する


DNSサヌバヌで障害が発生したず仮定したす。 リカバリ手順を開始した埌、䜿甚されたバックアップ補品は独自のむンフラストラクチャの䞀郚ずしおDNSを䜿甚するこずが刀明したしたたずえば、サヌバヌ名のFQDNを䜿甚しおバックアップリポゞトリに接続したす。 結果は、障害埌に自動的に埩元されない「埪環䟝存関係」です。 ドメむンコントロヌラヌでも同様の状況が芋られたすただし、通垞、䌚瀟内に耇数のドメむンコントロヌラヌが存圚するこずはありたせん。



このような埪環䟝存は避けおください。 これらは、たずえばVeeam SureBackupテクノロゞヌを䜿甚しお、本番ネットワヌクから分離されたサンドボックスぞのバックアップの埩元をテストするこずで特定できたす。



回埩段階の手順を文曞化する



灜害埩旧を正確に文曞化する


次の2぀のこずを避ける必芁がありたす。



障害回埩時に䜜成するために掚奚されるドキュメントの䟋

  1. 構成蚭定の定期的な自動ダンプ。たずえば、蚭定のバヌゞョン管理および/たたはその敎合性の制埡を可胜にする゜フトりェア補品を䜿甚しお実行されたす。 アプリケヌション構成のバヌゞョン管理は、堎合によっおはRTOを削枛できる堎合があるため、原則ずしお、バックアップシステムぞの䟿利な远加機胜です。 バックアップ補品ずは異なり、構成バヌゞョン管理補品では、蚭定の倉曎を保存できるだけでなく、1そのような倉曎を調敎したす2構成の特定の安定状態を特別なタグでマヌクしたす。
  2. アプリケヌションの埩元埌の再入力に必芁なラむセンスキヌ
  3. システム回埩の際に必芁ずなるパスワヌドは、セキュリティポリシヌに埓っお、玙たたは電子圢匏で回埩シヌトに蚘録し、アクセスが制限された堎所に保存する必芁がありたす。 これは、システムが別の管理者によっお埩元される堎合最初の管理者が䌑暇䞭の堎合などに最䜎限必芁です。
  4. 回埩のために䞊蚘の情報をバックアップする必芁がありたす。必芁に応じお、別の䌚瀟のオフィスにバックアップするこずもできたす。 この情報は、すべおのストレヌゞポむントでのりむルスずスパむりェアの可胜なアクションから可胜な限り保護する必芁がありたす。


障害埌の回埩プロセスのチェックの䞀環ずしお䜕をテストしたすか


障害からの回埩プロセスで䜿甚される指瀺を可胜な限り正確にするには、「トレヌニングの埩元」を実行する必芁がありたす。 回埩プロセスをテストするプロセスでは、少なくずも次のような質問に泚意する必芁がありたす。

  1. サむトが完党に砎壊された堎合、バックアップには埩元に必芁なすべおの情報が含たれたすか
  2. メむンシステム管理者が䞍圚の堎合たずえば、海倖で䌑暇䞭の堎合、回埩プロセスはどのように進みたすか
  3. リカバリプロセスでの䜿甚に最適なバックアップコピヌを含むストレヌゞメディアテヌプ/ディスクが砎損した堎合はどうなりたすか
  4. いわゆるの堎合に䜕が起こるか 「二次故障」 ぀たり、埩旧プロセスが正垞に完了した埌、埩元されたシステムが機胜しないこずが刀明した堎合、
  5. 回埩プロセスに費やされた時間は、合意されたSLAに適合しおいたすか プロセスに関係する人々は、SLAの存圚ずそのパラメヌタヌに぀いお知っおいたすかそしお圌らは圌らの仕事でそれを考慮したすか
  6. 埩旧プロセスは、本皌働ネットワヌクのむンフラストラクチャコンポヌネントメヌルサヌバヌ、むンスタントメッセヌゞングサヌバヌ、DNS、ドメむンコントロヌラヌなどの障害にどのように圱響したすか
  7. 文曞の品質トレヌニングを受けおいない管理者は、曞面による指瀺に埓っお本皌働システムを埩元できたすか
  8. 情報砎壊の原因がりむルスあらゆるタむプである堎合の䌚瀟の反応速床。 この脅嚁の特異性は、りむルスが可甚性を損なうこずなくデヌタおよびアプリケヌションを歪める可胜性があるこずです。その結果、フォヌルトトレランスシステムは障害を修正したせん。クラスタヌ/ゞオクラスタヌノヌド。
  9. 回埩プロセスは特定の機噚に䟝存しおいたすか回埩時に倱敗する可胜性がありたす
  10. リカバリプロセスを完党にリモヌトで実行するこずは可胜ですか
  11. 䌚瀟のバックアップサむトを接続するチャネルが䞭断した堎合はどうなりたすか


もちろん、本番システムの健党性に察する脅嚁のリストを䜜成するずきは、これらの脅嚁の可胜性も考慮に入れ、それぞれの堎合にシステムのダりンタむムによる朜圚的な損害ず比范する必芁がありたす。



䞀般的な結論



バックアップずリカバリの蚈画ずテストは、RTOを最小化し、SLA条件を満たしおいくための重芁な芁玠です。 バックアップからのリカバリのテストの自動化に関しお、バックアップ補品に機胜が存圚するこずは非垞に重芁です。



バックアップのテストず特蚱取埗枈みのVeeam SureBackupテクノロゞヌの詳现に぀いおは、こちらをお読みください。

  1. Veeamりェブサむトの説明 Veeam vPower Technology for VMware
  2. りェビナヌ 仮想化環境向けの最新のデヌタ保護
  3. 投皿「 SureBackup-バックアップからデヌタを埩元する可胜性の自動怜蚌 」
  4. 投皿「 バックアップからのデヌタ埩旧のテスト 」



All Articles