IT企業でのDRP計画とそのパフォーマンスの確認

災害復旧計画の運用性を確認します。







私たちは皆、このようなことは決して起こらないことを望んでいます。



ほとんどの企業は、災害復旧計画を持っています(少なくとも、そうすべきです)。 同様の計画は、データセンターのオペレーターによるものでなければなりません。 これらのオブジェクトはいずれも外部要因の影響を受けます-事故オプションを完全に除外することはできません。 たとえそれでも、最も保護されたオブジェクトはまだ非常に不快な状況になる可能性があります。



したがって、DRP計画( 災害復旧計画 )は、会社が事故前の運用レベルに迅速に到達するのに役立つはずです。 通常、このような計画は、事故が発生した場合の従業員の行動を説明しています。 このような計画を立てるとき、目標は通常、事故の結果を最小限に抑えながら、所定のリソースを使用して重要なタスクの制御を取り戻すことができるようにすることです。 しかし、計画は計画ですが、機能しますか? これを確認するには、「トレーニングアラート」を実施する価値があります。



データセンターには、外部要因に敏感な多くの機器が含まれており、これらの機器は膨大な量のデータを処理します。 小さな事故でも何が起こるかを示す最近の例は、ほとんどのデルタ航空便のキャンセルです



おそらく、そのような巨大な会社には独自のDRP計画がありました。 おそらく、それ自体に説明のつかない瞬間があったため、会社自体とその顧客の両方が苦しんでいました。 実際、計画とその迅速な実装の可能性は、2つの異なるものです。



あらゆる企業、さらにはIT企業は、独自の災害復旧計画(地震、火災、人的要因など)を作成する際に、インフラストラクチャ、人、プロセスを考慮する必要があります。



トレーニングアラームはどのくらいの頻度で発生しますか?



実際、ここで答えることは困難です。各企業には固有の状況があり、DRP計画とその実装の両方を統合することはできません。 それでも、会社の責任者はいつでも、計画が現在の状況を満たし、実行できることを確認する必要があります。 DRP計画の改訂は、すべての主要なインフラストラクチャ変更の価値があります。 また、「不安」は月に1回または1年に1回実行できます。これはすべて、会社が変化する頻度に依存します。



専門家は、少なくとも年に1回チェックすることを推奨しています。



準備する



企業が計画の実行可能性と運用性のテストを開始する前に、その結​​果を確認する必要があります。 すべての従業員の責任が合理的かつ正しく配分されていることを確認してください。 一部の従業員はまったく職務を許可されませんが、誰かがそれらの多くを持っているでしょう、そして、この人(または人々)は、実際、不可欠でした。



それは災害であり、従業員の1人がアクセスできない場合があり、これがキーパーソンであれば、計画全体が下り坂になる可能性があります。 すべての指示と規則は明確で理解できるものでなければなりません。 計画を確認するときは、DRP計画の実装の進行状況を注意深く監視する必要があります。



チェックされている計画のすべての詳細は、発生したすべての問題と困難を考慮して修正する必要があります。 特定の問題の解決とステージの実装に費やされる時間を追跡し、時間基準でチェックを実行する必要があります。 会社の経営陣と個々の従業員は、IT会社の機器とサービスがしばらくの間アイドル状態になった場合に何が起こるかを知る必要があります。 これは、運用、顧客、収益にどのように影響しますか?



テスト方法



1.計画の検証

これは純粋に理論的な段階であり、本格的な「教育」を含むことはほとんどありません。 会社の現在の状況と年に数回必要なあなたの周りの状況の順守計画を確認します。



ところで、DRPには運営委員会が必要です。 通常、有能な従業員、多くの場合トップマネージャーが含まれます。 さらに、仕事のために、災害からの救助を計画する方法で大いに助けることができる専門家を引き付けることが必要です。



2.アラームなしでテストする

この段階では、計画に従って、災害の影響を排除するプロセスに参加する必要があるすべての従業員の知識を確認する必要があります。 特定の不測の事態が発生した場合、各従業員に責任とその履行についてインタビューする必要があります。



このようなことをしなければ、従業員はあなたの計画をあまり真剣に受け止めません。 誰かが間違いなく何かを忘れたり、誤解したり、参加しないことを決めたりします。 災害の結果に対する「人的要因」の重大な影響を防ぐために、計画のそのようなチェックを実行する必要があります。 すべての困難、従業員の誤解、行動の同期の明確性の欠如-これらはすべて修正および修正する必要があります。



3.実物大試験

これらは実際に野外演習であり、災害発生時に起こり得る状況の発展に可能な限り近づける必要があります。 結果は具体的なものでなければなりません。 データセンターのオペレーターは、ダウンタイムがどれほど悪影響を及ぼして会社の業務に影響を与えるかを考慮する必要があります。



一部の企業は、「運動」が普通の従業員からの偽物であるという情報を隠すことを好みます。 実際、これにより、可能な限り現実に近い反応と行動の速度を達成することができます。



この段階では、時間、機器、施設などの会社のリソースを使用する必要があります。 結果は、会社の従業員が状況に迅速に適応し、「損傷した」機器の明確な時間内に戻るはずです。



何かがうまくいかない場合はどうしますか?



これは、ある程度発生する可能性があります。 主なことは、そのようなレベルの100%のチェックはスムーズにパスできないことを思い出すことです。 従業員のエラーや予期しない要因の介入は、計画の実施に確かに影響します。



テスト後、すべての情報を会社の従業員に配布する必要があります。 さらに、いくつかの事柄は、それらに関連する人にのみ報告されるべきです。 理想的には、社内の何かが大きく変わったときにDRPをテストする価値があります。



そして、テスト後、すべての結果はあなた自身の会社の利益のために使用されるべきです。 一般に、従業員と会社全体を非常に困難な状況に備えさせることが重要です。 数か月ごとに計画を操作(変更および変更)する必要があります。 専門家は、これを四半期に1〜2回行うことをお勧めします。 しかし、もちろん。 それはすべて、会社自体とその従業員に依存しています。







さまざまなシナリオや状況で計画の作業を確認する必要があります。 従業員が災害に備えた場合にのみ、会社は障害後に迅速に回復することができます。 さもなければ、そのような会社のビジネスは非常に苦しむことができます。



ところで、あなたの会社がそのような問題に備えているかどうか、そしてそうであれば、計画の実行可能性をどのように確認し、どのような機能を備えているかを知ることは興味深いでしょう。



All Articles