システム管理者は、まだバックアップしていない人と、すでにバックアップしている人に分かれていると言われています。 もちろん、これは冗談であり、巨大なひげでも、彼らが言うように、すべての冗談で...そして、多くの企業がバックアップに問題を抱えています。 これらの問題は、顧客ベースが発達している大企業の場合、数十万ドル、さらには数百万ドルもかかる可能性があります。
いくつかの簡単なルールに従うことで、バックアップの問題を回避できます。 ここでは複雑なことは何もありません。 私たちは彼らを家で成し遂げようとしている、そして私は言わなければならない、それはうまくいく。 これは技術的なブレークスルーではなく、多くの人が忘れている日常的な詳細についてであるとすぐに言わなければなりません。 バックアップを作成し、バックアップからデータを復元するプロセスを長い間確立してきました。 そして、私たちの仕事では、あなたに役立つかもしれないいくつかの便利な小さなものを使用します。
最初のささいなこと。 モニタリング
観察またはその不在だけでは、データのアーカイブコピーの作成またはこのコピーからの情報の復元に失敗することはありません。 ただし、これらのプロセスを監視して、問題が発生しないようにする必要があります。 まだ何か問題が発生した場合は、すぐに修正できます。 問題は、場合によってはデータが一度に複数のサーバーにバックアップされることです。 最新の監視システムを除くほとんどの監視システムは、一度に多数のサーバーを監視するようには設計されていません。
ソリューションは、データを収集し、ユーザー向けに視覚化する自動監視システムである場合があります。 このようなシステムでは、個人やクライアントを含む会社のすべてのサーバーを提示する必要があります。 理想的には、このようなシステムは、さまざまな規格に従って、さまざまなメーカーのサービスと機器を使用したバックアップの作成をサポートする必要があります。
自動照合システムの動作を調整する価値があります。 これを行うには、完全なコピーと元のコピーを常に比較できるとは限らないため、チェックサムのみを比較できます。
二番目のささいなこと。 不在通知
通常、通知は管理者に電子メールで送信されます。 これは比較的信頼できる通信チャネルですが、時々問題が発生します。 事実は、周囲のすべてが急速に変化しているということです。 サーバー構成、アプリケーション、バックアップデバイス、および従業員—すべてが更新され、消え、再表示されます。 一般に、これらすべての理由は、通知が適切な人に届かないという事実につながり、問題が始まります。
この場合、完璧な解決策はリアルタイム通知モードです。 複数のチャネルを介して通知を配信するプロセスを確立する必要があります。 さらに、1人が特に優先度の高いメッセージを受け取るべきではありません。 いくつかのケースでは、少数の人々ができるようにそれを作る方が良いです。
現代世界の通信チャネルは異なる場合があります。 これらは、電子メール、SNMP、SMSSなどです。 これにより、メッセージを受信し、それらにすばやく応答できます。 会社にリアルタイム通知システムを実装することをお勧めします。 この場合、すべてを一度に見ることができ、事故や失敗から数分、数時間、数日後にメッセージを受信することはありません。
些細なこと3.コマンドラインは常に役立つとは限らない
はい、多くの管理者は他の何よりもコンソールを好みます。 しかし、コマンドラインが原因で管理者が入力を間違えると、データセンターに大きな問題が発生します。
何ができますか? 何よりも、このケースはGUIでも機能します。 あなたは額の7つのスパンの管理者になり、小さな間違いを犯すことができます。それは大きな問題につながります。 また、GUIインターフェースを備えたシステムを運用する場合、ほとんどの場合、ヒューマンエラー要因は除外されます。
Trifle 4.報告と計画
報告を好む人はほとんどいませんが、計画に惹かれる人はさらに少なくなります。 システム管理者も例外ではありません。 その結果、作業効率が低下します。 また、これは問題のほんの一部です。 もう1つあります-これは、他の部門からのレポートの分析です。 多くの場合、管理者はそのようなレポートに十分な注意を払っていません。
ソリューションとして、バックアップ上のデータを複数のインフラストラクチャオブジェクトに一度に配布することをお勧めします。 これは、理想的には、データセンターの品質に悪影響を与えるべきではありませんが、多くのソースからデータを収集し、それらを任意の方法でコンパイルするのに役立ちます。 冗長性は常にあるべきです。 アーカイブの結果は、1つではなく複数のサーバーがプロセスで使用される場合、より信頼性が高くなります。 また、データのコピーをさまざまなサーバーに保存することをお勧めします。 いずれかのサーバーに物理的な脅威がある場合、データは別の場所から復元できます。
間違ったセットアップ
専門家は通常IT部門で働いているという事実にもかかわらず、多くの場合ここで間違いが発生します。 その理由のいくつかを次に示します。
- 誤ったログサイズ。 これにより、情報が失われる可能性があります。 通常の場合、問題を回避するために空き領域が必要です。
- ディスクからテープへの書き込みの問題。 場合によっては、機器が誤動作します。 テープへの書き込み速度は、ディスクデータの読み取りと一致する必要があります。 速度が一致しない場合、バックアップはまったく書き込まれない場合があります。
- 同時バックアップセッションの数を超えています。 アーカイブデータの書き込み(または読み取り)のプロセス数を超えるのは非常に簡単です。 バックアップ記録時間またはその回復をスキップすることもできます。
- バックアップのための技術スタックの問題。 本当に問題がある場合は、アーカイブされたデータのすべてのコピーが破損している可能性があります。 Googleにも同様の問題があります。
このようなエラーの種類に関係なく、バックアップを含むデータセンターのすべてのコーナーを同時に監視する展開された自動監視システムを使用することをお勧めします。 さらに、それら自体は役に立たないことを覚えておく価値があります。バックアップを処理する過程で復元される情報のみが価値があります。 データのバックアップは、データ回復プロセスで行う必要があるのと同じように、シンプルで簡単にする必要があります。 もう1つの重要なポイントは、プロセスの自動化です。
システム管理者は、どのような場合でも、どのデータセンターでも障害が発生することを理解する必要があります。 障害発生時にバックアップITインフラストラクチャが機能することを確認するために、すべてを行う必要があります。 前述のように、このために、明確なアルゴリズムに従って機能する自動化ソリューションを使用できます。 この場合、チームのメンバーは自分が何をすべきか、どのような場合に学ぶ必要があります。 何か悪いことが起こります。専門家の仕事は、最小限の時間でこの何かの結果を排除することです。
すべてが正しく行われていれば、自動モードで問題なくデータのアーカイブコピーが作成されます。 まあ、データの回復も簡単です。 主なものは、保存されたアーカイブコピーからのデータのバックアップと読み取りの合理化されたプロセスです。