クラウドプロバイダーの障害に対処する方法

複雑な状況と危機的な状況にある人々の行動は、さらなる協力について決定を下すために必要なすべてを理解できるリトマス試験です。



私たちは長年にわたって仮想インフラストラクチャをリースしてきましたが、IaaSプロバイダーの信頼性のトピックをめぐって生じてきたすべての恐れや神話をよく認識しています。 それらのいくつかに対処してみましょう。



/写真ボブキャットロック CC



ロシアのコミュニティでは、特定の西洋企業が危機的な状況を解決するためにどのように働いたかについて、注目を集めるストーリーが常に議論されています。 そのような話は十分に頻繁に発生し、結論を導き、他人の間違いから学ぶ余地を与えてくれます。



それが通常どのように見えるか



ITインフラストラクチャプロバイダー側​​の障害は、さまざまな理由で発生する可能性があります。 たとえば、技術要素の1つのファームウェア更新中にポイントエラーが発生した場合でも同様です。 そのような些細なことでも大きなトラブルにつながる可能性があります。問題に対するメディアの注目は、潜在的な顧客に状況をコントロールできないことを明らかにする複数の乗数です。



一方、エラーは後から優れた作業によって修正できます。 私たちは皆、大企業でのクラッシュを伴う数百のニュース記事を知っています。 しかし、誰が本当に特定の失敗の原因を覚えているのでしょうか? この状況から会社が生まれる方法は、多くの失敗よりもはるかに明るく記憶されています。



クラウドプロバイダーは、多くの場合、顧客側の業務の本質に対する誤解に直面します。 プロバイダーのエラーに苦しんだ人々の迷惑は理にかなっていますが、状況の適切な評価(プロバイダーの選択時を含む)には、基本的な知識が不足している場合があります。



たとえば、IaaSプロバイダーをUDPプロバイダーとTCPプロバイダーに最も単純に分割します。 1つ目-より高いスケーラビリティを提供しますが、信頼性にあまり注意を払いません。 2番目は反対です。 もちろん、私たちは非常に簡単な言葉で話しますが、実際には一般の人から隠された知識はありません。



TCPプロバイダーは、市場で入手可能なハードウェアおよびエンタープライズ製品を使用することのほぼ完全な類似物です。 UDPは信頼性が低くなりますが、問題はすべての人に起こります。



問題がある



上で言ったように、誰もがクラッシュします。 ソフトウェアの更新、ハードウェアの問題、または管理エラーのレベル。 もっと奇妙な状況があります。 たとえば、冷却および保護メカニズムの自動トリガーの問題。



大規模なIaaSプロバイダーの問題を大々的に取り上げたため、実際の状況が少し曖昧になりました。つまり、障害はITインフラストラクチャを使用する普通の企業の側にもあるということです。 このような情報の親密さのために、非常にまれにこれについて書いて話すことは注目に値します。



したがって、プロバイダーと独自のインフラストラクチャの間の実際の分布を評価することは非常に困難です。 プロバイダーは、最も困難な緊急事態を解決するための専門知識を持っているとしか言えません。 この分野に直接関係のないビジネス(たとえば、デジタルエージェンシー)は、常にそのような知識と専門の専門家がいることを自慢できるわけではありません。



おわりに



ITインフラストラクチャを選択して作業する場合、またはIaaSプロバイダーで仮想容量をリースする場合、サービスプロバイダーが提供する保証に注意する必要があります。 潜在的なリスクを認識し、最悪の事態に備えることが重要です。 このアプローチにより、障害の可能性を理解し、障害の発生に備えることができます。



All Articles