雲が落ちる

クラウドサービスに焦点を当てたデータセンター向けの新しい統合ソリューションである ETegro Therascaleの発表に備えて(近い将来詳細に説明します)、最大のクラウドサービスの発生などの瞬間に興味を持ちました。 情報の最終セットは非常に興味深いようでしたので、共有することにしました。 さらに、発見や秘密はありません。さらに、このリストは可能な限り完全であると主張していませんが、クラウドサービスについて考えるようになります。







ただし、最大規模の有名なHabralyudam Selectelからはほど遠いところから始めます。 9月24日の夕方、コミュニケーターの問題により、彼らは複雑な失敗を始め、11時間続いた。 詳細は説明しません。詳細は会社のブログに完全に記載されています。



最近では、Windows Azureのやや逸話的なケースが発生しました。 8月2日、このクラウドサービスは西ヨーロッパのユーザーが2時間半利用できませんでした。 失敗の原因は、安全弁の安全メカニズムでした。これは、ネットワーク構造の連鎖的な失敗を防止するために設計されたもので、容量が増加すると正しく機能しませんでした。



6月、Amazonは電力の問題と定期的な発電機の停止に苦しみました。 その結果、29日、サーバーの20分間のシャットダウンと、その後の1時間半のパフォーマンスの回復が行われました。 これは、US-East-1リージョンの1つのAZのインスタンスの7%に影響しました。 犠牲者の中には、NetflixやInstagramなどの有名な会社がありました。 障害の結果として、ELBでバグが見つかり、負荷が他のAZに転送される速度が大幅に低下したことに注意してください。



2月29日、Windows Azureは約7時間利用できませんでした。 この場合の問題は、セキュリティ証明書の操作でエラーを引き起こした日付でした(まったく同じように、「2Kの問題が再発する」)。



1月20日、悪名高いシリコンバレーにあるエクイニクスのデータセンターの問題により、Zohoサービスの500万人のユーザーの数時間の生活が台無しになりました。 データセンターには数秒しか電力がありませんでしたが、データベースの修正にかかる時間はそれほど長くありませんでした。



そして、それは今年だけです。 そして2011年から、あなたはすぐに多くを思い出すことができます。



たとえば、8月7日のアイルランドのデータセンターの10 kW発電機の問題は、最初は落雷によるもので、3時間にわたってMicrosoft Business Productivity Online SuiteとAmazon EC2を無効にし、Amazonに1日以上の復旧を要求しました。 そして、翌日以降に発生した問題は、ネットワークチャネルに問題があるため、すでにアメリカ地域で発生していました。



そして、US-East-1リージョンの同じAmazon EC2の以前の13時間の問題は、EBS(Elastic Block Storage)の問題です。 別のジョークは、2011年4月21日に起こったということでした-ある有名な映画でスカイネットが人類との戦争を宣言したまさにその日に。 もちろん、人工知能は何の関係もありませんでしたが、ノースバージニア州のインスタンスは3日後に復元されました。



しかし、アマゾンについて私たちは何ですか。 2011年9月、日差があり、最初の30分でGoogleドキュメントが利用できなくなり、その後、Skydrive、Hotmail、Office365など、ほとんどすべてのMicrosoftクラウドサービスがクラッシュしました。



gmailについて思い出す価値があります。2011年2月の最後の日にユーザーの0.02%がメールボックスが空であることを発見しました。 幸いなことに、損失はありませんでした。データは30時間以内に復元されました。 しかし、この事件は、ソフトウェアのエラーが同じデータの複数のコピーに影響を与えることさえあり、テープドライブへのバックアップはその動作特性によりこれさえも救うことができることをITの世界に再び思い起こさせました。



そして、これらはすべて完全なリストからはほど遠いものですが、最大のケースのみです。 障害統計を分析すると、ほとんどの場合、電源エラーまたはソフトウェアエラーの2つの理由で発生していることが簡単にわかります。 私たちが実際に扱っているハードウェアがこれらの「要約」に記載されておらず、すべてが深刻なデータ損失なしで行われたことはうれしいです。もちろん、ダウンタイムによる損失を推定できる人はほとんどいません。 ただし、独自の評価を行うことは意図的に控え、代わりに質問をしています。 そして、あなた、個人的にあなたとあなたの会社、あなたはどれだけクラウドサービスを信頼し、それらを使用する準備ができていますか、それをすでに使用していますか?



All Articles