怒っている猿が稼働時間を押し上げる





Netflixサービスシステム管理者は、サービスアーキテクチャを改善し、エンドユーザーに対する技術的な問題の影響を軽減する興味深いソリューションを見つけました。



同社は、「Chaos Monkey」(Monkey of Chaos(Houseと混同しないでください!))と呼ばれる内部サービスを作成して開始しました。これは、サービスを提供するサーバー上のAWSインスタンスまたはプロセスをランダムに強制終了します。 奇妙なことに、このアプローチは害を与えませんが、技術者が数匹のサルのウサギを殺すことでサービスの質を改善し、稼働時間を増やすのに役立ちます-Netflixシステムは24時間の検証を受けます:







この(逆説的ではないにしても)元のアプローチは、会社の莫大なお金と時間を節約しました。 そして、habragursはこれについてどう思いますか?



All Articles