7月1日のサーバーの問題

Evernoteは、7月1日から4日の間に、当社のサーバーの1台で一連のハードウェア障害を乗り切りました。 これらの問題は、世界中の6,323人のユーザーに影響を及ぼす可能性があります。 このクラッシュの結果、7月1日から4日の間にこれらのユーザーが作成または編集したメモの一部がEvernoteサーバーに正しく記録されませんでした。 影響を受けたすべてのユーザーにメールですぐに連絡し、サポートチームがデータ復旧手順を案内しました。 メモを復元する際に支援が必要な場合に備えて、テクニカルサポートへの優先アクセスを提供するために、影響を受ける可能性のあるすべてのユーザーにプレミアムサブスクリプションをすぐに提供しました(または、既にプレミアムユーザーであったユーザーに対して1年間延長しました)不便さの部分的な補償。



7月の初めにそのような手紙を受け取っていない場合、問題はあなたに影響を与えていません。





Evernote固有のデータストレージの冗長性(メモのコピーはハードドライブ、メールおよびブラウザの履歴に保存されていた)のおかげで、影響を受けたほとんどのユーザーはすべてのメモを復元できました。



これは1回限りの問題であることを保証したいと思います。 このようなインシデントの再発を防ぐために、アラートシステムとインフラストラクチャの冗長性を大幅に改善しました。 影響を受けたユーザーに心からおizeび申し上げます。 それらのほとんどがデータを失わなかったとしても、彼らは問題についての情報を含む長く恐らくエキサイティングな手紙を読むことを余儀なくされました。 また、データを失った人が、最も重要なメモを復元または再作成するために4日間作業していたメモに関する十分な情報を受け取ることを願っています。



影響を受けた数百人のユーザーから回答を受け取りました。彼らの理解と継続的なサポートに非常に感謝しています。 インターネット上のいくつかの場所で配布されている誤った情報のため、私たちは今これについて書いています。



以下は何が起こったかの技術的な詳細です。



各ユーザーのデータは「クラスター」(シャード)に保存されます。 クラスターは、フォールトトレランスを確保するために、稼働中のサーバーと予備のサーバーの2つのサーバーの組み合わせから形成されます。 サーバーに問題がある場合、システムはクラスター内の2番目のサーバーを自動的に起動します。 現在、37個のクラスターがあります。 先月クラスター番号22に問題がありました。 各サーバーのデータは、RAIDアレイに保存されます(完全な冗長性を備えています)。 また、データセンターと他の場所の両方のすべてのデータをバックアップします。 メモの完全なコピーは、WindowsとMacのソフトウェアクライアント(およびこの機能を有効にしたプレミアムユーザー向けのiPhoneとiPadのプログラム)にも保存されます。 つまり、Evernoteのメモは、少なくとも6つの場所に保存されます。プライマリサーバーのディスク、RAIDミラー、予備のクラスターサーバーとそのRAIDレプリカ、およびデータセンターとバックアップストレージのバックアップです。 ほとんどのユーザーは、ローカルクライアントにも1つまたは2つのコピーを持っています。 これにより、Evernoteでのデータ損失が非常にまれになります。



クラスタ22でのインシデントは、ハードウェアの問題とメインサーバーおよびスペアメカニズムとの即時の組み合わせが非常に低いために発生しました。 要するに、クラスターはしばらくの間2つのサーバー間を行き来し、そのときに作成されたレコードが上書きされるという事実につながりました。 障害の前に作成されたすべてのデータは、バックアップから簡単に復元できました。 このような一連の障害が再発する可能性は非常に小さいですが、念のために、フォールトトレランスメカニズムを変更して、最悪のシナリオでもデータが失われないようにしました。



All Articles