ビデオ:Uptime Day、モニタリング会議、24時間年中無休のサポート





4月、モスクワはuptime.communityコミュニティの最初の会議であるUptime Dayを開催しました。これは、24時間体制で複雑なプロジェクトを監視、サポート、管理する人々のコミュニティです。 ITSummaはイデオロギーのインスピレーターであり、このコミュニティの主催者の1人です。 会議では、Booking、Badoo、Parallels、ITSumma、Bitrix24の専門家が、監視とサポートの仕組みについて話しました。



スライド、要約、スピーチからのビデオをアップロードし、コミュニティ自体について少し説明します。



ロシアで開催されている無数のカンファレンスを見ると、開発者(バックエンド/フロントエンド)、管理者/開発者向けのイベントが膨大な数にあるという事実に突然注意を向けることができますが、他の人々がプロジェクトの監視にどのように関与しているかを突然知りたい場合は、 24時間年中無休の義務、どのように、誰が事故に正確に対応するか-知識は非常に離婚します。



熊手に足を踏み入れる気はまったくありません。 私たちは、自分のプロジェクトが決して失敗しないことを保証する(そして、もし失敗したらすぐに上昇する)人々が監視とサポートの仕組みに関する知識を交換し、より良い方法を理解できるようなコミュニティを作成することを決定しました自分自身、お互いに質問する-多分、誰かがすでに理解している問題があり、誰かがすでに、そして最も重要なことを決定している-お互いを知るために。



全員をまとめるために、uptime.communityコミュニティミーティング(これをまさに私たちがそれと呼ぶことにした)を手配しました。これは4月7日にデジタル10月に開催されました。 以下はスピーチそのものです。最後に、コミュニティに参加する方法を説明します。



車輪の発明:モニタリングの書き方



Evgeny Potapov、ITSummaのCEO



論文:



すべてのWeb開発者は、独自のフレームワークを作成したいと考えていました。 各管理者は、独自の監視を記述したいと考えていました。 独自の監視システムの開発の6年の歴史、その作成理由、データストレージの提供方法、フォールトトレランスとスケーリング。 埋めたバンプ。 システムが標準システムとどのように異なるか。



ビデオ:





スライド




ストリーミング監視



スタニスラフ・オシポフ



論文:



-広告プラットフォーム。 広告のR'n'DおよびOps機能。

-Zabbixを知覚に役立つツールに変えることができる3頭のクジラ。

-プレート、パッチ、レポート-Opsマネージャーを軌道に戻す。

-それは人々のようではありません。システムの幸福をストリーミングします。

-チャネル(SMS、Tg、Sl、Ml)、ストリーム/グループ。

-そして今、すべて一緒に:Zabbix、New Relic、Jenkinsなど。



ビデオ:





スライド




通常、監視を最初から実装する方法



Nikolay Sivko、Okmeterの共同設立者



論文:



多くのOkmeterクライアントは、監視から何が正確に必要なのかわかりません。 そのようなクライアントと通信する過程で、設備エラーからビジネス指標までのモニタリングでプロジェクトをカバーするための多かれ少なかれ一般的なアルゴリズムを形成しました。 正しいメトリック、アラートの正しい動作など。



ビデオ:





スライド




テストしていないときの監視



Ivan Kruglov、シニア開発者Booking.com



多くの人が知っているように、予約の展開では多くの場合、テストなしで行われます-エラーの価格は変更率の価格よりも安いです。 Ivanは、このような状況でエラーをすばやく検出し、何が起きているのかを監視し、変更を管理する方法について話しました。



ビデオ:





スライド
https://www.slideshare.net/slideshow/embed_code/key/crYlLI4fthc0YK "



効果的なテクニカルサポート24×7:使用説明書



Julia Sinyanskaya、Parallelsテクニカルサポートチームリーダー



論文:



Parallelsが企業クライアントのサポートをどのように構築し、既成の成果を達成したが、同時にリソースが限られていたか。 従業員の検索と雇用、適応とトレーニングプロセス、シフトスケジュール、パフォーマンス評価。



ビデオ:





スライド




Badooでの監視の構成方法



Badooの監視責任者、Ilya Ableev



論文:



燃えている椅子、燃えている家の燃えているテーブルを想像してください。 このようなことは、監視部門やIT企業の常勤管理者の典型的な一日のように見えます。 Badooは、燃焼温度に対処し、経験を共有する方法を学びました。



1. Badooとは:アーキテクチャおよび運用部門の機能。

2.なぜ独立した監視部門が必要なのか、それは何をするのか。

3.部門の仕組み:人数/シフト。 燃え尽きないように、自由時間に人々がすること。

4.ツール:問題の分析に使用されるもの、イベントの流れで迷子にならず、重要なインシデントを見逃さないための方法。



ビデオ:





スライド




ほとんど管理者なしでクラウドに住む方法:3人による数百台の仮想マシンの監視と操作



Bitrix24クラウドサービスディレクター、アレクサンダーデミドフ



論文:



1. Bitrix24と他の1C-Bitrixサービスがクラウドに存在する理由、インフラストラクチャ全体を管理する方法、3人で何百もの仮想マシンとサービスを管理する方法。 開発者やQAとのコミュニケーション方法、展開方法、そして実際の私たちの生活と開発方法。

2.監視が私たちのすべてです! 分散リアルタイム監視システム(nagiosでしたが、シンケンになりました)、分析、自動化、インシデントの処理。

3.ボーナス-Bitrix24のリリースから5年で踏んだ最も深刻なレーキと、それらを回避する方法を学びました。



ビデオ:





スライド




次のイベントは初秋に予定されていますが、今のところ- コミュニティに参加して-メールを残して、プロファイルを送信します(スパムは送信しません、私は誓います)。



All Articles