
ITインフラストラクチャの要素がどれほど効率的に機能するか知っていますか? それらは互いにどのように影響しますか? 何らかの要素がシステム全体を悪化させているのかもしれません。 この要素が何であるかを理解するには?
この記事では、個々の要素とITシステム全体のパフォーマンスを分析および監視し、サービス間の依存関係を判断し、パフォーマンスインジケーターがしきい値レベルを下回ったまたは上回ったときに警告するのに役立つソリューションについて説明します。
Splunk IT Service Intelligence(ITSI)についてです。 これは、ITインフラストラクチャの運用を監視および分析するためのツールであり、前に説明した運用分析プラットフォームSplunkで動作します。

このプラットフォームを使用すると、さまざまなデバイス、システム、およびアプリケーションからデータを収集、監視できます。 ITSI運用プロセスは、システム要素、主要なKPIのパフォーマンスインジケーターの可視性、および重要なITおよびビジネスサービスと関連するサポートサービスの動作を保証します。
1つのツールを使用して、イベント、メトリック、雑誌の分析など、IT分野の多くの問題を解決することができます。これにより、ITインフラストラクチャの要素の運用における最も重要な問題を特定および修正できます。
Splunk IT Service Intelligenceの主要な要素と、それらが必要な理由を見てみましょう。
サービスアナライザー
誰もが最も重要な情報をできるだけ早く簡単に取得したいことは明らかです。 これがまさにITSIスタートページ-Service Analyzerの目的です。 アプリケーションに入ると、一目でITシステム全体の全体的なレベルを評価できます。


Service Analyzerには、タイルビューとツリー構造の2つのビューがあります。これにより、一部のサービスが他のサービスにどのように影響するかを確認できます。
パフォーマンスインジケーターとそれに関連付けられたメインKPIは、色インジケーターを持ち、現在の状態レベルで並べ替えられ、タイルの形式で表示されます。
ツリービューには、すべてのサービスがグラフ形式で表示され、ノードにはノードの健全性のレベルが表示されます。 各ノードを開いて、関連するパフォーマンスインジケーターを確認できます。
以下の例では、Buttercupストアサービスは、Webストア販売、モバイルアプリケーション販売、Webストアサービス、モバイルアプリケーションサービス、およびサポートサービスに依存しています。 モバイルアプリケーションサービスは、ミドルウェアサービスとデータベースに依存する外部認証サービスに依存します。

ガラステーブル
すべてのユーザーが快適で理解しやすいわけではなく、有用な情報を取得するには、システム全体の構造を理解するだけで十分です。 Glass Tablesは、ほとんどすべてのユーザーが理解できる視覚的で便利な視覚化です。 「テーブル」を使用すると、作業スキームまたはビジネスプロセスのインターフェイスでサービスのステータスとパフォーマンスインジケータの値を確認できます。 便宜上、さまざまなウィジェットとアイコンを使用してKPIパフォーマンスインジケーターを表示できます。


注目すべきイベントレビュー
サービスがどのように機能するかを学んだ後、なぜそのように機能するのか、どのようなイベントが彼らの仕事に影響を与え、何らかの形でそれらに影響を与えるのかを知りたい。 このための注目すべきイベントレビューパネルがあります。
「注目すべきイベント」ダッシュボードは、現在サービスに影響を及ぼしている、またはサービスに影響を与える可能性のある問題に関する警告を表示するために使用されます。 パネルには、マルチKPIアラート、相関検索、および異常検出アルゴリズムによって生成された顕著な警告イベントが表示されます。
「注目すべきイベント」とは、次のことを意味する場合があります。
- 所定のしきい値を超えた場合のKPIの1つ。
- 複数のKPIアラートの結果。複数のKPIのステータスに基づいて警告を生成します。
- データポイント間の関係を検索する相関検索の結果。

プレゼンテーションを簡単にするために、すべてのイベントは、類似のイベントを決定する機械学習アルゴリズムを使用してグループ化されます。 情報パネルには、グループ内のイベントの数、グループ内のイベントの時間範囲、所有者、重大度、ステータス、説明など、イベントの各グループに関する情報が表示されます。 グループをクリックすると、グループ内のイベントに関する詳細情報を取得できます。
イベントの管理、イベントの実装のための特定のアクションとスクリプトの設定、たとえば、電子メールや外部システムへの通知の送信が可能です。
ディープダイブ
もちろん、現時点ではシステムの状態だけを見ると、氷山の一角しか見えません。 したがって、長期間にわたって状態を監視できると非常に便利です。 パフォーマンスの低下はどれくらい続きますか? 今はすべて順調ですが、1、2、1日前に問題がありましたか? なんで?
Deep Divesセクションでは、KPIインジケーターの履歴が追加されます。つまり、現在だけでなく数時間前にシステムのステータスを確認し、システムのさまざまな要素の結果を同時に比較したり、1つのサービスの結果を1日の結果と比較したりできます。 1週間または1か月前。

マルチKPIアラート
多くの場合、要因の組み合わせのみが問題を通知できるため、複数のKPIに基づいて、またはインジケーターが特定の値に到達した時間に応じて警告をトリガーできる必要があります。
[マルチKPIアラート]セクションでは、全体的な問題に対する各要因の影響の重みを考慮できる複合パフォーマンスインジケータを作成できます。

おわりに
上記の要約:
- サービスとKPIは、現在正常に機能しているサービスと逸脱しているサービスを示します。
- ガラステーブルを使用すると、特定のグループごとにインジケーターをグループ化し、視覚化できます。
- ディープダイブを使用すると、インジケーターのステータスを経時的に比較し、どのソースからこのまたはその問題が始まったかを判断できます。
- Multu-KPIアラートと重要なイベントは、特定の重要なイベントを識別し、それらを管理できるようにします。
上記の例では、システムの機能全体を100%網羅していませんが、一般的に、幅広いITランドスケープを持つ企業は主要な問題を解決できます。 ITSIは、ITインフラストラクチャを制御したい人にとって単に必要であると断言できます。
このトピックに関するすべての質問とコメントに回答させていただきます。 また、この分野、または一般的なマシンデータ分析の分野に特に興味がある場合は、特定のタスクのために既存のソリューションを完成させる準備ができています。 これを行うには、コメントにそれについて書くか、単に当社のウェブサイトのフォームからリクエストを送信してください。