このコンセプト-「オンザフライ」でのインシデントの診断-議論することを勧めます。
建築

その場でインシデントを診断するには、次のものが必要です。
- ユーザーによるインシデントの正式な説明(インシデントスナップショット)。 インシデントスナップショットは、赤いProLANボタンによって生成されることを前提としています。
- 監視システム。 ProLAN監視システムを使用することになっています。
- 情報アグリゲーター。 Information Aggregatorは、インシデントスナップショットを取得してデータベースに保存し、データベースの内容をリアルタイムで処理し、監視システム、診断知識ベース、およびサービスデスクと対話できる必要があります。
- 診断知識ベース。
- サービスデスク-システム。
診断知識ベース
診断知識ベースは、インシデントの根本原因に関する情報を含むデータベースです。
診断ナレッジベースの存在は、インシデントがその場で診断されるか通常どおりに診断されるかに関係なく、Service Deskの効率を大幅に向上させます。 何らかの形で多くの企業がすでにナレッジベースを持っているため、診断ナレッジベースは既存のものに追加することができます。 ほとんどの場合、既存の知識ベースを大幅に変更する必要はありません。
診断ナレッジベースと、テクニカルサポートサービスで一般的に使用されるナレッジベースの2つの主な(基本的な)違いを区別する必要があります。
- 診断を決定するための重要な要素は、「ユーザーの目を通して」のインシデントの説明です。 したがって、タスクNo. 1は、ITサービスのユーザーから見たインシデントの体系化です。
- 重要なパラメーターは、ITインフラストラクチャコンポーネントの品質評価です。 したがって、タスクNo. 2は、品質評価を取得するために必要なITインフラストラクチャのヘルスメトリックのしきい値の正しい決定です。
Red Buttonソリューションの実装など、両方のタスクを解決できます。
オンザフライのインシデント診断アルゴリズム
ステップ1
正式なインシデントの説明がユーザー側で作成されます(インシデントスナップショット)。 これは、手動で(適切に設計されたWebフォームを使用して)実行するか、赤いボタンを使用して自動的に実行できます。 もちろん、2番目の方法の方が優れています。なぜなら、より完全で正確なデータ(たとえば、インシデントの正確な時間)を取得できるからです。 短縮形のインシデントスナップショットの構成を図に示します(以下を参照)。

短縮されたインシデントのスナップショット構成
インシデントの写真は情報アグリゲーターによって撮影され、その内容はそこにある統合データベースに記録されます。
手順2〜3
Information Aggregatorは、特別なテスト(Expertise)を使用して、統合データベースの内容をリアルタイムで分析するエキスパートシステムを実行します。 新しいインシデントスナップショットの出現を発見した試験では、ITインフラストラクチャ品質評価のリクエストを作成し、監視システムに送信します。
リクエストパラメータ:
- WhereおよびIT Serviceパラメーターは、ITインフラストラクチャのどのコンポーネントを監視システムから取得する必要があるかについての品質評価を決定します(下図を参照)。 たとえば、サンクトペテルブルクのSAP CRMユーザーからインシデントスナップショットが取得された場合、次の情報を取得する必要があります:Peter-Moscow通信チャネル品質評価、SAP CRMアプリケーションサーバー品質評価、SAP CRMデータベース品質評価。
- Whenパラメーターは、ITインフラストラクチャコンポーネントの品質評価を取得する必要がある時点を決定します。

図3. ITインフラストラクチャの品質の評価。
ITインフラストラクチャコンポーネントの品質の評価は、ITインフラストラクチャの評価されたコンポーネントの作業を特徴付けるすべての重要なメトリックの推定値を組み合わせることにより得られる総合的な指標です。
メトリックの評価は、その値としきい値の比較です。
サービスリソースモデルをサポートする監視システムを使用する場合、ITインフラストラクチャ品質評価の取得は難しくありません。 サービスリソースモデルがサポートされていない場合、適切なディレクトリをInformation Aggregatorに追加することでタスクが解決されます。 いずれの場合でも、監視システムと情報集約器は互いに統合する必要があります。
ProLAN製品では、ITインフラストラクチャコンポーネントの品質評価には5つの意味があります。 良い、許容できる、注意が必要、間もなく、悪い 。
ステップ4-5
品質評価を受け取った試験では、診断知識ベースへのリクエストを作成します。 簡略化された形式では、診断ナレッジベースは以下に示す表の形式で表示できます。

重要な要素は、「インシデントスナップショットに含まれる」「What happened」ディレクトリの要素です。 推定診断を決定する重要なパラメーターとして、まずユーザーの環境パラメーター(インシデントスナップショットに含まれる)が使用され、次に監視システムから取得された品質評価が使用されます。
重要なパラメータのリストがより完全に決定され、その値の範囲がより正確に決定されるほど、単一の正しい診断を得る可能性が高くなります。
ステップ6
診断ナレッジベースから推定診断を受信すると、試験はインシデントの集約スナップショットの一部としてそれを含め、サービスデスクに自動的に送信されます。 (診断に加えて、インシデントの集約スナップショットの構造には、関連する重要なパラメーターの値と、その発生を開始したインシデントのスナップショットが含まれます。)
注目の質問
これがコンセプトです。 あなたの批判、提案、異議、可能性のあるアプリケーションの指摘などを聞きたいです。 -?