プロセスマイニング:知人

こんにちは、Habrahabr!



この記事では、ビジネスプロセス管理の分野からの興味深い技術に幕を開けようとします( eng wiki BPM )。 プロセスインテリジェンスeng wiki プロセスマイニング )は、イベントログからのデータに基づいてビジネスプロセスの検出、分析、最適化に焦点を当て、モデルとデータマイニングを使用したビジネスプロセスの古典的な分析間のミッシングリンクを表します( eng wiki データマイニング )。



免責事項
この記事は、オンラインコースの資料に基づいています コースラ プロセスマイニング:データサイエンスインアクションアイントホーフェン工科大学が所有。 記事資料の使用は、コースの著者の許可があり、ソースを参照する場合にのみ可能です。






図1.位置決めプロセスマイニング。



次に、ポジショニングのトピックを開発し、ユースケースに触れ、ソースデータについて話し、さまざまなタイプのプロセスインテリジェンスを検討します。



ポジショニング



プロセスインテリジェンスは、データを使用してビジネスプロセスを分析し、データ自体の分析を無視します。 つまり、データマイニングとは異なり、プロセスマイニングはソースデータの低レベルパターンに関心がなく、それらに基づいて意思決定をしようとしませんが、ソースデータから生じるビジネスプロセス(特にエンドツーエンド)を最適化するタスクを設定します。



Process Miningが回答する質問は、2つのグループに分けることができます(図1の左右の矢印を参照)。



ユースケース



次の表は、プロセスインテリジェンスの使用の一部と、関連する問題を上記のグループごとに示しています。

いや ユースケース ご質問 質問グループ
1 実際のビジネスプロセスの発見 プロセスは実際に(言葉ではなく、理論ではなく)どのように見えますか? コヒーレンス
2 ビジネスプロセスのボトルネックを見つける 実行の全体的な速度を制限する場所は、プロセスのどこにありますか? そのような場所の出現の原因は何ですか? 性能
3 ビジネスプロセスの逸脱を特定する 実際のプロセスは、予想される(理想的な)プロセスからどこで外れますか? なぜそのような逸脱が起こるのですか? コヒーレンス
4 ビジネスプロセスを完了するための高速/短時間の方法を見つける プロセスを最速で完了する方法は? 最小限の手順でプロセスを完了する方法 性能
5 ビジネスプロセスの問題を予測する プロセス中に遅延/逸脱/リスク/ ...の発生を予測することは可能ですか? パフォーマンス/一貫性


ソースデータ



多くの場合、プロセスインテリジェンスの出発点はイベントログからのデータです。 私たちに合った雑誌を考えてみてください。 このようなログの各行は、個別のイベントに対応しています。 同様に、各イベントは、アクティビティのフレームワークで実行されたイベントに関する情報と、その登録の時間を伝達します。 このようなイベントログはケースのセットと見なされ、個々のケースはそれらを参照するイベントのシーケンスと見なされます。



上記の仮定に基づいて、ログのイベントの主な属性を強調します。





図2.イベントログ-患者の入院データ。



もちろん、上記の属性の選択は、分析の目的に依存します。 たとえば(図2を参照)、患者が適切な治療を受けるための手順を説明するプロセスに関心がある場合、患者を症例識別子( 患者列)として使用し、アクティビティを患者が受信する手順として( アクティビティ列)、これらの手順を実行する医師を指定するリソースを使用します(列ドクター )。 医師が手順を実行する手順を説明する別のプロセスに興味がある場合、イベントの識別子は医師自身( 医師の列)になり、アクティビティは医師が実行した手順によって実行され( アクティビティの列)、リソースが注目になり、医師も( 医師の列)になります。



プロセスマイニングの種類



プロセスインテリジェンスは、ビジネスプロセスモデルとイベントデータの関係に焦点を当てています。 このような関係には3つのタイプがあり、分析のタイプを決定します。



プレイアウト



既製のプロセスモデルから始めます。 次に、シミュレーション中に記録されたイベントに関するデータをイベントログに書き込むためのプロセスのさまざまなシナリオを(モデルに従って)シミュレートします。





図3.再生の例。



図3は、完成したワークフローモデル(英語のワークフロー)のシミュレーションの例を示しています。 簡略表記を使用したプロセスモデル eng wiki BPMN プロセス実行の可能な方法の1つのステップは赤で示され、以下のログには、このパスを通過する間に記録された順序でイベントに関するデータが書き込まれます。



プレイアウトは、開発されたプロセスモデルの実行から予想されるデータ(イベントのシーケンス)への準拠を確認するために使用されます。



で遊ぶ



イベントログの完成したデータから始めます。 次に、ジャーナルに表示される一連のイベントの実行を保証するプロセスモデルを取得します(データに基づいてプロセスモデルをトレーニングします)。





図4.プレイインの例。



図4は、既成のイベントシーケンス(赤で表示)からプロセスモデルを取得する例を示しています。 よく見ると、図のすべてのイベントシーケンスがステップaで始まり、ステップgまたはhで終わることがわかります。 結果のプロセスモデルは、観測された特徴に正確に対応し、データからの派生の基本原理を示します。



Play-Inは、既知のデータを生成するプロセスの正式な説明が必要な場合に役立ちます。



リプレイ



同時に、プロセスモデル(Play-Inを使用して取得される可能性がある)とイベントログのデータ(Play-Outを使用して取得される可能性がある)を使用して、モデルに従ってイベントの実際のシーケンスを再生します。





図5.再生の例。



図5は、既成のプロセスモデルに従って既存のイベントシーケンスを再現する試みの例を示しています。 モデルは、ステップeへの移行を開く前にステップdを渡す必要があるため、この試みは失敗しました(表記のゲートウェイを調べると、失敗の理由を理解するのに役立ちます) eng wiki BPMN )。



リプレイを使用すると、モデルの実際のプロセスからの偏差を見つけることができますが、プロセスのパフォーマンスを分析するためにも使用できます-プロセスのパスに沿って遅延の場所と速度セクションが表示されるので、再生時にイベントの登録時間を記録し始めます。



オプショナル



習得した知識を実際に応用しようとする人のために、私はあなたがあなたの大胆な仕事を実現できるツールについて報告することを急いでいます。 ProMは、プロセスインテリジェンスを実行するために必要なすべてを含む無料のフレームワークです。 ProMの安定バージョンは、Windowsおよびその他のOSでダウンロードできます。 一般情報(サンプルのソースデータ、ガイド、および演習を含む)は、ProM Tools Webサイトにあります。



おわりに



ビジネスプロセスモデルとデータの分析には既存のギャップがあるため、データの価値が石油の価値と長い間比較されてきた現代世界の多くの興味深く複雑なタスクの解決策を見つけることは困難です( データは新しい石油を参照)。 プロセスマイニングは、ビジネスプロセス分析を新しいレベルに引き上げることにより、このギャップを埋めることを目的としています。



ご清聴ありがとうございました。引き続きトピックを自分で勉強してください。 上記のオンラインコースは素晴らしいスタートとなります コースラ プロセスマイニング:データサイエンスの実践



All Articles