以前の出版物「ITシステムの古典的統合の代替としてのDataScience Tools」の継続、
「ビジネスタスクを自動化するためのツールとしてのエコシステムR」と、 ビジネスタスクを自動化するための紳士のパッケージセットR この出版物には2つの目的があります。
極端な人?
開発者を含むITサービスの代表者と、ITサービスの消費者であるビジネス従業員を含むITサービスの代表者が共通言語を見つけられないことがよくあるのは秘密ではありません。 これは、デジタルであるIT環境があらゆる種類の客観的な指標を提供するという事実を背景に発生するのは逆説的に思えるかもしれません。 しかし、よく見ると、これは非常に論理的になります。ITサービスの99%がビジネスによって割り当てられる「予算の消費者」だからです。 したがって、予算保有者は、いくつかの図やグラフではなく、彼の主観的な感情に従って満足を要求する権利を感じます。
したがって、「誰が責任を負うのか」という質問に対する答えは、全体として常に知られています。 もちろん、ITのせいです! しかし、これは行き止まりのオプションです。問題の原因が明確にされず、排除されないため、これらの問題が繰り返し発生することを意味します。
この問題を建設的な方向に変換するための最初のステップは、この質問を「どのITシステムが責任があるのか?」に変換することです。
IT側からの次のステップは素晴らしいアイデアです:すべてを監視し、すべてを測定し、長期間保存し、それを専門家/ニューラルネットワークまたは他の誰かにフィードして、失敗の理由を教えましょう。 多くのベンダーが来ており、都市の平均予算に匹敵する価格タグでスペースの仕様を作成しています。
当然のことながら、1年の活動の後、そのようなおもちゃのためのお金がなく、決してありません、そして再び誰もが何も残されないことがわかります。
可能な解決策
何かできることはありますか? 野心を抑えれば、頭をつけて袖をまくりましょう。そうすることができ、さらにはとても良いことです。 膠着状態から抜け出すことを可能にするステップのロジックは、およそ次のとおりです。
正直に言うと、ITには既に何らかのツールをいくつかのデータを収集して保存する多くの監視ツール(無料とベンダーの両方)があります。 まず、そこで停止する必要があります。 彼らは他に何も買わなかったので、まだまだ見つかっていないという明確な証拠はありません。
ビジネスユーザーは、すべてのITの根性についてまったく心配しておらず、このトピックについて話す必要さえありません。 彼らは2つのことを気にします:彼らが働くアプリケーションはアクセス可能であり、それが遅くならないことです。 より正確には、アプリケーション全体ではなく、ウィンドウとボタンの限られたセットのみです。 これは少数のKPI(実際にはKPIビジネス)であり、ビジネスと対話するためにそれをさらに制御および使用する必要があります。
100,500のメトリックと自動依存関係検索および根本原因検索の相互相関のアイデアは、SFストーリーに適しています。 実際には、これは機能しません。 第一に、複雑なITシステムでは、n + 1のメトリックが常に忘れられていますが、それが理由であることが判明しました。 第二に、その構造が「一般に」のみ知られていることが多い純粋に非線形のITシステムへの線形依存の考え方を引き出すのは奇妙です。 第三に、追加の外部知識がなければ、何が原因で何が結果であるかを判断することは不可能です( スプリアス相関を参照)。 依存関係検索アルゴリズムは非常に複雑であり、観測されたシステムのモデルを含む必要があります。 これは長く、高価で、理解できない結果になります。
- いずれの場合でも、ITシステムの問題は2つのクラスに分けられます。a)症状に近づく必要がある場合と、左上隅にある「手を打つ」b)不明。手作業で調査して対処する必要がある
したがって、メトリックの相関の概念を次のように変換して、実用的な実装を行うことができます。
既知の問題に対する既知のソリューションは自動化されており、これ以上検討されません。 何をすべきか、時には薬を一生飲む必要がある。
できれば既存の手段で、ビジネスユーザーに関係するビジネスメトリックの値を収集し始めます。 これらのメトリック(時系列)は、参照インジケータとして使用されます。
ヘッドをオンにして、鉄メトリックの数を、これらのビジネスアプリケーションが動作する鉄のみに制限します。
ニューラルネットワークについて話す代わりに、最初に「視覚相関」アプローチを使用します。 この場合、問題を引き起こす疑いのあるビジネス指標と技術指標の時系列は、比較のために便利な形式で表示されます。 ITスペシャリストに、分析用のメトリックセットを変更するための便利なツールを提供します。
分析は比較的まれであり、リアルタイムの反応を必要としないため、すべてのシステムからすべてのメトリックをアンロードする中間リポジトリを編成しません。 既存の監視、制御、診断システムからの要求に応じて、分析のためにデータを取得します。
- 最初の成功した手順の後、追加することができます。 を含む処理アルゴリズム 考えられる原因と診断を明確にする方法に関する蓄積された知識を考慮に入れる。
西側は私たちを救うでしょうか?
この場合、欧米のベンダーには「傘システム」という概念があります。 しかし、私たちのタスクに関連して、ITとビジネスで何が起こるか分からないため、冗長で高価です。 可能なすべてを収集し、それを1つのシステムに駆動することはオプションではなく、非常に高価です。 「傘」システムの製造業者の世界モデルのフレームワーク内の一連の異種システム「Marry」も機能しません。 これらの傘のモデルは単純すぎて、友人や元の問題と一致していません。 さらにいくつかの「待ち伏せ」があります。
「傘」のFlash \ Javaグラフィカルインターフェイス!
ロシア語の完全なサポートはありません!
高度なカスタマイズには、マウス+内部スクリプト言語を使用します。内部言語は、数十キロドル以上の価値がある神聖な知識です。
組み込みの数学は平均計算で終わります。 複雑なアルゴリズム? プロフェッショナルサービス、あなたは何のお金のスーツケースを準備していますか?
- 欠損データをどうするかについての答えを得ることができますか? 過去に受信したデータ? 非周期的な時系列? 時系列の変化する頻度? 忘れて!
この問題は解決できますか?
実践により、エコシステムRのフレームワーク内で、この問題は完全に解決可能であることが示されています。 出力で得られるもの:
- 光沢のある分析コンソール+ダッシュボード(HTML + JS + CSS)。 私たちは両方とも信号機をビジネスに見せることができるので、メトリクスのインタラクティブな分析を行い、R。コンソールに飛び込むことなく考えられる理由を見つけます。 特定の理由により、これまでのところスクリーンショットを公開できないため、例として、イデオロギー的に類似した図へのリンクを示します(写真R + Tableau、 ここから引用)
ggplot静的(データオーバーレイ、変換、グリッド、フォントなど)のあらゆる複雑なグラフィック出力+ htmlwidgetsダイナミクスの幅広い可能性。
アーティストの想像力の範囲内で、あらゆる複雑な数学的処理。 ニューラルネットワークと予測をプルアップすることが可能です。
あらゆる味と色の時系列での作業のサポート。
便利なデータ処理(hadleyverse)。
任意のプロトコルを使用する他のシステムからのデータの便利で簡単なインポート。 2つ以上の段階的なインポート手順のための複雑な中間前処理を含む、データインポートロジックのあらゆる複雑さが可能です。 外部システムの変更に伴う輸入の基本的な適応の可能性。
同様に簡単なエクスポート。
- R内に留まりながら、外部システムに自動的に変更を加えるための手順を開発する機能
おわりに
考えられる質問「なぜR?」に対するおおよその答えは次のとおりです。
実用化の結果によると、Rのエコシステムは「日常の」ビジネスタスクにうまく適用できると考えています。 したがって、Rは問題の記述で使用されました。
数学+ Webプログラミングなしの統合されたWebインターフェイス+簡単なインポート/エクスポートおよび統合メカニズム+データを操作する便利な方法と方法。
最終結果を取得する速度とシンプルさ。
- を含む他の言語で生態系の許容可能な類似物を見つけることができませんでした。 Pythonフレームワーク内。 十分に長く検索しました。 私が見逃していて、同様のものがあれば、コメントに書いてください。
PS Rを使用することで解決できる可能性のあるタスクを持つ同僚が、コメントでタスクを匿名で概説した場合、非常に興味深いでしょう。 広く議論されているビッグデータに基づく推奨システムとは異なり、Rのエコシステムで自動化されたさまざまなビジネスタスクの例は、すでに投稿で提供されています。 その後、特定の問題とアプローチを議論する機会があります。
前の投稿: 「ビジネスタスクを自動化するための紳士のパッケージセットR」
次の投稿: 「Rスピードを見逃していますか?隠れた埋蔵量を探しています」