マネージャーのための機械学習:分離の秘跡

はじめに



繰り返しになりますが、機械学習(ML)に関連するプロジェクトを行っている会社と協力して、マネージャーが本質を理解せずにMLの分野の用語を使用していることに気付きました。 単語は文法的に正しく発音され、文章の適切な場所で発音されますが、その意味はsepulesの指定よりも明確ではありません。 同時に、チームリーダーと単純な開発者は、管理者と同じ言語を話すため、プロジェクトの作業を複雑にする競合状況につながります。 したがって、この記事は、開発者の経営陣とのコミュニケーションの促進技術(ラテン語から:簡素化または促進)、またはMLの基本用語を簡単かつ明確に説明し、それによってプロジェクトを成功に導く方法に専念します。 このトピックがあなたに近い場合、猫にようこそ。





メモへのエステティック:Sepulki、sepulcarius、sepulationは、Iyon the Pacificの14回目の旅で独創的なStanislav Lemが使用する用語です。

プロジェクト開始



MLプロジェクトは、検証メトリックの正当化から開始する必要があります。 怖いですね。 説明を始めましょう。 正当化(ラテン語からロシア語では合法化)は単に当事者の合意に達し、書面で修正され、承認されます-もちろん書面でも望ましいです。 締約国は、ドナーおよびプロジェクト管理者であり、その執行者でもあります。







それではvalidationに進みましょう。 MLプログラマーは通常、検証コードを記述した経験があり、トレース時に返されたtrueとfalseを確認します。 しかし、コードを扱っていないマネージャーにこの概念をどのように説明するのでしょうか? この単純な生活の例を使用しましょう。







市場を通過していると想像してみてください。桃が売られています。 売り手はあなたに言う:「ベリー! 「Haroshiy peersik、フレッシュ、ジューシー、ne neozheesh。」 ただし、よく見るとわかります。1つの場所で彼は甘やかされています。 あなたは言う:「まあ、彼はどこがいいの? これは腐っています。」 売り手は半額を提供しています。 「甘やかされて育ったものを切り取ることができます。たった4分の1で、利益があるようです」-それを購入すると、ML言語で検証が行われ、桃(スラングML-サンプル)が有効と認識されます。 甘やかされて育ったのではなく、別の場所で最高のものを見つけることができると考えると、障害が発生し、モモは無効であると認識されます。







検証には難しいことは何もなく、私たち全員が毎日検証を行い、あるものを自分にふさわしいものとして認識し、無効にして、他の何かを悪いもの、不適切なものとして認識しています。







エステテへの注意:突然、Jourdainは彼の生涯が散文で表現されたことを知って驚いた。 モリエール、貴族の町人。

最後に、 検証メトリックとは何かを説明するだけです 。 前の例から桃を買うことにした理由を考えてみましょう。









上記のすべては、この例の4つのカテゴリで構成される検証メトリックの例です。 最も単純なケースでは、桃が一度にすべての基準を満たした場合、それは有効であると認識され、購入されます。







これで、最初から同意することが非常に重要である理由、検証がどのように正確に行われるか、すべての関係者が満足するパラメーターの数としきい値について明らかになります。 条件に部分的に準拠している場合のアクションの説明は、特別なセクションを占める場合があります。







当然、各MLプロジェクトは、サブジェクト領域に応じて、独自の検証メトリックを持ちます。 検証のメトリックを修正するドキュメントは、州の憲法と同様にMLプロジェクトにとって重要です。







検証メトリックを規制するプロジェクトにドキュメントが最終的に登場し、すべてのプロジェクト参加者が利用できるようになった後にのみ、コードを作成しても意味があります。 検証コードはプロジェクトの中心であり、その品質は完璧でなければなりません。この部分に高い確率で誤りがあると、MLプロジェクト全体が崩壊する可能性があります。







精度計算の謎



管理プロジェクトの現状の最も重要な指標は正確さです。 それが何であるか、それを計算するために実行する必要があるアクションをマネージャーにどのように単純に説明できますか?







最初に、検証済みサンプルとは何かを説明する必要があります。 この例では、これは桃1個ではなく1トンを購入したときです。 私たちは座ったり、労働者を雇ったりして、桃を2つの容器に分けます。 コンテナの銘文:X(良い)とP(悪い)。 モモの選別によって行われる作業は、検証済みサンプルの作成です。







検証済みのサンプルが必要な理由を説明するにはどうすればよいですか? 妹がいて、桃の選び方を教えたいとします。 あなたはそれを市場に持って行き、「学び、私がどうするか見てください」と言う。 彼女がすでに学んでいるように思われるとき、あなたは彼女のスキルをテストしたいです。 どうやってやるの? コントロールサンプル、つまり たとえば、各コンテナから既に選別されている100個の桃をコンテナから取り出し、秘密のステッカーを静かに貼り付けて、自分から取ったコンテナを確認しますが、これは妹にはわからないため、新しい空のコンテナに個別に置くことをお勧めします。 姉妹の選挙で秘密のステッカーと一致する割合は、正確さの尺度です。 言い換えれば、正確さは、あなたのために選んだ桃でどれだけの姉妹が信頼できるかという客観的な価値です。 100%は、彼女があなたの注がれたコピーであり、あなたがするのとまったく同じことをすることを意味します。 0%-彼女の意見はあなたの意見とまったく反対です。







エステへの注意:はい、あなたは正しいです、時間の経過とともに、モモは劣化し始める可能性があり、その有効性は時々見直される必要があることを考慮する必要があります。 また、これは、たとえば「関連性」などの特性を持つコンピューターデータでも発生します。

次に、混乱する可能性のある4つのMLパフォーマンスインジケータを見てみましょう。 これらは、真陽性(TP)、偽陽性(FP)、真陰性(TN)、および偽陰性(FN)です。 単語の前半は、姉妹の意見と秘密の桃のステッカーとの一致(true)または不一致(false)を意味します。 後半は、単にあなたの妹が桃を投げた容器を意味します(X良い-ポジティブ、P悪い-ネガ)。 そして、2つの単語を合わせると、そのカテゴリの桃の数になります。







精度に加えて、3つの補助インジケータも使用されます。これらは、精度(精度)、リコール(感度)、およびf1_scoreです。







精度は、コンテナXに投入された桃についてのあなたの意見との一致率(%)を示します。 100%は、あなたが適すると認識したすべての桃があなたの妹によってそのように認識されることを意味します。 値が低いということは、不適合と認識されたものもコンテナXに入ったことを意味します。 指標は、不適切なモモが適切なモモに落ちないことがビジネスにとって重要であるが、適切なモモが誤って不適切であることが判明した場合、心配する必要がない場合に重要です。







リコールは、正しく選択された良いモモ(TP)と、この値と誤って不適切と見なされるモモとの合計(TP + FN)の比率を示しています。 100%は、妹が悪い桃の入ったバスケットに良い桃を決して投げないことを意味し、Precisionの反対です。 この指標は、企業が適切な桃を使用できない容器にできる限り落下させないことが必要な場合に重要です。







F1スコアは、精度とリコールの利点を組み合わせた合成スコアです。 その重要性はバランスの取れた学習を示しており、良いモモは悪い人と一緒にバスケットに落ちないので、悪い人は良い人に急ぐことはありません。





エステへの注意:このインジケータは、精度と再現率の間の調和平均であり、次の式で計算されます。



f1_score = 2*(recall*precision) / (recall + precision)
      
      





多くの場合、疑問が発生します。MLプロジェクトマネージャーは、これらのすべてのインジケーターを非常に深く理解し、理解する必要があるのはなぜですか。 回答:これはビジネスにとって重要です。 酪農場経営者として、あなたは乳量が何であるか、そしてそれらが考慮される式によって知る必要があります。農場経営者として、あなたは収量が何であり、どのように計算されるかを知る必要があります。 はい、マネージャーは牛の搾乳方法、子牛の扱い方、牛の扱い方を掘り下げることはできませんが、プロジェクトの主要なビジネス指標を理解することがビジネスの成功の鍵です。







まとめ



MLプロジェクトへの参加者である私たち全員が、良い必要な仕事をしています。 学生として、私たちのどれが夢を見なかったのですか?集合農場でジャガイモ、トマト、キャベツを整理して、人ではなくロボットがそれをするようにしました。 ストーリーを実現し、プロジェクトを成功させます。 この記事がMLプロジェクトの成功した開始に少し貢献することができれば嬉しいです。







この記事が役に立つと思われる場合は、コメントを書いてください。そして、適切で適切なMLプロジェクトの柱である、管理への加法性と一般化を説明する方法に関する2番目の記事を作成します。








All Articles