Beeline Data School、管理者向け





こんにちは、Megamind!



これまで、データスクールでアナリストを教え、機械学習法を使用して実際の問題を解決する方法を教えていました。 ただし、ほとんどすべての実用的なタスクは、ビジネスニーズとビジネス環境から始まります。



ビッグデータのawn明期には、分析の主な洞察と応用はデータからもたらされると信じられていたという話は今後しません。 これは確かに存在しますが、実際には、これは80対20の比率で発生し、アナリストのすべてのタスクの80%以上がビジネスから生まれています。



しかし、ビジネスがデータ分析を理解していない場合、ビジネスはこれらのタスクをどのように生成しますか? はい、非常に簡単です。 当社では、データ分析の機能をビジネスに説明するためにしばらく時間を費やしましたが、現在、さまざまな部門が注文を処理し、これらのツールの新しいアプリケーションを考案しています。



一方、データとその分析は、かつては非常に大企業の特権でしたが、今ではどこにでも浸透し、今日のスタートアップでも、このデータをどう処理するかをよく考えています。



データを使用してオファーをパーソナライズし、個々の製品を作成する方法、流出への対処または支払い以外のリスクの最小化方法、分析を使用して店舗の適切な場所を選択する方法、会社の従業員をセグメント化して動機付けスキームを選択またはレイオフを予測する方法、製品を効果的に推奨する方法、方法クライアントにプログラマティック広告の使用方法を紹介します。



これらの問題はすべて、ビジネスのさまざまな分野で他の分野と同様にますます提起されています。 たとえば、企業はテレマティックデバイスからのデータを処理するため、大量のデータを持っています。このデータをどう処理するか、どのように収益を上げるか。 または、データに基づいた会社を作り、すべての決定がデータに基づいて行われるようにする方法:どこから始めればよいでしょうか?



以前は、誰もがケースを追っていました。ビジネス上の問題を解決するための分析の使用の成功です。 しかし、実際には、各ビジネスは非常にユニークであり、一部のビジネスは他のビジネスには役立たない可能性がありますが、一方で、どのケースの成功も詳細にありますが、誰もあなたにこれらの詳細を教えません企業間だけでこれらの詳細は大きく異なります。



したがって、ビジネスで成功する分析のアプリケーションをすべて自分で発明する必要があります。 そして、これを成功させるためには、この非常に分析の可能性と制限について、そしてビジネス所有者として、そしてあなたの部門の従業員として、あなたがアプリケーションのほとんどがビジネスタスクにできるだけ近いそれらによって生成されるので、あなたが知る必要があります。



同時に、分析のアプリケーションだけでなく、この分析がどのように機能するか、問題のステートメントも理解することが重要です。 モデルの構築に必要な時間、必要なデータ、達成可能な精度、ビジネス感覚を考慮した場合に必要な精度。



この簡単な例を考えてみましょう。コールセンターへのコール、詐欺、またはその他のまれなイベントを予測します。 事前に顧客に連絡するための呼び出しの場合、およびそれを抑制するための詐欺の場合、このイベントの候補者のリストを1日に1回受け取る必要があるとします。



アナリストが、コールまたは不正の10%の誤検知分類格付けを持つモデルを作成したとします。 これは、10%の確率で、コールセンターに電話するつもりのないクライアントは収集されていると分類され、詐欺として詐欺を犯さなかったクライアントは分類されることを意味します。



同時に、コールセンターに電話したり、詐欺をしたりする人の正しい分類の確率は87%であると仮定します。



一見したところ、モデルは悪くありません。 87%のケースでコールセンターへのコール数や詐欺を減らすことで、多くのお金を節約できます。 同時に、誤って電話をかけたり詐欺をしたりしない人を10%のケースで分類します。



ただし、コールセンターへの1日あたりの呼び出しは、通常の状況では詐欺のように、クライアントベース全体に比べて比較的まれなイベントであることを思い出してください。 これらの行動が何らかの形ですべての顧客の1%に関係していると仮定します。これは真実にかなり近いものです。



一方、10%のエラーは、顧客ベース全体の99%に適用する必要があります。 100万人の顧客がいるとします。 その後、コールセンターへの電話を防ぐために1日連絡するか、100万* 99%* 10%= 99,000人の詐欺の疑いに基づいてサービスを拒否することが判明しました。 そして、あなたのベースが1000万人の顧客なら? そして、100なら?



そのような正確性はまったくあなたに合わないことがわかり、可能な限り電話をかけない人の予測に誤って含まれるという間違いを過小評価するために、実際に電話をかける人を推測する精度を犠牲にすることを好みます。 これら2つの値は相互接続されているためです。



別の例を考えてみましょう。 アナリストに流出モデルを構築してもらいたい。 まず、流出とみなされるものについて合意する必要があります。 ほとんどの場合、顧客は会社に退職したことを明示的に伝えるのではなく、単にサービスの使用をやめるだけです。 したがって、彼らがあなたのサービスを2週間使用していない場合、これは流出ですか? 1か月はどうですか? 2つはどうですか? これは、ターゲット変数として定義するものがモデルで予測されるため、事前に検討する必要があります。



また、モデルはどの時点で流出への逸脱を予測する必要がありますか? クライアントが1か月間サービスを使用していなかったとき? または、この期間の初めに、またはおそらく事前に、クライアントに連絡して彼を維持しようとする時間があるのですか?



これらおよび他の多くの微妙さが、それぞれのケースでのデータ分析のアプリケーションの成功または失敗を決定します。



さらにグローバルな問題があります。会社の組織構造のどこに分析を行う部門があるべきか、部門であるか、それがさまざまな機能に分散している場合、部門の組織構造が最も効果的か、どのプロセスが必要か、役割。



これらおよびその他の同様の質問にすべて答えるために、マネージャー向けのデータ分析コースであるData-MBAを実施しました



このコースでは、データ分析のためのすべての基本ツールと、特定のケースを例として使用するビジネスのさまざまな分野でのアプリケーション、これに関連する複雑さ、可能性と制限、プロセス、テクノロジー、および成功のために必要なはるかに多くについて説明しますデータ分析を使用してビジネス上の問題を解決します。



最初のレッスンは2月16日で、2月12日まで録音します。 特別な事前トレーニングは必要ありません。教室内のすべてを説明します。 こちらからサインアップできます



All Articles