旅行セールスマンの不幸と10月の赤

司令官のアリスタルコスは窓に立って、彼の目にわずかな悲しみがあり、南に飛んでいる蚊の群れを護衛しました。 秋 シーズンの終わり。 N市の住人が、吸血鬼や地位の対象(不潔な都市の住人は噛まれた住人よりも良いことが知られている)に対する自衛の手段として愛されるようになり、銃屋から拾い、自分の場所にスノートロールを輸入するようになりました。







画像






小売業では、季節商品の需要が低下すると、棚の品揃えが変更され、未請求の残高がサプライヤーの倉庫に戻されます。 混乱はまだです。 誰もがバランスの取れた製品ポートフォリオを持っているわけではありません。 シーズンの終わりにはキャッシュギャップが生じる可能性があり、サプライヤーは損失を減らすために最善を尽くしています。 セールスマンの失敗。







暑い夏が訪れたのは、シーズンが続いたためです-アリスタルコスの頭に落ち着いた考え-翼のある移動の年間リズムは、ある種の自然に事前に決定された枠組みに確実に適合しました。 しかし、売上と天気の間にこの相関関係がある場合はどうでしょうか?







天候と蚊のバトンの売り上げの相関関係を示してください。Excelのギガバイトの集計表は次のとおりです。これが、季節商品の返品について知り合ったきっかけです。







メッセージは明確でした-お金Mと天気Wを結びつける







画像






以下、重要なサインは大きな陽気な文字で示されます。







計画はありますか? もちろん、計画があります:



悪いセールスマンを売る

データの性質

セールスメカニック

これは、アリスタルコスが待っていた相関関係です

モデルT

モデルを売り手に売る

開始、開始-改善

店主の不平等の大きさ(パレートの法則)-一対の無限の瞬間

商店主ヘルツ

再生メモ

セールスマンの報告または熊手







30,000の店舗で400人のチームの54か月の売上がありました。 日ごとの製品の販売に関する月次レポートの要約表のデータ-各販売ポイントについて。 これらのうち、トランザクションの位置が復元されました-一意の日付を持つ個々の製品の注文(ここでは、クライアントが1日に1つの注文を出すという仮定を受け入れました)。







週ごとのバトン販売は季節ごとの需要を示しています。9月末(36週目)に返品義務(返品の簡略化はマイナス記号付きの注文)が販売収益を超えています。 シーズンの終わりが近づいています。







災害規模-バトンビジネスの3分の1



画像






しかし、売上と天気の間にこの相関関係がある場合はどうでしょうか? 天気の記録は、質問に答えるのに役立ちます。 米国の国家政権による地球周辺からの気象観測の集中収集の歴史は、前世紀の初めから広がっており、最も完全なデータは70年代から入手できます。 個人的または学術的な使用に利用可能なソースの1つはGSODです。 指定された間隔での販売データがあるため、仮説をグラフィカルにテストできます。







売上は金銭と個数で測定しますが、天気はどうですか?



アデレードと同じ方法でケメロヴォの天気を測定します-これらの方法は国際社会によって標準化されています。 世界気象機関に参加している国の公式ステーションの完全なリストには、一意の識別子が含まれています(たとえば、アデレードの空港にはWMO_ID = 94672があり、ケメロヴォ水文および環境モニタリングセンターWMO_ID = 29642がある )。これにより、 アーカイブレコードを検索できます。 特別な機器は、地上2 mの高さの乾湿計ブースに常に配置されています。駅のスタッフは、階段を使用して機器の測定値を収集します。







画像






次の指標について2時間の頻度で測定することは困難な仕事です。









彼らが言うように、それぞれに-彼自身



気象学者は観察を行い、営業担当者は売ります。 トランザクション-注文を記録します。







画像

画像



おそらく、良いセールスマンは手順とルートに従います-厳しい時間の制約が義務付けられています。 営業担当者や専属の営業担当者が多い場合に便利です。 しかし、今ではありません。 私たちの状況では、販売代理店は代理店に雇われています。 販売店の販売代理店の売り上げデータを分析します。



原則として、これはベストプラクティスであり、営業担当者の活動の記録を保持することをお勧めします。 ほぼ2,000のうち10分の1ごとに測定すると、営業担当者が1週間ストップウォッチを使用しました。 その後、これらの測定値を処理しました。 それはかなり前のことであり、測定プロセスは次のとおりでした。セールスマンを執followingに追って、彼の直属の上司が訪問のすべての段階を測定し、ノートにメモしました。 シフトの終わりに、地域事務所で、テーブルに入って私たちに送られました。 次に、2つの領域が顕著に区別されました-データの品質(完全性、列オフセット)にはクリーニングが必要でした。 実験の2週間は、混乱のpassed騒の中を通りました-各スーパーバイザーは2人の販売員を測定しました。 それから彼はプロジェクトマネージャーにそれらの地域での販売の成功について尋ねました-それは小さいことが判明しました。 それ以来、このルールは、営業担当者の成功の可能性をデータを明確に測定することにつながりました。 私たちのケースは中間のどこかにあります。

データは、営業担当者がモバイルデバイスに入力し、十分なゴミを持っているトランザクションから収集されます-アドレスを人間の形とジオコードに入れるハックでした(ジュニアモンキージョバーの役割のための興味深いプロジェクトにインターンを招待して問題を解決するようにアリスタルコスにアドバイスしました) :1)入力の自動化を検討し、2)顧客データ、特に住所データを保持する-突然新年のカードを全員に送りたいと思うと、メールに戸惑うことになります。







販売データとマーケティング計画およびアクションを比較する機能により、さまざまな気象条件での方法の有効性を評価できます。 現場でセールスマンと一緒に何が起こっているかを知るほど、より良い結果が得られます。 そして、絶え間ない利益相反など、多くの興味深いことが起こります。







画像






消費者製品の市場参加者の相互作用の仕組みについて簡単に説明します。 商品は、仲介者のチェーンを通じて消費者に届きます。 製造業者(P1とP2)はあらゆる段階で競争し、店内の棚は最後のフロンティアです。 通常、いくつかの大規模なサプライヤーはディストリビューターの注目を集めて戦いますが、小規模なサプライヤーは誰にとっても面白くなく、苦労します。

トランザクションには3つのタイプがあります。







•セルイン-製造業者から販売業者へ、

•売り切れ-ディストリビューターから販売拠点まで、

•セルスルー-消費者へ。







このセールスマンには、ディストリビューターやアウトレットにレコードを共有するよう説得するのに十分な交渉力があります。 市場シェアは最も強力な議論です。 流通ネットワークは情報を共有する可能性が高く、このプラクティスは拡大しています。







お金の流れと天気を描く



画像






バトンの需要のダイナミクスは、1週間の平均気温によって異なります。 シーズンの終わりは、コールドスナップの始まりと一致します。 これは一般的に市場です-私たちは603千平方キロメートルの販売地域を持っています-異なる時期に秋が都市や村を掃除するので、返品に10週間を費やします。 計り知れない。







なぜ平均気温は?







ミニマリズム 怠azine。 見せびらかす。 まあ、個人的な経験-私は夏に庭で本と一緒に座るのが好きですが、不幸は蚊です。 バトンを払い落とすと同時に読むのはあまり得意ではないので、香やfu蒸剤を燃やす必要があります-方法は厳しく、吸血昆虫よりも少し読むのを邪魔します、そして夏には庭に場所を見つけない方が良いです、妥協は避けられないからです。 夕方の新鮮さの到来、トレーナーを着てフードに身を包む時間、そして蚊の消失までの遅延が約30分であることに一度気づきました。 数日間続けて、この時点で気温を測定しました-約19°Cは、庭から蚊の到着を分離する目に見えない境界を通過します。 そして、ヒューリスティックが生まれました。







さらに、売り上げは本当に天気と相関しています。 「過去12時間のリターンと最高気温とのピアソンの相関関係は0.676722です」という答えがあった場合のみ、チーフセールスマンには行きません-彼らは理解できません。







中間的な結論-季節商品を小売店から倉庫、販売業者に返品する操作の履歴を調べ、店舗を訪れたときの売上が環境の状態(地上2mの気温)に依存するため、セールスマンの失敗を概説しました。







季節の終わり(巡回セールスマンの不幸)と機械学習演習への移行に十分な天気との関係についての議論を検討します-私たちの目標は、依存を一般化し、行動を促す新しい知識を作成することです。 たとえば、秋に返品を待つのではなく、各ポイントで品揃えを交換する決定を事前に行う。







大量のデータ-単純なモデルは機能しますか?







多数の例により、単純なモデルの使用が可能になると考えられています。 適切なデータがあります-わずか800万行。 日付と座標によって、気象条件をトランザクションと比較し、バイナリ分類問題を解決して、売上と返品を区別するアルゴリズムを教えることができます。







モデルT

画像




スライディングウィンドウと木材の組成。 3、1、および7日に選択されたウィンドウサイズ(ウィンドウに敬意を表して)



ひざの上に積み重ねます。あるモデルの出力を別のモデルの入力にフィードする方法です。これにより、モデルを個別に使用する場合と比較して、予測品質が向上します。 トランザクションごとに、イベントの3日前と7日前の天気情報でデータセットを拡張します。 スライディングウィンドウは、キャンペーンのモデルでもあります。 解釈されたアルゴリズムの使用は、人間工学的な考慮事項によって決定されます-誇大広告の波で販売することはおそらく素晴らしいですが、製品とその機能の仕組みについて推論する能力を知っていると、売り手がより成功することを信じるように教えられました。



さらに、 新年の GDPRが急ぎ、わかりやすいモデルの価格が上昇しています。



箱から出してすぐに、予測の精度(正解の割合)は99%です。 このような天気予報インタープリターは、歪みを最小限に抑えると想定できます。



一般に、品質メトリックの選択は重要なステップであり、このケースでは透明性戦略を決定します。最もよく解釈されるモデルを最良のものから選択します。 将来的には、機械学習アルゴリズムのファミリーを比較し、計算コストとスケーラビリティ、すぐに使用できるコンポーネントの可用性、運用コストなどのいくつかのパラメーターに従って評価します。 今、私たちはセールスマンの不幸な声明を発表し、解決アルゴリズムを提供しています。



だから。 小売店からの季節商品の返品としてセールスマンの失敗を指定し、システムの状態を記述する追加変数を1つだけ使用して、機械学習ツールを使用して合理的な精度でそれを解決しました。 これで、天気予報を解釈してシーズンの終わりを予測し、2週間の未来を見ることができます。



そのようなモデルをビジネスに提出する方法は?



画像






機械学習を使用して構築された製品の成功は、人々に聞こえる質問の精通度に依存すると考えています。 解決したばかりのバイナリ分類問題は、「与えられた条件下で何が起こるか?」という質問に答えます。これにより、毎日の天気予報の約束を個別に解釈できます。



質問を言い換えると、より便利な答え(およびストーリー)になります。



シーズンの終わりのモデルがあり、彼女は販売データから学習し、「天気予報に基づいて今後10日間のうち何日販売するか」という質問をします。



回答をエリアのマップに配置し、値を色でコーディングします。10は英国のレーシンググリーンに対応し、良好な状況に関連付けられるはずです。 私たちは、準備ができた読者が感情の嵐のような色域を引き起こすべきであることをブルゴーニュで示します。 回答5の不確実性は、背景と明確に対照的なカナリアシェードで表されます。



最も重要な芸術に関する論文を確認し、現象のダイナミクスを時間内に評価します-フレームごとのアニメーションを作成します(漫画は複製者の賞品になります-ノートブックを実行すると、あなたは幸せになります)。 夏の色のパレットの中で最初はti病である赤の閃光は、夜明けが日の出の前に来るので、シーズンの差し迫った終わりを予感させます。 瞬間-そして今、マップ全体が朝の夜明けの色であふれています。 棚から商品を一掃し、赤い10月の火で燃え上がり、セールスマンの不運、そして冬、そしてこれらすべてをもたらしました-都市、人々、しかしスタートの緑のために。



画像






カラーコーディングにより、マップ上のポイントのサイズは自由に別のアイデアを表現できます。これは、ビジネスの過去のボリュームまたは回帰問題の解決策(販売予測)のいずれかです。



司令官は地図の上に寄りかかっていました。 「ついに自分の売り上げを見ることができました」とリーダーから急に出ました。 北の少数のフェーディングポイントが混乱を予感させた。 目を閉じるとすぐに、大勢の営業員が都市や町を駆け巡り、今は静かに眠っていますが、明日は目覚ましになるとはまだ気づいていません。今度は棚で商品を交換し、シーズンの終わりを迎えました。



* * *



シーン2



訪問の頻度を分析して顧客の範囲を拡大し、Tモデルの精度を1桁向上させます。



ここでは、おそらく、遅刻した紹介を指定し、自己紹介をする価値があります。 これらのノートで起こっていることと説明されていることは、私の2番目の修士課程の一環として行われた研究のエピソードの1つです。 営業担当者の観察-データ分析から得られた必ずしも明らかな結論ではない-これは、この話の目的です。



私の名前はVadim Safronovであり、SAPセールスマンサポートエンジニア-プリセールスエンジニアです。



アリスタルコス司令官は地図に寄りかかった。 北は赤い色合いで咲きました。 100個の水晶のようなもの-販売の地域区分-は、営業担当者のチームを地域に固定します-それは明日大騒ぎしなければならない人です。 北部は過酷な地域であり、パスが雪で覆われる前に、7000の銃屋すべてを訪れるのは非現実的です。



しかし、すべての店主が等しくかわいいわけではない場合はどうでしょうか?



顧客の不平等の大きさは、次のエレガントな式で正確に説明されています。



画像






パレートの法則-xより大きいイベントの確率はxの次数に比例し、γは通常2〜3です。



流通ネットワーク-すべて一緒に、販売業者-販売店-ショップチェーン-は、スモールワールドモデルの特性を備えています。 これは予想されています。販売は人と人の関係であり、システムのダイナミクスは他のソーシャルネットワークのダイナミクスと似ているためです。 グラフ理論は、何が起こっているかを説明するツールを提供します。 管理者向けのよく知られたいくつかの概念を検討してください。 ロングテール(ロングテール)とオーバーアチーブメントのコスト(収益の減少)-顧客のごく一部が業務と利益の大きなシェアを生み出し、コストの不釣り合いな増加-完璧主義のペナルティ(またはレベルの高さの手数料)



なぜグラフなのか?



顧客関係管理の考え方には、ビジネスパートナー(SAP CRMの世界の中心的存在)間の関係が含まれます。 消費財のネットワーク効果は、顧客とのビジネスの規模と製品の人気の両方で観察されます。 リレーションのチェーンを記述し、ビジネスパートナーがノードとなるグラフにエッジで表示すると、ページランクなどの興味深い変換と計算を可能にする新しいデータ構造が得られます。 実際の比較実験は、店を訪れるセールスマンの頻度と、ランダムな瞬間に店内にいる確率と、セールスマンの予想されるエルゴシティとの実際的な対応について実行できます。 (言い訳:先に見たデータは使用できなくなり、オープン分析に適したものになるので、これを記入します)



巡回セールスマンの生活における多くの多くの問題は、グラフで解決されます。 そしてそれは素晴らしいことです。 たとえば、操作間の通常の80/20比率-どのように適用できますか?



従来の統計はすべて、中心極限定理に基づいています。これは、調査中のサンプルの個々のデータポイント間の独立性を意味します。 それどころか、パレートの法則は、システム内の要素間の密接な関係、つまりネットワーク構造の特徴的な品質を意味します。 バラバシは、このような重く傾斜した左尾部の分布の形成のダイナミクスの説明を最初に提供したものです(推奨されるアタッチメントモデル):選択肢があり、アクションの優先度を設定する能力がある場合、プロセスのダイナミクスは非ポアソンになります。 たとえば、ネットワークが成長し、新しいノードが既存のノードとリンクを形成する場合、確率pで最も接続されているノードに参加するか、確率1-pで隣接ノードをランダムに選択します。 パラメーター値に応じて、結果のグラフはp = 0でランダム(Erdos-Raineyモデル)であるか、スモールワールドモデルに固有の小さな直径(2つのノード間の最大最短パス)、高いクラスタリング(近隣ノードが相互接続されることが多いなど)を示します友人の友人はよく知っています)。



パレートの法則の顕著な特性は、関数のグラフの形式です。二重対数目盛では直線です。 パラメータ-指数γ-の計算は、少し前に解決された問題です(2007)。 パラメータの選択が利用できなくなるまで、単純にグラフを作成しましたが、目で直接評価しました-γの値はグラフの傾きにのみ影響します。 現在、このための既製のpowerLawライブラリがあります。 高等経済学部のレオニード・ジューコフ過程で 、べき法則が2番目のトピックであることは偶然ではありません。



パレートの法則の実用的な有用性:1)最適化の問題を解決することは便利です2)彼らはビジネススクールで教えますが、より重要です-ビジネスの言語を話すことは理解されるチャンスです。



累積出力分布関数のテスト:二重対数目盛のグラフ。



画像






パレート規則は私たちのケースに近く、店主の20%がお金の90%をもたらします。



最も重要な結果:



売上高では、分散が無限であるため、平均の概念は意味をなしません



まだ「中間チェック」で動作していますか? レオニード・ジューコフ (RU)またはユラ・レスコベック (EN)のパレート規則に関する講義をご覧ください -興味深いことがたくさんあります。



実際的な結果は、顧客ベースのランキングです。



アウトレットの振る舞いのセグメンテーション-機械学習におけるクラスタリングのタスク-何かの中に似ているグループを分離できる方法で、異なるグループ間の要素は大きく異なります。 利用可能なデータの問題を解決します。 アナログの方法。 ビジネスにクリア。 追加の動機は、属性セットの強化です。



データは、製品、数量、顧客、セールスマン、暦日、座標などの既知の注文の位置を表していることを思い出してください。 変数T-周囲温度-を追加します。このデータはオープンソース(GSOD)から取得できます。



顧客行動の兆候-小売店で注文を出す頻度-を構築します。 ほとんどの注文は、その場で、つまり販売業者のクライアントで行われます。 怠zyな営業担当者は、注文を収集する電話モードに切り替えることがあります-彼らはそれがすぐに効率に影響を与えると言います-売上は落ちます。



画像






訪問の頻度の尺度として-クライアントのスペクトルを分離可能なセットに分解できるようにします-訪問の平均頻度をヘルツで取得します。



アルゴリズム



各クライアント(アウトレット)について:



  1. 金額または商品単位で取引量を測定します(インフレなどの外部要因により、不安定な通貨での予測精度が低下する可能性があります)。
  2. 次に、受け取った属性に従って顧客のセット全体をランク付けし、等しいバスケットに分割します。 10個のバスケットの数を選択し、顧客ベースを10分の1に分割します。 クライアントコードにアルファベットコードを割り当てます['A'、 'B'、 'C​​'、 'D'、 'E'、 'F'、 'G'、 'H'、 'I'、 'J']、最高の顧客はバスケットA.
  3. セールスマンによる訪問の頻度を測定します。
  4. 符号頻度について手順2を繰り返します


これで、各クライアントの動作を頻度と通貨記号で記述し、2文字のコードでエンコードできます。 最も収益性の高い顧客セグメント、AA。



画像






ここには、注文、売上高、および顧客セグメントが表示されます(四捨五入のため、利息の金額は100と異なる場合があります)。 イギリスのレーシンググリーンで描かれたエリアを見てみましょう-以下、この色合いは期待の楽観性を強調しています-AAセグメントが利益のほぼ半分-クライアントベースのわずか3%を生み出していることは簡単にわかります。



この分解により、店主の不平等の仮定が確認され、機械学習のタスクに戻ります-巡回セールスマンの問題を解決します。



予測の質を桁違いに改善する-明白に! 店員の店への訪問頻度を比較的簡単に計算することで、分類子の正解の99.9%のシェアを達成しました。 これで、モデルの質問の範囲を拡大し、「今後10日間で最も収益性の高い顧客は何人購入しますか?」または「この顧客はいつ購入を停止しますか?」-顧客の行動を考慮して回答を得ることができます。



最終モデルT + F



画像






この演習では、次のことを行います。

1)巡回セールスマンの失敗を特定した

2)それを解決し改善する方法を検討した

3)提案された測定と制御の手段



次に何をする?



司令官は地図の上に寄りかかっていました。 夜明けが北に殺到しました。最愛の店主に走ることがすでに明らかであったところ。しかし、クラブがあなたと一緒に持っていくカートはいくつありますか?現象-予測可能になり、1つのことが決まりました-巡回セールスマンの不幸を測定する時が来ました。アリスタコスは、ラニテスとオーロラの輝きについて息を切らして、寝室に引退しました。



* * *



再生メモ



画像






ペッパーワセリンが火の寒さの中でキスをする、人気の科学コラージュ、2017



こんにちは、再現者!



学習の過程を繰り返して、セールスマンの失敗を自分で測定できます。このスキルは、チーフセールスマンと面談する際に役立ち、状況を理解することで輝きます。不運を測定します-結果と個人的な印象を共有します。



さらに、最高司令官が必要です。



歴史の



記録:-Aristarchusは、37の店舗で54か月を記録し、17のカテゴリで不運を測定し、都市Nのデータを共有し、さらに-ディストリビューターの目標を設定する方法を変更しました-現在、店主の行動を考慮しています (2017)

-匿名のチーフセールスマンは、7つのカテゴリの34,000の店舗で30か月を記録し、店主を優雅さなどで分類しました。 (2016)

-司令官-夕食時に友人の知人は、ディストリビューターと店主からデータを抽出する方法を共有しました。 (2014)

-セールスマンの次長は、ディストリビューターが店主とのビジネスを開くことを好まない理由を述べました。流通ネットワーク上のパートナーオペレーションからデータを抽出できるのは、この驚くべき能力です。 (2007)



私はいくつかに会えて幸運でした、そしてもしあなたが会った最高のセールスマンが本当なら、私は彼をこのリストに加えてうれしいです。



どうぞ!



* * *



セールスマンの報告または熊手





画像








技術的および組織的な問題に対処する場所は次のとおり



です。購入する必要があるようです。 (UPD:現在、約10日間のスプレッドがあり、カードが赤の場合、すでにリターンが来ている可能性が高いことを知っています)

-ディストリビューターが市場で作業するための単一または標準のプラットフォームがないことが起こります(それが起こる-Aristarchusは幸運でした、チーフの匿名司令官のようではありません)。その結果、パートナーはさまざまな情報システムとデータモデルを実装しました。ETLは30倍も興味深いものになっています。

-データ入力と送信の遅延が時系列を破壊する-会った最悪のディストリビューターが月に一度報告されました。



* * *



お知らせ:シーン3。不運を測定し、預言者が最初に登場します。



ここに説明されているすべてを行うコードがあります



All Articles