🧕🏼 🔝 👨🏽‍⚕️ 商品の分類と「現実の踊り」の非自明な機能 👨🏻‍✈️ 👎🏼 🤵

いつものように、最小限のリソースとコストで複雑な数学的問題を解決しようとしています。このタスクの本質は、購入者にとって最も便利になるように、オンラインストアの商品を分類することです。

最も簡単な方法は、順序を手動で設定することです。 物理的な店舗では、棚がまさにそれを行います。これは「レイアウト」と呼ばれます。私たちの場所では、売り手は各ポイントのプラノグラムに従ってこれを作成し（これはトレーニングに含まれています）、同じ大きな食料品店では、すべてが正常であることを確認する特別な男-マーチャンダイザーです。もちろん、インターネットでも同じことをしたいのですが、この方法は最高50ポジションまで可能です。

スケールの反対側には、デバイス（より正確にはその価格）や画面解像度などのブラウザーアセンブリから始まるユーザーに関するすべてのデータに加えて、サイトでのすべてのプロファイルデータとアクションの評価が最適な結果につながるビッグデータメソッドがあります。このようなデータを使用する最も簡単な方法は、プロファイルを作成し、サイトにアクセスしてから最初の20〜30秒で同じ人のプロファイルと比較することです。そして、最後にあなたに提供することは、例えば、最も安いアパートやホテルではなく、あなたに受け入れられる価格から始めます。おそらく、この並べ替えを知っているでしょう。これは、何らかの理由で、「クライアントにとって最も便利な」ソースを添えて印刷機で提供されます。

私の考えでは、私たちの顧客にとって最も便利なのは、理解しやすく、管理しやすいものです。

さまざまなオンラインストアで商品がどのように分類されているかを見ると、価格、在庫状況、および「人気」、「オゾン」などのその他のブードゥーパラメーターによる注文があることがわかります。この魔法について話しましょう。

どこから始めましたか

手作り。最大50の製品が最善の方法です。実際、同様のレイアウトでは、並べ替えを行わなくても可能です。商品は2〜3画面に配置され、ナビゲーションさえも必ずしも必要ではありません。すべてをまとめてダンプできます。ユーザーは満足します。でした。

ただし、買い手がカテゴリ（または一般にカタログ）のすべての商品を自分のRAMに詰め込めない場合でも、並べ替えが必要です。約100のゲームに到達したとき、最初の機能的なツール、つまり価格のはしごが必要でした。一般に、価格による並べ替えは非常にシンプルで理解しやすいものです。予算があり、その範囲内で維持したい。または、いくつかの類似製品を比較しますか？または、「下」と「上」のカテゴリを取得して、製品を比較するときに何に頼るかを理解するだけです。

このソートにより、1つの思考バグを悪用できます。

多くの人々は、プラグの境界を押し上げる高価な商品を意図的にカテゴリに導入し、「黄金の平均」はすでに以前よりも高価なものになりつつあります。現在の価格に関する情報がない場合、人はあまり安くはないものを買います（彼は良いものを望んでいるため）が、最も高価ではないものも買います。散布図は、ほぼ正規分布でセグメント内に入ります。これについて最も有名な文書化された経験（簡素化）：バーで彼らはビール0.3、0.5、0.7を販売しました。彼らは主に0.5を取りました。実験者は境界を0.5、0.7、0.9にシフトしました。人々は0.7を取り始めましたが、それ以前は消費率は0.5でした。

機械的には、非常に簡単に実装されます-価格が比較されます。同じ価格で、彼らは以前に比較配列に入った製品に幸運です（ほとんどの場合、以前にサイトに追加されました）。

価格ソートの最初の問題は、ベストセラーがかなり深く掘り下げられることです。 2番目-在庫切れの製品。リストの中央にある場合があります。第三に、多くの場合、上部に多くのゴミがあります。つまり、あらゆる種類の消耗品、パッケージング、その他の安価なものですが、多くの場合、人々が訪れた商品とは直接関係がありません。

したがって、ツールとして必要ですが、追加のツールとして必要です。メインの並べ替えは異なる必要があります。

売上で並べ替えると同時に、商品の評価を1から5のスケールで収集し始めたので、評価で並べ替えることができました。

売上で並べ替えるとき、急成長を遂げたのはベストセラーではなく、明らかに（断片的に）何よりもかかる安い商品です。平均以上の価格を持つ製品は、そのような種類のトップになる可能性が過小評価されています。したがって、何らかの形でバランスを取る必要があります。

モデルのアンサンブルを作成し、評価を全体的な評価の2番目の重み関数として使用することをお勧めします。それだけでなく、それについては後で詳しく説明します。

100件のレビューごとに4.5の「星」を付けた製品は、5つ星を付けて1つのレビューを付けた製品よりも明らかに優れているため、評価を取得してアンロードすることはできません。解決策は明らかです-レビューの数に応じて、評価関数全体の評価の重み係数を変更します。オプションは、1％から50％まで非線形に変化するという事実を考慮して検討されました。たとえば、200件のレビューは40％の重量、10件の評価は15％の重量になります。しかし、私たちは係数で十分に遊ぶことができませんでした-推定によるソートの完全に愚かな問題が生じました。

実際、推定値も正規分布に従って設定されています。

クソガウスは下から1部門だけシフトされました-結局のところ、実際には誰もいない学校の成績評価システムを覚えています。つまり、ほとんどの商品は2〜5の間隔で到着し、3.5〜4ポイントの範囲の最適な場所に到着します。すべてのヒットが4.5、すべてが非ヒット-4。

しばらくすると、一般に、すべての製品が同じになり、「評価による」個別のソートではまったく良い結果が得られませんでした。

もう1つの問題は、サイト上の古い投票のジレンマです。ユーザーをメールまたは類似のもの（生成が困難）で許可するか、許可しないでチートをフィルターする必要があります。ゆっくりとスムーズに。私はこれを非常によく知っています。大学で勉強している間でさえ、大学のサイトの「セキュリティテスト」のおかげで、別のグループ（システム数学者であり、情報保護でした）によってサポートされていたため、大学の紋章がなんとか通り抜けました。投票投票について。土曜日に。月曜日の朝、管理者が到着する前でさえ、学長は拳をテーブルに叩きつけて言った-「ここで繁殖をやめなさい、週末に400人の生徒が投票し、この紋章を取ります」。問題は、市内で最も人気のある接続がダイヤルアップであり、グラフィックを使用しないことでした。そして、投票があったものについては、彼らはそれを単に見なかった。 2年後、大学のITサービスの責任者であるあなたよりも少し詳しく説明しました。その後、3つのブロックが実行されました。そのとき、投票で保護することの重要性を自分の足で実感しました。

だからここ。評価のためにログインするのが最もwildの多いため、製品が巻き上げられる可能性があります。ログインしたユーザーからのみ（つまり、注文後、ほとんどの場合、それを受け取る前に）評価を収集することは、それほど冷静な考えとは思えませんでした。

評価の収集とそれによるソートを無効にし、さらに考え始めました。

二回目

物理的な世界とサイトで商品が販売されているときの商品の人気を比較することにより、次の結論を得ました。商品の評価だけでなく、評価の数も重要です。つまり、評価が100の製品は、正規分布の中心領域から両方が十分にノックアウトされていないにもかかわらず、評価が12の製品よりも明らかに優れています。

この部分に重み係数を付けることは可能でしたが、すべてがはるかに簡単に決定されました。私がこの問題について考えていた瞬間に（レーティングによるソートが無効になったため、すでにほとんど機能していなかったため）、Facebookはインターネット上にLikeボタンを詰めました。

Google、VKontakte、Facebookの3つのボタンで問題を解決しました。「評価」でソートしました。評価は、いいねの合計によって決定されました。さらに、このシステムの各投票は正確に考慮されました-ソーシャルネットワークとその承認のおかげで、この問題について考える必要はありませんでした。

再度、格付けによる並べ替えと売り上げによる並べ替えを交差させようとしましたが、ここでは商品の入手可能性の問題が完全に成長しました。

在庫状況

これらは威勢のいい年でした、そして、我々はできるだけ売れました。このサイトでのリアルタイムの存在は、十分な宇宙技術のように思えましたが、それは必要でした。店の数が増え、人が来たためにエラーの数が増えましたが、ゲームはありませんでした。「30分で3つの製品を比較し、2つではなかった」などの否定的なレビューの数などです。

かなり迅速に、しかし大量の血を流しながら、各店舗のベースをリアルタイムで（まあ、ほぼマイナスのキャッシュ）サイトと同期しました。

少し前まで働いていたので、急にもう1つのことに気付きました。売り上げによる並べ替えは特定の間隔に制限する必要があります。それ以外の場合、新しいゲームは解散する機会がありません-結局のところ、古いゲームはトップにあり、より歴史的に販売されています。

1か月に制限されます。

さらに、彼らは現在利用できない商品の選別を考慮に入れないという強い意志を持っています。 それらは単に、「過去のメリット」、つまり同じリスト内の履歴上の位置の順に、リストの下のソートの下部に積み上げられます。これは、人が製品を比較しないようにするためのもので、その製品の1つは現在購入できません。

問題があります。モスクワだけでもすでに9つのポイントがあり、商品がどこでも同時に終了したという事実ではありませんでした。プラスオンラインストア。オンラインストアにない製品をWebサイトに表示するにはどうすればよいですか？

家庭用電化製品の小売チェーンの1つによって提案された方法は正しいように思われます。ユーザーがサイトにアクセスすると、店（家に最も近い店）を選択するか、配送で購入することにします。一般的なサーフィンの前に。そして、この店のパラメータに応じたすべての商品「ダンス」。いいえ-ソートして、ウェアハウスオンラインストアしかないことを示しました。

お客様の行動プロファイルを観察したところ、アイデアはまあまあであることがわかりました。具体的には。なんで？すべてがシンプルです-地下鉄の環状線とノードにあるお店で、通常は地下鉄から1〜2分です（運が良ければ、クルスカヤのような地下鉄の建物でも）。これは、買い手が「お気に入り」ストアを持っていなかったことを意味しました。彼は、家、オフィス、バー、愛人の間の道路で、彼にとってより便利なものを呼び出します。

ただし、過去1か月の売り上げで80％を並べ替えることで、個々の店舗でしか入手できないという問題を解決しました。ゲームがネットワーク全体で販売されない場合、その位置は急激に低下し始めます。

現在のモデル

これは次の仮説でした。1つの「大きな」ゲームを「中」または「小さな」ゲームのペアと見なして、小さな作品をたくさん販売する問題を解決したらどうなるでしょうか。その後、すべてのささいなことはソートを登りません。

解決策は非常に簡単でした-1か月あたりの販売数で並べ替える代わりに、1か月あたりの売上高で並べ替えを開始しました。

次に、用語をいじり、期間を短縮して、現在の傾向が並べ替えに直接反映されるようにしました。

このタイプのソートは、現実世界でプロモーションを開始するための基礎になりました。 つまり、好転する商品は広告になります。これはすでに計算の物理的原理から来ています-胸の高さに最も循環する製品で、手と目により近くなります。

期間が短いほど、ゲームの関連性が「トップ」の位置に表示されます。間隔が長くなると、過去の販売の影響が大きくなります。したがって、商品間の競争の度合いを高めました。以前は、「老人」は最上部にいましたが、ここでは絞ることができませんでした。今では、すべての新しい売れ筋ゲームに確固たるチャンスが与えられました。それはトップで足場を得る価値がありました-そして今では、それだけでなくトップのおかげでも売れています。しかし、もちろん、現在のメリットのおかげで足場を得ることができました-つまり、その位置への関心が薄れてしまうと、「地下室」に戻りました。この完璧にバランスの取れた季節商品-ゴロドキとペタンクは夏に元気に登りました。

2番目のソート方法は、いいね！のセットです。

現在のモデルの問題

まず、基本的な並べ替えでゲームの好きなものやコメントの数を考慮しません -これはもちろん、人気を決定しますが、別のツールで作成されます。なんで？「ウォレット投票」がより現実的なデータを提供できるようになったからです。もちろん、理論上、一連のいいねの速度と加速を重みとして含めることができますが、これは将来の問題です。

第二に、ゲームの「温度」を考慮していません。 つまり、新しいアイテムは共通して保持されます。地理的な理由から同時打ち上げはありません（最も遠い地点はユジノサハリンスクで、そこを飛行します;本土で最も長い地点は3-4週間の供給です）。したがって、ゲームはどこでもすぐに初期加速を得ることができません-「明るい」効果は都市全体に広がります。おそらく、新規性のために初心者を上位にランク付けするのは最初の3〜4週間の間に正しいでしょう。

第三に、子供と大人の両方がプレイできるゲームがかなりあります。 そして、ほとんどすべてが良い贈り物です。これは、2〜3のカテゴリに類似したベストセラーリストが必ず存在すること、つまり、ソートの「トップ」が同じになることを意味します。同時に、各カテゴリでソートすることは論理的ですが、それでもまだ難しいです-各アイテムが誰のために購入されているかを知る必要があります（これはすでにクールなデータマイニングです。

4番目に、はい、最適な製品オファーのサービスを使用して、サイトでのユーザーアクションから並べ替えを発行できます。 おそらくあなたはこれらを知っています。一般的な原則は、ログインデータ（ブラウザー、画面、地理など）の分析、サイトでの行動（「子供たち」に行って、これら2つの製品を見た）、プロファイリング、オーバーレイです。同じプロファイルを持つユーザーが購入したもの、あなたがあなたを示す必要があるように。問題は、第一に、そのようなソートが制御を失うことであり、第二に、まだそれをテストしたことです。そして、彼らは彼らの基本的な方法で「現実の踊り」に大きな違いはなかった。考えられる理由の1つは、このような推奨事項のサービスが「私は望まない」を通じて必ず売りたいという激しい欲求であり、これがオファーとアルゴリズムの「攻撃性」に影響を与えたことです。切断されました。

その結果、正しいアイデアはゲームを「フィーチャー」すること、つまり、通常のソートに「エディターの選択」を追加することであることが明らかになりました。今年は性的休暇のテスト（2月14日と23日、3月8日）の一環としてこれを試みました。すぐに再試行しますが、方法は異なります。おそらく動作するでしょう。

はい、最初の製品はネファリウスです。

^{これが新しいインターフェースでの方法です}

つまり、ここでも、完全に手動の並べ替えからスマートオートメーションに至るまでの完全な円について説明した後、手動に戻ります。

そして、はい、問題は完全に解決されていません。改善の余地があります。一般に、振り返ってみると、上記のすべては論理的でシンプルに見えますが、信じてください。私たちが始めたばかりのとき、それはまったくそのようではありませんでした。私たちの歴史的なレーキに興味を持っていただけたことを願っています。

商品の分類と「現実の踊り」の非自明な機能

どこから始めましたか

二回目

在庫状況

現在のモデル

現在のモデルの問題

More articles: