👨‍👦 🙍🏼 🅱️ インタラクティブなリコメンダー：作成方法、作業方法 💋 😒 ❗️

推奨システムの構築方法どの機械学習モデルを適用できますか？インタラクティブレコメンダーはどのような問題を解決し、どの問題は解決しませんか？ eコマースポータルに役立つツールは何ですか？これについて-EPAM エカテリーナソテンコのビッグデータエンジニアのレポートで、彼女はこの春にサマラITsubbotnikで講演した「インタラクティブな推薦者を構築するアプローチの概要」。以下はレポートのビデオで、さらに下にはその概要があります。

すべての始まり

EPAMは、eコマースポータルのインタラクティブな推薦者を必要とする有名な英国のファッションハウスからアプローチされました。これに先立ち、EPAMは従来のオフラインレコメンダーの実装を導入しました。現在、顧客は、ユーザーの欲求について、リアルタイムではなく、リアルタイムで学習したいと考えていました。この問題を解決するために、カスタマーポータルを調査し、作業で次の要素を選択しました。

1.メインページ

これは、ユーザーが（まだログインしていない場合でも）ディレクトリを見るページです。すでに登録されているユーザーでも新規登録されているユーザーでも、最初から興味を持っている必要があります。これを行うために、カテゴリフィルターを使用した概念を提案しました。「これよりももっと欲しい」という原則に基づいて提案されたカテゴリーセットから選択し、正確に指定しない（「これが欲しい」）ことができます。これは、通常の検索との違いです。ユーザーが自分の希望を明確に定式化していない場合でも、ユーザーが興味のあるものをすばやく見つけることができるツールが提供されます。ここでは、ユーザーが新しいものを探しているのか、すでに馴染みのあるものを探しているのかを理解する必要があるため、インタラクティブな推薦者が適切です。この問題は、アルゴリズムのグループ「マルチアームバンディット」（マルチアームバンディット）を使用して解決できます。

2.メインディレクトリ

従来、ユーザーは、色、サイズ、およびその他の基準によるフィルターを使用して、カタログからアイテムを選択できました。人の好みがすでにわかっている場合、最も関連性の高い要素の選択を持つカタログをすぐに想像できます。ユーザー情報を使用するアルゴリズムは、 人口統計ベースの推奨者です。

しかし、ここで疑問が生じます。ユーザーのコンテキストがわからず、ユーザーの選択を決定するものがわからない場合はどうでしょうか。ここでは、 コンテキストベースのレコメンダーが役立ちます。さらに、推奨事項をインタラクティブに作成することもできます。たとえば、ユーザーが画面のスクロールを開始した場合、ユーザーは検索を続け、新しい製品を投げることを理解しています。すでに提示されているオプションが面白くないことを考慮します。ここでも、多腕バンディットモデルを使用できます。

3.バスケット

ユーザーが選択した場合は、他のことに興味を持たせることができます。これは、「彼らも購入します」という形式の製品ラインを使用して実装されます。この行を構築するには、 ランク付け学習または連続パターンマイニングアルゴリズムが使用されます。

4.ギフト

このセクションの主な問題は、ユーザーが自分でギフトを選択しないことです。あなたについてではなく、誰がギフトを受け取るかについての情報を使用する必要があります。ここでは、ユーザーの知識も協調フィルタリングも役立ちません。ユーザーが誰と友達か、子供がいるかどうかなどの情報が必要です。ここでは、ユーザー関係とシーケンシャルパターンマイニングに関する情報を使用した人口統計ベースのレコメンダーが役立ちます。

変換

タスクとツールを決定したら、どのツールが最大の変換をもたらすかを理解する必要があります。アパレル店の例を考えてみましょう。ドイツでは、衣服を購入する際のオンラインショッピング中のユーザーの行動に関する調査が実施されました。約50人の女性が参加しました。彼らは、レストランで卒業式の会議に行く方法を見つける必要がありました。実験の一環として、彼らは何個でも購入できましたが、300ユーロ以下しか費やせませんでした。収入、年齢、ファッションの習慣に関するデータに基づいて、研究者は参加者をいくつかのグループに分け、統計を収集し始めました。

この調査の結果から、ほとんどの場合、参加者はフィルターと検索を使用しました（71％）。フィルターの中で、彼らは色でフィルターを最も積極的に使用し、次にサイズとコストでフィルターを使用しました。レコメンダーについて話す場合、ほとんどの場合、コラボレーティブフィルターを使用しましたが、他のツールはあまり一般的ではありませんでした。

同時に、コンバージョンの主な割合は検索（62％）とフィルターを使用したナビゲーション（83％）によって生成されました。これは、ユーザーが探している場合、ユーザーが何を望んでいるかを知っているため、ユーザーを邪魔する必要がないことを意味します。共同フィルタリング、「これを着る」ことを推奨するスタイルガイドは、コンバージョンの50％未満を与えました。これは、人々が他人のように見えることを望まず、自分の個性を強調する傾向があるためです。一方、50％は悪くありません。適切に使用すれば、このようなリコメンダーは非常に効果的です。たとえば、「イベント/イベント」セクションでは100％のコンバージョンが発生しました。

それとは別に、セクション「トップセラーのリスト、新作、季節限定のオファー」でコンバージョンが0％になったことは注目に値します。これは絶対的な指標とみなすべきではありません。タスクを覚えておく必要があるからです。女性はカジュアルな服を選ばず、さらに、季節に依存しませんでした。したがって、他の条件では、このような推奨事項が機能する可能性があります。

理論推奨システムの種類

1つまたは別のレコメンダーを実装する方法を簡単に検討します。

1.協調フィルタリング

このアプローチの考え方は、人々がいくつかの方法で評価するユーザーと要素があるということです：ような、評価など。それらに基づいて、ユーザー評価のマトリックスが構築されます。しかし、誰もが好きではないので、このマトリックスは放電され、タスクは欠落している評価を回帰することです。

この概念を実装するアルゴリズムには2つのタイプがあります。

•近隣ベース（メモリベース）の方法。通常、非常に大きな完全な関係マトリックスを維持しながら、推定値を明示的に復元するのに役立ちます。これらの方法の主な欠点は、本当にパーソナライズされた評価を提供しないという事実による効率の低さです。

アルゴリズムの例 ：ユーザーベースのフィルタリング（UBCF）、アイテムベースのフィルタリング（IBCF）、スロープワン。

•モデルベースの方法。彼らのアイデアは、評価を与える人々に基づいて隠れた要因（ユーザーの興味）を特定することです。

アルゴリズムの例：

o行列因子分解（MF）：特異値分解（SVD、SVD ++、timeSVD ++、MSVD）、非負のMF（ALS）、因子分解マシン、確率的行列因子分解（PMF）

o RBM（制限付きボルツマンマシン）。

o共クラスタリング（COCL、ECOCL）によるインクリメンタルCF

o確率的主成分分析（pPCA）、確率的潜在的意味分析（pLSA）、潜在的ディリクレ配分（LDA）など

協調フィルタリングの利点は、サブジェクト領域全般に関する知識を必要としない推奨事項を作成するために、アイテムとユーザーに関する詳細を知る必要がないことです。それらは、自己組織化モードで相互にクラスター化されます。

欠点：コールドスタートの問題：新しいユーザーまたはアイテムが表示された場合、情報や評価がないため推奨されません。

2.コンテンツベースのレコメンダー

コールドスタートの問題を解決し、新しい要素を推奨するために、協調フィルタリングがコンテンツベースの推奨と統合される場合があります。このアプローチでは、すべてのアイテムを記述する必要があります。しかし、それらの特性は、法的または技術的な理由で常に取得されるとは限りません。

3.人口統計ベースのレコメンダー

ユーザーのコールドスタートが発生した場合、ユーザーに関する情報を収集し、説明する必要があります。

協調フィルタリングに関連するメソッドのグループの一般的な問題は次のとおりです。大量のデータに関してのみうまく機能します。これらの方法は、オブジェクトの推奨に適しています。その選択は、たとえば映画や音楽の推奨など、ユーザーの好みによって異なります。ただし、このアプローチは、車、不動産などの複雑なオブジェクトを推奨する必要がある場合には効果的ではありません。この場合、知識ベースのレコメンダーを使用できます。

4.知識ベースの推薦者

これには、提案された施設を評価し、ユーザーが選択する基準を記述する専門家が必要です。これらの専門家は、あなたがどのタイプのユーザーに属し、どのくらい使いたいか、あなたを引き付けるために製品が持つべき特性をすべて知っていると信じられています。したがって、問題はユーザーとアイテムの両方で解決されます。ただし、欠点があります。専門家は非常に高価で信頼性が低いため、カタログのすべてのルールを常に説明できるとは限りません。

5.コンテキスト認識レコメンダー

ユーザーがアイテムを選択するコンテキストは評価の段階では不明であるため、オフラインの専門家の評価は誤りで不完全な場合があります。コンテキストは時間とともに変化する場合があります。たとえば、あなたはいつもホラー映画を見ていましたが、子供が見たいと思ったため、突然漫画を探し始めました。推薦者の観点からすると、あなたは夢中になっていて、彼はホラー映画をあなたに推薦し続け、いつか回復することを提案します。本当にあなたに何が起こったのですか？コンテキストが変更されたため、これに対応する必要があります。これは、コンテキスト認識レコメンダーができることです。

コンテキストの推奨を効果的に行うには、時系列の意味での変化点検出の問題を解決する必要があります。ユーザーの行動が劇的に変化するということは、コンテキストが劇的に変化したことを意味します。コンテキストを考慮に入れることができるさまざまな方法があります：因子分解マシン、Byesian Probablistic Tensor Factorization。

6.インタラクティブな推薦者

彼らの主な目標は、現在のユーザーのセッションモードで彼の希望に最も関連するオプションを選択することです。

人生の例

バーで自分を思い出してください。素晴らしい時間を過ごしたい。ビールのタップが表示され、何を飲むかを選択し始めます。この時点で、あなたは問題を解決しています：なじみのない（探索）ビールを飲むか、なじみのある（搾取）ビールを飲みますか？これは探査対です。 悪用問題 。インタラクティブな推薦者によって決定されるべきです。この問題を解決する方法：

1.アクティブラーニング（AL）を使用すると、検索スペースを削減できます

2.マルチアームバンディット（MAB）アルゴリズム：E-greedy、UCB、LinUCB、Tomson Sampling、Active Thompson Sampling（ATS）

3.マルコフ決定プロセス（MDP）/強化学習（RL）

4.ハイブリッドスコアリングアプローチを検討できます-モデル構成を使用します。

MABアルゴリズムの主なタイプ

1. E-greedyは単なる頻度評価です。使用頻度に基づいて、盗賊のどちらか一方の手を選択します。バーのタップを思い出します。1つまたは別のタップを使用する頻度が高いほど、このビールが大好きになります。

2.信頼限界（UCB）-ユーザーが特定のアイテムを選択することで得られる喜びに感謝するよう努めています。タスクは、各ペンのこの喜びを正確に評価することです。新しいアイテムの場合、このアルゴリズムは潜在的に最大の報酬スコアを割り当てます。盗賊が引っ張られるたびに、報酬スコアが更新されます。このアルゴリズムは、常に搾取よりも探検に傾いており、あまりにも多くのハンドの計算をサポートできません。

3.トムソンサンプリング（TS）は、確率分布の形でバンディットの各手を表すことができ、そのたびに、各手と相互作用するときに確率を単純に再計算します。各ハンドはその履歴に基づいて選択され、私たちの目標は、ユーザーがMABと対話するときに経験する一般的なフラストレーションを最小限に抑えることです。

原則として、対話型リコメンダーは単独では使用されませんが、たとえば協調フィルタリングと組み合わされます。実際には、線形UCBおよびトンプソンサンプリング+確率的行列因子分解は、よく表れています。

機能について少し

レコメンダーを作成するには、データセットが必要です。モデルを説明する機能が必要です。知る価値のある2種類の機能があります。暗黙的フィードバックと明示的フィードバックです。 暗黙的なフィードバック -これは、ユーザーがスクロール、クリックなどを行うときです。そして、 明示的なフィードバックとは、彼らが明示的に好きまたは嫌いなときです。第二に何が危険ですか？明示的なフィードバック-評価、ユーザーからのいいね-は非常にうるさいです。同時に、暗黙的なフィードバック-スクロール、クリック、ビュー-は、推奨事項に対してはるかに優れています。ノイズが少ないのは、ユーザーの好みとは何の関係もないからです。ユーザーの気分や「0から5までのレート」の意味の理解に依存しないためです。バイアスの問題を解決しないために、暗黙的なフィードバックを使用できます。それだけでは作業できないことは明らかであり、両方の信号を考慮する必要があります。したがって、1つおよび他のアプローチを考慮に入れることができるモデルがあります。

Spotifyレコメンダーの例

Spotifyには音楽レコメンダーがいます。彼らは基礎として協調フィルタリングを使用します。彼らはユーザーの好みを監視し、それらをクラスター化します。また、特定の時間におけるユーザーの意図をユーザーの音楽的関心の空間に投影します。さらに、SpotifyはNLPメソッド（自然言語処理）を使用してプレイリストを分析します。すべてのユーザープレイリストに関するデータを収集し、プレイリストは同じテキストドキュメントであると言います。ここでは、テキストを操作して、たとえばプレイリストのトピックなどを抽出するだけで、従来のNLPツールを使用できます。さらに、ディープラーニングを使用してコンテンツを抽出します。彼らはトラックを取得し、ディープニューラルネットワークに通して、ユーザーが歌で評価する機能を抽出します。これは、ディープラーニングに基づくコンテンツベースのレコメンダーです。そのため、会社はアイテム自体に関するデータを収集します。

レコメンダーを作成するためのライブラリとシステム

オープンソースは私たちに何を与えますか？テクニカルオファーには、テクニカルライブラリとシステムの2つのレベルがあります。

最も強力なライブラリは、Spark MLLib、RankSys、LensKitです。 C ++ライブラリであるWafflesがあります。

1つのライブラリ（機械学習サーバー）よりも高いレベルのツールがあります。最も興味深いのは私にはPredictionIOのようです。

レコメンダーを作成したい場合は、レコメンダー、アルゴリズム、およびそれらの実用的なアプリケーションを構築するためのさまざまなアプローチについて説明している「Recommendation System Handbook、2nd Edition」をお読みください。

インタラクティブなリコメンダー：作成方法、作業方法