2年以上前に、Netflix は推奨エンジンの競争を発表しました。推奨システムの品質を少なくとも10%改善できるアルゴリズムを発明した人は誰でも100万ドルを獲得しました。 多くの研究グループは、分析に利用できる情報量に触発されて、熱心に仕事を始めました。 当初、ある程度の進展が見られましたが、その後は速度が低下し、現在では研究者は改善エリアで約8.5%停止しました。
この投稿では、推奨エンジンの改善がアルゴリズムの問題ではなく、 プレゼンテーションの問題である理由を調べます。 推奨事項をフィルターとして再考し、高い最終結果に焦点を当てずにそれらを適用することは、データの高速な「 処理 」よりも成功につながる可能性があります。
推奨エンジンの作成は簡単な作業ではありません。1年前にここで説明しました 。 重大な技術的困難に加えて、心理的な問題もあります。人々は推奨事項を受け取りたいですか、もし望むなら、どれだけ信頼しますか? おそらくより重要な質問は、ユーザーが1つ以上の不適切な推奨事項を取得するとどうなるかということです。 彼らはどれだけそっとそれを取るでしょうか?
推奨エンジンの遺伝学
すべての推奨エンジンは、次の問題を解決しようとします。特定のユーザーに、ユーザー自身と同じ新しいアイテムを好むユーザーベース全体の参加者が評価する一連の評価インジケーターを提供します。 この問題を解決するために使用できる多くのアルゴリズムがあり、それらはすべて、 個人、社会、基本の 3つのコンポーネントに焦点を当てています。
- パーソナライズされた推奨事項は 、以前の個々の行動に基づいています。
- ソーシャルの推奨事項は、これと同様の以前のユーザーの行動に基づいています。
- 基本的な推奨事項は、個々のプロパティに基づいてユーザーに特定の要素を宣伝します。
- これら3つのアプローチすべての相互使用 。
ソーシャルカウンセリングは、 共同フィルタリングとしても知られています。Xを愛する人はYも愛します。たとえば、 ロードオブザリングが好きな人は、 エラゴンとナルニア国物語を高く評価するでしょう。 このアプローチの問題は、人々の好みが実際に単純なカテゴリーに分類されないことです。 二人がファンタジー映画で共通の趣味を持っている場合、これは彼らがドラマや探偵小説も好きになるという意味ではありません。 良い例として、人間の遺伝的特徴を引用できます。 多くの場合、私たちは見た目に馴染みのある人に会います。 たとえば、2人の目や唇は非常に似ているように見えますが、完全に異なる人です。
別のタイプの推奨事項は、 実質的な推奨事項です。 このようなシステムの最も良い例は、Pandoraの音楽推薦サービスです。 これは、音楽の遺伝子である400を超えるさまざまな特性について、各曲のランキングに基づいて機能します。 次に、その特性に基づいてピースを自動的に一致させます。 アルゴリズムの改善や、他の分野での応用には多くの問題があります。 たとえば、映画の場合、監督、出演者、一般的な計画から、音楽、シーン、照明、オペレーターの仕事など、よりあいまいなものまで、さまざまな方法でそれぞれを評価する必要がありますしかし、これはすべて非常に複雑です。
ガレージの男
ユーザーに適切な推奨事項を提供するという問題の複雑さは、この可能性の広い分野にもあります。 状況は、人のどの遺伝子が特定の機能に関与しているのかを判断することに非常に似ています。また、音楽ファイルまたはビデオファイルのどのビットが5ポイントを与えたのかを特定することも困難です。 人間の思考のリバースエンジニアリングは非常に困難です。 これが、言及された記事で言及された主要な申請者の1人が推奨事項が真実であることを保証するために非常に興味深い方法を使用する理由です。
「 ガイ・イン・ザ・ガレージ 」というニックネームを冠したロンドン出身のギャビン・ポッターは、人間の慣性に頼っています。 明らかに、映画の評価は、私たちが今見た以前の映画の評価に依存します。 たとえば、3つの映画を連続して視聴し、それぞれ4の評価で投票してから、より良い映画を視聴した場合、おそらく5ポイントを与えるでしょう。 それ以外の場合、これらの映画を1点のみで評価すると、5点を投票した次の映画は4点のみを受け取ります。
このようなアルゴリズムが正しく機能しないと思われる場合は、5位になり、まだ進歩していることを確認できますが、残りのアルゴリズムは改善されていません。 改良された数式と、人間の心理学のわずかな組み合わせ-これは実際、非常に良いアイデアであり、これについてはもう少し詳しく説明します。
推奨事項をフィルターに置き換える
友人は映画やレストランを勧めましたか?何か良いことを期待してそこに行きましたが、最終的には失望しましたか? 何度か! 明らかに、そのような広告は評価を過大評価し、失敗の可能性を高めます。 数学言語では、このタイプの失敗は偽陽性として知られています 。 映画をすすめる代わりに、友人があなたが行くべきではない場所、あなたの時間はどうあるべきではないかをアドバイスしたらどうなるか考えてみてください。
そのような状況で何が悪いことが起こるのでしょうか? はい、ほとんど何もありません。ほとんどの場合、あなたはこの映画に行かないからです。 しかし、たとえ彼に行って彼を好きになっても、不快な後味はありません。 この例は、 偽陰性と偽結果に対する反応の違いを示しています 。 誤った結果はいらいらしますが、間違ったエラーはありません。 推奨事項を確認するアイデアは、上記の現象のアプリケーションとしてフィルターを使用することに正確にあります。
Netflixが何かを推奨すると、ほぼ間違いなく失敗に終わります。 すぐに、彼女はあなたが好きではない映画を推薦します。 代わりに、彼女が新しいアイテムを提供し、各ボタンの横に配置する場合はどうでしょうか。私が嫌いなものを除外します。 アルゴリズムは同じですが、認識が変わります。
リアルタイムフィルター
この考え方は、リアルタイムニュース時代において特に重要かつ効果的になります。 私たちは、新しい情報をフィルタリングすることにますます慣れています。 これはRSSフィードで毎日行っています。 過去の事柄がもはや関連しなくなったときのニュースの流れの観点から世界を考えます。 すでに署名されているため、推奨事項は必要ありません。 ノイズフィルターが必要です。 「ねえ、これは間違いなくあなたが必要とするものではない」と言うシンプルなアルゴリズムが必要です。
マシンがこのアクティブな情報のフィルタリングを実行できる場合、残りの情報を( より効率的に )自分で処理できます。 私たちはすでにメールボックスのスパムに夢中になっているので、「フィルタをかける」ボタンがあれば幸いでした。デフォルトでは参加せずに情報の流れ全体がフィルタリングされる可能性があります。人生の。
おわりに
完璧なレコメンデーションエンジンを作成するのは大変な作業です。 選択されたアルゴリズム、ソーシャルフィルタリング、または物事の内部プロパティにもかかわらず、推奨事項は非常に不信なビジネスです。ユーザーが誤った結果を受け取った場合、そのようなサービスを完全に拒否する可能性が高いです。 おそらく、問題の心理学の観点から問題を検討することで、アルゴリズムが実際に行うことを人々に理解させることができます。 推奨事項ではなく、マシンが単純に物事を除外できる場合。 どうやら、私たちはより寛容で理解できるようになります。
さて、推薦システムの印象について教えてください。 彼らは本当に述べられているほど良い働きをしますか? 映画やニュースを考慮に入れていない場合、上記のフィルターを適用するとよいでしょうか?
この翻訳を読んでくれたみんなに感謝します。 記載された問題についての考えやコメントを残してください。
Web Optimizator:サイトの読み込み速度の確認