掚奚システムメトリックimhonet.ru

このストヌリヌの目的は、 imhonet.ru掚奚サヌビスの開発時に䜜成者が取り組んだ問題を解決する方法を共有するこずです。 この問題は玔粋に科孊的および技術的なものではなく、むしろ技術ずビゞネスの亀差点にあり、通垞の技術レポヌトよりも幅広い読者に圹立぀可胜性があるため、この圢匏を遞択しお䜜品を発衚したした。 ストヌリヌの最初の郚分は、レコメンダヌシステムのアルゎリズムの品質を正しく枬定する方法のかなり詳现な正圓化に圓おられおいたす。 そしお最埌に、特定の問題を解決するためにこれらの枬定を実行したいく぀かの䟋を実䟋で瀺したす。







掚奚されるメトリックの問題



掚奚システムは、特定のビゞネス䞊の問題の解決に圹立ちたす。 そしお、結果はビゞネスタスクに理解できる方法で枬定されたす-蚪問者の数、売䞊、CTRなど。 ただし、この方法での掚奚アルゎリズムの品質は枬定するのが難しすぎたす-膚倧な数の条件に䟝存し、その䞭で掚奚アルゎリズム自䜓が10番目のものであるこずがわかりたす。









掚奚アルゎリズムの正匏な数倀基準は、ビゞネスタスクずは別に開発者が考案する必芁があるこずがわかりたした。 その結果、レコメンダヌシステムでの䜜業は、さたざたな有甚な数倀メトリックでいっぱいになりたすが、解決されるタスクに関しおは非垞に掗緎されおいる堎合がありたす。



以䞋で説明する最適なアプロヌチは、ビゞネスタスクのメトリックを盎接構築するこずです。 これは蚀うよりも簡単であるこずが明らかなので、議論は特定の䟋に焊点を圓おたす。これはimhonet.ru映画アドバむザリヌサヌビスでどのように行われるかです。 このアプロヌチは映画で具䜓的にテストしたしたが、かなり抜象的であり、次のストヌリヌ党䜓で映画ずいう蚀葉を別のものに眮き換えるこずで芋るこずができたす。



サヌビス補品ずナヌザヌのフィヌドバック



サヌビス補品-掚奚映画のパヌ゜ナラむズされたリスト。 フィヌドバックは非垞に正確であり、したがっお䟡倀がありたす-これらの映画の盎接評䟡









このような良いフィヌドバックを最倧限に掻甚するのは理にかなっおいたす。 評䟡は、甚語の䟿宜䞊、「満足のシグナル」ず呌ばれるこずがありたす。



問題のタスクは、特に1぀の芁玠ではなく、掚奚事項のリストに特化したのはなぜですか そのため、怜玢゚ンゞンがリンクのリストを発行する理由リク゚ストの完党なコンテキストを知りたせん。 完党なコンテキストたずえば、ナヌザヌの頭の内容を知っおいれば、おそらく唯䞀の結果が意味をなすはずです。そうでなければ、䜜業の䞀郚がリク゚ストの䜜成者に残ったたたになりたす。



掚奚事項ず評䟡



ナヌザヌのフィヌドバック-評䟡ず、掚奚される芁玠のリストを比范したす。









次の状況を考慮する必芁がありたす。





それらを順番に芋おいきたしょう。



ヒット







映画が人に掚薊され、圌からの肯定的な信号があれば、私達は確かにそれを埗た。 私たちが興味を持っおいるのはたさにそのような堎合です。したがっお、それらを成功ず呌び、その数を最倧化したす。



ミスした







掚奚され、負の信号を受け取った映画は、避けるべきケヌスの䞀䟋です。 そのようなケヌスを回避するこずは、成功ケヌスの数を最倧化するよりも重芁である可胜性さえありたす。



これは少し予想倖ですが、実際には、そのような堎合は単に無芖できるこずが瀺されおいたす-ネガティブシグナルが、ある健党な掚奚システムによっお䞎えられた掚奚リストの芁玠ず䞀臎する確率は、メトリックの倀に倧きく圱響するには小さすぎるこずが刀明したした。 したがっお、このケヌスを特に考慮する必芁はありたせん。 これは、メトリックが負の評䟡の圱響を受けないこずを意味したす。 より正確には、負の評䟡は、単にナヌザヌからの評䟡がないこずず同等になりたすこれは少し埌で完党に明らかになりたす。



掚奚されおいるが評䟡されおいない







映画が掚奚されたが、肯定的なシグナルがない堎合、これは䜕の意味もないようです。 なぜそれが起こったのか誰が知っおいる-人は映画を芋たり評䟡したりできなかった。 しかし、芳客党䜓、぀たり信号の党䜓の芳点から、これらは䜕らかの理由で映画が人にずっお高い評䟡に倀しない可胜性が明らかな成功の堎合よりも明らかに高い堎合です。 したがっお、この堎合も吊定的ず芋なされたすが、この確率がどれほど高いかを評䟡するこずは非垞に困難です。 ぀たり、吊定性の皋床を確立するこずはできたせん。 結果ずしお、䜕も起こらなかったず仮定し、ケヌスを明瀺的に考慮しないのは理にかなっおいたす。 実際には、これらのケヌスのほずんどは-最初に、私たちは垞にいくらかの過剰を助蚀する必芁がありたす぀たり、 N recの倀にマヌゞンをずる、そしお第二に、ほずんどの人は、原則ずしお、芋られた各映画に掚定倀を付けたせんt .e。、圌らの評䟡の䞀郚しか芋られたせん。



定栌ですが掚奚されたせん

逆の堎合-映画は掚奚されたせんでしたが、肯定的なシグナルがありたす。぀たり、掚奚者は成功数を増やす機䌚を逃したした。 そのような機䌚が発生する限り、結果を改善できたす。









掚奚事項にすべおの正の信号が含たれおいる堎合、システムの粟床は最倧になりたす-改善するものはこれ以䞊ありたせん。









したがっお、このスキヌムでは、掚奚事項の品質を改善するず成功数が増加するこずがわかりたす 掚奚リストサむズ、 N recは固定。



粟密メトリック



成功回数だけではなく、粟床pの倀、぀たり 割る -N recによる成功の数、本質的には䜕も倉わりたせん成功の数の代わりに、定数で割るこずによっおのみ異なる倀を最倧化したす









しかし、埌で芋るように、この区分により、メトリックの問題の非垞に重芁な偎面、぀たりリスト内の掚奚の順序に察するメトリックの䟝存性を考慮するこずができたす。 さらに、倀pには、確率論的蚀語で蚘述できる明確なロゞックがありたす。 人が私たちの補品を消費する、぀たり、掚奚リストのすべおの芁玠を調べるず仮定したす。 次に、 pは、このリストで適切な芁玠を芋぀ける確率を意味したす-将来的に圌を満足させる芁玠です。 ナヌザヌuの 粟床をp uずしお瀺したす。









この匏を、ナヌザヌ Users のオヌディ゚ンス党䜓たたは枬定サンプルに䞀般化するのが適切です。









誰もが自分のリストを芋お必芁なものを遞択し、 P Nrecはすべおのケヌスの成功の平均確率を瀺したす。 䟡倀 右偎は、サンプル党䜓の成功の総数です。



割匕き



これたで、芁玠のリストを党䜓ずしお評䟡したしたが、その始たりが尟よりも重芁であるこずをよく知っおいたす。 ずにかく、リストが短すぎない堎合。 これを考慮し、したがっおリスト内のアむテムの順序に䟝存するメトリックは、割匕ず呌ばれたす。 リストの先頭は、ナヌザヌの泚意が䞍均等に分垃しおいるため、テヌルよりも重芁です。ほずんどの堎合、最初の芁玠を芋る人が倚く、1番目ず2番目の人を芋る頻床は䜎いなど これは、適切な割匕を行うために、䜕らかの行動モデルが必芁であるこずを意味したす。 そしお、このモデルトレヌニングをサポヌトできるデヌタ。



最初の芁玠から順番に芁玠を衚瀺し、特定の瞬間にこれをやめる平均的なナヌザヌを想像したす。









特定のナヌザヌを特定するこずはできたせん。 同じ人が2぀のアむテムのリストを衚瀺したい堎合もあれば、20のリストを衚瀺したい堎合もありたす。



各芁玠から次の芁玠ぞの遷移の平均確率を取埗できればいいのですが、十分なデヌタがあり、少し簡単です。



任意の人が任意の劥圓なNの長いN個の芁玠のリストを調べる機䌚があるず仮定したす。その埌、完党な確率匏を䜿甚しおP Nの倀を平均できたす。぀たり、 P Nはオヌディ゚ンスのその郚分の成功確率の平均倀を意味したす長さNのリストをスキャンしたした。 甚語では、次のようになりたす。









粟床ずは異なり、 AUC倀は、より珟実的な条件での個人的な掚奚リストの成功の平均確率を掚定したす-泚目が䞍均䞀に分散しおいる生きおいる人々によっおリストが衚瀺される堎合。 AUC倀を取埗するために、 N rec 掚奚リストのサむズに察するP Nrec  precision 倀の䟝存性を䜿甚したこずに泚意しおください。これは少し前に修正したした。



AUCずは䜕ですか



AUCずいう甚語は、 リコヌル積分による粟床 も指したす。これは、分類子の品質指暙ずしお䜿甚されるこずもありたす。



私たちが行った合蚈は、ある意味でそのようなメトリックの類䌌物です。Nrecの異なる倀を䜿甚しお、 Recallの異なる倀をモデル化したす。







これは、ROC曲線を粟密リコヌル座暙でプロットするすでに叀兞的な䟋です。



重みwNの倀をすばやく評䟡する方法は



w Nの倀を掚定するための単玔で広範なモデルがあり、遷移の確率分垃党䜓を凊理するこずはできたせんが、 w Nの倀の質的に正しい動䜜を提䟛したす。









Qモデルの唯䞀のパラメヌタヌは、任意のナヌザヌがリストの次のペヌゞに移動する確率ですペヌゞネヌションWebログから簡単に取埗できたす。 ペヌゞにそれぞれm個の芁玠が含たれおおり、同じ確率pを持぀ナヌザヌが次の芁玠に移動する、぀たり各芁玠に1-pの確率を残すず仮定したす。 pは 、関係Q = p mから簡単に埗られたす。 最初の芁玠が確率1で衚瀺されるず仮定した堎合次に、人がN個の芁玠を芋おから離れる確率w Nが必芁です。蚈算は簡単です。









実隓では、ペヌゞは50個の芁玠で構成され、 Q倀は0.1でした。 Nに察するw Nの䟝存関係は次のようになりたす。









評䟡の䟡倀ず「満足」



これたでのずころ、正の信号の事実のみを䜿甚し、その倧きさがあるずいう事実を無芖したした。 明らかに、この情報を無芖するこずは䞍公平です。 グレヌディングスケヌルが適切に遞択されおいる堎合、信号の倧きさは、平均しお、人の満足床に比䟋する必芁がありたす。









このロゞックに埓っお、珟圚のメトリックで眮き換えたす









...成功カりンタヌ より有益な肯定的なポむントの量









S Nrec-倚くの成功した評䟡、぀たり、 。 スケヌルのプラス郚分は6ポむントで始たるため、䟿宜䞊すべおのrレヌティングから5を匕きたす。



なぜこれを行うこずができたすか メトリックにおけるプラスのポむントの圹割を少し異なる方法で想像するこずができるためです。









これは、 N recの長いリストを衚瀺する芖聎者の平均正のスコアです。 たた、長さの異なるリストがほが同じ人によっお衚瀺されるず想定したため、メトリックの増加は、すべおのナヌザヌのボトムが原因でリストのトップの平均スコアを増加させるアルゎリズムの胜力にのみ䟝存したす。



成功の確率ず成功の堎合の平均スコアの積は、掚奚アルゎリズムが達成できる満足床の合蚈ず呌ぶこずができたす。 ぀たり、メトリックは玔粋に確率論的な解釈を倱いたすが、珟圚の目暙にはより適しおいたす。  AUC rの数倀は任意であるこずに泚意しおください。実際、これはフィヌドバックのポゞティブポむントの特定の数であり、サンプルのサむズ、芖聎者のアクティビティ、遞択したナヌザヌの行動モデルなどに䟝存したす。



2぀の掚奚アルゎリズムが、芁玠の順序がわずかに異なるトップリストを生成したずしたす。 最初のケヌスでは、実際のナヌザヌ評䟡は次のように配垃されたした。









そしお、次のように、









アカりンティングおよび評䟡の倀ず割匕を同時に䜿甚するこずで、 AUC rはそれらを合理的か぀定量的に区別できたす。



長い尟ず短い頭



映画は、他のメディア補品ず同様に面癜い特城を持っおいたす人気による芁玠の分垃は非垞に䞍均䞀であり、倚くの人々に知られ評䟡されおいる映画はほずんどありたせん-これは短い頭であり、倧倚数は比范的少ないこずが知られおいたす-これは長い尟です。



たずえば、imhonet評䟡の分垃は次のようになりたす。









この分垃は短いヘッドの点で非垞に急峻であるため、信号の合蚈では、そこからのフィルムが支配的であり、メトリックぞの寄䞎の80以䞊を䞎えたす。 これにより、数倀が䞍安定になりたす。 短い頭から数個のオブゞェクトのみが䞊䜍に衚瀺されるようになるず、メトリックの倀が劇的に倉化したす。



あなたの奜奇心に先立ち、グラフの短頭郚分の特城は察数座暙で修正できるこずに泚意しおください







このような座暙は、たずえば、自然蚀語の単語の頻床分垃を蚘述するために䜿甚されたす。



掚奚システムの目暙は効果的な個人化であるこずを思い出しおください。 圌女は確かにスキルに関連付けられおいたす

ロングテヌルからアむテムを遞択したす。 ショヌトヘッドの芁玠は䞀般に誰にでも知られおいたす。぀たり、掚奚事項に含める必芁はほずんどありたせん。





したがっお、堅牢な゜リュヌションは、メトリック内の短いヘッドの重量を単玔に枛らすこずです。 正しく行う方法は 実際には、メトリックの問題から始たりたす。数倀の䞍安定性は必然的に感床の䜎䞋に぀ながりたす。 メトリックが区別し、その䞭で最倧の感床を達成する必芁があるテストケヌスをシミュレヌトしたす。 基準点ずしお、サンプルからナヌザヌに぀いお䜕も知らない状況を取り䞊げたす。 その堎合、掚奚事項の個人リストはすべお同じになり、映画の評䟡に察応したす。 この映画の評䟡を䜜成するために、評䟡党䜓に基づいお蚈算された映画が高く評䟡される単玔な確率を䜿甚したす。 たずえば、映画の任意のレヌティングが5ポむントを超える可胜性がありたす。









蚈算に぀いおは、もちろん、ラプラスルヌルに埓っおこの確率を修正したす。そしお、掚定倀を考慮するこずができたす。



幞いなこずに、評䟡に加えお、サンプルでは、​​性別、幎霢、奜きなファンタゞヌ、たたはその逆など、アンケヌトで瀺すさたざたな远加情報をナヌザヌに぀いお知っおいたす。 たずえば、性別はわかっおいたす。 次に、1぀の䞀般的な2぀の異なる掚奚リストの代わりにビルドできたす。 ベむズ確率匏を䜿甚しおこれを行いたす。









ここでは、基準点Pr> 5の確率が先隓的に機胜したす。 2぀の異なる掚奚リストが1぀よりも優れおいるため、メトリックの倀の増加を期埅する暩利がありたす。







盞察的な増加を評䟡する方が䟿利です。









ムヌビヌの蚭定に䞍可欠なナヌザヌに関する他の情報を䜿甚する堎合も、メトリックの増加が発生するはずです。 ゲむンが倧きいほど、この情報に察する感床が高くなりたす。 セックスに関する特定のケヌスに関心がないため、再トレヌニングしないように、芖聎者を分割するさたざたな方法でAUCの増加を平均したす。 この実隓では、アンケヌトのナヌザヌの回答を40の異なる質問に䜿甚したした。



次に、最適化タスクがどのようなものかを曞きたしょう。これにより、必芁なメトリックが芋぀かり、最適な感床が埗られたす。 基本的な考え方は短い頭からのアむテムの重量を枛らすこずであるこずを思い出しおください。 芁玠の短頭ペナルティの原因ずなる関数はσで瀺されたす。 最倧の感床を提䟛する関数σが必芁です。









ここで、 Gはオヌディ゚ンスセグメンテヌションメ゜ッドのセットであり、セグメントに察応する掚奚蚈算がありたす。



効果的であるこずが刀明した単玔な実隓では、 σずしおステップ関数シグモむドの近䌌を䜿甚したした。これは、 短い頭の重みを単玔にれロにしたす。





これは、最適化の問題









単䞀のパラメヌタヌσに぀いお解く必芁がありたす。このパラメヌタヌは、評䟡の数で゜ヌトされたフィルムのリスト内のステップの䜍眮を決定したす。 たずえば、最適化䞭に起こったこずは次のずおりです。





巊偎-芁玠が倚すぎたす。 右偎-誰も眰金を科されたせん。 最適な䜍眮40枚のフィルムに埮調敎で、メトリックの感床は〜20向䞊したす。



芁玄蚈算匏



䞊蚘のすべおのロゞックを考慮したメトリックの最終圢匏を瀺したす。 AUC rメトリック





次のように蚘述できたす。











ここで別の興味深い点に泚意したす。 評䟡のあるすべおのナヌザヌは、 AUC rの匏を等匏で入力したす。 ただし、評䟡尺床をさたざたな方法で䜿甚できる堎合もありたす。倚くの人が高い点を付けたり、逆の堎合もありたすが、高い点を䞎えるこずはめったにありたせん。 これは、メトリックでr掚定倀の盎接倀を䜿甚するず、2番目のナヌザヌからの寄䞎が枛少するため、最初のナヌザヌからの寄䞎が高くなるこずを意味したす。 方法は、さたざたなタむプのナヌザヌが行った評䟡が比范可胜な正芏化されたスケヌルを導入するこずです。 しかし、実際には、倧きなサンプルで䜜業する堎合、この効果は無芖できるこずが刀明したした。 䞻な理由は、スケヌルの䜿甚タむプが個人の嗜奜ず盞関しないため、 AUC rの蚈算時に発生する聎衆党䜓の平均化は、正芏化スケヌルの䜿甚ず同じ効果があるためです。



いく぀かのケヌススタディ



メトリックを䜿甚した実甚的な䟋を次に瀺したす。 imhonet.ru掚奚システムの機械孊習モデルを䜿甚したした。アプリケヌションの詳现はここでは省略したす。タヌゲットメトリックがAUC rである問題を解決した結果を単に瀺したす。 掚奚システムの特定の問題は、コヌルドスタヌトの問題です。 次の2぀のタむプがありたす。





評䟡を䞎える人が倚いほど、圌の掚奚事項のリストはより正確になりたす。 この䟝存性赀い線を、党䜓的な評䟡を䞎えるメトリック倀 AUC 0 、黒い線ず、 性別ず幎霢のみを䜿甚しお掚奚事項を䞎えるずきのレベルオレンゞ色の線 ず比范したす。







性別ず幎霢に関する情報は、5぀の評䟡ずほが同じです。



アンケヌト。 普通の人が芁玠の評䟡の圢で奜みをすぐに定匏化するこずは必ずしも容易ではないので、初心者には「アニメが奜きですか」、「アクションが奜きですか」などの簡単な質問に答えるこずをお勧めしたす。 この目的のために、私たちはそのような質問を数癟件提起したした。 それらの䜿甚が䜕をもたらすかを芋おみたしょう







質問はそれほど有益ではありたせんが、数倀による評䟡をするよりも答える方がはるかに簡単なので、ただ有益です。たずえば、10の評䟡は25の答えに盞圓したす。



別のセクションからの掚奚プロファむル。人は、別のセクションの芁玠の評䟡からプロファむルをすでに線集しおいるこずがありたす。異なるセクションの蚭定に関連がある堎合は、それを䜿甚しおみるこずができたす。この䟋では、アヌトブックの評䟡のプロファむルに぀いお、映画の掚奚事項を瀺しおいたす。







質問を䜿甚するよりも悪い結果になりたすが、特定の効果を修正できたす。



ノベルティ。ナヌザヌが補品の評䟡を開始する前に、新しい補品の掚奚を開始できるようにするためには、非垞に必芁です。これは、映画に関する発信デヌタに基づいおのみ実行できるこずは明らかです。掚奚システムでは、掚奚に重芁な圱響を䞎える映画の特性は次のずおりです。





このメタデヌタにより、「良い」ナヌザヌ初心者ではないが既に27の評䟡を䞎えおいるかのように映画の掚奚を開始できたす。







これは悪くありたせん。



ご枅聎ありがずうございたした



All Articles