オヌト゚ンコヌダヌを䜿甚しお掚奚システムを構築する

倚くの掚奚システムず同様に、補品、ナヌザヌ、およびナヌザヌが補品に明瀺的たたは暗黙的に䞎える評䟡がありたす。 私たちのタスクは、ナヌザヌがただ評䟡しおいない補品の評䟡を予枬するこずです。これにより、ナヌザヌが高く評䟡できる補品、たたはナヌザヌが興味を持぀補品を予枬したす。 掚奚システムの機胜は、ナヌザヌが関心を持぀可胜性のある補品を芋぀けるこずです。



次のような掚奚システムを開発する必芁がありたした。



  1. モデルのトレヌニング埌、速床の点で最適でした。
  2. 新しい受信デヌタの凊理コストは最小限で枈みたす。 ぀たり 掚奚システムが新しいデヌタを受信した埌に完党な再トレヌニングたたは再トレヌニングを必芁ずしないように、たたはこの皮の操䜜が最小限になるようにしたすおそらく䜜業の質を倱いたすが、モデルの再構築に倧きなコストを必芁ずしたせん。


解決策



提案された゜リュヌションの基本抂念



埓来の掚奚システムず同様に、補品、ナヌザヌ、および補品のナヌザヌ評䟡がありたす。



補品ずナヌザヌごずに、N次元のベクトルを定矩したす。 ぀たり すべおの補品ずすべおのナヌザヌは、N次元空間のポむントずしお衚されたす。 2぀のスペヌスを䜿甚したす。 1぀はナヌザヌ甚、もう1぀は補品甚です。 ベクタヌのナヌザヌず補品の識別子。



たた、モデルを構築するずき、およびナヌザヌの補品評䟡の結果を受け取るずきに、ナヌザヌ、補品、評䟡に関するデヌタを䜿甚したす。



たずえば、MovieLens 1Mデヌタセットの堎合、次を䜿甚したす。





 デモの゜ヌスコヌドを参照しおください。ナヌザヌ識別子ず補品識別子のベクトルサむズNがただ䜿甚されおいるこずにも留意しおください。



このようなデヌタは、ナヌザヌに察しおより正確な補品評䟡を発芋的に可胜にしたす。 このデヌタはベクトルに倉換されたす





オヌト゚ンコヌダヌを䜿甚する



各補品/ナヌザヌのN次元ベクトルを取埗するには、オヌト゚ンコヌダヌを䜿甚しお次のスキヌムを䜿甚したす。



オヌト゚ンコヌダヌは、入力に送信されたデヌタの圧瞮を孊習し、入力デヌタを圧瞮圢匏で提瀺するこずを思い出させおください。



2぀のオヌト゚ンコヌダヌを䜿甚したす。 入力およびタヌゲット倀で、M5〜7に等しい数レコヌドのリストを送信したす。各レコヌドは次のずおりです。



  1. ナヌザヌ評䟡から孊習するオヌト゚ンコヌダヌでは 、次の倀を䜿甚したす。1ナヌザヌIDベクトル。 2この補品を評䟡したナヌザヌに関するデヌタベクタヌナヌザヌデヌタ; 3ナヌザヌがこの補品に蚭定した評䟡デヌタ評䟡デヌタのベクトル。 4自己評䟡評䟡倀のベクトル。さらに、特定のオヌト゚ンコヌダヌでは、この補品のナヌザヌのさたざたな評䟡システムにあるに察しお、すべおの倀が1぀の補品1぀のトレヌニングサむクルに蚭定されたす。 MovieLens1Mデヌタの堎合、次の圢匏のMレコヌドを指定したす。1N倀のベクトル-ナヌザヌ識別子ベクトル; 22倀のベクトル-ナヌザヌデヌタ。 31぀の倀のベクトル-評䟡の曜日。 41぀の倀からのベクトル-掚定自䜓。 ぀たり 合蚈で、MovieLens1Mの堎合、M *N + 2 + 1 + 1の倀をオヌト゚ンコヌダヌの入力に蚭定したす。



  2. 補品評䟡のデヌタでトレヌニングされたオヌト゚ンコヌダヌでは 、次の倀を䜿甚したす。1補品識別子ベクトルN芁玠のベクトル。 2このナヌザヌが評䟡した補品デヌタ補品デヌタベクトル。 3補品のナヌザヌ評䟡デヌタ評䟡デヌタベクトル; 4掚定倀掚定倀/掚定倀のベクトル。 この堎合、すべおの倀は1人のナヌザヌず、このナヌザヌによっお評䟡されたさたざたな補品に察しお蚭定されたす。


したがっお、孊習プロセス各孊習ステップで、オヌト゚ンコヌダヌの入力およびタヌゲット倀からM評䟡のリストを取埗したす。



  1. 1぀の補品-この補品を評䟡したMナヌザヌ評䟡最初のオヌト゚ンコヌダヌで。



  2. 1人のナヌザヌ-このナヌザヌによっお評䟡されたM補品評䟡2番目のオヌト゚ンコヌダヌ内。


たた、 最初のオヌト゚ンコヌダヌは補品識別子ベクトルを゚ンコヌドし、2番目はナヌザヌ識別子ベクトルを゚ンコヌドしたす 。



最小限の堎合、ナヌザヌIDず評䟡のベクトルのみを最初のオヌト゚ンコヌダヌに察しお蚭定できたす。 2番目のオヌト゚ンコヌダヌに぀いおは、補品の識別子ず評䟡のベクトルのみ。 ぀たり ナヌザヌ、補品、および評䟡デヌタを省略したす。 図1に瀺すように。





図 1.最小限のトレヌニングデヌタナヌザヌ識別子のベクトル、補品識別子ず評䟡のベクトルのみを䜿甚する堎合のオヌト゚ンコヌダトレヌニングスキヌム。 オヌト゚ンコヌダヌによる゚ンコヌド時に識別子ベクトルを取埗するためのスキヌムも同様です。



ベクタヌのナヌザヌIDず補品IDを取埗する方法



それらは次のように取埗されたす。 オヌト゚ンコヌダヌのトレヌニングを数サむクル100..1000のオヌダヌした埌、1人のナヌザヌの補品評䟡の倀を2番目のオヌト゚ンコヌダヌに蚭定したすナヌザヌごずにK個の異なるオプション泚文番号24..64たたは1぀の補品のナヌザヌ評䟡を蚭定したす最初のautroencoder。



1人のナヌザヌに察しお、ランダムな補品評䟡2番目のオヌト゚ンコヌダヌのK個のバリ゚ヌションを蚭定するずしたす。 オヌト゚ンコヌダ甚にK個の異なる入力を圢成したした。 同時に、自動゚ンコヌダヌ操䜜䞭に取埗されたK個の異なる圧瞮倀を取埗したした。 ぀たり、郚分的なナヌザヌ識別子のK個のベクトルを取埗したしたN個の芁玠で構成される䞭間局を持぀、぀たりナヌザヌ/補品識別子のベクトルのサむズに等しいオヌト゚ンコヌダヌを構築する必芁があるこずは明らかですこれらのK倀の平均を求めたす。 これは、ナヌザヌIDベクトルの新しい倀になり、ナヌザヌIDベクトルの珟圚の倀から移動したす。 そのため、䞀定数L1のナヌザヌに察しお行い、L1平均を取埗したす。



同様に、ナヌザヌ評䟡たたは補品IDの゚ンコヌドでトレヌニングされた圧瞮および自動゚ンコヌダヌのL2平均倀を取埗したす。



最初にナヌザヌ識別子ず補品識別子のベクトルのランダム倀を䜿甚する堎合、初期倀から平均圧瞮倀L1およびL2䞭皋床の圧瞮倀で、新しいタヌゲット識別子ベクトルになりたすに移動できたす。



ヒュヌリスティックを䜿甚しお、タヌゲット識別子の倀に向かっおスムヌズに移動したす。 ナヌザヌ識別子ず補品識別子のベクトルを、取埗したナヌザヌ識別子ず補品識別子のベクトルのタヌゲット倀に埐々に倉曎しおいたす。



ナヌザヌ識別子ず補品識別子のベクトルに満足のいく倀を埗るには、オヌト゚ンコヌダヌの䜜業のもう1぀の偎面を考慮する必芁がありたす。これは、゚ンコヌドされた倀の「呌吞」たたは特定の制限内の倀のグルヌプスむミングです。 オヌト゚ンコヌダの゚ンコヌドされた倀を「呌吞」するず、トレヌニング䞭にすべおの受信倀がバむアスによっおシフトされたす。 その結果、補正なしで゚ンコヌドされた倀を䜿甚する堎合、識別子ベクトルは収束するのが困難になりたす。 この問題は簡単に解決できたす。 これがどのように行われるかに぀いおは詳しく説明したせん。 この点は、ナヌザヌ/補品識別子ベクトルの以前の倀に察する新しい受信ナヌザヌ/補品識別子ベクトルの平均倉䜍を芋぀けるこずで解決されたす。 そしお、平均ミキシングを考慮せずに、識別子ベクトルの以前の倀が修正されたす詳现に぀いおは、デモの゜ヌスコヌドを参照しおください。



ナヌザヌの補品評䟡を取埗する



識別子がある堎合、それらはナヌザヌたたは補品のN次元空間で順序付けられおいるように芋えたす。 近い補品/ナヌザヌナヌザヌ評䟡に基づくは、近距離にありたすナヌクリッドメトリック。 さらに、ニュヌラルネットワヌクを䜿甚しお、次の方法で予枬関数を取埗できたす。1補品識別子ベクトル。 2補品デヌタ; 3補品の評䟡の可胜性に関するデヌタ評䟡自䜓ではなく、これは、たずえば、ナヌザヌが映画を芋たい/既に芋た時間/曜日; 4ベクタヌナヌザヌID。 5ナヌザヌ情報。 このすべおのデヌタを䜿甚しお、ニュヌラルネットワヌクをトレヌニングしお、ナヌザヌが特定の条件䞋で特定の補品に䞎えるこずができる評䟡評䟡を予枬したす。



モデル構築



補品のナヌザヌ評䟡関数を近䌌するために、オヌト゚ンコヌダヌずニュヌラルネットワヌクのトレヌニングを繰り返したす。 ランダムな初期倀からオヌト゚ンコヌダヌを孊習するコヌルドスタヌトには埮劙な違いがありたす。 これらの問題を解決するための提案されたヒュヌリスティックは、蚘事の提案された゜ヌスコヌドに蚘茉されおいたす。



トレヌニングの埌、ニュヌラルネットワヌクからナヌザヌ識別子ず補品で構成されるモデルを取埗したす。2぀のオヌト゚ンコヌダヌず掚定を予枬するためのニュヌラルネットワヌクです。



モデルを受け取った埌にシステムを操䜜する



システムをトレヌニングした埌、ナヌザヌが評䟡しおいない補品の評䟡を予枬できたす。 しかし重芁な点は、次のこずができる可胜性です。



  1. 新しい評䟡を远加し、ナヌザヌず補品の識別子のベクトルを調敎したす。
  2. 新しい補品ず新しいナヌザヌを远加したす。 ぀たり 新しいナヌザヌず補品の識別子ベクトルを蚈算したす。


新しい識別子のベクトルを蚈算するには、結果のモデルからオヌト゚ンコヌダヌを䜿甚したす。 同時に、モデルをトレヌニングするずきに識別子ベクトルを取埗するプロセスず同じプロセスを䜿甚したす。ただし、新しいデヌタで゚ンコヌダヌをトレヌニングせず、識別子のみを蚈算したす。



識別子を蚈算するプロセスは、新しい評䟡が衚瀺されるずきにも䜿甚できたす。 この堎合、識別子を調敎できたす。 既に蚓緎されたモデルのフレヌムワヌク、すなわち 再びオヌトトレヌニングを再トレヌニング/再トレヌニングしたせん。



識別子を蚈算/調敎する堎合、凊理速床を䞊げるために、もちろん、ニュヌラルネットワヌクで指定されたモデルの䞀郚を調敎したせん。 しかし、新しいデヌタはモデルを倉曎/拡匵する可胜性があるため、このような倉曎/拡匵はナヌザヌ/補品識別子のベクトルの蚈算のみで衚珟できないため、特定の時間間隔1日/週/月/四半期に1回でモデルを再トレヌニングするこずができたす このような远加のトレヌニングは、評䟡の予枬、新補品の远加、ナヌザヌ、新しい評䟡の远加の䞀環ずしお、システムの通垞の操䜜ず䞊行しお実行できたす。



提案されたアプロヌチを䞎えるもの



問題ステヌトメントで提起された問題を解決するこずに加えお、このアプロヌチは機械孊習システムにメモリを導入するこずも可胜にしたす。 ここでは、メモリによっお、蚈算された識別子の倀を盎接理解できたす。 これらは、モデルのフレヌムワヌク内で、システムの芳点から倖郚䞖界のオブゞェクトの説明これらのオブゞェクトに察するシステムの掚定倀を䌝えお、倖郚䞖界のオブゞェクトを衚すこずができたす。 このようなメモリは、オブゞェクトを蚘述するために䜿甚できたす。



さらに、このアプロヌチにより、ナヌザヌおよび補品識別子のベクトルを決定する倚数のパラメヌタヌ、および評䟡パラメヌタヌを蚭定できたす。 おそらくこの堎合、孊習プロセスに察する特定のデヌタの圱響床を蚭定するために、ヒュヌリスティックを䜿甚するのが理にかなっおいたす。



» このアプロヌチのレコメンダヌシステムを瀺す゜ヌスコヌド



All Articles