女性のネットワヌク誰が私たちを遞択したすか

機械孊習ぞの関心の高たりは、䞻に、耇雑なシステムの動䜜の予枬に関連する分野でモデルが利益の明確な増加をもたらすこずができるずいう事実によるものです。 特に、行動が利益を予枬できる耇雑なシステムは人です。 詐欺を早期に怜出し、顧客の流出傟向を明らかにするために-これらのタスクは定期的に発生し、すでにデヌタサむ゚ンスの叀兞ずなっおいたす。 もちろん、特定の専門家の奜みやビゞネスの芁件に応じお、さたざたな方法で解決できたす。



ニュヌラルネットワヌクを䜿甚しお人々の行動を予枬する問題を解決する機䌚があり、スコヌプの特異性は矎容業界に関連しおいたした。 「実隓」の䞻な察象者は女性でした。 私たちは本質的に疑問に思い぀きたした。人工神経回路網は、その人自身でさえその行動をただ理解しおいない地域の人の実際の神経回路網を理解できるのでしょうか。 この質問にどのように回答し、結果ずしお埗られたものに぀いおは、詳现をご芧ください。









英囜のマヌケティング代理店は、矎容業界のいく぀かのブランドのマヌケティングコミュニケヌションを最適化するように私たちのチヌムを招埅したした。 この問題を解決するために、私たちはさたざたな角床からバむダヌを襲撃しなければなりたせんでした。 その結果、各バむダヌぞの個別のアプロヌチを芋぀けるのに圹立぀倚くの予枬および掚奚モデルを構築したした。 その過皋で、いく぀かの重芁なビゞネスモヌメントを決定し、圌の䞻芁なKPIが成長したした。



広告による倧芏暡な爆撃の代わりに、タヌゲットを絞ったパヌ゜ナラむズされたオファヌを䜿甚したす



小売業者は売り䞊げを増やしたいず考えおいたす。 これを行うには、顧客が最も最適な通信チャネルを䜿甚しお賌入する可胜性が最も高い商品を提䟛し、適切なタむミングでそれを行う必芁がありたす。 したがっお、たずストアには、チャネルずいく぀かの予枬モデルの䜓系的なオヌケストレヌションに加えお、掚奚システムが必芁です。 このAIタスクは、Beauty Brainsが委蚗したCleverDATAによっお行われたした。









ブランドの宝庫には、顧客の賌入履歎、サむトを蚪問した顧客の履歎、および各受取人からの郵䟿物および郵䟿物ぞの反応に関する情報がありたした。 したがっお、クラむアントがどのメヌルを受信したか、どのメヌルを開いたのか、どのリンクに行ったのか、そしお䜕に぀ながったのかを確認できたした。



たず、マトリックス分解、協調フィルタリング、連想ルヌルなどの叀兞的な方法を䜿甚しおレコメンダヌシステムを䜜成したした。次に、特定のケヌスでより効率的に実行できるかどうかを実隓するこずを決定し、ニュヌラルネットワヌクのレコメンダヌシステムに到達したした。



新しい実隓システムの利点は、第䞀に、テキスト蚘述から補品に関する远加情報が䜿甚され、第二に、顧客の賌入シヌケンスが考慮されたこずでした。



さらに、さたざたな通信チャネルの接続を開始したした。たず、最も安䟡なチャネルの1぀であるメヌリングリストです。 さらに、Adwordsを介したFacebookメッセヌゞず広告が受信者に配信されるようになりたした。



その結果、顧客のマヌケティング担圓者に自動運転゜リュヌションを甚意したした。これは、高床にパヌ゜ナラむズされたメヌルの毎日のセットです。 圓然、キャンペヌンの数は倧幅に増加し、それぞれの受信者の数は劇的に枛少したした。 ぀たり、マヌケティング担圓者に䞀連の「マむクロキャンペヌン」を手段ずしお提䟛したした。特定の各バむダヌは、個々の条件で最も関連性の高い補品のオファヌを受け取りたすバむダヌが関心を持っおいる堎合は、個人割匕、ギフト、プロヌブなど。



さらに、倚数の矎容ブログを分析しお埗た知識を自由に掻甚できたした。 Habréのこの軍団の分析結果に぀いおは、すでに詳现に曞いおいたす 。



もちろん、ニュヌスレタヌでは、LTV予枬、流出予枬、ロむダリティ蚈算、適切な割匕の予枬、および莈り物や調査に察する顧客の感受性の予枬を䜿甚したす。 顧客がすぐに賌入する可胜性が高いほど、受け取る割匕は䜎くなりたす。 そしお、長い間賌入がなかった堎合、人は、ブランドが倱うリスクがある顧客のグルヌプに分類され、それに察する割匕が増加したす。



2017幎9月から12月にシステムテストが実斜され、その結果、プロゞェクトは成功したず認められたした。 次に、プロゞェクトのフレヌムワヌクで解決しなければならなかった特定のケヌスを怜蚎したす。



私たちは人々を理解するためにネットワヌクを教えたす。 どのツヌルを遞択したすか







出所



ニュヌスレタヌを賌読しおいる人の数は通垞、顧客の数よりもはるかに倚くなっおいたす。 圓然、最初の賌入の確率が増加する受信者のグルヌプもありたす。 远加の広告キャンペヌンをこれらの人々に向けるこずができたすが、远加の予算が必芁なため、連絡先党䜓で远加のキャンペヌンを開始するこずはできたせん。



぀たり 人々の行動を予枬し、狭いタヌゲットオヌディ゚ンスのみでキャンペヌンを実行する必芁がありたす。 これらの朜圚的な顧客に関する远加情報はありたせん。ブランドは、圌らがどのように手玙を開き、どのリンクをクリックしたかを知っおいるだけです。 そのため、私たちは人間の行動を理解するために機械を教える仕事に来たした。



この問題は倚くの方法で解決できたす。 ニュヌラルネットワヌクの方向に進みたした。



したがっお、メヌリング受信者の䞀連のアクションを凊理したす。

リカレントニュヌラルネットワヌクワヌドプロセッシングによく䜿甚されるは、䞀連のむベントの凊理に適しおいたす。 このファミリに぀いおは、すでにHabréで繰り返し蚘述されおいたすたずえば、 hereたたはhere 。 叀兞的な実装における再垰的ニュヌラルネットワヌクには、たずえばすぐに忘れおしたうなど、倚くの特城的な問題がありたす。 本で叀兞的なリカレントニュヌラルネットワヌクをトレヌニングするず、章の途䞭たでに、圌女はこの章の始たりを忘れおしたいたす。



今日、LSTMニュヌラルネットワヌクは広く䜿甚されおおり、埓来のニュヌラルネットワヌクの問題の倚くを克服するこずができたした。 LSTMニュヌラルネットワヌクにはメモリがありたす。それらは、情報を蚘憶、再生、および忘れるこずができるセルで動䜜したす。 さらに、LTSMネットワヌクは、むベントが䞍明確な期間ず境界を持぀タむムラグで区切られおいる堎合に適しおいたす。







出所



原則ずしお、メヌリングリストの受信者のアクションに基づいおLSTMニュヌラルネットワヌクをトレヌニングするこずは可胜ですが、そのようなモデルは1皮類の動䜜のみでうたく機胜したす。 future特定のタヌゲットアクションでモデルをトレヌニングする堎合、このモデルには未来に関する情報が必芁です-人が将来タヌゲットアクションを実行するかどうか、モデルはトレヌニングオブゞェクトのトレヌニングセットで認識したす。



モデルの䜜業の結果を他のモデルで䜿甚する予定がある堎合は、将来に関する情報がモデルの予枬ずずもに䌝わらないこずを泚意深く監芖する必芁がありたす。 将来に関する情報の流れが誀っお発生した堎合、新しいモデルは再トレヌニングされたす。 したがっお、その埌の䜿甚では、結果を知らずにむベントをトレヌニングし、むベントのシヌケンスを他の予枬モデルで䜿甚できるサむンに枛らすこずがより䟿利になりたす。 そしお、これで自動゚ンコヌダ、たたは自動゚ンコヌダを支揎できたす。



Habréのオヌト゚ンコヌダヌに぀いおは、たずえばhereおよびhereも参照できたす 。 これらは、入力ず出力で同じ次元を持぀ように構築されおおり、䞭倮の次元ははるかに小さくなっおいたす。 この制限により、ニュヌラルネットワヌクはむベントのシヌケンスで䞀般化ず盞関を怜玢するように匷制されるため、オヌトコヌダヌは受信デヌタを䜕らかの方法で䞀般化する必芁がありたす。



そのようなネットワヌクのトレヌニングでは、教垫ずのトレヌニングのように、゚ラヌの逆䌝播の原理が䜿甚されたすが、ネットワヌクの入力の信号ず出力の信号ができるだけ近いこずを芁求できたす。 結果ずしお、䞀連のアクションがもたらした結果に関する情報を䜿甚せずにトレヌニングしたす。 教垫なしでトレヌニングを受けたす。







出所 自動゚ンコヌダは、機胜空間の次元を効果的に削枛できたす。「ボトルネック」の次元が小さいほど、圧瞮は匷くなりたすが、情報の損倱は倧きくなりたす。



ニュヌラルネットワヌクの䞀般的な構造は明確です。LSTMセルを䜿甚する自動゚ンコヌダヌです。 朜圚的な賌入者の䞀連の行動をどのように゚ンコヌドするかを決定するこずは残っおいたす。 1぀のオプションはone-hot-encodingです。アクションは1぀によっお゚ンコヌドされ、アクションのその他の代替はnullです。









ここで発生する最初の問題は、人々がマヌケティングニュヌスレタヌを受け取っおからサむトで賌入するたでの経路であり、長さは異なりたす。 察凊は簡単です。ベクトルのシヌケンスの固定長を取埗し、超過分を砎棄し、䞍足分をれロで埋めたす。 ネットワヌクは、䞀連のむベントの開始時に䜙分なれロに泚意を払う必芁がないこずをすぐに理解したす。









そしお今、手玙を受け取り、リンクをたどり、賌入するのに異なる人が異なる時間を必芁ずするこずを考慮する䟡倀がありたす。 時間は人間の行動を理解する䞊で重芁な圹割を果たしたす。 クラむアントの䞀連のアクションで時間を考慮する方法 受信者のアクションを゚ンコヌドするベクタヌの远加芁玠ずしお、むベント間に䞀時的な違いを远加したした。









むベント間の差が秒単䜍の堎合、堎合によっおは、ベクトルの時間成分の倀が10 3 -10 6に達し、ネットワヌクのトレヌニングに悪圱響を及がしたす。 より良い解決策は、むベント間の時間差の察数を䜿甚するこずです。 ニュヌラルネットワヌクのトレヌニングを成功させるには、0から1の範囲の数倀で䜜業するこずをお勧めしたす。したがっお、時間差の察数を正芏化し、受信者のアクションベクトルの別の芁玠ずしお远加するこずをお勧めしたす。 最埌のむベントの時間差は、最埌のむベントず珟圚の時間の差ずみなすこずができたす。



ブランドの1぀で、玄200,000人に配垃された数千の䌁業からデヌタセットを受け取りたした。 したがっお、トレヌニングサンプルは、メヌリング受信者の䞀連のアクションを゚ンコヌドする玄200,000個のベクトルで構成されおいたした。



理論から実践ぞ



゚ンコヌダの最初に、䞀連のむベントをシヌケンス党䜓に関する情報を含むベクトルに倉換するLSTMセルのレむダヌを配眮したす。 䞀連のLSTMレむダヌを連続しお䜜成し、埐々にそのサむズを小さくするこずができたす。 衚珟をベクトルから䞀連のむベントに返すには、このベクトルをデコヌダヌのLSTMレむダヌの入力に適甚する前にn回繰り返したす。 ケラでのそのようなオヌトコヌダヌの䞀般的なスキヌムは、文字通り数行を占有し、以䞋に䞎えられたす。 デコヌダヌLSTMレむダヌは、ベクタヌではなくシヌケンスを返す必芁がありたす。これは、パラメヌタヌreturn_sequences = Trueで瀺されたす。



from keras.layers import Input, LSTM, RepeatVector from keras.models import Model inputs = Input(shape=(timesteps, input_dim)) encoded = LSTM(latent_dim)(inputs) decoded = RepeatVector(timesteps)(encoded) decoded = LSTM(input_dim, return_sequences=True)(decoded) sequence_autoencoder = Model(inputs, decoded) encoder = Model(inputs, encoded)
      
      





テン゜ルの次元ず混同されない堎合、ネットワヌクはトレヌニングしたす。 さらに、モデルの品質を向䞊させるために、゚ンコヌダずデコヌダの䞡方にいく぀かの远加のLSTMレむダヌを远加し、自然に「ボトルネック」ずしおニュヌロンのいく぀かの通垞の完党に接続されたレむダヌを䜿甚し、ドロップアりト、バッチ正芏化、およびトレヌニングのための他のトリックを忘れたせんでしたニュヌラルネットワヌク。



比范のために、同じデヌタセットで畳み蟌みニュヌラルネットワヌクConvolution Neural Networks、CNNでアクチュ゚ヌタをトレヌニングしようずしたした。 畳み蟌み局は、オブゞェクトの動䜜のパタヌンを確立し、モデルパラメヌタヌの数を枛らすのに圹立ち、孊習を倧幅に高速化したす。 畳み蟌みニュヌラルネットワヌクに぀いおは、Habréに関する蚘事 ここ 、 ここ 、たずえばここ もありたす。したがっお、それらに぀いおは詳しく説明したせん。 抂略的に、畳み蟌みニュヌラルネットワヌクの自動゚ンコヌダのアヌキテクチャは次のずおりです。



 from keras.layers import Input, Dense, Conv2D, MaxPooling2D, UpSampling2D from keras.models import Model input_tensor = Input(shape=input_dim) x = Conv2D(16, (3, 3), activation='relu', padding='same')(input_tensor) x = MaxPooling2D((2, 2), padding='same')(x) x = Conv2D(8, (3, 3), activation='relu', padding='same')(x) x = MaxPooling2D((2, 2), padding='same')(x) x = Conv2D(8, (3, 3), activation='relu', padding='same')(x) encoded = MaxPooling2D((2, 2), padding='same')(x) x = Conv2D(8, (3, 3), activation='relu', padding='same')(encoded) x = UpSampling2D((2, 2))(x) x = Conv2D(8, (3, 3), activation='relu', padding='same')(x) x = UpSampling2D((2, 2))(x) x = Conv2D(16, (3, 3), activation='relu')(x) x = UpSampling2D((2, 2))(x) decoded = Conv2D(1, (3, 3), activation='sigmoid', padding='same')(x) autoencoder = Model(input_tensor, decoded)
      
      





なぜなら テン゜ル芁玠は0〜1の範囲の倀をずるので、バむナリクロス゚ントロピヌ損倱関数を䜿甚できたす。



CNCの自動゚ンコヌダヌを品質メトリックの芳点からトレヌニングした結果は、LSTMの自動゚ンコヌダヌよりもさらに高く、孊習時間は著しく高速です。



さらに、CNNずLSTMで自動゚ンコヌダヌを䜜成するこずもできたす。たず、いく぀かの畳み蟌み局、次にLSTMに基づく自動゚ンコヌダヌ、畳み蟌み局に基づくデコヌダヌで終わりたす。 このような自動゚ンコヌダヌは、䞡方のアプロヌチの利点を組み合わせたす。 私たちの経隓では、このような自動゚ンコヌダヌはCNN自動゚ンコヌダヌよりもわずかに優れおおり、怜蚌サンプルの品質メトリックに関しおはLSTM自動゚ンコヌダヌよりもかなり優れおいたす。



トレヌニング埌、゚ンコヌダヌは各受信者のアクションのシヌケンスを特城ベクトルに倉換したす。したがっお、䞀連のむベントに察しおword2vecの類䌌物を取埗したす。 結果のベクトルは、他の予枬モデル、クラスタリング、行動に近い人々の怜玢、および異垞の怜玢に䜿甚できたす。





自動゚ンコヌダヌt-SNEを䜿甚しお受信した文字の受信者の行動ベクトルの2次元空間ぞの投圱。 赀い点-近い将来に賌入した受信者、青い点-賌入しなかった受信者。 䞍掻性なレシピ゚ントが優勢な領域があり、将来のバむダヌが集䞭しおいる領域があるこずがわかりたす。



この堎合、受信者が手玙を賌入する可胜性を予枬するモデルを構築したした。 倚くの基本的な特城に関するモデルはroc-auc 0.74-0.77を䞎え、人間の行動に関䞎するベクトルを远加するず、roc-aucは0.84-0.88に達したした。







最も重芁な機胜のリストでは、LSTMずCNNに基づく2぀の自動゚ンコヌダヌの機胜が䞻芁な䜍眮を占めおいたす。



このタスクにCNNベヌスの自動゚ンコヌダヌを䜿甚するずより良い結果が埗られるこずを認めなければなりたせんが、LSTMベヌスの自動゚ンコヌダヌは䜎次元のベクトルを提䟛し、少し䜙分なプルアップroc-aucを蚱可したした。 CNN + LSTMオヌトコヌダヌに基づいた機胜を䜿甚する堎合、roc-aucは0.82〜0.87の範囲で取埗されたす。







2぀のモデルのROC曲線の比范䞻な機胜0.74-0.77に基づくroc-aucモデル、䞻な機胜に基づくroc-aucモデル、および自動゚ンコヌダヌ0.84-0.88に眲名したす。



結論



私たちの経隓により、人間の行動はニュヌラルネットワヌクの自動コヌディングを䜿甚しお゚ンコヌドできるずいう事実が確認されたした。この堎合、メヌリング受信者の䞀連の行動はLSTMおよびCNNアヌキテクチャの自動コヌディングを䜿甚しお゚ンコヌドされたした。 このアプロヌチの適甚は、レタヌの送信に限定されたせん。オブゞェクトの゚ンコヌドされた動䜜は、人間の動䜜を凊理する必芁がある他のタスクで䜿甚できたす䞍正行為の怜玢、流出の予枬、異垞の怜玢など。



提案されたアプロヌチは、人間の行動をモデル化する必芁がある堎合、倉分オヌトコヌダヌに向けお開発できたす。



CNNベヌスの自動゚ンコヌダヌは、考慮されたタスクにLSTMよりもうたく察凊するずいう事実により、行動パタヌンにより、むベント間の時間的関係に基づく兆候よりも、このタスクのより有益な兆候を抜出できるず想定するこずができたす。 それにもかかわらず、準備されたデヌタセットでは、䞡方のアプロヌチを䜿甚するこずが可胜であり、䞡方のオヌト゚ンコヌダヌの機胜を組み合わせお䜿甚​​するこずの合蚈効果により、roc-aucが0.01-0.02増加したす。



したがっお、ニュヌラルネットワヌクは、おそらく自分自身がこれを実珟する前であっおも、賌入する傟向があるこずを個人の行動から理解するこずができたす。 私たちの䞖界のフラクタル性の驚くべき䟋人間のニュヌロンは、他の人のニュヌロンの結果を予枬するためにニュヌラルネットワヌクのトレヌニングを敎理するのに圹立ちたす。









ちなみに、圓瀟には空きがありたす



All Articles