10,000いいね

1月の初め、 コインと私はロンドンの寒く雨の多い通りをさまよい、技術、生活、その他について話しました。 時々、古いCanon EOS 400Dで写真を撮りましたが、ある時点で友人が「ここで写真を撮って、写真を撮って、誰もあなたの写真が好きではない」と言いました。 答えを見つけることができませんでしたが、家に戻ったときに、ソーシャルネットワークの1つでアカウントを作成して、写真を投稿したり、いいねしたりすることができます。 その後、彼は数百の興味深い写真を選択し、最初の写真を投稿しました。 そして、ほんの数人が彼女を好きになりました。 これでは十分ではなく、何らかの方法を考え出す必要がありました。







サブスクライバーの数を増やすには、注意する必要があります。 これはさまざまな方法で実行できますが、最も簡単で実行可能なのは、誰かに登録して、その人が見返りに同じことをすることを期待して彼の写真を楽しむことです。 2つの理由でこれを行うのは無意味ではありません。スパムに非常に似ていることと、そのようなアクションの数に制限があることです。 したがって、サインインする可能性のある人だけをフォローする方法を理解する必要がありました。



最初にランダムに2〜3千人を購読し、その後、テーブルのユーザープロファイルにある3つの数字を書き留めました。投稿数N p 、サブスクリプション数N fおよびサブスクライバー数N fdです。 表の最後の列Mに 、ユーザーが応答して自分にサブスクライブしたかどうかに関する情報を入力しました。



次のように思えた。



  1. 人が多いほど、ユーザーはすぐに私をフォローします。
  2. 投稿数に対する購読数の比率が大きいほど、ユーザーは早く私を購読します。 (投稿が多いほど、アカウントは古くなります。アカウントがずっと前に作成され、サブスクリプションが少ない場合、ユーザーは他のユーザーのサブスクライブに興味がありません。)
  3. 購読者数に対する購読者数の比率が大きいほど、ユーザーはすぐに購読します。 (観察によると、この数はショップ、ボット、有名人などでは小さく、普通の人では1に近いことがわかります。)


可視化実験により、対数座標ではすべてがより良く見えることが示されました。 点群は強く交差しますが、何らかの分類器を作成して、何が起こるかを見ることができます。







サポートベクターメソッドを使用して、次の線形分類器を取得しましたが、これは予想と一致しています。



–0.19 log N fd + 0.42 log N f -0.18 log N p > 0.57。



その後、物事はさらに楽しくなりました。つまり、約4分の1から5分の1ずつ戻ってきてくれました。 しかし、これは私が望んでいた結果ではありません。 もっと良いものを考え出す必要がありました。



上記の3つの数値に加えて、他の情報を抽出するのに時間を浪費したくなかったので、これらのパラメーターをもう一度見ると3日でどうなるかと思いました。



再びデータを入力すると、これらの値のさまざまな組み合わせで遊ぶようになりました。 そして、1つの要素を追加するだけで非常に良い結果が得られることがわかりました-アカウントのサブスクリプションの数がどれだけ増加したか。 3日間でより多くの人が人をフォローするほど、彼が私をフォローする可能性が高くなります。



ここではすべてが対数のほうが優れているため、最終的な新しい要素は次のようになります。



\ log _ {+}(x)= \ left \ {\ begin {array} {ll} \ log x、&x> 0、\\ 0、&x \ leq 0. \ end {array} \ right。



このような関数は、負の値の対数に関する問題を回避します。 また、サブスクリプションの数が減っている人は、おそらく私たちにとって興味深いものではありません。







サポートベクターメソッドは、次の線形分類器を提供します。



-0.06 log N fd + 0.17 log N f -0.10 log N p + 0.16 log +N ' f - N f )> 0.55



私たちに従う人を購読しないときの間違いは私たちにはあまり興味がないので、結果をさらに改善するために不平等の右側をわずかに増やすことができます。 その結果、約1秒ごとにサブスクライブしてくれました。



以下は、2つの結果の分類器のROC曲線です。







87日後、10,000人の加入者を獲得したので、私はやめました。 最後の15の投稿のいいねの平均数は490に等しく、これは私が目指していた数とほぼ同じでした。 いいね!の数ではなく、サブスクライバーの数を最大化したことを考えると、特にこのようなアカウントの平均値に近いため、この結果は悪くないと思います。



4番目の要因は、この実験で私にとって最も興味深いものであることが判明しました。3日間のサブスクリプション数の変化です。 非常にシンプルであると同時に、予想外に非常に重要であることが判明しました。



All Articles