ソーシャルネットワークでの広告の感染性の分布

ソーシャルネットワークの開発の事実により、エージェント間の距離がなくなり、2つのエージェント間の接続が偶発的に発生する可能性が高くなるため、エージェントへの情報の感染がますます容易になります。 したがって、感染がどのように広がるかを予測する能力の問題が重要になります。



また、最初は生物学でネットワーク内の感染の広がりを予測する必要が生じましたが、この問題は経済を含めて存在します。 結局のところ、たとえば、企業がソーシャルネットワークを介して何らかのノベルティを広めたい場合(この情報を拡散する方法は、ソーシャルネットワークの積極的な開発が始まって以来、最も人気のある方法の1つです)、正しく感染するためには、時間とともに感染がネットワーク上をどのように進むかを理解する必要があります製品情報を広めるための最小限の費用で大使を選ぶ。 したがって、ネットワーク予測モデリングは、経済主体のネットワークに関しても需要があります。



次に、例としてFlickrネットワークを使用した感染拡大モデルの実用的なアプリケーションを示します。 このために、最も一般的で実用的な2つのモデル、SI(疑い-感染)とSIR(疑い-感染-回復)が実装されます[1]、[5]。



FlickrネットワークでのSIモデルの実装



Flickrの写真ホスティングを使用して広告したい製品を生産しているとしましょう。 これを行うために、一定数のユーザーに「感染」させ、商品のプロフィール写真に対応するハッシュタグを付けて公開する権利を購入します。 あるエージェントから別のエージェントへの感染の転送は、ハッシュタグ転送と呼ばれます。



「健全な」ネットワークメンバー(感染しやすい)、および最初に製品に「感染」した(感染した)メンバーがあることを考えると、ネットワーク上でのウイルスの分布モデルは、SI流行の分布モデル(特定の感染確率t)で説明できます。 e。広告に対する個人の影響度の尺度[3]、およびSIRモデル(個人が製品を購入するという考えで「病気になり、広告の影響を受けなくなったとき」)[4]。



SIモデルの場合を考えます。 簡単にするために、最初にネットワークの1つのメンバーに感染できると仮定します。 次に、マネージャーのタスクを削減して、ネットワーク内の反復的な変化を観察することができます(つまり、選択した時間間隔で、段階的なネットワーク状態が現在の情報に基づいて次の瞬間に予測されます)。 したがって、接続された巨大なコンポーネントでユーザーを感染させることにより、感染の広がりがどのように進行するかを段階的に観察できます。 また、SIモデルの特性により、i番目のステップで巨大な接続コンポーネントを結合する頂点は、遅かれ早かれ感染します。



たとえば、ネットワークが機能し始めてから数か月後に、Flickrネットワークグラフの巨大なコンポーネントを作成してみましょう(図1)。



画像

図1 Flickrネットワークの巨大な接続コンポーネント



明らかに、広告キャンペーンの最終的な指標は、「感染した」ネットワークエージェントの割合であるべきです。 SIモデルの場合、これは単にグラフ全体の巨大な連結成分の頂点の割合になります。 Flickrネットワークのいくつかのスライスを取り上げて、SIモデルを使用していくうちに感染集団の割合がどのように変化するかを見てみましょう(図2)。



画像

図2。 グラフの成長に伴う流行の合計サイズ(感染率)



論理的な結果が得られます。グラフが大きいほど、その接続コンポーネントが大きくなるため、感染したネットワーク参加者の割合が大きくなります。 次に、ネットワーク上の感染拡大のより複雑なモデル、つまりSIRモデルについて考えます。



FlickrネットワークでのSIRモデルの実装



SIRモデルのタイプ別にFlickrネットワークでの感染の広がりを表すために、情報を浸透として広める方法を使用します[2]。



浸透の概念は物理学から来ました。物理学では、材料の混合物を流れる電流の流れを意味します。 感染の広がりの理論に関連して、浸透は、2つのエージェント間の接続による感染の伝播または非伝播です。



伝染病の理論における浸透の本質を説明するために、列Gの一部の頂点uがちょうど感染したと仮定します。 この頂点は頂点vと関連しています。これは、頂点vが次の瞬間に感染する確率pがあることを意味します。 たとえば、「イーグル」が確率pでドロップアウトするコインを投げることにより、イベントの結果を見つけることができます。 しかし、結果を決定するという観点からは、流行の最初にコインを投げたのか、頂点uが感染して頂点vの感染の脅威が生じた瞬間にコインを投げたかは関係ありません。 そして、流行の最初の段階でコイン投げの手順を実行し、rib骨が2つの特定の頂点間の感染を見逃すかどうかを判断することを妨げるものは何もありません。 コイントスの結果に応じて、感染を伝播するカテゴリに移行した場合、エッジはアクティブであり、そうでない場合、パッシブであると言います。 最初に感染した頂点の場合、次の定理を定式化することが可能になります。



定理1.頂点vは、アクティブエッジからのパスによって最初に感染した頂点uに接続されている場合にのみ、流行の結果として感染します。



この理論は、SIRモデルに直接関連しています。 T(伝送確率)を通じて、エッジがアクティブになる確率のしきい値を定義します(グラフ内のすべてのエッジをチェックするために単一の数値が固定されています)。 時間t = 1で初期頂点に感染します。次に、この頂点から続くエッジのどれがアクティブであるかを調べ、それに沿って感染を通過させ、頂点自体を回復されたクラスに転送します(母集団からドロップ-これはこの例では、ピークが広告にさらされ、次のステップで何人かの友人に広告のアイデアを伝えることができた後、製品に関する情報を広めることに興味を失いました)。



感染した頂点が完全に使い果たされるまで説明された手順を繰り返し実行すると、グラフ全体の頂点の数に関して、感染したネットワーク参加者の合計割合は回復したクラスの多くの頂点になるという結論に達します。

デフォルトでは、最初に感染した単一の頂点になると、巨大な接続コンポーネントの頂点の中から選択されると想定しています。 また、さらにシミュレーションを行うたびに、500回の反復が行われ、結果が全体にわたって平均化されたことにも注意してください。



最初に感染した数(inf)とT(伝播の確率)のさまざまな組み合わせで、流行(500回のシミュレーション)の結果として感染した人の受信シェアの分布を見てみましょう。 図3 9つの組み合わせが表示されます(T = 0.25、0.55および0.85、inf = 1、50および100)。



画像

図3 総流行範囲のしきい値Tおよび感染者の初期数への依存性



最初に感染した人の数が増えると、分布がますます正常になりつつあるという事実につながります(明らかに、多数の法則が機能します)。 Tパラメータの増加により、「テール」が「より簡単」になります(低いTでは、最初に感染したTが多数存在しても、感染の「良好な」拡散が保証されないため)。



これとは別に、最初に感染したノードが1つだけの場合、最初に感染したノードの「中心性」と感染したノードの合計割合との相関関係がTパラメーターによってどのように変化するかを調べます(図4)。



画像

図4 最終カバレッジと、さまざまなTのソースノードの「中心性」との相関



ある時点から、逆の関係でトレンドが確立されることに注意してください(次数中心性、近接中心性、中間中心性)。 これは、Tが小さく、感染がそれ自体で広まらない場合、ネットワーク感染を開始するために選択する頂点が非常に重要になるためです(つまり、「中心性」と感染総数の間には強い正の相関があります)。 また、パラメータTの値が大きくなると、感染が広がり、元のノードの「中心性」の重要性が次第に低くなります(つまり、相関が低下します。つまり、最初に感染したノードの「中心性」に関係なく、感染は自然に広がります) 。



したがって、予測グラフとしきい値Tについての情報を使用して、商品の分布をモデル化することができます(これと利用可能なすべての予算に関連して、総シェアのターゲットインジケータに応じて、初期に「感染」するエージェントの数の戦略を構築することが可能になります「感染」)。



主な結論は、SI流行性拡散モデルを使用した場合、巨大な接続コンポーネントに入るネットワークグラフの頂点は遅かれ早かれ感染するということです。



SIRモデルを使用する場合の感染エージェントの合計割合は、SIモデルの場合よりも常に少なくなります。 ただし、SIRコンセプトは、感染したピークの初期数、エッジがアクティブになるしきい値確率など、感染した割合の目標値とプロモーションの会社の予算に応じて、さまざまな指標の機会を提供します。 したがって、2つの指定された入力パラメーターと作業で特定された関係を持つことで、マネージャーのタスクは最適化タスクに削減されます。



参照資料



1.ベイリー、NTJ(1975)、感染症の数学理論とその応用、第2版。 (Charlin Grin&Company、ロンドン)

2. David EasleyとJon Kleinberg、「ネットワーク、群衆、市場:高度に接続された世界に関する推論」、Cambridge University Press、2010年、p。 655

3. Diekmann、O.、H。Heesterbeek、およびT. Britton(2012)、感染症動態を理解するための数学ツール(Princeton University Press、プリンストン、米国)

4.ジャン・メドロック、流行の数学的モデリング。 ワシントン大学、22&24 Vaf 2002

5. Romualdo Pastor-Satorras、Claudio Castellano、Piet Van Mieghem、Alessandro Vespignani「複雑なネットワークの流行プロセス」、2015年4月22日



All Articles