♦️ 🆔 👨🏽‍✈️ Calltouchマルチチャネルアトリビューション 👕 ✅ 👩🏾‍⚕️

はじめに

近年、現代のインターネットマーケティング担当者のツールキットはますます急速に拡大しています。今日、検索エンジンの最適化に加えて（

$SEO$ ）およびYandex.Directのコンテキスト広告と

：

$Google \：Adwords$ 実用化された

メ ー ル

$メール$ チャンネル、ソーシャルネットワーク、

$Instagram$ 、リマーケティング/リターゲティングなど。したがって、マーケティング担当者は、特定のプロジェクトに最も効果的な広告チャネルを選択するタスクに直面しています。コールタッチは、最適な広告チャネルを選択するのが難しいことに加えて、チャネル間の広告予算のその後の分配に対するチャネルの有効性の複雑な評価が非常に困難になるという事実について話すことにしました。 CalltouchシニアプロダクトマネージャーColumn Fedor Ivanov mthmtcn 。

Calltouchによれば、この複雑さは主に、ユーザーがマーケティング担当者と本質的に同じツールを持っているという事実によるものです。直接リンク経由で、またはソーシャルネットワークまたはYandex広告から切り替えることでサイトにアクセスできます。そして。さらに、サイトでターゲットアクション（コンバージョン）を実行する前に、ユーザーはさまざまな「エントリポイント」からサイトに繰り返しアクセスできます。最初に広告をクリックしてサイトにアクセスしたとき（

$CPC$ ）、Yandexが検索クエリで発行した、2番目の訪問は直接遷移でした（

ダ イ レ ク ト

$ダイレクト$ ）、しかし3番目（変換につながる-

$C$ ）ソーシャルネットワーク（

ソ ー シ ャ ル

$ソーシャル$ ）この場合、チェーン（マルチチャネルシーケンス）を観察します。

直 接 ソ ー シ ャ ル

$CPC→直接→ソーシャル→C$

したがって、広告チャネルの有効性を評価する場合、マーケティング担当者はまず、サイトでのコンバージョンの形成に対する特定のソースの貢献度をどのように評価するのかという質問に答える必要があります。別の方法では、この質問は次のように定式化できます。1つまたは別のマーケティングチャネルが除外された場合、サイトでのコンバージョンはどうなりますか？この質問に答えるために、属性モデルと呼ばれる多くの方法論があります。これらのモデルをさらに詳しく考えてみましょう。

アトリビューションモデル

アトリビューションモデルは、チャネル間でコンバージョンの「ウェイト」を分配する方法です。アトリビューションモデルの選択に応じて、チャネル（ソース）の重みが計算されます。これは、このソースがコンバージョンの形成に貢献したことを条件付きで考慮することができます。実際、Yandex MetricsまたはGoogle Analyticsのすべてのユーザー（「マルチチャネルシーケンス」セクション）はこれらのモデルに遭遇しました。現在、次の主要なアトリビューションモデルが区別されています。

最後のインタラクション（最後の間接インタラクション、AdWordsのラストクリック、最後の重要な遷移）によって- $Last \：クリック\：Model \ :( LCM）$
最初の相互作用は $最初の\：クリック\：モデル\ :( FCM）$
線形モデル- $線形\：モデル\ :( LM）$
一時的な不況- $時間\：減衰\：モデル\ :( TDM）$
位置に基づいて- $位置\：タイプ\：モデル\ :( PTM）$

すでに述べたように、属性モデル同士の主な違いは、シーケンス内のチャネルの重みを計算する方法です。各モデルをさらに詳しく考えてみましょう。明確にするために、次のマルチチャネルシーケンスがあるとします。

$$表示$$ AdWords→CPC→ソーシャル→メール→Yandex→CPC→ダイレクト→C $$表示$$

ラストクリックモデル

このモデルは、その単純さと直感的な「正確さ」のため、実際に最も広く使用されています。最も一般的なケースでは、

$Lcm$ すべてのモデル

％

$100％$ 変換の重みは、ターゲットアクションの発生に先行するマルチチャネルシーケンスの最後のチャネルに与えられます。私たちの場合、クラシック

$Lcm$ モデルは重みを与えます

％

$100％$ チャンネル

ダ イ レ ク ト

$ダイレクト$ そして

％

$0％$ 他のすべてのチャネル。

実際には、さまざまな種類があります

$Lcm$ モデルでは、「最後の」チャネルを選択する方法がすべて異なります。モデルのタイプに応じたチャネル選択方法を示す表は次のとおりです。

最初のクリックモデル

このモデルでは

％

$100％$ シーケンスの最初のソースに重みが与えられ、

％

$0％$ みんなに。この場合、最大重量はソースによって受信されます

ダ イ レ ク ト

$ダイレクト$ モデルが

$Lcm$ 最後のチャネルの重みを「最大化」し、「アクションを誘発」してから、

$FCM$ モデルは、チェーンを開始するチャネルを優先します。つまり、サイト内のユーザーの「関心を喚起します」。このモデルも実際に使用されますが、

$LCM$

線形モデル

線形モデル（

$Lm$ ）、およびその一般化と改善（一時的な不況のモデルであり、位置に基づく）は、主に、そのフレームワーク内ですべてのチャネルがゼロ以外の重みを受け取るという事実によって統一されています。モデルの違いは、すべてのチャネル間でウェイトが分散される方法のみです。の場合

$Lm$ すべてのチャネルに同じ重みが与えられます（つまり、変換の形成への寄与）は同等と見なされます。私たちの場合、チャンネル

： 、

$AdWords \：CPC、$

ソ ー シ ャ ル 、

$ソーシャル、$

メ ー ル 、

$メール、$

： 、

$Yandex \：CPC、$

ダ イ レ ク ト

$ダイレクト$ 重量があります

$inline$ ％

タイムディケイ

アトリビューションモデル

$TDM$ （

時 間 ： デ ィ ケ イ ： モ デ ル

$時間\：ディケイ\：モデル$ ）は、チャネルの寄与が大きい、つまり変換に「近い」という仮定に基づいているため、チャネルの重みはチェーン内の位置の単調増加関数です。チャネルの重みの計算式については、ここをクリックしてください。

ポジションタイプモデル

アトリビューションモデル

$PTM$ 3つのモデルの組み合わせです。

、

$LCM、$

$FCM$ そして

$LM$ そのフレームワークでは、最大シェア（通常

％

$40％$ ）チェーンの最初と最後のインタラクションを受け取り、残りを受け取る（通常は

％

$20％$ ）は、中間チャネル間で（線形モデルのように）均等に分散されます。この例では、チャネル

：

$AdWords \：CPC$ そして

ダ イ レ ク ト

$ダイレクト$ 受け取ります

％

$40％$ 重量と

$ソーシャル、$

$メール、$

$Yandex \：CPC$ によって

$inline$

アトリビューションモデルの選択方法

アトリビューションモデルの選択は、広告の効果を評価する上で最も重要なステップです。モデルに応じて、アナリストはチャネルの収益性について完全に反対の結論を得ることができます。これは、意思決定プロセスに時間がかかるトピック（不動産や自動車のトピックなど）で特に顕著に見られます。自然な疑問が生じます：どの属性モデルを参照として使用する必要がありますか？残念ながら、この質問に対する単一の答えはありません。サイトでのユーザーの行動（ユーザーセッション）の詳細な分析によってのみ、コンバージョンをトラフィックソースにリンクする特定の方法を選択することについて十分な情報に基づいた決定を下すことができます。

原則として、選択はモデルで停止します

$LCM、$ ただし、実際には、交換する状況に直面しています。

$Lcm$ に

$PTM$ その後のチャネル間での資金の分配により、マーケティング活動の有効性を大幅に高めることができました。

それとは別に、属性モデルがコンテキスト広告を最適化する際に考慮すべき最も重要な要素であることは注目に値します。モデルの選択は、入札の計算に使用される統計に直接影響します。各キーフレーズが個別の広告チャネルであると考える場合、オプティマイザーの入力に行く統計を大幅に充実させることができます。さらに、キーワード間の連続したユーザークリックの分析により、最適化の効率が向上します。この作業の別の章で、このトピックの議論に専念します。

マルチチャネルシーケンスの分析に使用するアプローチの説明に進む前に、「コミック」の例を示します。これは、一方で古典的な帰属モデルの限界を示し、一方で、答える必要がある基本的な質問を定式化することを可能にします。

C =「女の子を自宅に連れて映画を見に行く」ことを目標とするとしましょう。

次の一連のアクション（基本的にチャネル）があり、目的の目標に至ったとします。

女の子を知る→映画館に招待する→花を贈る→公園で散歩をする→家に連れて行く→レストランでデートに招待する→花を贈る→夕食を扱う→カクテルを扱う→別のカクテルを扱う→...冗談を言う→C

モデルを扱っている場合

$LCM、$ それから私たちは、目標を達成するために、原則として冗談で十分であると信じています。モデルの枠組みで検討する場合

$FCM、$ 私たちが出会うとすぐに成功が保証されます（これは同じジョークと比較して真実に似ています）。モデル

$Lm$ すべてのアクションが同等の貢献をしたと仮定します。モデル

$PTM$ 最大の貢献は、知人と冗談（そして平等な共有）の事実によって行われ、他の要因の影響は取るに足らないと仮定しています。ついに

$TDM$ 私たちの次の行動のそれぞれが少女の興味を「刺激」し、それによって究極の目標を達成する可能性が高まると信じていますが、それでもジョークは決定的な要因でした。

ご覧のように、古典的なモデルはどれも上記の状況を適切に説明することはできず、それ以上に、どのチャネル（アクション）が実際に最も重要であることが判明したかという質問に正しく答えることができません。

次に、アトリビューションモデルから回答を受け取りたい主な質問を作成します。

冗談を言うだけで十分ですか？もしそうなら、どのくらいの頻度で？
目標を達成するために冗談を言う習慣はどれほど典型的ですか？
冗談を言わないとどうなりますか？
ジョークを他のアクションに置き換えることは可能ですか？ある場合、どちらを交換する必要がありますか？

提示されたほとんどの質問に対する正しい答えを得るには、1つのシーケンスのみを考慮するだけでは不十分です。一方ではユーザーの行動を予測でき、他方では各インタラクションポイントのサイトでのコンバージョンの確率を推定できる統計を収集する必要があります。

私たちが検討しているモデルはもともと、チャネルが相互依存していると仮定して、マルチチャネルシーケンスの複合評価のために開発されました。上記の定式化された質問のほとんどに答えることができます。さらに、説明した方法を使用して、各キーフレーズのコンバージョン率を予測する方法を示します。これは、コンテキスト広告で入札単価を最適化するために必要な要素です。

まず、モデルが機能するデータ形式について説明します。

カスタムセッション

一定期間、分析しているとします

$T$ 、サイトがコミットされました

$M$ 遷移、つまり、データがあります

$M$ ユーザーセッション。それぞれ

$i$ セッション

$S_i$ パラメーター（セッション属性）の固定セットがあります

$P$ 。分析のために、すべてのセッション属性のセットに含まれる次の属性セットが必要です。

$A = \ {SrcType、\：TimeS、\：TimeF、\：URL、\：clientID、\：CVtype \} \サブセットP、$

ここで：

$SrcType$ -サイトへの移行が行われたチャンネル
$TimeS$ -セッション開始時間
$TimeF$ -セッション終了時間
$URL$ -ユーザーがサイトにアクセスしたときに訪問したページのアドレス
$clientID$ -一意のユーザー識別子
$CVtype$ -セッションの結果として変換が行われたかどうか（ $CV$ -はい $N$ -いいえ）

さらに、簡単にするために、期間が

$[TimeS; TimeF]$ 分析期間内

$T$ 、したがって、属性を削除します

$TimeS、\：TimeF$ 考慮されたパラメータのセットから。また、パラメータは

$URL$ チャンネルのレベルからキーフレーズのレベルへの移行を行うためにのみ必要（マーキングの存在に応じて

$URL$ ）、入札単価の最適化には役立ちますが、コンバージョンへのチャネルの影響を評価するためには必ずしも必要ではありません。チャネルの下で、トラフィックのソースを理解します。これには以下が含まれます。

Yandex CPC
Google CPC
フェイスブック
ヴコンタクテ
Instagram
直接
紹介
など

プレゼンテーションを簡単にするために、広告チャネルを次のようにエンコードします。

$c_1、\：c_2、\：...、\：c_k$ 、それらの数が

$k$ 。

今、それを仮定します

$M$ セッション

$\シグマ= \ {S_1、S_2、...、S_M \}$ 開始された

$G \ leq M$ ユーザーによって。一意のユーザーIDを使用する

$clientID$ 多くは壊れることがあります

$\シグマ$ に

$G$ 互いに素なサブセット：

$\シグマ= U_1 \カップU_2 ... \カップU_G、$

どこで

$U_i$ 多くのセッション（終了日の増加順にソート）と同じ

$clientID$ 、つまり、同じユーザーによって開始された時系列に並べられた多くのセッション。私たちの仮定を考えると

$[TimeS; TimeF] \サブセットT$ 、その後のデータに基づいて

$U_i$ 私たちはすべてと一致することができます

$i$ ユーザーの次のチャネルチェーン：

$c_ {i1}→c_ {i2}→...→c_ {iL_i}、$

どこで

$L_i = | U_i |$ -セット内の要素の数（実際には、ユーザーがサイトをクリックする数）

$U_i$ 。上記のコンバージョンチェーンは、

$i$ ユーザーがサイトとやり取りしている。

2つの追加の「擬似チャネル」を紹介します

$CV$ そして

$N$ ルールにより：

セッション中の場合 $i$ ソースを持つユーザー $c_ {ij}（1 \ leq j \ leq L_i）$ コンバージョンがあり、その後に $c_ {ij}$ 加える $CV$ 受け取った $...→c_ {ij}→CV→...$
最後の現在のセッションの結果として $i$ ソース付き $c_ {iL_i}$ その後、変換は発生しませんでした $c_ {iL_i}$ 加える $N$ 受け取った $...→c_ {iL_i}→N$

さらに、次の形式のチェーンを扱うときの状況にも注意を向けます。

$... \ rightarrow c_ {ij} \ rightarrow CV \ rightarrow ... \ rightarrow CV \ rightarrow ...$

このような構造を持つシーケンスは、上記で定式化された規則に従っては発生しませんが、上記のセッションパラメーターに加えて一意の組み合わせがある場合、たとえば発信者のトピックなど、多くの場合に発生する可能性があります：

$clientID→TelNumber$

この場合、上記のチェーンの最初の呼び出しは一意の呼び出しになり、それ以降の呼び出しはすべて、指定された

$clientID$ 。このようなチェーンは、サイトへの移行に関する情報に加えて、オフライン（通話ログなど）を含むサイトとのユーザーインタラクションの「ログ」が維持される場合、モデルで考慮されます。

ユーザーとサイトの相互作用チェーンを形成するための上記の方法論の重要な特徴に注目します。相互作用の連鎖（マルチチャネルシーケンス）が常に2つの「イベント」のいずれかで終了するという事実にあります。

$CV$ または

$N$ 。このイベントで

$N$ シーケンスの最後でしか会えませんが、

$CV$ 任意の場所に表示される場合があります。

説明されたルールによって形成されるシーケンスの典型的な例を示します。簡単にするために、3つの異なるチャネルに制限します

$c_1、\：c_2、\：c_3$ 追加する

$CV$ そして

$N：$

$c_1→N$
$c_1→c_2→N$
$c_1→CV$
$c_1 \右矢印c_2 \右矢印CV \右矢印c_1 \右矢印N$
$c_1 \右矢印c_2 \右矢印CV \右矢印c_3 \右矢印N$
$c_1→c_2→CV→CV$
$c_1 \右矢印c_2 \右矢印CV \右矢印CV \右矢印c_3 \右矢印N$

マルチチャネル属性モデルを構築するために必要な次のステップは、イベントが発生するようにシーケンスを変換することです

$CV$ 同様に

$N$ 、厳密にシーケンスの最後にのみ発生する可能性があります（このようなシーケンスはエレメンタリと呼ばれます）。これを行うには、元のチェーンを「分割」して、常に最後に立つようにします

$CV$ または

$N$ 。

例として一般的なシーケンスを使用して、この手法を示します。

チェーン1〜4はすでに「基本」形式に縮小されています。
チェーン5は以下に「分割」されます。 $c_1→c_2→CV$ そして $c_1→c_2→c_1→N$
チェーン6の「分割」： $c_1→c_2→CV$ そして $c_1→c_2→c_3→N$
チェーン7は以下に「分割」されます。 $c_1→c_2→CV$ そして $c_1→c_2→CV$
チェーン8は以下に「分割」されます。 $c_1→c_2→CV$ 、 $c_1→c_2→CV$ そして $c_1→c_2→c_3→N$

分割の結果、すべてのチェーンが「基本」になり、モデルの説明を開始できます。ただし、このステップに進む前に、この段階で既にサイトのコンバージョンに対するチャネルの影響を評価する方法の質問に答えることができます。

変換に対するチャネルの影響の計算

のセットを考えます

$G$ シーケンス（それらはすべて基本的なもの、つまり、

$CV$ または

$N$ 。シーケンスから仮定

$X$ で終わる

$CV$ そして

$G$ -

$X$ に

$N$ 。チャンネルの影響を示す

$c_i$ サイトでの一定期間のコンバージョン

$T$ を通して

$I（c_i）$ 、および小学校

$j$ チェーンスルー

$R_j$ 。影響の大きさ

$I（c_i）$ チャンネル

$c_i$ コンバージョンごとに、チャネルを削除した場合の「失われた」コンバージョンの数と見なします

$c_i$ 存在するすべてのコンバージョンチェーンのうち、コンバージョンの総数を参照

$X$ ：

$I（c_i）= \ frac {| \ {R_jのc_i \、R_jの\、CV \ R_jの\} |} {X}$

明らかに、

$c_i$ 価値

$I（c_i）$ 次の不等式を満たします。

$0 \ leq I（c_i）\ leq 1$

さらに

$I（c_i）= 0$ チャンネルの場合のみ

$c_i$ 「変換」シーケンスに含まれていない

$I（c_i）= 1$ 削除の場合のみ

$c_i$ サイトでのすべてのコンバージョンが失われます。したがって、チャネルを削除した後に得られる新しいコンバージョン数を簡単に見積もることができます

$c_i$ ：

$CV_ {new} = X *（1-I（c_i））$

チャネルの効果を計算する

$c_1$ 、

$c_2$ 、

$c_3$ この例では。観察している合計

$8$ からの変換（変換チェーン）

$13$ 素鎖

$R_j$ 。チャンネル

$c_1$ すべての変換チェーンに参加します。つまり、変換への影響は

$1$ ：

$I（c_1）= 1$ 。次のチャンネル

$c_2$ に存在する

$7$ 変換チェーン、つまり

$I（c_2）= 7 /8。$ ついに

$c_3$ 1つの変換チェーンの一部である場合、

$I（c_3）= 1 /8。$

チャネルの影響の合計が1に等しくないことは簡単に置き換えることができます。便宜上、正規化を入力し、正規化された効果を考慮することができます

$I_n（c_i）$ コンバージョンごとのチャネル：

$I_n（c_i）= \ frac {I（c_i）} {\ sum \ limits_ {i = 1} ^ k I（c_i）$

この場合、明らかに

$\ sum \ limits_ {i = 1} ^ k I_n（c_i）= 1$

変換に対するチャネルの影響を計算する式は、あるチャネルの別のチャネルへの影響を評価する必要がある場合に簡単に変更できます。特に、タスクがチャネルの影響を調べることである場合

$c_i$ に

$c_j$ 、次の理由を使用できます：チャネルによって開始されたユーザーセッション

$c_i$ チャンネルとのセッションにつながる

$c_j$ チェーンの数だけ

$R_f$ そのような

$c_i$ 前に

$c_j$ 。次に、

$I（c_i、c_j）$ そのような効果の大きさ：

$I（c_i、c_j）= \ frac {| \ {R_f│c_i、c_j \ in R_t \：および\：c_i \：先行\：c_j \} |} {| \ {R_t│c_j\ in R_t \} |}。$

一般的に、関数

$I（c_i、c_j）$ 対称ではない：

$I（c_i、c_j）≠I（c_j、c_i）。$ シーケンス

$R_f$ それらが同時になるように

$c_i$ 前に

$c_j$ そして

$c_j$ 前に

$c_i$ （つまり、サイクル形式）は、式の分母でも考慮することができます。前に紹介した正規化は、当然、今説明したより一般的なケースに一般化されています。

$I_n（c_i、c_j）= \ frac {I（c_i、c_j）} {\ sum \ limits_ {h = 1} ^ k I（c_i、c_h）}。$

チャネルが無効になったときの基本的なメトリックの変化の評価

質問に答えた後、すべてのチェーンからチャネルを削除すると、コンバージョン数はどのように変化しますか

$c_i$ 広告の有効性の分析に使用されるこのような基本的な指標の値がどのように変化するかについて、完全に自然な疑問が生じます。

費用
コンバージョン費用（CPA）

これらの質問に追加の仮定を伴うことなく答えることはかなり困難です。基本的な公理は、チャンネルを削除すると

$c_i$ いくつかのチェーンから

$R_j$ 、 このチェーンは中断されます。より正確には、文言は次のようになります。チャネルを削除する前のチェーンが次の場合：

$R_j = \ {c_ {i1} \ rightarrow c_ {i2} \ rightarrow ... \ rightarrow c_ {ik} \ rightarrow c_i \ rightarrow c_ {i（k + 1）} \ rightarrow ... \}、$

その後、チャネルを削除した後

$c_i$ チェーンは次の場所で変更されます。

$R_j \ rightarrow R_j ^ {new} = \ {c_ {i1} \ rightarrow c_ {i2} \ rightarrow ... \ rightarrow c_ {ik} \ rightarrow N \}。$

この仮定は、ユーザーがサイトとの対話に使用したチャンネルを削除すると、このサイトとのユーザーの対話がなくなることを意味します。

基本的なメトリックを評価するには、ユーザーセッションのパラメーターに「移行コスト」などのインジケーターを追加する必要もあります。チャンネルが無料の場合（直接移行など）、ユーザーがこのチャンネルをクリックしたときに広告主が支払う費用として解釈できます。その場合、移行の費用は

$0。$ チャネルの合計コストのみを確立できる場合（たとえば

$SEO$ ）、特定のセッションの移行コストは、チャネルごとの総コストとすべてのセッションのこのチャネルの使用回数の比率に等しいと仮定します。チャネルの移行コストを示します

$c_i$ チェーン内

$R_j$ を通して

$V_j（c_i）$ 。したがって、コストを見積もることができます

$V（R_j）$ シングルチェーン

$R_j$ 次のように：

$V（R_j）= \ sum \ limits_ {c_i \ in R_j} {V_j（c_i）}。$

同時に、チャネルあたりの総コスト

$c_i$ 等しい：

$V（c_i）= \ sum \ limits_ {j：c_i \ in R_j} {V_j（c_i）}。$

チャネルを使用するときにユーザーをサイトに引き付けるための総費用

$c_1、c_2、...、c_k$ 等しい：

$V = \合計\制限_ {j = 1} ^ G \合計\制限_ {c_i \ in R_j} {V_j（c_i）} = \合計\制限_ {i = 1} ^ k \合計\制限_ {j：c_i \ in R_j} {V_j（c_i）}。$

式の双対性は、総コストを計算するさまざまな方法によって説明されます。最初のケースでは、すべてのチェーンの各コストを要約します

$G$ チェーン、および2番目-すべてのチャネルコストを要約します

$k$ チャンネル。

すべてのチャネルチェーンから削除した後に新しいコストを推定するには

$c_i$ 次の式を使用するのが最も明らかです。

$V_ {new} = V_ {old}-\ sum \ limits_ {j：c_i \ in R_j} {V（R_j）}、$ どこで

$V_ {new}$ -チャンネルを削除した後の新しい費用

$c_i$ 、そして

$V_ {old}$ -以前の費用。ただし、このような単純なロジックでは、これらのチェーンではコストが正しく見積もられません。

$R_j$ 会う場所

$c_i$ 、その前に、リモートチャネルではなく、他のチャネルが関係している可能性があります。したがって、より正確な評価を行うには、「切り捨てられた」チェーンのコストを考慮する必要があります。したがって：

$V_ {new} = V_ {old}-\ sum \ limits_ {j：c_i \ in R_j} \ sum \ limits_ {t：\：c_t \：先行\：c_i} {V_j（c_t）}。$

明らかに、

$\ sum \ limits_ {j：c_i \ in R_j} \ sum \ limits_ {t：\：c_t \：先行\：c_i} {V_j（c_t）} <\ sum \ limits_ {j：c_i \ in R_j} { V（R_j）}、$

つまり

$V_ {old} -V（c_i）<V_ {old}-\ sum \ limits_ {j：c_i \ in R_j} \ sum \ limits_ {t：\：c_t \：先行\：c_i} {V_j（c_t） }。$

最後の不等式は、チャネルを削除することを意味します

$c_i$ 通常、特定の価値を持つ新しいチェーンが出現しますが、明らかにコンバージョンは発生しません。したがって、損失を推定することができます

$損失（c_i）$ チャネルの削除（すべての「切り捨てられた」チェーンのコスト）、および節約

$EC（c_i）$ チャネルがチェーンで保存された場合に発生するすべての「非必須」トランジションのコストとして：

$損失（c_i）= \ sum \ limits_ {j：c_i \ in R_j} \ sum \ limits_ {t：\：c_t \：先行\：c_i} {V_j（c_t）}、$

$EC（c_i）= \ sum \ limits_ {j：c_i \ in R_j} {V（R_j）}-損失（c_i）$

さて、チャンネルを削除した後の支出の変化を測定する方法を学んだ後

$c_i$ 、チャネルがなかった場合に発生する新しいコンバージョンコストを推定できます。

$CPA_ {new} = \ frac {V_ {new}} {CV_ {new}} = \ frac {V_ {old}-\ sum \ limits_ {j：c_i \ in R_j} \ sum \ limits_ {t：\： c_t \：前に\：c_i} {V_j（c_t）}} {X *（1-I（c_i））}$

チャネルを削除する前に、以前の変換コストがあったと仮定すると：

$CPA_ {old} = \ frac {V_ {old}} {X}$

チャネルを削除する目的は、コンバージョンのコストを削減することです。決定的なルールは次のとおりです。

$CPA_ {new} -CPA_ {old} <0。$

つまり、チャネルを削除することでコンバージョンのコストが減少した場合（その数が合理的に減少した場合）、チェーンから除外し、予算への支出を停止できます。

さらに、チャネルを削除するときに「失われたコンバージョン」のコストを見積もることができます。

$CPA_ {loss} = \ frac {V_ {old} -V_ {new}} {X * I（c_i）}、$

したがって、ルールの代わりに

$CPA_ {new} -CPA_ {old} <0$ 別のものを使用できます：比率が

$CPA_ {loss}> CPA_ {old}、$

その後、チャンネルを削除します

$c_i$ サイトでのコンバージョンの全体的なコストを削減します。

次に、チャネルの変換確率を計算するために必要な基本モデルの説明に進みます。

モデルの説明

マルチチャネルアトリビューションモデルの説明を始める前に、 Sergey Bryl による注目すべき記事と、著者がマルコフチェーンの美しさと機能を使用してマルチチャネルアトリビューションを説明した2番目の記事を参照したいと思います。この記事のフレームワークでは、マルコフ過程のフレームワーク内での変換確率の計算に関連する主な点をより詳細に説明し、確率行列に基づいて変換確率を計算する効果的な方法も提案しました。

マルチチャネル属性モデルの2つの代替解釈、グラフとマトリックスを提供します。 1つ目はモデルを視覚的に記述することを可能にし、2つ目は必要な特性を効果的に計算することを可能にします。両方の記述が実際にはマルコフ過程と呼ばれる同じランダム過程と、その過程に対応するモデルであるマルコフ連鎖を表していることを示します。

グラフモデル

グラフは、数学的な抽象的なオブジェクトであり、グラフの頂点のセットとエッジのセット、つまり頂点のペア間の接続です。たとえば、多くのピークでは、特定の航空会社が運航する多くの空港を利用できます。また、多くのcities骨では、この航空会社の都市間定期便を利用できます。

グラフは、そのエッジのそれぞれに方向がある場合、つまり本質的にベクトルである場合、指向性と呼ばれます：エッジの場合、グラフはどの頂点から開始し、どの頂点から終了するかを正確に示します。

グラフの各エッジに重みと呼ばれる数値が割り当てられている場合、グラフは重み付きと呼ばれます。加重指向グラフの典型的な例は、都市間の距離のネットワーク（グラフの頂点）です。ここでは、エッジ（道路）の重みによってその長さがわかります。

チェーンのセットをグラフの形式で表現するには、2つのセットを修正する必要があります。頂点のセット

$V$ そして多くの接続

$E$ それらの間。ピークは、マーケティングチャネルと2つの追加イベントです。

$V = \ {c_1、\：c_2、\：...、\：c_k、\：CV、\：N \}。$

として

$E$ 相互接続された要素のペアを選択します

$V$ 。上記で検討した基本チェーンについては、次のものがあります。

$V = \ {c_1、\：c_2、\：c_3、\：CV、\：N \}、\\ E = \ {（c_1、N）、\ :( c_1、c_2）、\ :( c_2、 N）、\ :( c_1、CV）、\ :( c_1、c_2）、\：...、\ :( c_3、N）\}。$

多くのことを考慮して

$E$ 一致する要素が発生する可能性があり、結果のグラフに複数の（重複した）エッジがある場合があります。

ご覧のように、少数のセッションであっても、このようなグラフィカルな表現はやや面倒であり、分析を複雑にします。重複したリブを1つのリブに置き換えて、テイクの数を重みとして使用することで、ある程度の単純化を実現できます。次に、元のグラフが有向重み付きグラフに変換されます。

このグラフはすでに分析に適しています。次の目標は、エッジの重みを確率的表記に変換することです。 2つの頂点を接続するエッジの重みを、ある頂点から別の頂点に遷移する確率で置き換えます。

特に、トップを考慮してください

$c_1$ 。グラフの次の頂点はそこから到達可能です。

$c_2、\：CV、\：N$ 。上から合計

$c_1$ 記録された

$1 + 11 + 2 = 14$ トランジション、さらに

$11$ のうちにあった

$c_2$ 、

$2$ -で

$N$ そして1つ

$CV$ 。次に

$P（c_1、c_2）、\：P（c_1、N）、\：P（c_1、CV）$ -移動する確率

$c_1$ で

$c_2、\：CV、\：N$ したがって、その後：

$P（c_1、c_2）= \ frac {11} {14}、\：P（c_1、N）= \ frac {2} {14} = \ frac17、\：P（c_1、CV）= \ frac { 1} {14}。$

簡単に交換できます

$P（c_1、CV）$ ソース変換の確率です

$c_1$ 古典的なモデルで

$LCM$ モデルが明らかになる

$Lcm$ ユーザーセッションを分析することで収集できる大量の統計は考慮されません。残りのすべての頂点に対して計算を行うと、グラフは次のように変換されます。

このモデルに基づいて、特定のチャネルの合計コンバージョン確率を計算できます。計算には、次の再帰式が使用されます。

$P_ {full}（c_i、CV）= \ sum \ limits_ {c_j：c_i \ rightarrow c_j} {P（c_i、c_j）P_ {full}（c_j、CV）}$

この式の意味は、特定の頂点の合計変換確率を計算するには、特定の頂点から到達可能なすべての頂点を選択し、元の頂点からこれらの頂点への遷移確率を計算してから、到達可能な各頂点の合計変換確率を再度計算する必要があるということです。この式は、グラフが単方向の場合、つまり頂点を接続するエッジがある場合、変換の完全な確率を即座に提供します

$c_i$ そして

$c_j$ しかし、接続するエッジはありません

$c_j$ c

$c_i$ 。それ以外の場合、上記の式は線形方程式系を定義します。未知数の数は、グラフの「戻り」エッジの数に等しくなります。

たとえば、合計コンバージョン確率を計算します

$P_ {full}（c_1、CV）$ ソース用

$c_1$ 。

以来

$c_1$ に関連付けられている

$c_2、\：CV、\：N$ しかしから移動する確率

$N$ で

$CV$ ゼロであり、から移動する確率

$CV$ で

$CV$ 1に等しい場合：

$P_ {full}（c_1、CV）= P（c_1、c_2）* P_ {full}（c_2、CV）+ P（c_1、CV）* 1 = \ frac {11} {14} * P_ {full} （c_2、CV）+ \ frac {1} {14}。$

順番に

$c_2$ に戻ることができます

$c_1$ またはに行く

$c_3、\：CV、\：N$ 、つまり：

$P_ {full}（c_2、CV）= P（c_2、c_1）* P_ {full}（c_1、CV）+ P（c_2、c_3）* P_ {full}（c_3、CV）+ P（c_2、CV ）* 1、\\ P_ {full}（c_2、CV）= \ frac {1} {11} * P_ {full}（c_1、CV）+ \ frac {3} {11} * P_ {full}（c_3 、CV）+ \ frac {6} {11}、$

それから

$P_ {full}（c_1、CV）= \ frac {11} {14} * \ Bigl（\ frac {1} {11} * P_ {full}（c_1、CV）+ \ frac {3} {11} * P_ {full}（c_3、CV）+ \ frac {6} {11} \ Bigr）+ \ frac {1} {14}。$

便宜上、

$P_ {full}（c_1、CV）= x$ 、次の線形方程式を取得します。

$x = \ frac {11} {14} * \ Bigl（\ frac {1} {11} * x + \ frac {3} {11} * P_ {full}（c_3、CV）+ \ frac {6} { 11} \ Bigr）+ \ frac {1} {14}。$

計算する

$P_ {full}（c_3、CV）$ 。ソースから

$c_3$ にしか行けない

$CV$ または

$N$ 。それから

$P_ {full}（c_3、CV）= \ frac {1} {3}。$

最後に、次の方程式があります。

$x = \ frac {11} {14} * \ Bigl（\ frac {1} {11} * x + \ frac {3} {11} * \ frac {1} {3} + \ frac {6} {11 } \ Bigr）+ \ frac {1} {14}。$

どこから

$x = P_ {full}（c_1、CV）= \ frac {8} {13} = 0.6154。$

。

上記のモデルの主な利点はその可視性です。一方、明らかな欠点（簡単な例でもわかる）には、多数のトラフィックソースの場合の計算の複雑さが含まれます。さらに、異なるキーワードがソースとして使用される場合、計算の量が桁違いに増加し、それにより後続のすべての計算が実現不可能になります。さらに、次の形式のグラフで遷移の可能性を許可する場合：

$... \ rightarrow c_i \ rightarrow c_i \ rightarrow ...$ （つまり、ループを許可する）、方程式系は非線形になり、必要な確率の発見が著しく複雑になります。次のセクションでは、マトリックスモデルの検討に進み、合計確率の式を計算するための効果的な方法を示します。

行列モデル

前の章では、マルチチャネル属性のグラフモデルについて検討しました。計算のためにより便利な形式に変換するために、再度、

$k$ チャンネル

$c_1、c_2、... c_k$ および2つの追加の「擬似チャネル」

$CV$ 、

$N$ 。グラフモデルでは頂点の役割を果たしたことを思い出させてください。

ユーザーごとにコンパイルされた観測されたシーケンスから、遷移確率（つまり、条件付き確率）を簡単に計算できます。

$P（c_i、c_j）、\：P（c_i、CV）、\：P（c_i、N）$ 。前述したように、

$P（N、c_i）= P（CV、c_i）= 0$ そして

$P（N、N）= P（CV、CV）= 1$ 。次に、サイズの正方行列を作成できます

$（k + 2）\回（k + 2）$ その要素は条件付き確率です

$P（c_i、c_j）、\：P（c_i、CV）、\：P（c_i、N）、\：P（N、c_i）、\：P（CV、c_i）：$

そして

$P（N、N）、\：P（CV、CV）$ ：

$H=\begin{pmatrix} P(c_1,c_1)& P(c_1,c_2)& …& P(c_1,c_k)& P(c_1,CV) & P(c_1,N) \\ P(c_2,c_1)& P(c_2,c_2)& …& P(c_2,c_k)& P(c_2,CV) & P(c_2,N) \\ …&…&…&…&…&… \\ P(c_k,c_1) & P(c_k,c_2) & … & P(c_k,c_k) & P(c_k,CV) & P(c_k,N) \\ 0&0&…&0&1&0 \\ 0&0&…&0&0&1 \end{pmatrix}$

特に、上記の例では、次のようになります。

$H=\begin{pmatrix} 0&\frac{11}{14}&0&\frac{1}{14}&\frac{2}{14}\\ \frac{1}{11}&0&\frac{3}{11}&\frac{6}{11}&\frac{1}{11}\\ 0&0&0&\frac13&\frac23\\ 0&0&0&1&0\\ 0&0&0&0&1 \end{pmatrix}$

それは誰にとっても簡単です

行列の

行

$i$

フェア：

$H$

$\sum\limits_{j=1}^k{P(c_i,c_j)}+P(c_i,CV)+P(c_i,N)=1.$

この条件が満たされる行列は、確率論と呼ばれます。任意の確率行列は、マルコフ過程と呼ばれるランダムな過程を定義することが知られています。このようなプロセスには、より形式的な（数学的な観点からは厳密ではありませんが）定義を与えます。

マルコフ過程は、一定数の状態を持つランダムな過程であり、次の状態への遷移の確率は、システムが置かれている現在の状態のみに依存します。

したがって、さまざまなマーケティングチャネル間で検討している移行プロセスは、移行確率のマトリックスによって決定されるマルコフプロセスと見なすことができます。

$H$ 。このように定義されたモデルは、特に以下の重要な質問に答えます：

状態から移動する確率は何ですか $c_i$ 述べるための $c_j$ ステップ？ $t$
どのように各チャネルに存在する確率分布ステップ？ $t$

各チャネルの変換確率を推定する私たちの応用問題では、最初の質問の特定のケースに答える必要があります：

状態（チャネル）からの総確率

$c_i$

$CV$ ？

ランダムプロセスのマルコフ理論により、この質問に対して非常に簡単な答えを出すことができます（状態が

$CV$ そして

他の状態への遷移は不可能です）：この確率を計算するには、行列を無限に上げ、その位置で値を取得する必要があります

$N$

$(i,k+1)$ ：

$P_{full}(c_i,CV)=\lim_{t\rightarrow \infty}H^t (i,k+1).$

州からの場合は、厳密に証明することができます

$CV$ そして

他の状態に移行することはできません;この制限があります。もちろん、実際には、マトリックスの「無限」次数では操作できません。ただし、原則として、「無限大」の代わりに、十分に大きい2つの程度を取るだけで十分です。行列を累乗する便利さ

$N$

は、行列乗算を正確に生成する必要があるという事実にあります

$2^t$

自分に

実際、たとえば、

$H$

$t=8$ 。次に計算する

計算に十分です：

$H^{2^8}=H^{256}$

$H*H=H^2,\\ H^2*H^2=H^4,\\ H^4*H^4=H^8,\\ H^8*H^8=H^{16},\\ H^{16}*H^{16}=H^{32},\\ H^{32}*H^{32}=H^{64},\\ H^{64}*H^{64}=H^{128},\\ H^{128}*H^{128}=H^{256}.$

この例では、必要な確率の限界の「収束」の速度を示し

ます。表からわかるように、すでに

計算された確率

$H^8$

は、グラフモデルに基づいて以前に取得した正確な値とは異なり、小数点以下4桁です。計算された確率値

$P_{full}(c_1,CV)$

$H^{16}$ 、

$H^{32}$ 、

と一致します。したがって、この場合、計算に限定するだけで十分でした。

$H^{64}$

すべてを必要とする

$H^8$

行列乗算。したがって、必要な確率に対する限界の収束率は十分に高いため、このモデルは実際のアプリケーションで効果的です。

$3$

チャネル評価から最適化まで

構築された分析モデルにより、3つの主要な問題を解決できます。

サイトでのコンバージョンに対するチャネルの影響を評価する
チャネルが相互に影響を与えることを評価する
チャネルを使用するとサイトでのコンバージョンにつながる可能性を評価する

コンバージョンオプティマイザーを設計する際に、掲載結果に基づいてコンテキスト広告で入札単価を管理し、目的を達成できるようにする

（主要業績評価指標）、コンバージョン率を評価する必要があります

$KPI$

各キーワードフレーズ。前述のように、特定のコンバージョンアトリビューションモデルの選択は、広告チャネルのレベルだけでなく、キーフレーズのレベルでもコンバージョン率の計算に直接影響します。従来、オプティマイザーはモデルで動作します

$CR$

またはその修正。以前は限られた能力を示しました

$LCM$

は、変換率を予測します（中間接続の分析ではなく、直接接続のキーワード変換のみを考慮するため、原則として過小評価します）。提示されたコンバージョンアトリビューションモデルにはこれらの欠点がありませんが、確率を計算するためにより多くのコンピューティングリソースが必要です。説明したアプローチの柔軟性は、「チャネル」としてセッションの任意の不可欠な属性を使用できるという事実にもあります。特に、パラメータを考慮します

$LCM$

これは以前の計算では使用していませんでした。

$URL$

には、セッションの開始時にユーザーがアクセスするサイトのページに関する情報が含まれています。サイトに関連付けられている広告アカウントですべての広告がマークされている場合

$URL$

マークは、我々は非常に私たちの分析を強化することができます。

$UTM-$

タグは、追加されるデータを含むパラメーター（変数）です。

$UTM$

先（ランディング）ページおよびトラフィック特性の詳細は、ウェブ解析システムへの転送を可能にします。典型的な例を考えてみましょう

$URL$

タグ、たとえば会社が受け入れた形式

$UTM$

$Calltouch$ ：

site.ru/?utm_source=YD&utm_medium=cpc&utm_content=kvartiry_ceny&utm_campaign=YD_KVARTIRY_POISK_MSK&calltouch_tm=yd_c :{campaign_id}_gb:{gbid}_ad:{ad_id}_ph:{phrase_id}_st:{source_type}_pt:{position_type}_p:{position}_s:{source}_dt:{device_type}_reg:{region_id}_ret:{retargeting_id}_apt:{addphrasestext}

中括弧に含まれる動的パラメーターに基づいて、特に、ユーザーがクリックした広告の表示をトリガーしたキーフレーズまで、広告のクリックの「パス」を追跡できます。「合理的な」動的パラメータ（またはその組み合わせ）をチャネルとして選択できます。特に、チャンネルとしてパラメーターを選択した場合

$\ {phrase_ {id} \}$ 、その後、さまざまなキーワードについてユーザーのサイトへの移行チェーンを追跡できます。このタイプのチャネルについてすべての引数を繰り返すと、モデルは各キーフレーズの合計変換確率を計算できるようになります。

結果の変換率の配列は、変換オプティマイザーへの入力として使用できます。

おわりに

このペーパーでは、現在使用されているコンバージョンアトリビューションの古典的なモデルの概要を説明します。さらに、マルコフプロセス（チェーン）に基づくマルチチャネルアトリビューションモデルについて説明します。これにより、各広告チャネルのコンバージョンの確率を包括的に評価し、サイトでのコンバージョンに対するチャネルの影響を計算できます。構築されたモデルを適応させて、コンテキスト広告の入札単価を最適化するための実証済みのアプローチ。

Calltouchマルチチャネルアトリビューション

はじめに

アトリビューションモデル

ラストクリックモデル

最初のクリックモデル

線形モデル

タイムディケイ

ポジションタイプモデル

アトリビューションモデルの選択方法

カスタムセッション

変換に対するチャネルの影響の計算

チャネルが無効になったときの基本的なメトリックの変化の評価

モデルの説明

グラフモデル

行列モデル

チャネル評価から最適化まで

おわりに

More articles: