この投稿では、CalltouchシニアプロダクトマネージャーのFedor Ivanovが、キーフレーズによるコンバージョンを予測する別のアプローチの重要性について話します-サイトでの最終的なコンバージョン(マクロコンバージョンと呼ばれます)に影響する主要な指標としてマイクロコンバージョンを分析します。
マイクロコンバージョンは何をもたらすことができますか?
日常の実践では、しばしば「変換」の概念に出くわします。 この用語は、サイトでユーザーが実行するターゲットアクションを意味します。 このようなターゲットアクションの例には、トランザクション、電話、アプリケーションの送信、サイトへの登録などがあります。どのアクションがコンバージョンと見なされるかは、主に広告主の選択であり、ビジネスの詳細、サイトの機能などに基づいて行います。
コンバージョンにはある程度の価値があることは直感的に明らかです。また、単位時間あたりのサイトでコンバージョンが増えるほど、広告主が受ける利益(直接的または間接的)が増えるためです。 この点で、コンバージョン率は、最終的にコンバージョンを達成したサイト訪問者のシェアと見なすことができ、CPAは1人の「コンバージョン」訪問者を引き付ける平均価格と見なすことができます。
![](https://habrastorage.org/webt/59/e7/8b/59e78b36dd6ce806965238.png)
したがって、このモデルは単純な販売目標到達プロセスです。サイトのオーディエンス全体がエントランスに入り、アウトプットでその部分がコンバージョンを達成しました(マクロ)。
しかし、サイトでの「生活」の過程で、訪問者は何らかの方法で特定のアクションを実行し、サイトでターゲットアクションを実行する忠誠心と意欲を評価することができます。 そのようなアクションの例は次のとおりです。
- サイトの少なくとも5ページを表示する
- 「バスケット」セクションに移動します
- 連絡先情報を表示する
- ニュースレターの購読
このようなアクションは「マイクロコンバージョン」と呼ばれます。 要約すると、マイクロコンバージョンは、サイトでのユーザーの中間的なアクションであり、提供された商品やサービスへの関与と関心の度合いをある程度反映しています。 これらのアクションが追跡されるように分析システムが構成されている場合、最初の販売目標到達プロセスを大幅に強化できます。
![](https://habrastorage.org/webt/59/e7/8b/59e78b36dd715368202554.png)
マイクロコンバージョンの統計情報は、主要なマクロコンバージョンの統計情報よりも数倍速く累積する可能性があることは明らかです。 たとえば、製品を購入するユーザーよりも、サイトの5ページを表示するユーザーの数が大幅に多くなります。 この事実は、オプティマイザーの実行に必要な統計の収集を大幅に加速します。
一方、マイクロコンバージョン分析を使用すると、販売目標到達プロセスの弱点を追跡でき、ウェブサイトの分析が簡素化されます。 たとえば、サイトへの1000人の訪問者のうち200人が「バスケット」セクションにアクセスし、「バスケット」から注文したのは10人だけだった場合、ユーザーが注文するように招待されたフォームには処理と改善が必要であると想定するのが合理的です。
それにもかかわらず、マイクロコンバージョンの定義を与えたとき、特定のマイクロコンバージョンの指標が「ある程度」ユーザーの忠誠心とマクロコンバージョンを行う意欲を反映していることを無駄に言及しませんでした。 たとえば、「ユーザーセッションの長さは10分以上」という目標がマイクロコンバージョンとして選択されている場合、この目標に対する高いコンバージョン率は、サイト全体の高いコンバージョン率を必ずしも意味しません。
したがって、重要な問題は、マクロ変換に対する特定のマイクロ変換の影響の分析です。 次のセクションでは、このような分析に対する既存のアプローチについて詳しく説明します。
マイクロコンバージョンの影響評価方法
ある数量が他の数量に与える影響を評価するための最も簡単な方法(この場合、マクロ変換の特定の目標に対するマイクロ変換)は相関分析です。 このアプローチは、ランダム変数を操作する数理統計学のセクションの1つである科学で開発されました。
ランダム変数とは、一定の確率で発生するイベントであり、分布法則に従います。 したがって、変換とマイクロ変換の概念から抽象化し、ランダム変数について説明します -マクロ変換の数と -何らかの目的でのマイクロコンバージョンの数 。 セクション(サイト、個別の広告キャンペーン、さらには個別のキーワード)で観察されるこれらのインジケーターの値は、このランダム変数の実装(値)と呼ばれます。
相関係数 (ピアソン線形相関)により、ランダム変数の関係を評価できます そして 観察されたN値(特定の実装)に従って。 この値は-1〜1の値を取ります。値が近いほど 統一する(または-1にする)ほど、「ランダム」に(直接または逆に)「接続」されます。 言い換えれば、より正確に値を「推測」できる についての情報を持っている 。 最初のケースでは、依存関係は直接です。 そして2番目-反対: 。
私たちの解釈では、これは 、より多くのマイクロコンバージョンが発生しました 、マクロ変換が期待されるほど 。 もし 、より多くのマイクロコンバージョンが発生しました 、マクロ変換が期待されるほど少ない 。
ランダム変数を直接相関させる例は、購入したユーザーの数と、製品をバスケットに入れたユーザーの数です。 ランダム変数の逆相関の例は、トランザクションの数と失敗の数です。
相関係数を使用すると、ある確率変数の挙動を別の確率変数に対して正確に予測することができますが、いくつかの制限があります。 まず、サンプルの量(観測値)は非常に大きくする必要があり(数十個の観測)、ミクロレベル(たとえば、キーフレーズのレベル)で1つの量が別の量に及ぼす影響を自動的に明らかにしません。 さらに、相関計算式は、 そして ガウス(通常)です。 また、係数を計算するとき 観察可能な値のみが使用され、その平滑化(たとえば、プーリング)の間に系統的エラーが増加します。
さらに、興味深い事実は、2つの量の間に相関関係がないことは、それらの間に関係がないことを意味しないということです。 たとえば、依存関係は本質的に複雑な非線形である場合がありますが、相関関係は明らかにしません。 つまり、ゼロ相関はイベントの独立性を意味するという広く信じられていることは間違っています。 上記の明確なデモは、次の図です。
![](https://habrastorage.org/webt/59/e7/6f/59e76f43c5f50318011624.png)
2つの確率変数の相関係数は図の上に示され、これらの量の値は図自体にプロットされます。 相関関係は、他を検出することなく、線形依存関係のみを「予測」することが容易にわかります。
情報理論の原理と基本概念に基づいて、この変換が複雑で非線形であっても、異なるレベルの変換間の関係の検索を大幅に簡素化できる、マイクロ変換の分析に対する代替アプローチを提案しました。
相互情報とは何ですか?
相互情報は、一般的な情報理論の基本概念の1つです。 相互情報は、2つのランダム変数の統計関数であり、1つのランダム変数に含まれる情報の量を別のランダム変数と比較して表します。
したがって、2つの確率変数の分布がわかっている場合、1つのイベント(たとえば、マクロ変換)に関する情報が別のイベントの発生(または発生ではない)を示す量に関して、それらが相互接続されている度合い(依存関係の形式)を計算できます何らかの目的のためのマイクロコンバージョン)。
相互情報を計算するための一般式 ランダム変数間 そして 以下:
どこで -量のエントロピー そして 、そして -イベントの条件付きエントロピー イベント発生時 。 少し後で、式に含まれる各量の計算方法を検討しますが、最初に相互情報の基本的な性質について説明します。
•対称的です:
•次のものに限定されます。
•イベントが機能依存性によって関連付けられている場合、エントロピーに等しい
上記のすべてのプロパティが存在するため、相互情報はイベント間の関係を計算する際の相関関係の良い類似物と考えることができます。 特に、後者のプロパティは、任意の性質の依存関係を検出することを可能にしますが、残念ながら、その形式の確立は別個のかなり重要なタスクです。
イベント依存メトリックとしての相互情報
上記で調べたすべてのプロパティは、相互情報がイベント(コンバージョンとマイクロコンバージョン)の間のメトリックと見なされることを示しています。 ただし、実際には、正規化された相互情報を使用すると便利です。
この場合 。 さらに、相互に関連する値が小さいほど、メトリック値は1に近く、その逆も同様です。1つのイベントの開始が別のイベントについて話すほど、メトリックは0に近くなります。この種の式は、重要な属性を選択するために機械学習問題でよく使用されます(問題の次元を減らすのに役立ちます) さらに、分類およびクラスタリングの問題にも同様のアプローチが積極的に使用されています。 最終変換(マクロ)の形成に対するマイクロ変換の効果を評価するために使用することをお勧めします。
ランダム値モデリング
相互情報は、特定の分布関数を持つランダム変数についてのみ計算できるため、最初に分布を選択する必要があります そして 。 変換(およびマイクロ変換)は互いに独立して発生するため、いくつかの確率(変換およびマイクロ変換の確率) そして 、そのような量の振る舞いは、二項分布法則を使用して最も適切に記述されます。
どこの下 そして コンバージョン(マイクロコンバージョン)が発生する確率と反対のイベントの確率をそれぞれ理解しています。 そのようなモデルは、その単純さに加えて、計算に必要な統計データが不十分であるため便利です。 そして 、これらの値はプーリング方法を使用して計算できます( ppcworldを参照)。 さらに、二項分布確率変数の場合 計算するのに十分簡単 :
つまり:
変換とマイクロ変換の間の相互情報の計算における最大の難しさは、条件付きエントロピーの計算に起因します。この記事の次のセクションでは、この問題について説明します。
条件付きエントロピーの計算
ランダム変数間の条件付きエントロピー そして 次の式で計算できます。
ここで:
- -クリックがマイクロまたはマクロのいずれの変換にもつながっていない可能性
- -クリックがマクロ変換につながった可能性があるが、マイクロ変換はなかった
- -クリックがマイクロコンバージョンにつながった可能性があるが、マクロコンバージョンはなかった
- -クリックがマイクロコンバージョンとマクロコンバージョンの両方につながる可能性
- -マクロ変換がなかった場合、マイクロ変換が存在しない確率
- -マクロ変換が発生した場合、マイクロ変換が存在しない確率
- -マクロ変換がなかった場合のマイクロ変換の確率
- -マクロ変換が発生した場合、マイクロ変換の確率
条件付き確率の定義に基づいて、以下を計算できます。
したがって、計算する必要があるだけです 。
定義により:
これら4つの確率の計算には、次の統計情報の蓄積が必要です:clickIDで番号を付ける各クリックについて、このクリックによって開始されたユーザーセッションがターゲットでのマイクロコンバージョンとサイトでのマクロコンバージョンにつながったかどうかのベクトルインジケーターをコンパイルする必要があります:
どこで 目標iのコンバージョンがなかった場合、 目標iのコンバージョンがあった場合。
さらにキーワードID、バナーID、キャンペーンIDを統計に追加すると、各キーワード、バナー、キャンペーンのコンバージョンに対するマイクロコンバージョンの影響を計算できます。 独自の統計が計算に十分でないことが判明した場合、プーリング方法を使用して、より高いレベルから常に「継承」できます。 したがって、最終的に次のようになります。
![](https://habrastorage.org/webt/59/e8/71/59e871bc95b8b519103535.png)
この方法で集約された統計により、分子と分母の両方を計算できます。 最終的に、変換と各マイクロ変換の間の条件付きエントロピーを計算できるようになります。つまり、サイトでの最終変換に対するマイクロ変換の効果を計算するタスクは完全に解決されます。
さらに、キーワード、バナー、キャンペーンのレベルでデータを合計することにより、サイト全体のレベルだけでなく、より低いレベルでもコンバージョンとマイクロコンバージョンの依存関係を計算でき、最適化の効果が大幅に向上します。
次の章では、取得したデータに基づいて、マイクロコンバージョンの重みを推定する方法と、この情報を最適化に使用する方法の問題について検討します。
マイクロコンバージョンのウェイトと入札単価の最適化
サイトの全体的なコンバージョンに対する何らかの目的でのマイクロコンバージョンの効果を評価するには、正規化された重みの式を使用すると便利です。
この場合、選択されたすべての目標に対するマイクロコンバージョンのサイトでの最終的なコンバージョンへの合計効果は1です。
サイトへのすべての遷移の影響係数(重み)を計算し、最大の影響を与える目標を選択すると、マイクロコンバージョンデータが収集されるサイトのそれらの部分を最適化し(A / Bテストなど)、全体的なコンバージョンを増やすことができます。
コンテンツ広告の入札最適化の目標に直面している場合、計算する必要があります 各キーワードのレベルで (コンバージョンオプティマイザーが最適な入札単価を計算して送信するのは彼らのためです):
明らかに、キーフレーズの入札単価(キーワードX) いくつかの機能 統計に依存します (主にマクロ変換係数について )およびターゲットとして設定されているKPIから:
次に、マイクロコンバージョンを考慮した最適化のために、最後の式の一般化を使用できます。
パラメータはどこですか キーワードごとのクリック数とマクロコンバージョン数の単調減少関数です。クリック数とマクロコンバージョン数が多いほど、値は小さくなります (入札単価を計算するためのマイクロコンバージョンの動作についての知識が必要でないほど)。
したがって、マイクロコンバージョンに関する情報は、キーワードに関する統計情報が少ない場合に特に価値があります。
最適化の場合
このペーパーで説明するアルゴリズムは、Calltouch変換オプティマイザーの不可欠な部分です。 マイクロコンバージョンに基づく最適化は、オプティマイザーが確立されたKPI内で最大化しようとする変換の数が少ない場合に特に効果的です。 これは、小さな広告アカウントの場合、または特定のタイプのコンバージョンを選択する場合のいずれかです。 コールの最適化を検討する場合(このタイプの最適化に特化したのはCalltouchです)、タグ付きコールは特定のタイプの変換です。 システムでは、手動とCalltouch Predict自動タグ付けツールの両方を使用して、通話にタグを付けることができます。
このセクションでは、BIIKS(井戸掘削)のコンテキスト最適化に関するAshmanov&Partners機関との共同ケーススタディの結果を示します。 このテストの目的は、現在のCPA内で聞かれるターゲットコールの数を増やすことでした。
テスト結果:
コンバージョンコスト:広告キャンペーンをCalltouch Optimizerに接続することにより、クライアントは最大の通話を受信しながら、現在のコンバージョンコストを維持することを期待していました。テストの最初の4週間で、次の結果が達成されました。
![](https://habrastorage.org/webt/59/e6/1c/59e61c2220735091185206.png)
コンバージョン率:Calltouch Optimizerに接続された広告キャンペーンで、テスト期間のコンバージョン率が55%増加しました。
![](https://habrastorage.org/webt/59/e6/1c/59e61c22206d2610267406.png)
コンバージョン数:テスト期間中のコンバージョン数が大幅に増加しました:オプティマイザー使用時の増加は91%でした
![](https://habrastorage.org/webt/59/e6/1c/59e61c2246ee5059718400.png)
おわりに
この論文では、マイクロコンバージョンの分析に対する新しいアプローチと、サイトでのメインコンバージョンへの影響について検討します。このアプローチは、情報理論の原理に基づいています。その実装には、分析システムによって監視される特定の目標を選択し、その中からメイン(コンバージョン)を選択し、少なくとも30日前にサイトへのクリックに関する統計を蓄積するだけで十分です。この記事で提案されている手法は、サイト上の「弱い」スポットを特定するためにも、コンテキスト広告のレートを最適化するためにも使用できます。