IMOに忠実なプレイヤーを残すことの予測

前の記事で、 Innovaでデータマイニングを使用して、ゲームで過ごした数時間または数日間の行動のログに基づいて、Aion MMORPGで出発し始めたばかりの新人の出発を予測する方法について説明しました。 しかし、ゲームに何ヶ月も何年も費やしてきた退役軍人もいます。 同じデータマイニング方法で関心の衰退を予測するために、すでに高い精度で学習しています。



技術的な詳細



最後の記事から何も変わっていません。データマイニングでは、2つのデュアルXeon E5630 32Gb RAMブレード、ソースおよび中間データ用の10 Tbコールドストレージ、作業データ用のRAID10 SASアレイの3 Tbホットストレージがまだあります。 MS SQL 2008R2の下の両方のサーバー-1つはデータベースの下、もう1つはAnalysis Servicesの下。 ソリューションのソフトウェア部分は、SQL Serverに含まれる標準のMicrosoft Business Intelligenceパッケージです。



入力-38,000人の熱狂的なプレーヤーの6か月間のアクティビティログ。



退去と見なすもの



初心者の場合、質問は立っていませんでした-数分または数時間でゲームを終了し、実際にはすべて-プレイヤーが失われます。 最終日、人がゲームに参加したとき、出発日を記録し、この情報でニューラルネットワークをトレーニングしました。 しかし、退役軍人のために、どの事実が出発と見なされ、最終的に何を予測するかを正しく決定するために、いくつかの反復を行いました。 最初の仮定は最も単純なものでした。つまり、人はすべてが好きなときにプレイし、その後プレイを停止します。 カレンダーにゲームの日を記して、次のようなものを期待しました。











私たちのアイデアは、最後のゲームの日が予測する出口点だということでした。 しかし、現実ははるかに複雑であることが判明し、ほとんどのプレイヤーは次のように動作します。











正式にゲームの最終日となる8月25日の出発の瞬間とは何ですか? または、たとえば、1週間ゲームに参加している人がいなかった16日ですか? または、7日間連続でゲームを始めていない7月31日ですか? さまざまな仮説を試してみましたが、最も単純なものはまったく機能しませんでした。 特定の日がゲームの最終日になることを予測するために、65%の悲しい精度で成功しました。



データをよく見ると、最後のカレンダーに示されているように、ほとんどのプレイヤーはゲームの日数が長くなっていることに気付きました-数週間または数ヶ月の残りのアクティビティ。 彼らは実際に既に積極的プレイを停止していますが、それでも時々ゲームに参加します。 実際、そのような人々のために、すでにケアが行われています-彼らはもはやゲームに満足していないが、inertia性で行きます-友人とチャットしたり、物を売ったり、彼らのアカウントさえ一族のメンバーによって使用されています。



次のステップは、経験則に従って尾を切り落とすことで、活動が落ち始めた真の日に到達しようとすることでした。 最も効果的なアプローチは、「 過去30日間の合計アクティビティが9日間未満になったときのゲームの最終日 」で、精度は約80%でした。 しかし、経験的なアプローチは忠実ではあるがあまりアクティブではないプレーヤーにはうまくいきませんでしたので、さらに考えなければなりませんでした。



セグメンテーションへの移行



成功は、バイナリ思考の「左/左」から既存のアクティビティクラスターの使用への移行でした。「プレイヤーがゲームを離れた」状況から「プレイヤーのアクティビティが出発の可能性のしきい値を下回る」状況です。 ここ数年、過去30日間のアクティビティの日数である使用頻度の指標(西洋の文献では頻度)を使用しています 。 簡単に言えば、私たちは毎日、1日おき、週に数日、または月に一度、ゲームに参加している人を見かけます。 頻度によって、アクティビティクラスターを構築し、対象者をセグメント化します。







ここで、ゲームからの離脱に隣接する極度に非アクティブなゾーンであるピットに陥ることとして出発を定義します。 この再定義は数学的であるだけでなく、ビジネスの観点からも明確な意味を持ちます-プレイヤーがもはや私たちと一緒ではないことを事後的に予測する代わりに、理由を見つけるために数週間前に彼の将来の非活動を予測したいですさらにプレイする意欲を高めました。



新しいアプローチは、セグメント[7-9]、[10-15]および[16-20]については2週間で、またセグメント[21-25]については3週間後にピットに落ちる危険性のあるプレーヤーの予測でした。 つまり、勢いを失っているプレーヤーを探しています。そのプレーヤーの活動は、今後数週間で大幅に低下するはずです。







メトリックの選択



最初のデータマイニングプロジェクトから、合計アクティビティの重要なメトリックが引き出しを予測するためにどれほど重要であるかを学びました。 今、彼らは重要な役割を果たすことが期待されていますが、それでも、他のソーシャルおよびゲーム固有のメトリックを試すことにしました:





数学



以前は、初心者には1〜2日のゲームデータが使用されていたため、モデルに瞬時値があり、必要な最大値はメトリックの正規化でした。 ただし、退役軍人の場合は、週と月のスケールに注目するため、移動平均と合計、微分、傾斜角など、時間ごとのデータの集計が必要です。







たとえば、30暦日のゲーミング日の移動量を使用し、T-SQLで直接完全に計算される最小二乗法で直線的に近似しました 。 線の係数は、データマイニングモデルへの入力に送られます。 そして、ゲームに費やされた毎日の時間を分析するために、非アクティブな日を捨てる別のステップが追加されました。







ETLは実際にやり直され、すべてのデータがリロードされましたが、アプローチは明確に正しいものでした。最初のクラスターは、未加工の手動で構成されていないモデル[16-20]で実行され、精度は80%未満でした。 さまざまな期間と集計およびカウントの方法で30を超えるさまざまなメトリックを試した後、アクティビティのすべてのセグメントのピットへの転落を予測する精度が80〜90%になりました。 すでに良い結果が得られましたが、もっと欲しいと思いました。 そして数ヶ月間、彼らはさらに別のアイデアを思いつくまで、精度を改善するのに苦労しました。



過去に戻る



データを時間軸に沿って延期すると、図は次のようになります。











ゼロポイントは、2〜3週間前に予測を行う日です(前述のように、セグメントによって異なります)。 異なる期間に対して計算された異なるメトリックがモデル入力に送られます。たとえば、 X日間に対して計算されたゲームの日の移動平均プレイ時間の1次微分です 。 重要なこと:すべてのメトリックは、ゼロ点からカウントされます-3日間、5日間など。



新鮮な考えは、過去をより詳細に調べることでした。 たとえば、7日間のゲーム1日あたりの移動平均プレイ時間の同じ導関数を計算できますが、14日前-ゼロポイントの2週間前です。 プレーヤーのフェードアクティビティの長い尾を覚えていますか? 実際、コンポーネントのテールセクションと、データモデルによる独立した分析を思い付きました。 過去の期間と深さについていくつかのオプションを試しました。特に、サンプル(7、-21)は効果的でした-21日前の7日間、(7、-14)、(7、-7)、(14、-14)。











このアイデアは突破口となり、ほぼすべてのセグメントで精度が95%に向上しました。







ブラックボックス内



このプロジェクトの最も顕著な結果は、最終的なデータマイニングモデルであり、さまざまな数学的組み合わせと2つのメトリック (毎日の活動とプレイ時間) からの計算に完全に基づいて、第2種の精度とエラーで最高の結果が得られます!



セグメントごとに、モデルでは異なるメトリックが重要でした。 たとえば、[21–25]の場合、詳細な過去の絶対にすべての計算が必要でした。 しかし、[7–9]の場合、30日間の近似値が最も近い過去と一緒に重要であることが判明しました。ゼロ点までの3日間と5日間のデータです。 すべてのモデルは、導関数、ゼロ値、および線形近似係数に基づいていました-すべては、初心者の予測のために操作した単純な瞬時値よりもはるかに複雑です。 最終モデルの例( 写真はクリック可能です ):







そして、あなたがこれが魔法の数学を備えたある種のブラックボックスであるという印象を持っているならば、私たちはこの意見を完全に共有します、私たちにとってそれはブラックボックスです。 初心者向けの予測でさえ、マイニングの日付が去る理由についてほとんど語っていないことに驚きました。 出発を高精度で予測しましたが、なぜこれが起こっているのか分かりませんでした。 しかし、初心者のために、少なくとも彼らのプレイスタイルと使用されたゲーム機能に関する多くのデータを取得し、これらのデータに基づいて個々のメールヒントのシステムを作成しました。 退役軍人の場合、少なくとも人間が読める結果を得ることができませんでした。 これは美しく、95%正確ですが、完全に不透明なブラックボックスです。



まとめ



忠実なプレーヤーのゲームアクティビティが大幅に低下することを、2〜3週間前に予測できます。これにより、コミュニティマネージャーがそのようなプレーヤーの面倒を見て、理由を見つけ、ゲームへの関心を高めることができます。



このデータマイニングプロジェクトは、初心者向けの予測よりもはるかに複雑であることが判明しました。 実験と微調整により多くの時間が費やされましたが、最終的には95%の精度のしきい値に達しました。 最も興味深いことに、一般に、Aion固有のメトリックは最終モデルに該当しませんでした。 予測は、ゲーム費やされた 毎日のアクティビティと時間の派生メトリックにのみ基づいており、ゲームだけでなく、すべてのWebサービスに適用できます。



All Articles