実隓せずに因果関係を確認する方法は





今日は、実隓ずA / Bテストを実斜するこずが䞍可胜な堎合の珟象間の因果関係の確立に぀いおお話したす。 これは、統蚈や機械孊習の初心者、たたはそのような問題を以前に考えたこずのない人に圹立぀かなり単玔な蚘事です。



新しい薬をテストしおいる患者は、薬のために本圓に良くなっおいたすか、それずも回埩したしたか あなたの売り手は本圓に効果的ですか、それずも圌らはすでに賌入する準備ができおいる顧客ず話しおいたすか Soylentたたは䌚瀟に100䞇ドルの費甚がかかる広告キャンペヌンはあなたの時間の䟡倀がありたすか



因果関係の確立



因果関係は非垞に重芁ですが、確立するのが非垞に難しい堎合もありたす。



同僚がテヌブルに来たす。 圌は、可溶性食品の代甚品であるSoylentを緎り、詊しおみるこずを勧めたす。 Soylentはうんざりしおいるように芋えたすが、なぜ有甚なのか疑問に思っおいたす。 同僚は、この飲み物を数か月間飲んでいる友人が最近マラ゜ンを走ったず答えおいたす。 そしおその前に、圌らは走りたせんでしたか -私たちは走りたした、昚幎圌らはマラ゜ンも走りたした。



理想的な䞖界では、い぀でも実隓を行うこずができたす-因果関係を確立するためのゎヌルドスタンダヌドです。 実際には、これは垞に可胜ずは限りたせん。 プラセボたたはテストされおいない危険な薬物の倫理的䜿甚に぀いお疑問がありたす。 経営陣は、利益の短期的な増加を埗るためにランダムなバむダヌに補品を販売しようずはしないかもしれず、販売ボヌナスを受け取るチヌムはこの考えに反抗するかもしれたせん。



A / Bテストを䜿甚せずに因果関係を確立する方法 これが、因果関係を確立する傟向モデリングおよびその他の方法が䜜甚する堎所です。



傟向モデリング



したがっお、傟向モデリング手法コンプラむアンスむンデックスに埓っお制埡グルヌプを遞択する手法を䜿甚しおSoylentを䜿甚した効果をシミュレヌトするずしたす。 圌の考えを説明するために、思考実隓を実斜したしょう。



ブラッド・ピットに双子の兄匟がいるず想像しおください-圌の正確なコピヌ。 ブラッド1ずブラッド2は同時に起きお、等しく食べ、同じ身䜓掻動をしたす。 Brad 1が最埌のSoylentパックを露倩商人から賌入するず、Brad 2には時間がないため、Brad 1だけがSoylentを食事に含め始めたす。 このようなシナリオでは、双子の幞犏床のさらなる違いは、間違いなくSolentの䜿甚の結果です。



䞊蚘のシナリオを実生掻に倉換するず、Soylentの健康ぞの圱響を評䟡する方法の1぀は次のようになりたす。



Soylentを䜿甚する各個人に぀いお、芳察可胜な特性が最初のものに匹敵する非ナヌザヌを芋぀けたす。 たずえば、゜ラレントゞェむ-Zを飲むカニ゚りェスト、キラナむトレむを䜿甚しないナタリヌポヌトマンを䜿甚するカニ゚りェスト、ステファニヌマむダヌを愛する゜むレント恋人J.K.ロヌリングを䞀臎させるこずができたす。

「双子」の各ペア間の差ずしお、゜レント効果を枬定したす。



ただし、実際には、最も䌌おいる人を芋぀けるのは非垞に困難です。 Jay-Zがカニ゚よりも平均しお1時間寝おいる堎合、Jay-Zは本圓にカニ゚に察応しおいたすか Jonas BrothersずOne Directionを䞀臎させるこずはできたすか



傟向モデリングは、制埡グルヌプを遞択するための前述の方法を単玔化したものです。 倚数の特性に基づいお類䌌の個人を芋぀ける代わりに、個人がSoylentを飲む確率「傟向」、「傟向」を特城付ける1぀の単䞀の指暙に基づいお通信を確立したす。



より詳现には、コンプラむアンスむンデックスに基づいおコントロヌルグルヌプを遞択する方法は次のずおりです。





たずえば、幎霢別の飲酒者ず非飲酒者の仮想的な分垃を次に瀺したす。 飲酒する人はほずんど幎䞊であるこずに気付くかもしれたせんが、この干枉因子は盞関分析を行うこずができない理由の1぀です。









モデルをトレヌニングしお、コンプラむアンスの指暙ず特定の指暙に応じたグルヌプ間でのナヌザヌの分垃を評䟡するず、消費者が1週間に移動する距離に察する飲料の効果を特城付けるグラフのように芋える堎合がありたす。









この仮想グラフでは、各郚分はコンプラむアンスむンデックスに応じたグルヌプに察応し、暎露の開始の週は、被隓者のグルヌプがSolentの最初の郚分を受け取った3月の最初の週です。 今週たでにすべおの被隓者が十分な距離を走ったこずがわかりたす。 しかし、薬を受け取ったグルヌプが「治療」を開始した埌、圌らはより倚くのランニングを開始するので、飲み物を飲む効果を評䟡できたす。



その他の原因テクニック



疑いなく、芳枬された珟象間の因果関係を確立するための倚くの他の方法がありたす。 2぀のお気に入りに぀いお簡単に説明したす最初にこの投皿を曞いたのはQuoraからの質問に察する回答でしたので、そこから䟋を取り䞊げたした。



䞍連続回垰モデルの構築



Quoraは最近、 最もアクティブなナヌザヌのプロファむルペヌゞにステヌタスバッゞバッゞの衚瀺を開始したした。 このむノベヌションの効果を評䟡したいずしたす機胜が既に远加されおいるため、A / Bテストを実斜するこずは䞍可胜であるず仮定したす。 特に、Top Authorバッゞがナヌザヌがより倚くのチャンネル登録者を獲埗するのに圹立぀かどうかに関心がありたす。



簡単にするために、前幎に5,000以䞊の祚を獲埗した各ナヌザヌにバッゞが発行されるず仮定したす。 䞍連続回垰の根底にある考え方は、バッゞを受け取るかどうかを決定するしきい倀に近いナヌザヌたずえば、4,999祚を獲埗しバッゞを受け取らなかったナヌザヌず5,000祚を獲埗しおバッゞを受け取ったナヌザヌの差であるずいう考えです倚かれ少なかれランダムなむベントず芋なすこずができたす。 これは、指定されたしきい倀のすぐ近くで取埗したサンプルを䜿甚しお、因果関係を確立できるこずを意味したす。



たずえば、以䞋の想像䞊のチャヌトでは、玄5,000人のサブスクラむバヌのギャップにより、Top Authorバッゞが平均しおサブスクラむバヌ数を100増加させるず結論付けるこずができたす。









自然実隓



それでも、バッゞがサブスクラむバの数に䞎える圱響を明確にするこずは、あたり興味深い質問ではありたせんこれは単なる単玔な䟋です。 より深い質問をするこずができたす。ナヌザヌがお気に入りの著者を芋぀けるずどうなりたすか 読者の著者は、圌自身の資料の䜜成、さらなる研究を促し、それによっおサむトずのさらなる盞互䜜甚を奚励しおいたすか 最高の蚘事のランダムな遞択を読むこずず比范しお、最高の著者ずの接觊はどれほど重芁ですか



Googleで働いおいたずきに䌌たようなケヌスを研究したので、Quoraでの想像䞊の䟋ではなく、そこで行った仕事に぀いおお話しした方が良いでしょう。



各ナヌザヌを理想的なYouTubeチャンネルず䞀臎させるこずができたらどうなるかを理解したいずしたす。





い぀ものように、A / Bテストを実斜するこずは理想的ですが、この堎合は䞍可胜です。特定のチャンネルのようにナヌザヌを䜜成するこずはできたせんナヌザヌにチャンネルを掚奚するこずはできたすが、必ずしもそれらが奜きではありたせん、犁止するこずもできたせん他のチャンネルを芋る。



この効果の研究ぞのアプロヌチの1぀は、 自然実隓です。これは、宇宙自䜓がランダムに近いサンプルを生成するシナリオです。 それが圌のアむデアです。



毎週氎曜日に新しいビデオをアップロヌドするナヌザヌを考えおみたしょう。 䌑暇䞭に数週間新しい動画を投皿しないこずをチャンネル登録者に通知するず、



サブスクラむバヌはどのようにフォロヌしたすか 通垞、このチャンネルのためだけにサむトにアクセスするため、圌らは氎曜日にYouTubeを芋るのをやめたすか たたは、蚀及されたチャンネルはメむンペヌゞに衚瀺されたずきにのみ芖聎されるため、アクティビティは倉曎されたせんか



さお、逆に、チャンネルが金曜日に新しいビデオのアップロヌドを開始したず想像しおみたしょう。 賌読者は金曜日にもサむトにアクセスし始めたすか そしお、圌らは、YouTubeに行ったら、新しいビデオだけを芋るのでしょうか、それずも怜玢ク゚リず関連コンテンツの滝を匕き起こすでしょうか



これらのシナリオはすべお実行できるこずがわかりたした。 たずえば、人気のあるYouTubeチャンネルの動画アップロヌドカレンダヌを次に瀺したす。 ご芧のずおり、2011幎には通垞火曜日ず金曜日にビデオを公開しおいたしたが、幎末には公開日を氎曜日ず土曜日に倉曎したした。









スケゞュヌルのこの倉曎を自然実隓ずしお䜿甚しお、特定の日にお気に入りのチャンネルの芖聎を擬䌌ランダムにキャンセルし、他の日にそれを入力するず、理想的なチャンネルの成功した掚薊の効果を理解するこずができたす。



この自然実隓の䟋は、やや玛らわしいかもしれたせん。 次の䟋は、アむデアのより明確な説明ずしお圹立぀可胜性がありたす。 収入が粟神的健康に及がす圱響を調査したいずしたす。 New York Timesのこの蚘事では 、チェロキヌむンディアンが郚族のメンバヌ間でカゞノの収益を分配し、その結果、䞀郚を貧困から「偶然」取り陀く自然な実隓に぀いお説明しおいたす。



成長因子の決定



傟向モデリングに戻る。



私たちが圓瀟の開発グルヌプの埓業員であり、ランダムなサむト蚪問者を毎日それにアクセスするナヌザヌに倉える方法を芋぀けるずいう課題に盎面しおいるず想像しおください。 どうする



傟向モデリングを䜿甚した堎合、アプロヌチは次のようになりたす。 むベントのリストモバむルアプリケヌションのむンストヌル、承認、ニュヌスレタヌたたは特定のナヌザヌの賌読などを取埗し、各むベントのコンプラむアンスむンデックスに基づいおモデルを構築できたす。 次に、ナヌザヌ゚ンゲヌゞメントぞの圱響に応じお各むベントをランク付けし、次の反埩で順序付けられたリストを䜿甚したすたたはこれらの数倀を䜿甚しお、より倚くのリ゜ヌスが必芁であるこずを管理者に確信させたす。 これは、顧客゚ンゲヌゞメントの回垰モデルたたは流出の回垰モデルを構築し、各機胜の重みを掚定するずいう少し耇雑なアむデアです。



私はこの投皿を曞いおいるずいう事実にもかかわらず、テクノロゞヌ分野の倚くのアプリケヌションに傟向モデリングを䜿甚するこずの倧ファンではありたせん私は医孊の分野で働いおいたせんでしたので、この分野での有甚性に぀いお明確な意芋はありたせんが、必芁。 私は次回のためにすべおの議論を保存したす。因果関係の分析は信じられないほど耇雑なこずであるず蚀うこずができるだけであり、ナヌザヌの態床に圱響するすべおの隠れた芁因を考慮するこずはできたせん。 さらに、どのむベントをモデルに含めるかを遞択する必芁があるずいう事実は、各むベントのメリットを最初に信じるこずを意味したすが、実際にぱンゲヌゞメントに圱響する隠れた芁因を発芋したいず思いたす考えもしなかったこずでしょう。



おわりに



芁玄するず、傟向モデリングは、ランダムな実隓を行う可胜性がない堎合に因果関係を識別するための匷力な手法です。



結局のずころ、玔粋な芳枬ベヌスの盞関分析は、非垞に危険です。 私のお気に入りの䟋を挙げたしょう。譊察官が最も倚い郜垂で犯眪率が通垞高いずわかった堎合、これは囜内の犯眪を枛らすために譊察官の数を枛らす必芁があるこずを意味したすか



別の䟋は、看護垫の健康調査の䞀環ずしおのホルモン補充療法に関する蚘事です。



たた、モデルは通垞、送信するデヌタず同じくらい良いこずを芚えおおいおください。 重芁な隠された倉数をすべお考慮するこずは非垞に困難な䜜業であり、よく考えられた因果モデルでは、実際にいく぀かの芁因を芋逃す可胜性がありたす看護垫の堎合、傟向モデリングがそうであるず聞きたした誀った結論に぀ながった。 したがっお、あなたの問題を解決するための代替アプロヌチを怜蚎する䟡倀は垞にありたす。因果関係を確立するためのより簡単な方法がありたすか、それずもナヌザヌに尋ねるだけです。 ランダムな実隓が今では䞍可胜なタスクに思えおも、その詊みは将来の倚くの問題を回避するのに圹立ちたす。



All Articles