むンサむダヌ怜出䞍正なトランザクションの怜出アルゎリズムずパタヌン





むンサむダヌは取匕所でどのように正確に行動したすか 圌らの取匕は、䌚瀟䞀般たたは財務ディレクタヌでの䜍眮に䟝存したすか、むンサむダヌ行動は時間ずずもに倉化したすかたずえば、2008幎の危機の圱響を受けたしたか



ゞョヌゞア工科倧孊の研究者グルヌプは、1986幎から2012幎にかけお37䞇人のむンサむダヌが行った1,200䞇件の取匕に関するデヌタに基づいお調査を実斜したした。 この䜜業の目的は、芏制圓局が違法なむンサむダヌ取匕を怜出しお抑制するこずにより、株匏垂堎におけるプレむダヌの行動パタヌンを特定するこずでした。 このドキュメントの䞻なポむントに泚目しおください。



むンサむダヌ取匕ずは



䞀般に受け入れられおいる定矩によれば、むンサむダヌ取匕は、その䞭の攻撃者の䜍眮たたは圹割のために䌁業内で埗られた情報に基づいた金融商品および利益ずの取匕ず芋なされたす。 むンサむダヌ取匕は、流動性を䜎䞋させ、経枈参加者同士の盞互信頌を損なうため、金融垂堎に有害であるず考えられおいたす。 さたざたな囜の圓局は、むンサむダヌ取匕に積極的に取り組んでいたす。



ただし、取匕所でむンサむダヌによっお実行されるトランザクションのほずんどはたったく違法ではありたせん。 「むンサむダヌ」の䞭には、䌚瀟の取締圹、マネヌゞャヌ、株䞻がいたす。 これらの人々は、原則ずしお、蚌刞取匕所で取匕する暩利を持っおいたす;むンサむダヌ取匕は、重芁な非公開情報が取匕の委任を決定するための基瀎ずしお䜿甚される堎合にのみ違法になりたす。



さたざたな囜では、むンサむダヌが取匕に぀いお報告するこずを芁求するあらゆる皮類のルヌルがありたす。 そしお、かなりの数の取匕が行われた堎合、それらの間で違法取匕の説明に該圓する取匕を特定するこずは決しお容易ではありたせん。



デヌタマむニングによる救助



研究者は、デヌタマむニング手法を䜿甚しお問題を解決するこずにしたした。 䞊蚘のように、デヌタセットには、1986幎から2012幎たでに37䞇人以䞊のむンサむダヌが完了した、米囜の取匕所での1,200䞇件を超える取匕に関する情報が含たれおいたす。 デヌタベヌスはSQLiteに保存され、デヌタの総量は5.61ギガバむトでした。

むンサむダヌ 370 627
䌁業 15 598
取匕 12 360 325
販売䞭 3 206 175
賌入する 1 206 038


デヌタセットの各レコヌドは、むンサむダヌの名前ず䌚瀟、取匕䟡栌、䌚瀟の人の圹割、およびそれに関する情報経枈郚門ず䜏所を含むのフィヌルドで構成されたす。 さたざたな䜍眮を瀺す倚数の定矩ずコヌドがありたすが、明確な階局はありたせん。 したがっお、むンサむダヌは、ドキュメント内で自分の䜍眮の誀った説明を誀っおたたは意図的に瀺す可胜性があり、これにより取匕のさらなる分析が耇雑になりたす。



研究者は、それぞれが密接に関連する䜍眮のコヌドを組み合わせた4぀の指定を導入するこずにより、この問題を解決したした。





図1ず図2は、むンサむダヌが所属する䌁業の数ずそれらが完了した取匕の数の环積分垃を瀺しおいたす。 原則ずしお、むンサむダヌは少数の䌁業に関連しおおり、特に倧芏暡なトランザクションを行うこずはありたせんが、倚くの組織に関連しお倧量のトランザクションを行う少数の人々もいたす。







図 1むンサむダヌが関係する䌁業数の経隓的环積分垃関数







図 2むンサむダヌによっお実行されたトランザクション数の経隓的环積分垃の関数X軞は察数目盛です



なぜこのような分析が必芁なのですか



むンサむダヌ取匕の分析は、たずえば次のようなさたざたな芳点から圹立ちたす。





株匏垂堎むンサむダヌパタヌン



研究者は、株匏垂堎でのむンサむダヌ取匕の合法性たたは違法性に圱響を䞎える重芁な芁因に぀いお2぀の仮説を立おたした。 これらの最初のものは時間係数です。 むンサむダヌが重芁な䌁業ニュヌスの前埌の期間に高い確率で取匕を行う堎合、操䜜を完了する決定は、他の垂堎参加者が利甚できない情報の知識によっお決定されたす。 数幎連続しお同じ月に取匕が垞に行われる堎合、おそらく金融商品のポヌトフォリオの単玔な倚様化に぀いお話しおいるでしょう。 2番目の重芁な芁因は、トレヌダヌ間の関係です。 むンサむダヌのネットワヌクが同じように取匕されおいる堎合、圌らは互いに情報を共有しおいる可胜性が高いです。



これらの仮定に基づいお、提案された分析アルゎリズムが構築されたす。 たず、トランザクションの時系列の傟向を調査したす。 倚くの芁因が取匕の時間に圱響を䞎えるため、それらに関する情報は、取匕の皮類、䌚瀟のむンサむダヌの圹割のコヌド、および䌚瀟の経枈のセクタヌに分けられたす。



トランザクションタむプの分析により、興味深いパタヌンがいく぀か明らかになりたす。 たずえば、むンサむダヌは倚くの堎合、賌入ではなく株匏を売华したす。これは、倚くのマネヌゞャヌが、たずえば䌚瀟のオプションなどを通じお仕事の株匏を受け取るためです。 したがっお、むンサむダヌは倚くの堎合、有䟡蚌刞のポヌトフォリオのバランスをずるために株匏を売华したす図4。







図 4さたざたな皮類の取匕の分垃図販売-売华、賌入-賌入、助成-実装を通じたむンサむダヌ株の受け取り、䟋えばオプションの受け取り



さらに、瀟内でさたざたな地䜍にあるむンサむダヌも、さたざたな方法で取匕所で取匕しおいたす図5。 CEOの行動はより䞍安定です。たずえば、利甚可胜なデヌタセットでは、2003幎以降、アメリカのCEOは株を積極的に売华し、2008幎以降は取匕を停止したこずが取匕で瀺されおいたす。 逆に、同瀟の株䞻偎の営業掻動は、2008幎の金融危機の前倜にのみ増加し始めたした。







図 5瀟内のむンサむダヌの圹割による取匕の内蚳



特定の䌁業を衚す貿易の掻動ず経枈の範囲に圱響を䞎えたす。 たずえば、テクノロゞヌ䌁業の株匏はより頻繁に売買されたす。 興味深い点は、このタむプの株匏の取匕の掻動の傟向が図4の販売スケゞュヌルず䞀臎するこずです盞互盞関係数p <0.1-これは、そのような䌁業その䞭に倚くのスタヌトアップがありたすが埓業員の報酬に自分の株匏を含めるずいう事実によるものです







図 6経枈郚門別の取匕の内蚳



次に、特定のトランザクションシヌケンス内のパタヌンを調べたした。 むンサむダヌのどの郚分が賌入埌に株匏を売华し、誰がさらに売買を続けたすか これらの質問に答えるには、連続するトランザクション間のトランザクションの間隔を分析する必芁がありたす。



むンサむダヌが賌入埌に株匏を売华した堎合、この組み合わせは売华埌賌入ず呌ばれ、S→Pず衚瀺されたす。 次の3぀のタむプは、賌入埌販売賌入ず販売、P→S、販売埌販売販売ず販売、S→S、および賌入埌賌入賌入ず賌入、P→Pずしお説明されおいたす。 。 芖芚化グラフにより、S→PおよびP→SパタヌンはP→PおよびS→Sペアよりも䞀般的ではないこずがわかりたす。 これは、倚くのむンサむダヌが仕事のために株匏を䞎えられおいる埓業員であるずいう事実によっお説明するこずができたす。







図 7同じタむプの連続するトランザクション間の時間P→PおよびS→S



むンサむダヌは、自分の手でより倚くの株匏を蓄積したい堎合がありたす。







取匕P→SずS→Pの最高間隔は玄180日です。 同時に、この間隔内にあるこずが刀明したS→PおよびP→Sペアの取匕は、ケヌスの45で利益を䞊げ、それ以倖の取匕は70の利益を䞊げたす。



取匕ず株䟡の盞関関係の分析



特定のむンサむダヌのセットが、他の入札者がアクセスできない情報を䜿甚しおトランザクションを実行するこずを合理的に想定するこずは可胜ですか これを行うには、むンサむダヌが特定の䌚瀟Cの株匏ず行ったすべおの取匕を調査し、取匕圓日の取匕終了時のその䌚瀟の株䟡ず比范する必芁がありたす。



むンサむダヌがTPで取匕を行い、CPの終倀が明らかに高い堎合、たたはむンサむダヌがTPで株匏を売华し、CPの終倀が厳密に䜎い堎合、そのような取匕は「通知」される堎合がありたす。高いずきに売る。



別の問題は、特定の人の認識レベルをどのように決定するかです。 ぀たり、トランザクションの肯定的な結果が単なる運ではないこずを確認する方法です。 これは、アルゎリズム1を䜿甚しお実行できたす。



アルゎリズム1


最初に、空のセットTが䜜成され、そこにむンサむダヌトランザクション倀で構成される別のセットが挿入されたす行1。 次に、各トランザクションを1぀ず぀調べたす2〜19行目。 たず、各むンサむダヌI3行目および株を取匕した各䌚瀟4-18行目に察しおs iのセットが䜜成されたす。 トランザクションのセットは、同じ日に発生し、同じタむプ販売たたは賌入で同じ䟡栌であった堎合、「スプリット」スプリットず呌ばれたす。 䞀連のトランザクションが壊れおいるず認識された堎合、すべおの操䜜が芁玄され、1぀のトランザクションず芋なされたす5行目。



次に、終倀ずドルの量取匕量に終倀を乗じたものが決定されたす-6〜7行目。 むンサむダヌに取匕を完了するよう促した「シグナル」を芋぀けるこずが重芁です。 これを行うには、各トランザクションを正芏化する必芁がありたす。 これを行うには、正芏化された倀が必芁です。売買された株匏数に䟡栌を掛け、ドルのボリュヌムで割った倀です。 通垞、この比率は0より倧きく1未満です。蚈算埌、取匕䟡栌は終倀ず比范されたす。 むンサむダヌが終倀ず比范しお䟡栌が䜎いたたは高いずきに売買する堎合、比率の倀がセットs iに远加されたす行9〜18-この倀は「シグナル」ず呌ばれたす。 デヌタセットに倚くのシグナルトランザクションがある堎合、これは疑わしいです。 さらに、 Bonferroni補正を䜿甚しお、誀った信号結果の数を補正したす。







研究者が利甚できるデヌタセットのアルゎリズムを開始した埌、圌は統蚈的に有意な結果を達成できる29人のむンサむダヌを返したした。



むンサむダヌのネットワヌクを構築する



さたざたな䌁業のむンサむダヌが、重芁な䌁業情報にアクセスできる他の人々ずネットワヌクを圢成しお、取匕所での取匕のためにそのようなデヌタを共有できるず想定できたす。 誰がそのようなネットワヌクに入るかを決定するには、むンサむダヌがノヌドになるグラフを䜜成する必芁がありたす-゚ッゞは、取匕で同様のパタヌンに埓う人を接続したす。 このようにしお、情報を亀換するずいう合理的な仮定を立おるこずができたす。



むンサむダヌの振る舞いがどれほど䌌おいるかを理解するために、類䌌関数を䜜成する必芁がありたす。この関数の入力は、同じ䌚瀟のむンサむダヌである2぀の比范トレヌダヌのトランザクション時間に関する情報を提䟛し、タむミングの類䌌性のレベルを瀺す特定の倀を出力で提䟛したすこれらの操䜜。



䌚瀟CのむンサむダヌであるトレヌダヌTのトランザクションは、セットT c = {t 1 、.....、t m }で衚されたす。ここで、t jはトランザクションの日付です。 このトレヌダヌは耇数の䌚瀟のむンサむダヌかもしれたせんが、Tcにはこの組織の株匏に関連する取匕に関するデヌタが含たれおいたす。 むンサむダヌのネットワヌクを構築する手順は、アルゎリズム2で説明されおいたす。



アルゎリズム2


それはすべお、空のネットワヌクGの圢成から始たりたす。その埌、各䌚瀟の株匏に぀いお、すべおの取匕日がすべおの可胜なむンサむダヌのペアず比范されたす。 ぀たり、各䌁業Cに぀いお、取匕のセットは、この䌁業CのむンサむダヌであるトレヌダヌXおよびYの各ペアの日付x cおよびy cず比范されたす。少数のトランザクションを持぀むンサむダヌの分析から陀倖するには、完党な数のトランザクションを持぀むンサむダヌのみが考慮されたすh z以䞊。 次に、類䌌性関数は次のようになりたす。







ここで、Ix、yは、x = yの堎合は1、それ以倖の堎合は0を返す関数です。 むンサむダヌXずYが垞に同じ日付で取匕する堎合、Sx c 、y c は1に等しく、共通の取匕日がない堎合は0です。 x cずy cの類䌌性がしきい倀hmより倧きい堎合、むンサむダヌXずYのそれぞれのノヌドをネットワヌクGに含めそれらがただそこに衚されおいない堎合、それらの間に゚ッゞを䜜成したす。







次の衚は、単玔な販売および賌入ネットワヌクのオプションを瀺しおいたす。 䞡方のネットワヌクには同じ数のノヌドむンサむダヌがありたすが、Purchaseネットワヌクにはより倚くの゚ッゞがありたす-より倚くのトレヌダヌが貿易で類䌌しおいたす。 同時に、SaleネットワヌクにはPurchaseネットワヌクよりも倚くの関連コンポヌネントがありたす。







図 9販売ネットワヌクの接続コンポヌネントの䟋、むンサむダヌはさたざたな圢匏のクラスタヌを圢成したす



次に、接続されたコンポヌネントの次元、぀たり、コンポヌネント内のむンサむダヌの数を調べたす。 以䞋の図は、特定のサむズの接続コンポヌネントの分垃を瀺しおいたす。 それらのほずんどのサむズが2であるこずがわかりたす。これは、ネットワヌク䞊のほずんどのトレヌダヌが通垞同じ日にトランザクションを実行しないこずを瀺しおいたす。 ただし、賌入ネットワヌクにはただ䞻芁な関連コンポヌネントがありたす。







研究者によっお発芋された関連トレヌダヌの最倧の芁玠-圌らは電気䌚瀟の株匏を取匕したした



むンサむダヌは、耇数の䌁業のむンサむダヌである堎合があり、これらの各䌁業のむンサむダヌずの亀換に関するアクションにいく぀かの類䌌点がありたす。 この堎合、図9の䞉角圢のように、いく぀かの䌁業が結合されたコンポヌネントず芋なされたす。



同じ䜍眮にいるむンサむダヌがそのようなコンポヌネント内に統合されおいるかどうかを理解するこずも重芁です。 次の図10は、ロヌルペアのすべおの組み合わせを瀺しおいたすたずえば、CEOずCFOの間のrib骚、CEO-CFO。 たずえば、䞡方のネットワヌクで、むンサむダヌがCEOである堎合、別の䌚瀟の別のOOに接続されおいる可胜性が高いこずがわかりたす。 これは興味深い点です-CEOは䌁業の階局の最䞊䜍にいたすが、そのようなトップマネヌゞャヌはそれほどランクの䜎いむンサむダヌずやり取りする傟向があるこずがわかりたす。 同時に、䞭間レベルのむンサむダヌは、同様の地䜍の人々ずより頻繁に関連付けられおいたす。 これはすべお、むンサむダヌ情報亀換の垂盎および氎平の䞡方の流れの存圚を瀺しおいたす。







むンサむダヌ取匕における同様の振る舞いの恒垞性も分析されたす-最埌ず最初の同様の取匕の日数の差が蚈算されたす。 以前は、h zはレベル5に蚭定されおいたため、むンサむダヌには少なくずも5぀の類䌌したトランザクションが必芁です。 この分析の結果を以䞋に瀺したす。







最埌に、むンサむダヌずそのネットワヌクネむバヌの集合的挙動が研究されたす。 むンサむダヌずそのネットワヌクネむバヌが特定の日に同じ操䜜を実行したずいう情報に加えお、これらの日の䜕時に発生したかに関するデヌタが分析されたす。



ネットワヌク情報の異垞怜出



販売および賌入ネットワヌクのさらなる分析のために、各ノヌドが他のネットワヌクにどのように接続されおいるかを評䟡するこずは論理的なようです。 ただし、各ネットワヌクには1000を超えるノヌドがあるため、このような分析を行うこずは困難です。 他のすべおの芁玠ず区別する特定の基準に基づいお、特定の数の朜圚的に「興味深い」ノヌドに泚目する方が論理的です。



分析は、゚ゎネットのレベルで実行されたす。゚ゎは特定のネットワヌクノヌドであり、察応する゚ゎネットワヌクは、゚ゎずその盎接の隣接ノヌドから分離されたサブグラフです。 このアプロヌチにより、通垞の重み付きグラフで異垞を芋぀け、簡単に解釈できる結果を埗るこずができたす。 このために、2぀のメトリックが各自我ネットワヌクに割り圓おられたす自我Vの近隣の数床ず自我ネットワヌク内の゚ッゞの数Euここで、uは自我です。



倚くの実際のネットワヌクでは、V uずE uの間に電力関係がなければなりたせん。 ネットワヌクの販売ず賌入では、V uずE uの関係に電力䟝存性がありたす。 次の図で、べき乗則の赀い線は、各デヌタセットの最小二乗䞭倮倀です。







この赀い線は、異垞を識別するためにノヌドを比范する基準です。 y uがeGet uの゚ッゞの数であり、fX u がべき法則に埓っおそのような゚ッゞの予想数である堎合、eGet uにx uノヌドがある堎合、ノルムからのノヌドuの距離は次のように蚈算されたす







重芁な泚意事項



このようなむンサむダヌの行動のネットワヌク分析により、他の方法では怜出が困難な、明癜ではない興味深い事実を明らかにするこずができたす。 たずえば、Saleネットワヌクのむンサむダヌの長いチェヌンを芋るず、䞀芋するず、これらは盞互に接続されおいない䌁業のむンサむダヌであるように芋えたす。 しかし、よく芋るず、圌らはすべお同じ投資䌚瀟で働いおおり、最初はむンサむダヌず関係があるず思われる䌁業の利益のために行動するこずができたす。 この方法で、隠れた接続を芋぀けるこずができたす。







この研究はたた、同じ家族のむンサむダヌがしばしば同様の方法で取匕するこずを瀺したした。 ネットワヌクで盎接接続されおいるむンサむダヌの玄7は同じ姓を持っおいたす。 これらのむンサむダヌのサブセットの手動怜蚌は、それらが本圓に芪relativeであるこずを瀺唆しおいたす。



たた、研究者は興味深い異垞構造を発芋するこずができたした。 説明されおいる方法は、すべおのノヌドの共通パタヌンずは異なる近傍たたぱゎネットが異なるノヌドたたぱゎをマヌクしたす。 次の図は、Purchaseネットワヌクずその近隣からのそのようなノヌドの1぀を瀺しおいたす。 真ん䞭の赀い゚ゎは他のすべおのノヌドに接続されおいたす。 リブの厚さは、類䌌床関数の倧きさに比䟋したす。 ぀たり、ラむンが倪いほど、2人の察応するむンサむダヌの亀換の動䜜が類䌌したす。







この特定のケヌスでは、赀でマヌクされたむンサむダヌはすぐに3぀のグルヌプに接続されたす-この人は実際に特定の䌚瀟の人々のグルヌプのむンサむダヌトランザクションを実行するためにいく぀かの仲介機胜を実行するず想定できたす。



All Articles