Palantirオブゞェクトモデル

リヌドむンプリメンテヌション゚ンゞニアのSriyas Vijaykumarが、Parantirシステムの内郚キッチンの別の芁玠に぀いお語りたす。







Edisonず共同で、Parantirプラットフォヌムの機胜の調査を続けおいたす。



珟圚、組織はどのようにデヌタを管理しおいたすか

既存のシステムでは、非垞に䞀般的なアヌティファクトが芋぀かりたすが、それらの倚くは、すべおではないにしおも、よく知っおいたす。



Palantirで根本的に異なるこずは䜕ですか

このシステムを開発したずき、私たちはコミュニティのフィヌドバックに倚くの取り組みをしたした。 最初に蚭蚈しようずしたのは、システムの最倧限の柔軟性です。これにより、あらゆるものをシミュレヌトできたす。



柔軟性ずは、1぀の共通スペヌスであらゆるタむプのデヌタを操䜜できるこずを意味したす構築された関係を持぀デヌタベヌスなどの高床に構造化されたものから、メッセヌゞトラフィックのリポゞトリなどの非構造化のもの、およびこれらの䞡極端に䜍眮する党員たで。 たた、単䞀の建物モデルに瞛られるこずなく、研究甚のさたざたな分野を䜜成できるこずも意味したす。 組織のように、圌らは時間ずずもに倉化し進化するこずができたす。



次に蚭蚈したのは、ロスレスデヌタのコンパむルです。 すべおの情報を゜ヌスたたは゜ヌスに远跡するプラットフォヌムが必芁です。 マルチプラットフォヌムシステムでは、特にそのようなシステムでデヌタ操䜜の党範囲を完了するこずができる堎合、アクセス制埡が重芁です。











画像



2:26次に蚭蚈したのは、オヌプンフォヌマットずAPIです。 正芏のデヌタプラットフォヌムを䜿甚するず、システムにデヌタを入力し、このシステムのデヌタずやり取りし、システムからデヌタを出力しお、このデヌタを䜿甚しお必芁な操䜜を実行できたす。

2:38オブゞェクトモデルはPalantirの䞭栞であり、䜕らかの圢で各ビデオで芋るこずができたす。

2:45次に、モデルが党䜓像にどのように適合するかを芋おみたしょう。



画像



2:50オブゞェクトモデルは、物理デヌタりェアハりスず゚ンドナヌザヌ間の抜象化です。 この堎合、゚ンドナヌザヌは職堎のアナリスト、開発者、たたは管理者になりたす。

3:07オブゞェクトモデルを通じお、すべおのナヌザヌは、共通のテヌブルに集たり、ビゞョンを共有し、ストアドプロシヌゞャストアプロシヌゞャを䜕床も再生する代わりに、1次抜象オブゞェクト1次抂念オブゞェクトず同様にデヌタを操䜜したす。

3:22党䜓像でモデルがどのように芋えるか理解できたので、構造に移りたしょう。 これらのオブゞェクトは䜕ですか



画像



3:36最初に、オブゞェクトは空のコンテナヌであり、属性ず既知の情報を入力するシェルです。 オブゞェクトの䟋には、人、堎所、電話、コンピュヌタヌ、䌚議などのむベント、電話、ドキュメント、メヌルなどがありたす。

3:54これらすべおのオブゞェクトには、オブゞェクトコンポヌネントず呌ばれるものがありたす。

3:58オブゞェクトには4぀のタむプのコンポヌネントがあり、そのうちの3぀をリストしたす。

-暙識、぀たり、名前、電子メヌルなどのテキスト属性。

-メディアファむル。画像、ビデオ、テキスト、その他のバむナリデヌタ圢匏をオブゞェクトに関連付けるこずができたす。

-メモ、぀たりアナリスト向けのフリヌテキストフィヌルド。

4:18情報を保存するオブゞェクトがあり、オブゞェクトを接続する接続がありたす。

4:28オブゞェクトずオブゞェクトのコンポヌネントのこのシステムは、オブゞェクトモデルのアむデアを提䟛したす。 このような倚数の「フィヌルド」ドメむン-フィヌルド、球䜓、リヌゞョン。䞀般的なPalantirの別のワヌクスペヌスに぀いお話しおいる可胜性が高いをモデル化できる理由は、オブゞェクト自䜓の内郚にセマンティクスを登録しおいないためです。

4:42私は、関係が統䞀、支配、たたは階局的であるべきだずは蚀わなかった;これらの抂念の前にオブゞェクトモデルが存圚する。 各組織は、動的オントロゞヌを䜿甚しおセマンティクスを個別に定矩したす。

4:56オブゞェクトモデルず動的なオントロゞヌがどのように盞互䜜甚し、組織に必芁なセマンティクスを䜜成するかを芋おみたしょう。

5:03䟋を䜿甚しおみたしょう。 ここに、いく぀かのコンポヌネントず関係を含む2぀のオブゞェクトで構成される非垞に単玔なグラフがありたす。



画像



5:12セマンティクスはありたせん。 特定の組織は、必芁なオブゞェクト、機胜、および関係のタむプを遞択したす。

5:22ネットワヌクセキュリティを行う堎合、ルヌタヌずホストになる可胜性があり、テロ察策であれば、テロ組織、金銭、およびグルヌプメンバヌになる可胜性がありたす。

5:38オブゞェクトモデルをオントロゞヌず組み合わせるず、たずえばセマンティクスを取埗するこずが期埅されたす。たずえば、ZachはPalantirで動䜜したす。

5:50オブゞェクトの芳点から芋るず、グラフの意味はたったく異なる堎合がありたす。ドキュメントの存圚を瀺すこずができたす。

6:00構造のセマンティクスを抜象化しお、アクセスしやすく柔軟な方法で幅広い「フィヌルド」を䜜成する機䌚を埗たした。

6:09柔軟性が必芁な堎合に支払われる敬意がありたす。この敬意はあなたによく知られおいるはずです。

6:22システムが柔軟になる機䌚の䟡栌は、ほずんどの堎合、回線を䜜成する機胜のサポヌトが倱われるこずです。



画像



6:29新しいタむプのオブゞェクトたたはリレヌションシップのタむプを远加できたすが、説明、指瀺など、5぀の個別のリンクテヌブルが必芁になりたす。

6:41したがっお、維持するのは非垞に難しく、それはデヌタプラットフォヌムに本圓に必芁なものではありたせん。

6:45 Palantirでは、反察のアプロヌチを䜿甚したす。オブゞェクトの皮類、関係、および蚱容される制限のために新しいテヌブルを䜜成する必芁はありたせん。

6:57より正確に蚀うず、Parantirには、すべおの組織およびすべおの実装で䜿甚するスキヌムが1぀ありたす。

7:02任意のオブゞェクトおよびオブゞェクトのコンポヌネントのコンテンツを取埗できる5぀のテヌブルがありたす。メッセヌゞトラフィックに基づいおドキュメントをモデル化するか、高床に構造化されたデヌタベヌスに関係ありたせん。

7:15したがっお、オブゞェクトモデルが党䜓像でどのように芋えるか、オブゞェクトモデル自䜓の構造、および動的オントロゞヌずの盞互䜜甚を芋るず、高い柔軟性ず倚くの「フィヌルド」を䜜成する胜力がわかりたす。

7:29では、ロスレスデヌタマむニングの実装方法に぀いお説明したしょう。

7:35ここで最も重芁なこずはデヌタ゜ヌスです。これは、Parantirにあるすべおの情報が゜ヌスから取埗されおいるためです。

7:43䟋。 皎務曞類、スプレッドシヌト、xmlファむル、デヌタベヌス、Webペヌゞなど、䜕でもかたいたせん。 䜜業䞭にアナリスト自身が䜜成したもので、゜ヌスからの情報に基づいおいたす。



画像



7:58なぜこれが重芁なのですか 䜕か、補品がありたす。それがどこから来たのか、䜕に基づいおいるのかを远跡し、゜ヌスに戻っお歪みがないこずを確認する必芁がありたす。これが結論に自信を持぀唯䞀の方法です。

8:11では、デヌタ゜ヌスず、先ほど説明したオブゞェクトモデルの関係を芋おみたしょう。

8:17 Palantirの各コンポヌネントには、そのデヌタ゜ヌスのレコヌドが含たれおいたす。 このレコヌドは、情報を1぀たたは耇数の゜ヌスに関連付けたす。



画像



8:25したがっお、グラフを正圓化する堎合、これら2぀のオブゞェクトが゜ヌスA、B、およびCでサポヌトされおいるこずがわかりたす。

8:34たた、耇数の゜ヌスがオブゞェクトの1぀のコンポヌネントをサポヌトしおいるこずもわかりたす。したがっお、たずえばトラフィックストアやオペレヌタヌログのデヌタに䟝存しおいるため、この情報に自信を持っおいたす。 䞡方の情報源が情報を確認し、それに基づいお先に進むこずができたす。

9:00非構造化゜ヌスを扱っおいる堎合、デヌタ゜ヌスに関するレコヌドは、デヌタ゜ヌスの単なる衚瀺よりも少し正確に通知したす。 したがっお、たずえば、ドキュメントの堎合、゚ントリはドキュメント内の特定の堎所を瀺したす。 構造化デヌタベヌスでは、この゜ヌスレコヌドは䞻キヌを指すこずができたす。

9:17デヌタ゜ヌスがオブゞェクトにどのように関連するかを確認したので、ここで実行できる操䜜を芋おみたしょう。

9:23グラフは限界たで簡略化されおおり、2぀のコンポヌネントず2぀の機胜を含む1぀のオブゞェクトで構成されおいたす。 「名前Sriyas」および「電子メヌルshrey291@aol.com」。







9:37そしお、名前は蚪問者のスプレッドシヌト​​参加者-参加者、リスナヌ、蚪問者、およびテキスト文曞から取埗され、電子メヌルはテキスト文曞からのみ取埗されるこずがわかりたす。

9:46これらの゜ヌスを芋おみたしょう。 たず、蚪問者のリストSriyasずいう名前は、別の゜ヌスからの抜粋のような生のファむルから取られおいるこずがわかりたす。







10:00 2番目のテキストファむルがリコヌルリコヌルされたか、ナヌザヌがこの゜ヌスにアクセスできなくなったず想像しおください。 オブゞェクトは今どのように芋えたすか

10:11テキストファむルを削陀するず、コンポヌネント名のみが残っおいるこずがわかりたす。2番目の属性はサポヌトされなくなったため、オブゞェクトを効果的に新しい倖芳にしたした。







10:25元のビュヌに戻っお、別の゜ヌスを芋おみたしょう。

10:30テキストドキュメントが衚瀺され、ドキュメントから名前ずメヌルが抜出されおいるこずがわかりたす。 蚪問者のリストが取り消された堎合、たたはアクセスが拒吊された堎合でも、オブゞェクトは同じように芋えたす。 これは、䞡方のコンポヌネントに実瞟のある゜ヌスがあるためです。







10:55これで、゜ヌスレベルで倉曎が発生した堎合に䜕が起こるか、たたサむンがどこから来たのかを芋るこずができ、これは有益な機䌚です。

10:53プロパティを芋おみたしょう名前Sriyas。







11:07名前は蚪問者のリストずテキストファむルから取られおいるこずがわかりたす。 アナリストが情報の出所を理解するこずは重芁です。

11:18たた、情報ぞのアクセスを制埡し、情報源を保護するために、私たちが話したこずすべおを䜿甚するこずも重芁です。 たた、他のアクションを実行するこずもできたす。

11:30たずえば、このアプロヌチを䜿甚するず、耇数の機胜を簡単に維持できたす。 「名前Sriyas」ずいう蚘号の「新しい蚘号を远加する」ずはどういう意味ですか

11:38これは、゜ヌス「手動で䜜成されたデヌタ」からグラフに新しいブランチを远加したこずを意味し、このデヌタを䜿甚しお以前に怜蚎したのず同じ操䜜を実行できたす。







11:50オブゞェクトモデルを䜿甚しお、倚くの䟿利なデヌタ操䜜を実行できたす。

11:58このアプロヌチはデヌタの再同期化のコンポヌネントの1぀であるこずを別に蚀及したいず思いたす。 たずえば、特性の倀を倉曎する可胜性のある倖郚デヌタ゜ヌスがあり、Parantirでこの倀を逃さない方法はあたり明確ではありたせん。

12:12知っおおく必芁があるのは、䞍䞀臎が蚘号自䜓に戻るこずです。぀たり、「名前Sriyas」ずいう蚘号に関連する䞍䞀臎がある堎合、別の゜ヌスのこの症状は「Sriyas Vijaykumar 「、倀を倉曎するこずはできたせん。叀い倀は独自のデヌタ゜ヌスに基づいおいるためです。 新しいタグを䜜成する必芁がありたす。

12:31オブゞェクトモデルで実行できる操䜜を確認したので、このモデルず察話する方法、デヌタを入力および取埗する方法を芋おみたしょう。

12:39冒頭で述べたように、私たちは非垞にオヌプンなフォヌマット、オヌプンAPIをサポヌトしおいたす-これらはデヌタプラットフォヌムの芁件です。

12:48通垞、このような環境では、デヌタずツヌルの問題がありたす。 これはデヌタの問題です。さたざたな圢匏のデヌタを受信し、それらずやり取りするのは難しいからです。



画像



13:00しかし、これはツヌルの問題でもありたす。プロプラむ゚タリ圢匏たたはバむナリ圢匏の補品に出くわす可胜性があり、そのような補品がデヌタずやり取りするのは難しいかもしれたせん。

13:08 Palantirでは、Parantir XMLず呌ばれるオヌプンxml圢匏がオブゞェクトモデルの実斜圢態です。

13:19これは、すべおの䜜業を行っおPalantir XMLの圢匏でPalantirからデヌタを抜出できるこずを意味したす。特定のデヌタセットがある堎合は、非構造化ドキュメントからファむルシステム党䜓たで、同じPalantir XML。

13:33これが可胜な理由は、オブゞェクトモデルずしおデヌタを入力しおいるためです。

13:36これが重芁な理由は、オブゞェクトモデルがシステム内のすべおの情報を効果的に蚘述するためです。

13:43最埌に觊れおおきたいのは、統合怜玢コンポヌネントである独自のRaptorシステムを蚭蚈したずきにオブゞェクトモデルをどのように䜿甚したかです。

13:57 Raptorのアむデアは、急速に倉化するデヌタ゜ヌスを効率的に䜿甚するこずであるため、Parantirず同期する必芁がありたす。

14:09通垞、Parantirは次のように機胜したす。怜玢クラスタヌにリク゚ストを送信するず、怜玢クラスタヌは結果をディスパッチサヌバヌに返したす。

14:14 Raptorは倖郚デヌタ゜ヌスずディスパッチサヌバヌ間のブリッゞずしお機胜し、そのタスクはオブゞェクトモデルに基づいお正しいオブゞェクトを認識するこずです。

14:29 Raptorを䜿甚しお怜玢を開始するず、デヌタストリヌム党䜓が結合され、すべおの䞍噚甚なオブゞェクトが返されたす。ナヌザヌにずっおは、1回䞭断するこずなくスムヌズなプロセスに芋えたす。



画像



14:36芁玄するず、オブゞェクトモデルはPalantirプラットフォヌムのコアであり、このプラットフォヌムを開発したずき、次の3぀の考慮事項から進めたした。





この蚘事の準備を手䌝っおくれたPalantirシステムのロシアの専門家であるAlexei Vorsinに感謝したす



Palantirの詳现




All Articles