生命とグラフ:システムモデリングへのネットワーク化されたアプローチ





あらゆる種類のネットワークが現代世界を支配しています。 ほとんどすべてのデータをネットワーク構造として表すことができます。 同時に、多くの人々は、ネットワークの原理がさまざまなシステムの基礎であることを認識せず、理解していません。 この投稿では、さまざまなシステムをシミュレートし、その長所と短所を分析するいくつかのタイプのネットワークを検討し、モデリングへのネットワークアプローチがもたらすメリットについても説明します。



ネットワークと市場



取引とは、取引の参加者が別の参加者によって製品またはサービスを販売するプロセスです。つまり、一種のネットワークです。 市場ネットワークの分析は、経済がどのように機能するかを理解するのに役立ちます。

少し前に、就職活動プロセスを研究していたMark Granovetterは、 弱いつながりの力を発見しました。







Granovetterの研究は、ソーシャルネットワークの分析に非常に大きな影響を与えました。 特に、それは常識に反する何かを主張します:連絡先の少ない専門家(弱いつながり)は、仕事に関する有用な情報の最良の情報源である可能性があります。あなたがより密にコミュニケーションをとる人々にアクセス可能です(強い接続)。 この「弱リンク仮説」は今日、あらゆる種類の関係を分析するために使用されています。



数十年前、ソーシャルネットワークを分析する際、研究者は個人的な経験を通じて収集したデータのみを操作し、最も近い仲間にインタビューし、「現場」で多くの時間を費やしていました。 今日、無数のウェブサイトやソーシャルネットワーキングアプリケーションが分析用の生データを提供しています。 はい。インターネット自体は、ウェブサイト間の論理的な関係を反映した大きなグラフの形で表すことができます。 そして、これらの生態系の機能の原則を研究して理解するために、ソーシャルネットワークの分析に使用されるさまざまな手法を使用できます。 実際、今日の分析の有能な使用は、ソーシャルネットワークの分野における主要な革新の1つです。



成功ネットワーク



ネットワークを使用して市場関係を理解する方法は他にもあります。







これは、2010年現在のアトランタの情報セキュリティの分野における新興企業間の関係の図です。 彼らはスタートアップの参加者自身とLinkedInやGoogleから受け取った情報のおかげでそれを構築することができた。 図の各ノードは会社に対応しています。 ノードAとBの間の接続は、会社Bの創設者が以前に会社Aで働いていたことを示唆しています。たとえば、Internet Security Systems(ISS)とSecureITはスタートアップの創業者の真のインキュベーターであり、図に示されている会社のほとんどを生み出しています。



この単純な図は、ネットワークベースの原則がスタートアップエコシステムプロセスの根底にあるという考えをよく示しています。 いわゆる「成功ネットワーク」のおかげで、企業のクラスター全体が一緒に生き残ります。これは、同じ方向に働き、多数のスキル、ソーシャルキャピタル、および金融リソースを開発する個人間の関係です。



このネットワークは、 PayPal MafiaFairchildrenなどの多くの有名なソーシャルネットワークに似ています。 ここでいう「 ソーシャルネットワーク 」とは、FacebookやVKontakteではなく、ソーシャルネットワークの分析を使用して研究される社会構造を意味します



上記の図は、スタートアップとエコシステムの作成における指導とトレーニングの重要性を証明しています。 会社のIPOに従業員が参加することは、各従業員がスタートアップ資本を獲得することに相当します。 地方では、従業員は通常、リスクを冒して独自のスタートアップを作成するための能力と財源が不十分であるため、地方の企業がスタートアップのエコシステムに存在することはほとんどありません。



ただし、一部のスタートアップが他のスタートアップの生成を開始するとすぐに、エコシステムは自己開発型になり、外部のサポートは不要になります。 起業家の初期の世代は自分自身に投資し始め、新しい起業家の指導者となり、出現した各クラスターはより安定し、その中の関係は拡大します。



そのようなスキームから利益を得る方法の1つは、そのようなクラスターを構成する企業に投資することです。 当然、このためには、利用可能なデータの配列を分析し、ダイアグラムを構築することにより、これらの関係を最初に識別する必要があります。 したがって、クラスター内の企業間の相互作用の相乗効果により、市場での成功の可能性が高まるため、投資損失の割合を減らすことができます。



InMaps LinkedIn



かつて、LinkedInで働いていたAli Imamは 、InMapsをサイドプロジェクトとして開発しました。 しかし、彼は非常に成功し、聴衆は熱意をもってこの機能を使い始めました。



InMapsは、 スノーボールサンプリングと1.5ホップネットワークを使用するアプリケーションの優れた例です。 「雪だるま」は、1人以上の人で始まり、友人、友人の友人、友人の友人などが選択に含まれるにつれて雪だるまのように成長するサンプルです。 サンプルが十分に大きくなり、必要な結論がその根拠に基づいて得られるまで。 「1.5年のレセプションを備えたネットワーク」とは、オブジェクトまたは人の周りに形成された人々のローカルグループを意味しました。 これら2つの概念は、全体をカバーできない大きなグラフの個々の部分を分析するのに役立ちます。



LinkedInユーザーがInMapsに連れて行かれ、彼に関連する人々、およびそれらの間の接続が追加されました-それは「1.5年のレセプションを持つネットワーク」でした。 元の人物と彼に関連付けられた人物が「放射状」に接続されていない状態で撮影された場合、これは「1回の取得でネットワーク」になります。 「セントラル」ユーザーの友人間の接続だけでなく、最初のユーザーと接続していない他の人との接続を含めると、「2つのレセプションを持つネットワーク」が得られます。



面白いですが、結果としてInMapsのバグの1つが機能に変わりました。 開発の最終段階では、ユーザーがアプリケーションで作成されたクラスターに名前を付けることができる機能はまだ実装されていません。 同時に、開発者に疑問が生じました。プロジェクトにユーザーの注意を引き付ける方法は?



最終的に、開発者の1人の兄弟の関係の地図が大判プリンターで印刷され、彼は自分で発明したクラスターの名前を手動で接着しました。 このストロークは、マップ上のクラスターに名前を付ける必要があるときに、その後ユーザーに大いに好かれました。 これは、新しいツールに関する情報のウイルスの普及を強化するだけであり、その助けを借りて、あなたのキャリア全体、職業活動を視覚化することができました。







メールボックスネットワーク



ネットワークのもう1つの興味深い例は、 エンロンのデータ分析の結果です。 企業の破産に伴う大規模な調査中に、約0.5 GBの電子メールが収集され、その後、さまざまな統計ソフトウェアをテストするための標準データセットになりました。



エンロンのデータを扱った後、この記事の著者であるラッセル・ジャーニーは、他人の手紙ではなく個人情報を扱いたいと判断しました。 これを行うために、彼はGmailのInboxフォルダーから文字をダウンロードし、Avro形式に変換するスクリプトを書きました。 InMapsで使用されるアルゴリズムを使用して、ラッセルは受信ボックスから関係マップを作成しました。







ラッセルが参加したグループとメーリングリストを明確に示しています。 彼はまた、手紙の著者間のリンクのマップを作成しました。その上で、彼らはグループと組織によってグループ化されます。 「メールボックスネットワーク」の技術は、2014年に3億9,200万ドルで買収されたRelatelQプロジェクトの基盤を形成ました。 RelatelQの利点の1つは、CRMシステムに入力されるデータの量を大幅に削減できることです。 これは、通信が行われる会社の自動識別と、CRMシステムでの受信と送信の通信間のリンクの作成のおかげで達成されます。



この技術は、ラッセルジャーニーによって設立されたKontexaのスタートアップでも使用されています。 これを使用して、共同のセマンティックメールボックスを作成できます。 セマンティックレベルで異なるメールボックス間の関係を視覚化する例を次に示します。







この仕事は後にアジャイルデータサイエンスの本の基礎を形成しました。 読者はその助けを借りて、メールボックスから個別にレターをダウンロードし、 Apache PigとPythonで分析できます。



CRM分析



CRMデータベースには数百万ドルの費用がかかる可能性があり、さまざまなツールやテクニックをテストできるため、アナリストにとっては天の恵みです。 興味深いタスクの1つは、後続の自動ターゲティングのためにこのようなデータベースを視覚的にクラスタリングする可能性を調査することでした。



以下は、主要なHadoopベンダーであるCloudera、Hortonworks、MapR、Pivo​​talのCRMデータベースに基づいた関係のマップです。 パートナーシップリストに基づいて関係が確立されました。 ほとんどのビッグデータ企業はそのようなリストを持っています。 提案されたソリューションで製品とサービスが使用されている組織をリストします。 最初に、4つのベンダーのそれぞれについてパートナーシップマップが作成され、次にパートナーパートナーシップが追加されました。







これらのカードを使用して、特定のクラスター向けに設計されたコンテンツを作成し、より効率的にターゲットにできます。



ここで、おそらくアイデアを思いついたでしょう。このようにして市場全体のマップを作成したらどうでしょうか。 そこに何の市場-経済! 商品とお金の関係に関与するすべての組織間の関係のグローバルスキームを作成します。 おそらく、この野心的なプロジェクトは実装される可能性があります。 特に、このようなカードの助けを借りれば、経済の弱点を見つけやすくなり、さまざまな市場の効率が向上します。 この目的のために、たとえば、 Relatoスタートアップが作成されました。 後で、その助けを借りて収集されたデータは 、レポート「 ビッグデータのマッピング:オライリーとのパートナーシップを通じてパブリックドメインに表示されるデータ牽引する市場」にまとめられます。 このレポートは、ビッグデータを扱うための製品とサービスを提供する企業の分析を示します。

ご覧のとおり、ネットワーク構造はさまざまな現象やシステムの根底にあります。



そのため、次に何らかの種類のデータを使用して作業を開始する際には、「ネットワークではないのか」と自問してください。 関係の同様の見方を私に与えるものは何ですか?



All Articles