「Know Yourself」:ITMO大学でのソーシャルメディアマイニングプロジェクト

ソーシャルネットワークは、タイムキラーでありニュースの発信源であるだけでなく、さまざまな研究の分野でもあります。 ITMO大学の科学者と学生がFacebookとInstagramの投稿から学んだことを以下に説明します。



/ perzon seo CC-BYの写真



「顧客が望むもの」:ソーシャルネットワークでのプロファイリング



このプロジェクトは、シンガポール国立大学でのインターンシップ中に、ITMO大学のコンピューター技術学部の学部生のグループによって処理されました。 このプロジェクトの目的は、企業が視聴者のニーズをよりよく理解するのに役立つシステムを作成することです。この視聴者がソーシャルネットワークで自分自身について語っているという事実を考慮します。



例:会社は、その製品に満足している(または逆に不満を持っている)人々を一体にしたものを把握したいと考えています。 ITMO大学の学生の開発により、ソーシャルネットワークのデータに基づいて、このような[満足/不満]顧客の肖像を作成し、適切なソリューションを提供できます。割引に興味がある人や、別の製品を提供する人がいます。



仕組み: ITMOユニバーシティチームによって提案されアルゴリズムは、ソーシャルネットワークのユーザーが残すオープンデータ(地理位置情報タグ、公開メッセージ、写真、キャプション)を分析します。 これらのデータは、一連のパラメーター(ツイートの平均サイズ、写真内の最も一般的なオブジェクト、小切手の分布など)に変換され、ニューラルネットワークに送信されます。



彼女の仕事の結果はタスクに依存します:場合によっては、メッセージの感情的な色付けを評価する必要があり、他の場合は、いくつかのソーシャルネットワークからのデータの分析に基づいて、選択したタイプのユーザーとその好みのより完全な画像をまとめる必要があります。 これは、個々のユーザーと作業することではなく、人々のグループ全体を特徴付ける一連の属性を形成することに関するものです。



ドナルド・トランプがTwitterで言ったこと



消費者プロファイリングプロジェクトに取り組んでいるITMO大学の大学院生の初期の開発は、Twitter、Instagram、およびFoursquareのデータに基づいて個人の婚mar状況を推測するシステムです。 研究者によると、3つのソーシャルネットワークの組み合わせは最大86%の予測精度を提供し、1つのソーシャルネットワークからの情報によると、アルゴリズムは17%低い精度で婚status状況を推測します。



確かに、この場合の多くは、誰がどのようにソーシャルネットワークで自分自身を宣言するかに依存します。たとえば、ドナルド・トランプのTwitterは、彼の所有者が独身であると「報告」しています。 研究者は、結果はTwitterアカウントの維持に関する主な作業が大統領自身ではなく、彼のPRマネージャーによって行われたという事実によるものです。



ところで、この研究の結果、ITMO大学のプログラマーは、人工知能に関するAAAI会議(AAAI-2017)でレポートを作成しました。この会議では、AIの作成とトレーニングに携わる科学者が集まります。





感情と安全:群衆の気分を感じる方法



ソーシャルメディアデータに基づく研究のもう1つの例は、ITMO大学のハイテクコンピューターテクノロジー科学研究所(NKTの科学研究所)の従業員によって開発された感情分析システムです。



仕組み:写真の表情は8つの基本的な感情と比較されます-これは怒り、ネグレクト、中立状態、悲しみ、驚き、幸福、悲しみです。 感情認識アルゴリズムは、畳み込みニューラルネットワークにも基づいています。 アルゴリズムの精度を向上させるため、研究者は写真の一部をユーザーが自分で「手動で」評価した結果を使用できます。



同時に、アルゴリズムは「写真」だけでなく、テキストメッセージの感情的な気分も認識します。最初の調査では、ソーシャルネットワークFacebook、Twitter、Vkontakteのデータが使用され、投稿の視覚的およびテキスト的コンポーネントが包括的に評価されました。 さらに、研究者は「明確化条件」を設定できます。たとえば、特定の場所を参照して資料を評価します。



仕事の結果は、アカウントプロファイリングの場合と同様に、現在の研究課題に依存します。例えば、シリウスの子供のキャンプでのシステムの最初の立ち上げは、革新的な立場を作り出すことを可能にしました-ソーシャルネットワークのユーザーの資料によると、彼はこの感情を喚起しますオブジェクトまたはソチ、クラスナヤポリヤナ、アドラー内の地図上の場所。



アルゴリズムの使用の別の例は、サッカーの試合で緊張の温床を認識する機能です(コンフェデレーションズカップと今後のワールドカップ2018の準備でITMO大学の他の開発が使用されたものについて話しました)。



この場合、研究者はソーシャルネットワークInstagramに限定し、試合中にファンが公開した写真を分析しました。 戦いが修正された試合の写真では、アルゴリズムは「悪のファン」を見つける可能性が2倍であることが判明しました(戦いがなかった試合と比較して)。



極端な状況では、戦いに加えて、花火の使用、スタンドやスタジアムのフィールドへのオブジェクトの投げ込み、攻撃的なバナーのデモンストレーション、不寛容な聖歌の唱えなども考慮されました。 2013年から2015年までの期間に試合[FC Zenit]を検討しました。 約10試合になり、その後、他のチームを獲得しました。



試合との試合はほとんどありませんでしたが、ロシアサッカー連合の公式統計と協力し始め、試合だけでなく、ファンの健康と状態を脅かす可能性のある他のイベントにも目を向けたとき、700試合のうち3シーズンにわたってスタンドでの極端なイベントでは、ゲームの約半分が行われました。



-NKT科学研究所のエンジニアであるVasily Boychuk




社会の下書きと情報の普及



ソーシャルネットワークデータを使用した石油製品科学研究所のもう1つの開発は、「ソーシャルドラフト」を検索し、世論を評価するシステムです。 このプロジェクトでは、特定の戦略に従って、Vkontakte、Twitter、Instagram、Live Journalのユーザーの公開資料を分析し、メッセージの最も重要なコンテンツ要素、主題、感情的な気分を決定し、いいね、再投稿、引用の数などの特定の特性に従って投稿をマークアップできます、コメントなど



このアプローチにより、将来、選択した基準に従って接続のグラフを作成し、そのようなグラフ上の情報の分布を予測することが可能になります。 このシステムは、実際のユーザーをボットと区別し、ユーザーの「社会的重み」を評価できます。これには、特定のソーシャルグループの意見のリーダーであるかどうかの理解も含まれます。



パンチ、スケッチ、つる



ソーシャルネットワークは、社会の緊張点や既存の問題について話すだけではありません。 それほど頻繁ではありませんが、ユーザーは自分にインスピレーションを与えるもの、興味、またはただの笑顔を友人と共有します。 したがって、VKフェストとオタクピクニックフェスティバルへの訪問者のために、ITMO大学は非古典的で楽しい形式でその開発のデモを準備することがよくあります。



たとえば、昨年のVKフェストでは、感情の分析に関する研究が実証されました。300周年記念公園に来た訪問者は、フェスティバルの「インタラクティブな写真」を見ることができました。最も興味深い場所、写真の最も人気のある会場などです。 もちろん、すべての情報は、Vkontakteのユーザーがページでフェスティバルについて語った内容に従って変更されました。





リチャード・ドーキンス。 ITMO大学の写真



そして、Geek Picnic-2017フェスティバルのために、ITMO大学はソーシャルネットワークの分析の別の例を用意しました-最も有名なミームを含むメモキューブ:「Wat」からGreat Gatsbyの有名なショットまで。 彼の隣には、フェスティバルのヘッドライナー、進化生物学者、科学の普及者であるリチャード・ドーキンスのサイン会がありました。



ところで、ITMO大学は、Geek Picnicフェスティバルにメモキューブをもたらしただけでなく、スマートホームシステムから機能性食品まで、その開発の多くをもたらしました。 大学のオタクピクニックインタラクティブゾーンへの訪問者が他に覚えていたことは、 こちらをお読みください



All Articles