ITMO大学でのソーシャルメディアマイニング

本日、ITMO大学の科学者とプログラマーによる新しいプロジェクトに関する簡単なニュースレターを準備することにしました。 ソーシャルメディアマイニングと、人気のあるソーシャルネットワークのユーザーの地理的選好の決定に関連するタスクについて説明しましょう。



フランクリン・ハイネン CC-BY写真



Instagramを使用して観光客に最適な場所を見つける



目的:主に地域住民に関心のある場所(博物館、レストラン、カフェ、アトラクション、リラックスできる場所)を特定する。 得られた結果を使用して、市内で最も人気のある魅力的な場所のリストを展開し、旅行ガイドを多様化します。



ソーシャルメディアマイニングの助けを借りて問題を解決するために、ソーシャルネットワークInstagramが選ばれました。 Institute of High-Tech Computer Technologies( NII NKT )の従業員で構成されるプロジェクトチームは、このソーシャルネットワークのかなりアクティブなユーザーベースと、分析の結果を絞り込むことができる透過的な行動パターンを使用して、その選択を説明します。



データ分析に向けた最初のステップの1つは、観光客のプロフィールを編集し、関連するユーザーを除外することでした。 「観光客」の行動の主な兆候が強調されました:都市の中心部からの多数のInstagramの出版物(たとえば、サンクトペテルブルクでは、観光客は主にネフスキープロスペクトにある場所の写真を公開しています)統計によると、ゲストの都市での滞在期間は通常、数週間を超えません)



タスクは、観光客がほとんど知らない場所を見つけることでした。 したがって、「インサイダー」情報を取得するために、観光客にとって最も有名な場所を破棄することが決定されました。 カザン大聖堂、エルミタージュ、プルコヴォ空港などの場所での人気と出席は疑いの余地がないため、観光客が要求するこれらの場所やその他の場所は、研究から意図的に除外されました。



分析結果(カテゴリ別のサンクトペテルブルクの人気のある場所のYandexマップ )が専門会議で発表され、ジャーナルProcedia Computer Scienceの科学資料の形で発表されたことは注目に値します。





Twitter、Instagram、Foursquareを使用して、ユーザーの地理的な好みを予測する



目的:3つのソーシャルネットワークからの情報のクロス分析を使用して、ロケーションユーザーを一度に推奨する



タスクを実装するために、科学者グループは教師とのトレーニングのモデルを選択しました。 ここでは、Foursquareユーザーが推奨する特定の場所を反映するジオタグだけでなく、テキストデータ(Twitter)とInstagramの投稿に基づく視覚設定も考慮する必要がありました。



作業の過程で、最も類似したユーザーからの行動情報を使用して、推奨事項を改善する機会が実現しました。 プロファイリングは、3つのソーシャルネットワークのデータを含む多層グラフのクラスタリングを使用して実行されました。



簡単に言えば、このようなシステムは、ユーザーがスポーツに興味があり、対応するツイートや出版物をInstagramに公開する場合、ユーザーに最適なスポーツ施設を推奨できます。



この作業は、ITMO大学の科学者とシンガポールの同僚によって実施されました。 これを行うために、ニューヨーク、シンガポール、ロンドンの居住者向けに適切なデータセットが編集され、研究の結果が情報検索の研究開発に関する国際ACM SIGIR会議で発表され 「多層グラフのクラスタリングによるクロスドメインの推奨事項」に反映されています 「。



Habréのブログからのその他の資料:






All Articles