
ロケーションジオロケーション
過去1年にわたり、世界のさまざまな国で、さまざまな言語の研究を繰り返し行ってきました。 しかし、それは常に1つ以上の近隣諸国でした。フランスの意見が分析のために選択され、フランスの意見がベネズエラの選挙のために選択されました。
それでも、ソーシャルメディアの使用における人々のメンタリティの違いは明白になりました。たとえば、フランス語では、Twitterメッセージの位置情報(ジオリンク)の割合は75%、ベネズエラでは80%、ロシアではわずか44%でした。
Snowdenの状況に関する最初の分析では、トピックへの関心がグローバルで多言語であることを示しました。 そのため、実際には、ジオロケーションと言語の自動検出のための新しい高度なモジュールの利点(または欠点)を評価することができました。その開発は開発者と言語学者の多大な努力でした。
メッセージの言語を理解するためにジオロケーションが非常に重要なのはなぜですか? 問題は、著者の場所を特定するために、プロファイルデータだけでなく、彼の投稿、ツイート、コメントなども分析することです。 つまり、著者のプロファイルの地理データを考慮し、新しいメッセージが到着するたびに更新します。 著者のメッセージへのジオタグを考慮します。 メッセージ内の地理情報を考慮します。 著者のプロフィールと他のソーシャルネットワークのプロフィールを作成し、そこの地理データを考慮します。 ジオディクショナリをすべて実行して、さまざまな形式のジオインディケーションのデータを単一のフォームに取り込み、多くの都市-地域-国を作成します。
Snowdenのテーマにより、世界中のソーシャルメディアのジオロケーションの「病院の温度」を調査することができました。 分析には、TwitterメッセージとFacebookメッセージに加えて、ロシア語のメッセージにVKontakteを使用しました。 結論:ジオロケーションは、国レベルですべての著者の57.8%、都市に対して41.4%の精度で決定されます。
研究の結果によるファクトグラフィー(8月1日から8月20日までのデータ):
-600,000件を超えるメッセージ。
-23万人のユニークな著者。
-世界230か国(8,000の集落)から!

私たちの多くにとって、これは驚くべきことです。世界には200を超える国(および地域)があります。 たとえば、ウォリスとフツナ、セントルシア、ブーヴェ、マヨット、キリバット、さらにはニウエなどの美しい名前があります:-)
メッセージを分析するために、さまざまな国のSnowdenという名前のスペルが使用されました。
アメリカ、イギリス、ドイツ、フランス、ポーランド、チェコ共和国、ハンガリー、ルーマニア、モルドバなど:スノーデン
ブルガリア:EDUARD SNOUDN
ウクライナ、ベラルーシ:エドワード・スノーデン
カザフスタン:エドワード・スノーデン
スロバキア:エドワード・スノーデン、エドワードヴィ・スノーデノヴィ
マケドニア:エドワード・スノーデン
セルビアおよび旧ユーゴスラビア:エドワード・スノーデン、エドワード・スノフデンアルバニアエドヴァルド・スノフデン
アゼルバイジャン:エドヴァルド・スヌーデン
ギリシャ:Σνόουντεν
このトピックは、言語学者にとって非常に興味深いものでした。 言語(17言語)と位置情報を決定するための新しいモジュールをチェックすることに加えて、短いテキスト(この問題は数か月前に解決されました)だけでなく、主にツイートなどに見られる非常にスラングな表現も音調化するための実用的な具体的なソリューションを見つける必要がありました:
間違ったオバマ。 スノーデンは愛国者です。 アメリカへの裏切り者は
ソース:twitter.com | ジム・ハックニーによる投稿| アメリカ、スプリングフィールド| 08/14
21:05:34
アラビア語、象形文字、または現地語のメッセージもプールに届きました。次に例を示します。
vaلاقخدمةLavabitللبريدالإلكترونيالآمنلارتباطهابــ Snowden:لنأكونشريكاًفيجرائمضدالشعبالأم... t.co/2JZZZnjwzhnn
ソース:twitter.com | 著者:タルバフサイン| ダブルス:49サウジアラビア、リヤド| 08/10 18:46:52
Quyêtđịnhchờxemmưasaobăng。 Haiz、lãoSnowdenrât "đangyêu" nha、muôngiêtqua B-)
ソース:facebook.com | キム・ウンウォン投稿| 大韓民国、ソウル|
08/12 18:45:38
RT @supinya:กรณี#Snowdenปล่อยข้อมูลว่าสหรัฐสอดส่องโดนไล่าแทบแย่เพราะไม่มีรัฐใด
อยากออมรับว่าสอดส่องจริงแต่านตำรวจไทยภูมิใจนำเสนอมากแปลกแต่ิงริง
ソース:twitter.com | 投稿者:なだない| タイ、プーケット| 08/13 15:36:58
このようなメッセージは、トピックへの関心を評価するために使用されましたが、調子化されていませんでした(メッセージ感情決定モジュールを介して送信されませんでした)。
Snowdenの主題に関する研究の結果はKommersantに掲載されています。
ロシア、アメリカ、ヨーロッパの地域向けにシャープ化された地図作成モジュールを世界地図に拡大する時間がなかったことは残念です。
地図作成と、ソーシャルメディアの最初の「世界」研究で明らかになった新しいタスクの全範囲に取り組みます。 新しくて興味深いものが、企業ブログでどのように公開されるのでしょうか。 じゃあね!