ニューラルネットワークと通常のカメラを使用した心理的なポートレート

こんにちは、こんにちは! 今年、私たちは再びImagine Cupを開催します。これはIT分野の学生スタートアップの競争です。 皆さん(学生)を参加に招待します! それまでの間、私たちは昨年3位になったソーシャルグローブチームのメンバーについて話します。 無駄ではありません。なぜなら、彼らのサービスは、デジタルフットプリントを追跡し、ソーシャルネットワークからのデータに基づいて、人の心理的プロファイルを作成できるからです。 また、従来のカメラとニューラルネットワークを使用して識別が行われます。







2018 Imagine Cupシリーズ



1. ニューラルネットワークと通常のカメラを使用した心理的ポートレート

2.本を勉強せずに歴史を勉強する


序文、アイデアの説明、問題の説明



今年はImagine Cupコンテストが15回開催され、3人のチームが参加することを決定しました。 それはすべて、高等経済学部のImagine Cupの一部として開催されたハッカソンから始まりました。その目標は、コンペティションでうまく提示できるプロジェクトのアイデアを思い付くのを助けることでした。 長いブレーンストーミングの結果、ソーシャルネットワークの人物に関するデータに基づいて、友人であれ後半であれ、ユーザーの興味や性質に適した人物を見つけることを目的としたプロジェクトのアイデアが提案されました。



アンケートに基づいてこれを行う多くのサービスがありますが、長い間アンケートを記入し、最も重要なことには、非常に非効率的です。 人々は自分自身についての真実を書くのではなく、自分がどんな人になりたいのかについて書きます。 このため、このようなアンケートの精度はわずか40%です。



私たちは世界中のさまざまな大学-ケンブリッジ大学、スタンフォード大学、Antwept大学などの科学的研究を研究し始めました。



科学論文のいくつかのリスト:





ドナルド・トランプのキャンペーンでソーシャルネットワークのデータを使用したとして非難された多くの作品、主にミハル・コシンスキーの作品では、ソーシャルネットワークの彼の「デジタルトレース」のデータを分析することにより、人に関する心理情報をある程度正確に見つけることができることが指摘されました、再投稿、いいね、コメント。 Facebookのソーシャルネットワークで調査が行われました。 たとえば、ソーシャルネットワーク上の約68件のいいねのおかげで、Kosinskiシステムは、ユーザーの肌の色について95%の精度、性的指向について88%、特定の政党(米国)の支援について85%で言うことができます。



さらに、これらの研究に基づいて、性格特性の組み合わせと関係の質の間に相関関係があると結論付けることができました。 性格はしばしばBig-5モデルを使用して測定されます。Big-5モデルは、外向性、同意性、良心、神経症、経験への開放性という5つの独立した特性を備えた人格を表します。



これらの記事に基づいて、最初のプロトタイプを作成しました。これは、ユーザーがTwitterアカウントを使用してアクセスできるWebサービスです。



その後、最初のレビューを受けました。 人々は興味を持ち、ほとんどの場合、人々の検索ではなく、自分の心理プロファイルに関する情報に興味を持ちました。



このプロトタイプを使用して、高等経済学部のコンテストの決勝で2位(および聴衆の結果による1位)を獲得し、プロジェクトを修正することが決定された全ロシア決勝の準備を始めました。 これで、ユーザーは人々、彼らの心理、および関心をWebサービスではなく、現実の世界で見ます! このサービスは、通常のカメラを使用して、人を認識し、ソーシャルネットワークから受け取った必要な情報をその人の顔のすぐ隣に提供します。 将来的には、MicrosoftのHololensなどの有望なテクノロジーと組み合わせて使用​​するためにプロジェクトを完成させることが計画されていました。



実装と使用技術



一般的な言葉



ソーシャルネットワークで個人のプロファイルの分析を実装する概念は、インターネット上の人間の行動と彼の興味や性格特性との相関関係に関するデータを提示した科学記事に基づいていました。



そのため、さまざまなAzureの認知サービスは、構文およびセマンティック(キーワード抽出)テキスト分析、および異なる言語で動作できるようにするための英語の翻訳者にとって非常に役立ちました。



興味のあるプライベートな言葉



人間の興味は限られたリストから決定されました。 このリストの各カテゴリは、いくつかのキーワードによって特徴付けられています(たとえば、料理は、野菜、果物、天ぷら鍋、フライパンなどの単語によって特徴付けられます)。 単語のセマンティック分析を使用して、ユーザーツイートのどのカテゴリに属する​​かを判断しました。



文字についての私的な言葉



私たちが研究した科学的研究では、Big 5の特徴は、人間の文章の構文上の特徴、例えば、平均的な長い単語、文中の単語の数、動詞の数、テキストの感情的な色付けと相関していることが注目されました。 後者を決定するために、各単語に感情的な特徴が与えられた辞書が使用されました。 それを使用して、前の段階で取得したキーワードの感情的な性質を判断し、これを構文的特徴に関するデータとともにニューラルネットワークの入力に送りました。



残念ながら、ニューラルネットワークの使用経験は十分ではなく、このサブタスクの本質を定性的に理解するのにかなりの時間がかかりました。 その結果、Big 5の特性を決定する際に良好なパフォーマンスを達成できなかったため、大きな成功を収めなかった作業の多くの部分については説明しません。



建築









一般的に、ユーザー部分のプロセスは次のとおりでした。



アプリケーションでは、3秒ごとにビデオストリームからフレームが割り当てられ、Face APIサービスに送信されます。そこで、顔はプリコンパイルされたデータベースと比較して検出および認識されます。 ソーシャルネットワーク上の人物とそのアカウントの写真のセットの間に接続を確立することにより、ベースは手動で補充されます。 将来的には、ページからデータを自動的に収集し、適切なリンクを確立することを検討できます。



必要な接続を受け取った後、興味や性格に関するデータがデータベースから返され、写真で見つかった各顔の横の画面に表示されます。



データベースへの入力とプロファイルの分析について:



実装では、マイクロサービスに基づくアーキテクチャを使用して、水平スケーリングをサポートし、十分な柔軟性を備えたプロジェクトを開発および起動(展開)しました。



マイクロサービスを作成するための主な言語は、GoとC#です。 word2vecのラッパー、テキスト分析、翻訳者、人間のキャラクターを分析するためのニューラルネットワークはC#で記述されました。 継続的な情報処理、マイクロサービスへのリクエストの送信、キャッシュ、および負荷分散を行います。



関心コンテンツ分析ユニット







このユニットの作業は、英語のユーザーツイートを処理し(他の言語のツイートは以前は翻訳サービスによって英語に翻訳されていた)、キーワードを取得するためにMicrosoftのテキスト分析サービスに送信することでした。



その後、受信したキーワードはWord2Vecマイクロサービス( More )に送信されました。 それを使用して、単語から各関心カテゴリのキーワードまでの意味距離を計算しました。 有意な距離が形成され、最終的に、i番目の数値がテキスト全体の関心のi番目のカテゴリへの近接性を特徴付ける距離ベクトルを取得しました。 このベクトルは正規化され、その後、人の興味を判断し、同様のベクトル(興味)を持つ人を検索するために使用できます。



Big-5の特性を決定するために、5つの出力(テキストがマイクロサービスに読み込まれた人の特性の重大度)を備えたKosinskiで訓練されたニューラルネットワークが使用されました。







Visual Studio開発環境は、新しいバージョンをサーバーにすばやく展開できるため開発を加速し、Azureクラウド分析はボトルネックを迅速に発見し、サーバーのパフォーマンスを監視しました。



得られた結果



ロシアのImagine Cupファイナルで3位になったことを誇りに思っていますが、何よりもブースへの訪問者からいただいた肯定的なフィードバックに満足しています。



チームについて少し



私たちの目標は、第4次産業革命の時代に自分自身を実現するために、人々が自分の強みを見つけて発展させるのを支援することです。 これを行うために、機械学習とビッグデータ分析を使用して、Michal Kosinskiの方法論に基づいて人々のプロファイルを分析するシステムを開発し、その後個別のトレーニングを行っています。



ちなみに、 ここではみんなとのミニインタビューを見ることができます。



イマジンカップ2018



賞金100,000ドルで競うことができるマイクロソフトからの最大の国際テクノロジーコンペティション。これを行うには、最大3人のチームを編成し、AI、ビッグデータ、複合現実のカテゴリでプロジェクトのアイデアを考え出し、実装する必要があります。



すべての最新情報は、VKontakteグループおよびTelegramチャネルにあります。



サインアップ!



あなたはロシア出身ですaka.ms/ImagineCup2018_en

あなたはカザフスタン出身ですaka.ms/ImagineCup2018_kz

あなたはベラルーシ出身ですaka.ms/ImagineCup2018_by



All Articles