ビデオ分析の組み合わせ:脳と機械が私たちの顔をどうするか

画像



顔を見てすぐに認識するスキルは超大国です。 しわ、しわ、楕円形の分析、研究に時間を費やす必要はありません。 顔認識は瞬時に簡単に行えます。 それはとても簡単なので、私たちはそれをどうやってやるかわからない。



異なる顔が互いにどのように見えるかを考えてください-2つの目、口、鼻、耳が両側に突き出ている、毎回同じ順序で(ほとんどの場合)。 このような簡単な方法でオブジェクトを分析することは信じられません。



私たちは誕生から顔を認識するように「プログラム」されていますが、今では人々はより多くのことを達成しています-彼らは機械にこのスキルを教えました。 人の認識および識別システムの広範な導入は、社会の生活にどのように影響しますか?



パレイドリア:自動顔検索



画像



「自動」モードのユーザーは、あらゆる表面の見慣れた画像を区別できます。 建物の3つの建築要素のみが、驚いたアヒルの顔として認識されます。 これはパレイドリアの例です。



パレイドリアという言葉は、ギリシャ語のパラ(パラ-近く、近く、何からの逸脱)と幻影-イメージから来ています。 これは、錯視の名前、画像の知覚、または実際にはそうではない意味です。 たとえば、木の幹の顔や雲の中の動物の姿はパレイドリアです。



画像

そのような写真は、thingswithfaces.comで見つけることができます。



私たちが幾何学図形で見る人の顔と動物の顔。 絵文字文化全体がこの原則に基づいています。 :-)



画像



パレイドリアの現象は、アルゴリズムの言語に簡単に翻訳されます。 シンスンバックアーティストのキムヨンフンは、OpenCVライブラリのスクリプトを使用して、雲を撮影し、人間の顔にしばらく融合させました。



サッチャーの幻想:システムの生物学的間違い



画像



認識スキルの重要性を示す生物学的なバグがあります。 あなたの周りのほとんどのオブジェクト-椅子、テーブル、コンピューターは見やすく、どの角度からでも正しく識別できます。 ただ顔ではありません。



逆さまの顔は、サッチャー効果(錯覚)と呼ばれる脳の機能不全を引き起こします。 この現象は、倒立ポートレート写真の局所的な変化を検出することが困難な状態を表します。



マーガレット・サッチャーの写真を裏返し、結果を見てみましょう。
画像



最初の写真は正常に見えますが、裏返した場合、目と口の間違った位置がすぐに目を引きます。 人間と人工ニューラルネットワークは、さまざまな方法で画像を認識します。 私たちの耳の間の「神経回路網」がだまされやすいのは驚くべきことです。



サッチャーの幻想は、脳が情報を処理する基本的なメカニズムを示しています。 脳は、目、鼻、口、耳のペアという個々の要素のセットを読み取ります。 顔の特徴の個々の特徴に加えて、顔の特徴と位置との関係が考慮されます。 つまり、人はシステム全体として認識されます。



したがって、逆向きの顔が表示されると、脳が画像全体を評価するのがより困難になります。情報は、要素ごとに別々に「収集」されます。 しかし、正しい顔が示されるとすぐに、単一のシステムの認識が突然再接続し、問題が始まります。馴染みのある機能が異常な方法で接続されていることが明らかになります。



なぜこれが重要なのですか? 人間の脳は、知覚の完全性による顔の特徴のわずかな違いを認識することができます。 大脳皮質の領域は顔を認識して視線の方向を決定し、扁桃体と膵島は表情を分析し、前頭葉の前頭前野の領域と快感に関与する脳システムはその美しさを評価します。



機能のようなバグ:チェルノフの顔



画像

c



人間の知覚の特異性は、「顔」を使用して集約された多次元データを分析するために使用されます。 1973年、アメリカの数学者であるドイツのチェルノフは、「人」を使用して特徴的な依存関係を特定し、いくつかの変数間の複雑な関係を研究する概念を概説しました。



チェルノフのデータは、顔のピクトグラムの形で反映されます。選択された変数の相対値は、鼻の長さ、眉間の角度、顔の幅-合計36変数までの個々の特徴の形状とサイズとして表示されます。 したがって、オブザーバーは、値の各構成に固有のオブジェクトの視覚特性を識別できます。



面で構成されたダイアグラムをすばやく見ると、プロファイルの特性が大幅に異なる(一致する)かどうかをすばやく判断できます。 顔の特徴の詳細なレビューにより、どの特徴(各顔の特徴は元のデータセットの個別の特徴)の類似性と違いが明らかになります。 たとえば、上の図では、悲しい顔文字と面白い顔文字で国の違いに気付くのは簡単です。



なぜあなたの顔を車で



画像



素早い顔認識のスキルは、幼稚園からあなたの子供を拾い上げ、パートナーを選び、正しく適切に感情を表現するのに役立ちます。 しかし、人がこの能力を人工ニューラルネットワークに転送するとどうなりますか?



アイデアは拒否を引き起こす可能性があります。 データを保存し、動きを監視し、購入や感情を分析する技術を誰もが簡単に受け入れる準備ができているわけではありません。 単純なビデオ監視からパーソナライズされたビデオ分析への移行には、責任の大幅な増加が伴います。



画像



今日、 DeepFaceなどのアルゴリズムは、人間よりも高い精度で個人の類似性を判断します。 Nvidiaアルゴリズム自体は、存在しない人の顔を数秒で作成します。 上記のコラージュの顔は、70,000枚の画像のデータセットでトレーニングされた StyleGANニューラルネットワークによって生成されます。 彼らは恐ろしくリアルに見えます。



画像

SearchFaceアルゴリズムのデモ



最初は、Facebookの顔認識アルゴリズムにより警戒感が高まりましたが、誰もがそれに慣れました(またはソーシャルネットワークを離れました)。 VKontakte上の写真で人を検索するFindFaceサービスは、さまざまなレビューを受けて、いじめに使用されましたが、同様のSearchFaceプロジェクトの閉鎖は、すでにユーザーの間で否定的な反応を引き起こしました。



小売業者は、顔認識技術をインストールして、盗難を防ぎ、年齢、性別、さらには顧客の感情に関するデータを収集します。 最終的に、目標は顧客サービスを改善し、それを活用することです。 システムが個人的に有益であると顧客が認識すると、多くの人が新しい技術の導入に同意します。



「個人情報の盗難」のケースが増えていることを考えると、クレジットカードや個人データの詐欺であるため、消費者は適切なタイミングでシステムを好むでしょう。 それらを正しく識別します。



現在、アルゴリズムは、メガネ、かつら、複数日毛など、照明不足、低解像度、マスキングの問題の解決に役立ちます。 システムは非常に高速で実行されており、人を数秒で数百万人のデータベースにマッピングします。



米国の一部の店舗では、盗難容疑者に選択肢を提供しています。自分で写真を撮るか、正式な罪状を請求することができます。 泥棒は買い物の禁止とともに自由を手に入れ、彼の写真は公式にデータベースに入ります。 人の画像を含むファイルは暗号化され、システムの所有者のみが利用できます。



誰が認識から利益を得るか





ほとんどの店舗では、すでにCCTVカメラがインストールされています。 ビデオ分析の場合、ハードウェアの更新は不要です。クラウドサービスに接続するだけです。 また、Ivideonビデオ分析サービスでは、エントリのしきい値は実質的にありません。 このソリューションのコストは、カメラあたり1,700ルーブルであり、起業家はソフトウェアにアクセスできます。



小売業者が顔認識技術を使用する主な動機は、盗難を防ぐことです。 米国だけ National Retail Foundationによると、 2017年の全商品の約1.33%が盗難により失われました-468億ドル以上の損害。



顔認識技術により、店舗盗難の数が30%以上削減されます。


多くの場合、二次的な要因が被害の量に影響を与えます。従業員の過失、セキュリティサービスへの不十分な準備、救いたいという欲求です。 これらの問題やその他の問題は、カメラとクラウドテクノロジーで解決する必要があります。



顔認識システムは、ブラックリストの迅速な作業を促進します。クライアントの写真を信頼できない人物のデータベースと比較し、一致する場合は、警備員に適切な警告を送信します。



分析ソフトウェアは、店舗のセキュリティを大幅に強化します。 経験豊富な泥棒は、カメラの「死角」に気付くことができます。 この場合、警備員は自分の電話を使用して容疑者を撮影し、この人物がデータベースに登録されているかどうかを確認できます。



ブランドは長い間モバイルマーケティングを使用してきました-SMSを送信し、通知をプッシュし、ターゲットを絞った広告を表示します。 従来の小売業の場合、認識システムは、Cookieを使用するオンライン販売者が受け取ったのと同じ機能を提供します。



泥棒を識別するために使用されるのと同じプラットフォームは、売り手がどの店頭が顧客をより引き付けるかを把握するのに役立ちます。 認識システムは、店舗の入り口でVIPクライアントを識別するのに役立ちます。 CRMからのデータを使用して、売り手は顧客に有利なオファーを迅速に提供できます。



画像

ソウルの国際金融センターでは、案内板のカメラがリアルタイムで人の年齢と性別を判断し、特定されたパラメーターに従って広告を提供します



顧客情報は、売り上げを増やし、視聴者のニーズを評価するための強力なツールをアクティブにします。 カメラは、性別、年齢、感情状態に応じて、特定の訪問者のビデオ広告の表示を設定するのに役立ち、広告の有効性を計算するためのデータプロバイダーにもなります。



小売業者にとっての上記の機会は、しばしば迷惑な広告のように聞こえます。 「利益の成長」と「視聴者のニーズ」に関する論文は、ERPから電子値札まで、市場のあらゆるITツールに付随しています。 人工知能と将来のテクノロジーに関する純粋なマーケティング以外に、認識システムに直面するものはありますか? 既存の店舗で実際のシステムを使用する例を通してこの質問に答えます。



「現場で働く」:実際の状況で誰が顔を認識するか



画像



セブン-イレブンは、世界最大の小売チェーンであり、セブン-イレブン・ジャパンの管理下で、18か国に36,000以上の小規模店舗を統合しています。 同社は最近、11,000の店舗にソフトウェアをインストールしました。 流通ネットワークでの顔認識および行動分析の技術は、ロイヤルティカード所有者の特定、顧客トラフィックの監視、倉庫内の商品の在庫レベルの決定に使用されます。



画像



Saksは、Hudson's Bay Companyが世界で最も古い会社(1670年に設立)の1つによって現在所有されている100周年を迎えるプレミアムストアです。 Saks は、主に盗難防止のためにビデオ分析を使用しています。 このソフトウェアは、盗難容疑者の写真を有名な万引きのデータベースと照合します。 カメラはネットワーク化されているため、結果はニューヨークのサックス本社で見ることができます。



Guardianによると、ヨーロッパの高級店やホテルでは、VIPや有名人を追跡して最も快適な状態を提供するために、定期的に顔認識技術を使用しています。


画像



米国では、CaliBurger Burger Network ロイヤルティプログラムで顔認識技術を使用しています。 対話型キオスクは、顧客を「認識」し、注文を記憶し、お気に入りの料理を提供し、顔による身分証明書付きの支払いを受け入れます。



システムは、モバイルアプリケーション、ボーナスポイント、クレジットカードを使用するのが難しいと感じる高齢者向けのボーナスプログラムに入るためのしきい値を削除します。



顔認識システムは、アジア、特に中国で広く使用されており、食料の支払い、ATMからの現金の引き出し、さらにはローンの受け取りに使用されています。 中国の顔認識精度は人間の目よりも優れています。 これは、2Dから3D認識への中国の大規模な移行によるものでもあります。



最初のケースでは、アルゴリズムは分析のためにデータベースに保存された2次元画像を使用します。 3D認識分析は、再構築された3次元画像を分析し、はるかに高い精度を示します。 中国では、顔スキャンを使用して、購入(たとえば、KFCでの支払い注文)、支払い、建物への入場ができます。



画像



Alipayでは、支払い認識システムが写真ではなく生きている人になる前に、それを理解できるように微笑む必要があります 。 アリペイを欺くことは不可能だと言われています。髪の色、化粧、かつらを使っても何も変わりません。 システムは、顔のジオメトリとその上の特定のポイントの位置を考慮した一連の特徴的な機能を使用します。



結論



欧米企業と中国による顔認識技術への直接投資の規模は膨大です。 それにもかかわらず、ロシアでは、そのようなプロジェクトの実施は時間の問題です。 大規模な営利企業はすでに利益と経済的利益を理解しています。 顔認識を製品と見なす場合、ビジネスの各セグメントには価格などの固有の特性があることを理解することが重要です。 企業が大規模になるほど、より多くのカメラと分析モジュールが必要になる場合があります。 大企業向けのソリューションは常にカスタマイズされた複雑なプロジェクトであり、カスタマイズには追加の資金が必要です。 中小企業は、顔認識モジュールが接続された単一のカメラで簡単に実行できます。 この場合、ソリューションのコストはクラウドビデオ監視の使用に匹敵します。



All Articles