「バイパスチューリング」:キャプチャ認識への新しいアプローチ

Mark ZuckerbergとJeff Bezosを投資家とするVicariousの開発者は、テキストキャプチャを認識できる新しいディープラーニングモデルを説明する記事を公​​開しまし 。 新しい確率的生成モデルにより、科学者は「思考」インテリジェントシステムの作成に一歩近づいたことを確認できました。



この技術がどのような成功を収め、この分野で他にどのようなソリューションが登場したかを説明します。





/写真リックB PD



システムは、視覚野の機能を再現する技術を使用します。 これはコンピュータービジョンのモデルであり、開発者はこれを「再帰皮質ネットワーク」(RCN-Recursive Cortical Network)と呼んでいます。



RCNでは、オブジェクトは輪郭と表面の組み合わせとして表されます。 輪郭は表面の境界であり、後者は条件付きランダムフィールドを使用してモデル化されます。 これらのコンポーネントにより、可能なすべての組み合わせを慎重にソートすることなく、モデルが文字を認識することができます。



Captchaは、システムが少なくとも1%の精度で解決すると、 ハッキングされたと見なさます。 再帰的な皮質ネットワークは、66.6%の精度でreCAPTCHAをハッキングし 、それぞれ57.4%および57.1%の精度でYahooとPayPalをキャプチャしました。



他の科学者の決定によってreCAPTCHAを回避することできましたが、同時に特定の画像を認識するために、大きなラベル付きデータセットのトレーニングまたは手動調整が必要でした。 Vicariousシステムの精度はこれらの方法に匹敵しますが、必要なデータは300分の1です。 また、開発者は、ネットワークを訓練するために多くのノイズと歪みのある画像を使用しませんでした-皮質ネットワーク自体がそのようなCAPTCHAを一般化しました。



次は何ですか



Vicariousプロジェクトの目標は、一般的な人間の問題とタスクを解決できる人工知能を作成することです。 したがって、科学者は皮質ネットワークを改善することを計画しています。 開発者のグローバルな目標は、人間の脳のように機能する本格的な人工知能を作成することです。



ただし、新しいシステムはテキストキャプチャのみを認識します。 また、多くのサイトでは、より複雑な「自動チューリングテスト」、ロジックタスク 、さらにはユーザーが写真回転するように求められるミニゲームを提供しています。



ただし、現在、そのような「高度な」キャプチャをクラックできるソリューションがあります。 たとえば、メリーランド大学の研究者は、GoogleのreCAPTCHAを「クラック」できるunCAPTCHAシステムを作成しました。これにより、道路標識や店頭などのすべての画像を選択できます。



研究者は、プロジェクトコードをGitHubのリポジトリにアップロードしました。 チューリングテストを回避するために、彼らの方法はreCAPTCHAのサウンドバージョンを使用します。 オーディオキャプチャは一連の異なる数字であり、 ホワイトノイズを背景に異なる速度とトーンで声に出されます 。 攻撃を行うために、このサウンドファイルがダウンロードされ、音声付きのコンポーネントに分割されます。



次に、それらはGoogle、IBM、Microsoftなどからの6つの無料の転記オンラインサービスにロードされます。システムは生成された結果を収集し、発見的方法を使用して最も可能性の高い行を決定します。 次に、数字がcaptchaフィールドに順番に入力されます。



テストにより 、メリーランド州の科学者の開発により、450回のreCAPTCHAの問題が5.42秒で85%を超える精度で解決されることが示されました。 これは、reCAPTCHAオーディオファイルを聞いている人が費やす額よりも少なくなります。



開発者自分の作業をGoogleに報告し、ITの巨人はシステムにいくつかの改善を加えました。 たとえば、テキストに加えて、テキストの小さな断片がオーディオファイルに含まれるようになり、reCAPTCHA認識の成功が低下しました。



ただし、開発者はチューリングテストを「破る」だけでなく、それを強化しようとしていることに注意してください。 たとえば、Facebookはソーシャルネットワークのユーザーに写真を送信して身元を確認する新しいキャプチャのテストを開始しました。 同社にはソリューションをテストするための独自の環境がないため、ユーザーはテスターとして機能します。



同社の代表者は、新しい技術により、アカウントの作成、支払い、または友人としての追加リクエストに関連するサイト上の疑わしいアクティビティを特定できるようになると述べています。 Facebookによると、写真の検証プロセスは完全に自動化されており、検証後、写真はサーバーから削除されます。



Vicariousについて


Vicariousは、人工知能システムの開発に従事している会社です。 本社はサンフランシスコにあります。 組織の目標は、コンピューターが人間として考え、学習できるソフトウェアを作成することです。






PS企業のIaaSに関する最初のブログのその他の資料:






All Articles