🤣 🔲 📧 DeepMind AIが学校の数学テストに失敗しました 👨🏿‍🤝‍👨🏻 🤦🏼 🏖️

人気の科学やエンターテイメントメディアでさえ、AIプロジェクトの成功に関するニュースに圧倒されています。人工知能は移動中の人を打ち負かすか、StarCraftのプレイを学び、有名なチャンピオンとの戦いで勝利します。そして、これは成果のほんの一部であり、実際にはもっと多くの成果があります。普通の人（ある意味では、IT分野とは関係ありません）は、本当の「大きな」人工知能が現れようとしていると思うかもしれません。

しかし、すべてがそれほどバラ色ではありません。たとえば、先日、AIが高等数学のテスト（英国の標準、学校のテスト）に合格しようとして、それを行うことができなかったという情報がありました。

原則として、失敗の原因はそれほど困難なく説明できます。したがって、数学的問題を解決する人には、次の能力と能力が関係します。

数値、算術演算子、変数（複雑な関数を形成する）、単語（質問の定義、問題の意味など）など、本質的に記号を変更します。

計画（たとえば、数学的な問題を解決するために必要な順序で関数をランク付けする）。
関数の構成（加算、乗算）に補助アルゴリズムを使用します。
短期メモリを使用して中間値を保存する（例：h（f（x）））。
以前にルール、変換、プロセス、公理についての知識を得た実践。

DeepMindは、さまざまな種類の数学的問題および問題の選択についてトレーニングおよびテストされました。開発者はクラウドソーシングを使用せず、代わりに、多数のテストタスクを生成したり、複雑さを制御したりするためにデータセットを合成しました。開発チームは、「自由形式」のテキストデータ形式を使用しました。

初期データは、英国の学校（16歳未満）の生徒に対する選択した課題からのタスクに基づいていました。タスクは、算術、代数、確率論などの方向から取られました。

DeepMindチームは、数学的問題を解決するためのニューラルネットワークアーキテクチャを選択し、LSTM（長期短期メモリ）およびTransformer （シーケンスを操作するためのニューラルネットワークアーキテクチャ）に決めました。

DeepMindは、数学の問題を扱うために2つのLSTMモデルをテストしました。単純なLSTMと注意深いLSTMで、その動作スキームを下の図に示します。

以下に、Transformerモデルの図を示します。

結果はあまり良くありませんでした。 AI回答の35％のみが正解でした。これは、どの学校の基準でも不十分な評価です。

もちろん、DeepMindの研究者は、数学とAIの研究を始めたばかりです。将来的には、同じAlphaGoの場合と同様に、より多くの成功が期待できます。

詳細な研究データはこちらでご覧いただけます。

DeepMind AIが学校の数学テストに失敗しました

More articles: