DeepMind AIが学校の数学テストに失敗しました





人気の科学やエンターテイメントメディアでさえ、AIプロジェクトの成功に関するニュースに圧倒されています。 人工知能は移動中の人を打ち負かすか、StarCraftのプレイを学び、有名なチャンピオンとの戦いで勝利します。 そして、これは成果のほんの一部であり、実際にはもっと多くの成果があります。 普通の人(ある意味では、IT分野とは関係ありません)は、本当の「大きな」人工知能が現れようとしていると思うかもしれません。



しかし、すべてがそれほどバラ色ではありません。 たとえば、先日、AIが高等数学のテスト(英国の標準、学校のテスト)に合格しようとして、それを行うことができなかったという情報がありました。



原則として、失敗の原因はそれほど困難なく説明できます。 したがって、数学的問題を解決する人には、次の能力と能力が関係します。



数値、算術演算子、変数(複雑な関数を形成する)、単語(質問の定義、問題の意味など)など、本質的に記号を変更します。





DeepMindは、さまざまな種類の数学的問題および問題の選択についてトレーニングおよびテストされました。 開発者はクラウドソーシングを使用せず、代わりに、多数のテストタスクを生成したり、複雑さを制御したりするためにデータセットを合成しました。 開発チームは、「自由形式」のテキストデータ形式を使用しました。



初期データは、英国の学校(16歳未満)の生徒に対する選択した課題からのタスクに基づいていました。 タスクは、算術、代数、確率論などの方向から取られました。



DeepMindチームは、数学的問題を解決するためのニューラルネットワークアーキテクチャを選択し、LSTM( 長期短期メモリ )およびTransformer (シーケンスを操作するためのニューラルネットワークアーキテクチャ)に決めました。



DeepMindは、数学の問題を扱うために2つのLSTMモデルをテストしました。単純なLSTMと注意深いLSTMで、その動作スキームを下の図に示します。







以下に、Transformerモデルの図を示します。







結果はあまり良くありませんでした。 AI回答の35%のみが正解でした。これは、どの学校の基準でも不十分な評価です。







もちろん、DeepMindの研究者は、数学とAIの研究を始めたばかりです。 将来的には、同じAlphaGoの場合と同様に、より多くの成功が期待できます。



詳細な研究データはこちらでご覧いただけます








All Articles