タスクの複雑さは、人々がよく使用する複雑な言語構造にあります。 人でも、「この本では表紙だけが良い」といったフレーズでネガをすぐに認識しません。 このコンピューターをトレーニングする方法は?
これまでで最高のコンピュータープログラムで感情を判断する精度は、80%以下でした。 スタンフォードの科学者グループは、悪名高いAndrew Ngの参加により、 なんとか85%に到達し、再帰ニューラルネットワークでさらにトレーニングを行うことで、精度が95%に向上する可能性があります、 と研究の著者の1人は言います。 95%-それは絶対に驚異的な結果であり、すべての人が皮肉を認識してそのような正確さで単語の調性を決定できるわけではないことに注意してください。
ニューラルネットワークの初期トレーニングでは、科学者は12,000件の映画レビューのデータセットを使用し、自動パーサーを使用して別々のフレーズに分割しました。 結果は21万5000フレーズでした。 それらのそれぞれは、正または負の調性の程度についての評価で3人によって読まれました。 スクリーンショットは、Amazon Mechanical Turkユーザーに提供されたインターフェースを示しています。

著者は、NaSent(Neural Analysis of Sentiment)モデルを作成しました。これは、再帰的神経テンソルネットワークと呼ばれ、各フレーズの個々の単語を処理し、関係のツリーを構築し、各単語が持つ感情的な色付けと単語が相互にどのように影響するかを分析します。
オンラインデモでは、プログラムの仕組みを学ぶことができます。 彼女は、各単語、各フレーズ、およびテキスト全体の評価でツリーを構築します。 プログラムの一意性は、次の2つの例で推定できます。これらの例は同じ単語で構成されていますが、順序が異なり、文のトーンを変更します。プログラムはこれを理解します。

「シュールなレオンとは異なり、この映画は奇妙だが好感が持てる」というフレーズの分析により、全体的に肯定的な結果(青)が得られ、「奇妙だが楽しい」という組み合わせが肯定的に正しく認識される

同じ単語からのフレーズであるが、「シュールでありながら好感の持てるレオンとは異なり、この映画はおかしい」という異なる順序のフレーズは、否定的なレビューとして正しく認識されます(一般評価では赤色)
ところで、オンラインデモは、同時にニューラルネットワークをトレーニングするためのツールでもあります。 各ユーザーは、分析のためにプログラムに任意のテキストを提供し、エラーを修正することで結果を修正できます(間違った評価の円をクリックするだけです)。
無料プログラムのオンラインデモ
科学研究 (pdf)
ニューラルネットワークをトレーニングするためのデータセット (6 MB)
プログラムコード (10月18日から始まるEMNLP会議の前に公開予定)