今では、人間の言語を理解して話すことができるデバイスやアプリケーションを持っている人を驚かすことは不可能です。 そのようなアプリケーションは、言語学と人工知能の交差点で一般的な方向を形成する自然言語処理方法に基づいています。
なぜデバイス、アプリケーション、サービスの大部分がロシア語で機能しないのですか?
私はしばしばこれを繰り返す必要がありますが、その理由は単純で悲劇的です。 実際、自然言語処理の問題を解決するには、専門的なプログラム(情報リソースを非常に必要とするアナライザー)、辞書、軍団、シソーラスを使用する必要があり、そのおかげで機能を実行できます。
これらはすべてロシアでは事実上存在せず、商業企業や学術グループの仕事を麻痺させ、彼らに車輪の再発明をさせたり、言語技術を単に放棄させたりしています。
すぐに実行できる最も便利なことは、関心のある人々がより迅速にそれに慣れ、現在利用可能な少数の利用可能な技術の使用を開始できるようにすることです。
これを行うには、機能の説明を含む利用可能なソフトウェアのカタログをコンパイルし、トレーニング資料を作成し、データへのリンク、マニュアル、およびその他の情報リソースを提供する必要があります。 それが私がNLPubを作成した理由であり、私は誰もがその開発に参加することを勧めます。
NLPubを通じてどのような情報が収集されますか?
以下のトピックには特に注意が払われます。
- 商用および非商用の両方で使用可能なテキスト処理ツール -トークナイザー、形態素解析器、パーサー、調性解析ツール。
- リソース -辞書、シソーラス、テキスト隊、基本的および応用的な問題を解決するために必要。
- イベント -研究者および開発者向けのテーマ別の会議およびセミナー。
- 教育 -自然言語処理およびデータ分析の分野における教育機関および専門的な再訓練コース。
プロジェクトを支援するにはどうすればよいですか?
次の3つの方法があります。
- 知識ベースを補充し、読者に国内のコンピューター言語学の状況に関する高品質で正確な関連資料を提供する。
- 知識ベースのコンパイルおよび開発の過程で作成された不正確さ。
- さまざまなテーマコミュニティでNLPubについて話し 、自然言語処理の分野での公共の関心を高めます(少なくとも、 私がやった方法についてのブログを書いてください )。
これは誰のものですか?
NLPubは非営利プロジェクトであり、営利企業とは提携していません。 これは、営利企業にとっての道を閉ざすものではありません。 それどころか、製品に関する情報を投稿することは、オープンで無料のソリューションとともに非常に歓迎されます。 現在、 ツールのリストには、多くの市販製品があります。
ここのコメントと、 よりプライベートなコミュニケーションチャネルの両方に記載されているすべての質問とコメントに喜んでお答えします。