音声をテキストに自動翻訳するサービスとSkypeのプラグインであるElevenを開発しています。 サービスは通話中にSkypeに接続し、音声会話を処理して、5〜7秒以内にテキスト形式でユーザーに返します。 テキストログはおなじみのブロックに分けられます:あなたの言葉とあなたの対話者の言葉。 会話の開始と終了を判断するには、Skypeとの通信が必要です。
音声認識の考え方は新しいものではなく、世界は非常に多様な機能を備えた音声ダイヤルのサービスを積極的に開発しています。 当社の製品は、フリーランサー(開発者およびデザイナー)を対象としており、作業の利便性を向上させることを目的としています。
仕組み
すべてが非常に簡単です。私たちはあなたの声をカットし、HTTP経由でサーバーに送信します。 回答を取得し、クラウドに保存します。 プラグイン自体がSkypeに接続し、会話の開始と終了を監視します。 しかし、一度見たほうがいいと思います。
なぜこれをするのですか
不快な状況:
-作業には変更が必要です。
-そしてそれは言うことが不可能になる前に?
-話した。
-証拠?
フリーランサーはしばしば忘れられた仕事の問題に直面します。 結果を顧客に示した後、詳細の一部が正確ではないことがわかりました。 事実、準備ができていない人は、メモリに3〜4ポイントしか保持できないということです。 時間内のささいなことはまったくメモリに保持されていません。 イレブンは非常に緊急の課題を解決します-交渉の事実をキャプチャします。
そうそう。 私たちがすべてのプレゼンテーションで見せている穴を通して見たビデオは私たちに名前を与えました。
www.youtube.com/embed/G2Y0oqZOyl0