ロボットのためのスタニスラフスキー。 感情的な統合の可能性を使用する方法

これからの休日におめでとうございます! この投稿は、素晴らしい新年ほど技術的なものではありません。 伝統により、新年の前夜、私たちはパートナーや顧客への贈り物を思いつきます。 しかし、私たちはまた、より多くの聴衆のために何か良いことをしたいです。 最高の贈り物-自分で作った。 そして、子供たちにとって贈り物は最も楽しいものです。 そのため、今年は「ロボットが子供たちにおとぎ話を読む」というプロジェクトを思いつきました。 12の新年の物語を取り上げ、音声合成を使用してを出して、 Voice Fabricポータルに投稿しました。



画像



ご存知のように、音声技術センターは複数のTTS(音声合成)投票を作成しました。これらは、 コンタクトセンター 、音声通知システム、モバイルアプリケーションのIVRシステム( ラジオRSSおよびリーダー)で使用されます。



声の選び方


合計すると、「音声ロボット」のチームには現在、5人の女性の声と2人の男性の声があります。 各音声には独自の名前があります。 女性の声の優位性は、情報システムではユーザーが知覚しやすい女性の声であるという事実によって説明されます。

各音声の個性は、いくつかの要因によって保証されます。 まず、音声がプロトタイプとして使用されるスピーカーのスタジオ録音中に、音声の音色が保持されます。 次に、このスピーカーのスタジオフォノグラムから特別に作成された統計的に計算された音声モデルを適用することにより、スピーカーの声のイントネーションの特徴を保持します。おとぎ話では、もちろん、新年とクリスマスのテーマ、著作権の欠如、個人的な好みに導かれました。 コレクションは雑多なものであることが判明しました:これらはロシアの有名な民話(「2つのフロスト」、「シスターシャンテレル」、「スノーメイデン」)、および兄弟のグリムとG.Khのヨーロッパの古典です。 アンデルセン。 また、あまり知られていませんが、魅力的なクリスマスの物語、「グロスターの仕立て屋」と「トゥイクルマウス」を見つけました。 そしてもちろん、彼らはO.ヘンリーのすばらしいたとえ話を無視することはできませんでした。これはおとぎ話ではなく、真の愛についての非常に感動的な物語です。







スコアリングプロセスはどのように機能しますか?


まず第一に、役割が分配されました。主に男性のキャラクターが男性の声に、女性が女性に与えられました。 例外はありましたが、まれでした。 著者にとって、テキストは男性と女性の両方の声で読まれました。 経験の変化のためだけに。 一部のキャラクターは、追加の特徴的な音色を受け取りました。 たとえば、マウスは女性の声だけでなく、音色も「小さな」漫画のキャラクターの方向に変化しました。

スコアリング前のテキスト処理は最小限でした。 SSMLの「音声」タグがテキストに挿入され、テキストの音声名と音色を設定するための追加タグが設定されました。 時々、「走って、心から楽しもう」という明確な言葉で強調の場所を指定する必要がありました。







私たちの仕事は自​​然な音を実現することでしたので、声はキャラクターの感情を伝える必要があります。 そして、私たちの音声ロボットはこれを行うことができます。 たとえば、彼らは笑うことができます。 これを行うには、楽しい絵文字をテキストに追加します。 そしてため息。 これを行うには、テキストに悲しい笑顔を追加します。



しかし、他の感情の表現により、それはより困難であることが判明しました。 私たちのロボットは否定性を表現する訓練を受けていないことが判明しました。 物語「フォックス・シスター」では、老婦人は非常に優しく、愛情深く老人をscります。



/> : , , :/>- !.. -! !







そして、声は完全に時代遅れではなく、メロディアスで若いように聞こえます。 ここでは、スタニスラフスキーの精神で「信じられない!」と叫ぶことができます。

同じおとぎ話の面白い瞬間:「小さなキツネが飛び跳ねて、テストで浴槽の中で彼女の頭を打ちました。」 女優が技術教育を受けており、経済学からは程遠いことがすぐにわかります。

実際、私たちの新年のプロジェクトはより創造的な取り組みです。 しかし、合成音声は実際の劇場で使用されます。 MDGsは、サンクトペテルブルクのAlexandrinsky Theaterでプロジェクトを開始します。 スピーチシンセサイザーが開発されており、特定の俳優の声のスピーチと感情的な特性を保持しながら文学的なテキストを読むことができます。



どうしたの?


Voice Fabric音声合成技術専用のMDGポータルでおとぎ話のページを立ち上げ、 VKontakteFaceBookのページでも発表しました。

私たちは子供たちが私たちのプロジェクトをどのように認識するか非常に心配していました。 それにもかかわらず、読者は私たちの物語が好きでした。 VKontakteの調査参加者の半数以上が、プロジェクトを前向きに評価しました。 当然、本を読んでいる親をロボットで置き換えることはできないという批判がありました。 そして、これに完全に同意します! しかし、彼らは子供たちを面白いゲーム形式でハイテクの世界に紹介することさえできます! さらに、この技術には重要な機能があります。視覚障害のある子供たちにおとぎ話を読むことができます。

どう思います



PS最近では、英語を話す同僚のキャロルが私たちのロボットのチームに加わりました。私たちは彼女の創造的なデビューのために興味深い何かを間違いなく思いつきます! 画像







All Articles