SXSW ITフェスティバルで発表された世界初の「性別を問わない」音声アシスタント

SXSWでは、音声の音声が女性または男性に似ていない仮想アシスタントを導入しました。 それがどのように作成されたかを教えて、見込みを見てください。





フォトガレスハーフエークリー / CC BY-SA



「ジェンダーニュートラル」な声が必要な理由



調査によると、スマートスピーカーと音声アシスタントのユーザーは、はっきりした女性または男性の特徴のない「中立」バージョンの音声を欠いています。 Space10のR&Dアンケートでは、12,000人の回答者のほぼ半数が、アシスタントの「無性」の声を聞きがっています。 この設計では、人々はそれをアシスタントの「ボンネットの下」に隠されたAIシステムとよりよく関連付けます。 ニュートラルボイスは、「車」のイメージにより適しています。 ただし、この市場の大企業にはこのような選択肢はありません。



Virtueの専門家は解決策を提案しました-オースティンでのSXSW会議で、彼らはQと呼ばれる新しい「無性の」音声アシスタントを導入しました。



Qアシスタントの仕組みと作成方法



新しいアシスタントを作成するために、5人の声が1つに「結合」されました。 最後の「声」は、ヨーロッパのさまざまな国からのアシスタントの潜在的なユーザーに耳を傾けるために与えられました。 テスト結果に応じて、声は修正されました-低くまたは高くされた-そして再びユーザーに聞くことができました。



45,000人の回答者からなるフォーカスグループとの反復作業により、プロジェクトの作成者は「中立」の声に導かれました。



開発者によると、アシスタントの声は男性と女性の声の間の周波数範囲にあるため、Qの音は人々にとって「セックスレス」のようです。 前者の場合、周波数スペクトル 80〜180 Hzで、後者の場合、140〜255 Hzです。 音声Qは、145〜175 Hzのニュートラル範囲に分類され、性別を一意に決定することはできません。


このリンクのビデオやプロジェクトのWebサイトで 、アシスタントのサウンドを聞くことができます





意見と可能性



ジャーナリストはプロジェクトQについて前向きに話します。 CNBCコラムニストによる 、アシスタントは非常に「自信がある」ように聞こえますが、同時にフレンドリーで反応が良いようです。 プロジェクトの作成者は、アシスタントの見込みについて話しました。 Qはスマートスピーカーと音声アシスタントのユーザー向けの選択肢を広げるため、彼らはこのアイデアの成功を信じています。



開発者 、独自のデバイスやアプリケーション起動する予定はありませんが、IT企業の注意を引き付け、アシスタントに中立的な声を追加するように提供したいと考えています。 Qの作成者は、自社の製品について音声アナウンスを使用する運送会社、州、およびその他の組織に伝える予定です。



ただし、プロジェクトの将来は不明です。 Qの作成者と協力することを希望しているテクノロジー企業はまだありません。おそらく、テクノロジーメディアの騒ぎの後、ITの巨人によって「ジェンダーに中立な」アシスタントが独立して開発されるでしょう。



他に誰が無性助手を開発していますか



音声アシスタントの分野では、Qアナログはまだありません。 ただし、投票の「性別」を選択する機能は、この分野のすべての注目すべきプロジェクトにすでに存在しています。 英語を話すユーザーの場合、Google Assistantに 10の異なる男性と女性の声があり、Siriには異なるアクセントの男性と女性の声があります。 Amazon Alexaでサウンドを変更できます。スマートスピーカーの「スキル」でさまざまな音声を使用できます。





写真トニー・ウェブスター / CC BY-SA



Qアナログはチャットボットエリアにあります。 最初の「ジェンダーに中立な」ボットの1つは、英国の会社Sageで開発されました-Peggと呼ばれていました。 プロジェクトマネージャーのKriti Sharmaによる 、アシスタントは、 人間のふりをしているボットではなく、彼のためにボットのIDを作成するために無性にされました。



ニュートラルチャットボットは、GoDaddyおよびLoweの店舗チェーン向けにも開発されています。両方のボットはカスタマーサービスの分野で使用されます。



結論



スマートスピーカーとアシスタントの作成者は利用可能な音声の範囲を拡大しますが、アシスタントの「デフォルト」サウンドは変更されません。 Slateによる 、この永続性はブランド認知に関連している可能性があります。アシスタントの声が劇的に変化すると、耳でさまざまなサービスを区別することに慣れているユーザーに否定的な反応を引き起こします。



ほとんどの場合、「中立的な」音声は、大規模な音声アシスタントの市場で一般に受け入れられている標準にはなりません。 ただし、そのようなソリューションがユーザーの間で人気があるため、仮想アシスタントの多種多様な画像を提供できる新しいプレーヤーが出現する可能性があります。






追加の読み物-ブログとテレグラムチャンネルのサウンドと音楽について:



木や他の植物が言うように

グラフィックスをサウンドに変える方法と、なぜそれが必要なのか

A. ポッドキャストを記録および編集する

A. ゲームのサウンドトラックの機能とタスクは何ですか







All Articles