ロンドン大学クイーン・メアリー校の新しい研究によると、AIが生成した音声は人間の声と区別がつかないほどリアルなレベルに達しており、コミュニケーション、セキュリティ、倫理におけるテクノロジーの役割について重要な疑問が提起されている。
AI音声技術は画期的な進歩を遂げました。ロンドン大学クイーン・メアリー校の新たな研究によると、合成音声はもはや人間の声と区別がつかないほどに聞き分けられるようになり、人工知能の能力が大きく飛躍したことを示しています。
AIが生成した音声は説得力に欠け、人間の声と簡単に区別できると長年多くの人が考えてきました。しかし、最新の研究は、この認識がますます時代遅れになりつつあることを示しています。
掲載 PLOS One誌に掲載された研究では、実際の人間の声と、AIが生成した2種類の音声(特定の人物に似せて複製された音声と、特定の人間を模倣せずに大規模な音声モデルから作成された音声)を比較した。
研究の参加者は、声のリアリティ、優位性、信頼性を評価しました。
調査結果によると、AIが生成した音声は人間の声と同じくらいリアルに聞こえるため、聞き手にとって区別が難しいことが明らかになりました。興味深いことに、AIが生成した音声は人間の声よりも優勢に聞こえ、場合によってはより信頼できると感じられることが多かったのです。
「AIが生成した音声は今や私たちの身の回りに溢れています。誰もがAlexaやSiriに話しかけたり、自動カスタマーサービスシステムに電話を受けたりしたことがあるでしょう」と、ロンドン大学クイーン・メアリー校の心理学上級講師で、本研究の共同著者でもあるナディーン・ラヴァン氏はニュースリリースで述べています。「これらの音声は本物の人間の声とは少し違いますが、AI技術が自然で人間らしい音声を生成できるようになるのは時間の問題でした。私たちの研究は、まさにその時が来たことを示しています。人々がこれらのリアルな音声をどのように認識しているかを早急に理解する必要があります。」
ラヴァン氏は、市販のソフトウェアを使用してチームが音声クローンを簡単にかつ迅速に作成できることを強調しました。
「このプロセスに必要なのは最小限の専門知識と、数分間の音声録音だけで、費用もほとんどかかりません」と彼女は付け加えた。「これは、AI音声技術がいかに身近で洗練されたものになったかを示すものです。」
AI音声合成の急速な進歩は、倫理、著作権、そしてセキュリティに深刻な影響を及ぼします。特に、リアルな音声生成がより身近になり、高度化するにつれて、誤情報、詐欺、なりすましへの懸念は極めて重要になります。
しかし、前向きな面としては、ラヴァン氏は AI 音声技術が刺激的な機会をもたらす可能性を強調しました。
「アクセシビリティ、教育、コミュニケーションの改善に応用できる可能性があり、特注の高品質の合成音声によってユーザーエクスペリエンスを向上できる可能性がある」と彼女は述べた。
出典: ロンドンのクイーン·メアリー大学
