健康

名古屋大学、AIの力で声を再生する技術を開発 - 日本経済新聞

2024-10-25

著者: 結衣

名古屋大学の三河典之教授が率いる研究チームは、カメラで捉えた口元の動きから人の声を合成するAIを開発しました。この技術は、声を失った人々が自分の声を取り戻す手助けをすることを目的としています。言葉を発するのに重要な役割を果たす口元の動きを解析し、発話を生成する「代替音声」や、スマートフォンと連携して出力する方法などが存在します。これにより、ユーザーは自分自身の声でコミュニケーションを取ることが可能になります。

この技術は、20年前からの英語の発音解析を基盤にしていますが、日本語の発話においても数々の困難がありました。特に、日本語では音の数が限られているため、個別の発音の識別が難しく、実用化にはさらなる研究が必要とされていました。

研究チームは2009年に神奈川工科大学と共同で、日本語の音声生成のための言語モデルと発声解析を進めてきました。現在、AIは口元の動きから声をリアルタイムで再生する技術を持ち、発話内容を自然に再現する能力が向上しています。

このアプリケーションは、個人の声を合わせた合成音声を5分間で生成することができ、次々と自分の声で発話することが特徴です。実用化には語彙を増やすためのAIの機能向上が不可欠です。名古屋大学の三河教授は、「実証実験に早く取り組み、数年後の実用化を目指したい」と語っています。

今後、この技術が医療分野やコミュニケーション支援の場面でどのように活用されるのか、非常に楽しみですね。声を失った人々が再び自分の声で話せる未来が近づいています。