ビジネス

チャットGPTに新たな音声対話機能、感情的な会話も可能に…日本語にも対応 : 読売新聞

2024-09-24

著者: 陽斗

【ニューヨーク=小林泰貴】米オープンAIは12月、対話型AI「チャットGPT」に新たな音声対話機能を導入することを発表した。回答速度を大幅に改善し、人間を相手にしているかのように滑らかに会話することが可能になるという。日本語にも対応している。

新機能は「アドバンスドボイスモード」として、12月から有料会員向けに順次提供が開始される。従来は音声による回答に3~5秒かかっていたが、新機能では人間とまったく同じ10・13秒で回答できるとのこと。発音やアクセントをより自然にし、感情的な表現もできるように進化している。

日本語や英語など5つ以上の言語に対応し、合計で9つの音色から21の音声を選択できる。対面、利用回数などに一定の上限が設けられる見込みで、将来的にはスマートフォンのカメラで撮影した文字や文書を理解し、音声で回答する機能も導入される予定だ。

新機能は更新されたが、会話内容の一部が不適切だった場合や、データの不正使用が報告された場合などには利用制限が設けられる。11月には米大統領選を控え、民主党支持者に対する「ディープフェイク」の濫用などが問題視されている。オープンAIはこうしたリスクに対応するため、対策を強化する方針を示している。

オープンAIは新機能の実現に向け、既存の音声合成技術と機械学習を駆使し、ユーザーの指示に基づいて声色を様々に変えることができるほか、悪用されるリスクを軽減させるための取り組みも行っている。これにより、個人情報やプライバシーに対する配慮が強化されている。

音声対話機能が提供されることで、よりインタラクティブな体験が可能となり、新たなビジネスモデルやアプリケーションの創出につながると期待されている。