会話 | AI-Papers

【Moshi】重複発話や割り込み対応が可能な音声対話モデル！遅延の少ない全二重の対話が実現

この論文では、Moshiというリアルタイム音声対話モデルを提案しています。Moshiは、音声から直接音声を生成する技術を用いることで、自然な会話体験を提供します。従来のモデルでは難しかった重複発話や割り込みへの対応が可能になり、遅延の少ない全二重の対話が実現。

2024.09.24

論文解説音声