项目标书摘要:Outline of Research at the Start:従来の音声認識・対話システムは、原則としてユーザが1人、すなわち1人の話者がシステムに話すことが大前提となっている。これに対して本研究では、複数人がいる会話に参与することを目指して、音声認識と音声対話の両面からモデル化及びシステム実装を行う。具体的には、(1)音声分離・発話者検出(誰が話しているのか)、(2)発話権認識(次に誰が話すのか)、(3)聞き手反応の生成(発話権がない時にどう反応するか)、(4)感情・雰囲気の認識に基づく対話生成、の課題に取り組む。ロボット・AIが、複数人がいる状況で、基本的なコミュニケーション能力及び社会性を身に着けることができるかという問いに答えるものである。