マルチモーダル 動画に対応したRAG手法「VideoRAG」で視覚情報の活用の質が向上 動画応答生成手法「VideoRAG」を提案!動画とテキスト情報を統合し、質問に適した外部情報を活用。従来のRAGと比べ、視覚情報の利用により応答の質が向上。これで動画への質問ももっとスムーズに! 2025.01.31 マルチモーダル論文解説