Diffusion Transformer

論文解説

高速な音声生成TangoFlox!Flox変換とCLAPランク付け最適化

この論文では、高速・効率的な音声生成技術「TangoFlox」を開発。オープンデータセットを活用して柔軟性と音質を向上。流れ変換技術とCLAPランク付け最適化を採用し、高品質な音声生成を実現。
動画

【AdaCache】動画の内容に応じて必要な計算量を自動調整する生成モデル

動画生成AIの処理速度を向上させる新手法「AdaCache」を提案。動画の内容に応じて必要な計算量を動的に調整し、キャッシュを活用することで、画質を維持したまま最大4.7倍の高速化を実現しました。