強化学習 社会的AIエージェント問題解決の手法「SDPO」でマルチターン会話の性能向上 新手法SDPOはエージェントの問題を特定して最適化を図り、各セッションの特定セグメントに注目して精密なフィードバックを提供。他の手法より性能が向上し、社会的AIエージェントのトレーニングに効果的です。 2025.01.29 強化学習論文解説
言語・LLM LLMの考えすぎを抑え効率性20%向上する手法 LLMの考えすぎ問題がモデルの効率と精度に与える影響を分析し、Reasoning Preference Optimizationで緩和。提案手法により数学テストの精度と効率が約10%-20%向上。o1やQwQ-32Bなどを用い、数学的問題や一般知識に基づくテストを実施。 2025.01.06 言語・LLM論文解説
言語・LLM LLM高速化へ新手法Dynasorで効率と精度向上 この論文では、LLMの推論効率を高めるために「Certainties」という概念を導入し、それに基づくリソース配分手法「Dynasor」を提案しています。Dynasorは計算効率と応答精度の両方を向上させることに成功しています。 2025.01.05 言語・LLM論文解説
動画 3Dオブジェクトからリアルタイム4Dシーンの生成 3Dオブジェクトを動きのある4Dオブジェクトに変換する新手法を提案しました。この手法は動きを抽出し、4Dシーンをリアルタイムで生成する最適なプロセスを活用。視覚的な品質と動的な表現のバランスが優れており、その優位性を実証しました。 2025.01.05 動画論文解説