推論

強化学習

【Meta-CoT】高難度な数学タスクに優れたフレームワークでLLMの推論能力を向上

新たなフレームワーク「Meta-CoT」で複雑な推論能力を向上!自己強化型学習法とバックトラッキング機能を活用し、モデルの正確性と自己修正能力を強化。特に高難度の数学タスクで優れた性能、「Big MATH」が貢献。
マルチモーダル

画像の安全性を自動判断するAI技術「MLLM-as-a-Judge」

新たな手法「MLLM-as-a-Judge」を提案。画像の安全性を自動判断し、CLUEフレームワークを活用して関連性や条件を高度に判定。従来より高精度・効率的な結果を実現し、応用可能性も示唆。
言語・LLM

LLMの考えすぎを抑え効率性20%向上する手法

LLMの考えすぎ問題がモデルの効率と精度に与える影響を分析し、Reasoning Preference Optimizationで緩和。提案手法により数学テストの精度と効率が約10%-20%向上。o1やQwQ-32Bなどを用い、数学的問題や一般知識に基づくテストを実施。
言語・LLM

LLM高速化へ新手法Dynasorで効率と精度向上

この論文では、LLMの推論効率を高めるために「Certainties」という概念を導入し、それに基づくリソース配分手法「Dynasor」を提案しています。Dynasorは計算効率と応答精度の両方を向上させることに成功しています。
言語・LLM

TransformerにCoTを導入することで全ての推論問題を解決できる!

この論文では、Transformerに「Chain of Thought(CoT)」を導入することで、従来の並列処理が得意なTransformerに複雑な計算能力を持たせる方法を提案しています。この手法によって、複雑な問題の解決が可能となり...