精度

マルチモーダル

画像の安全性を自動判断するAI技術「MLLM-as-a-Judge」

新たな手法「MLLM-as-a-Judge」を提案。画像の安全性を自動判断し、CLUEフレームワークを活用して関連性や条件を高度に判定。従来より高精度・効率的な結果を実現し、応用可能性も示唆。
画像

複雑な幾何学図形を認識する「Slow Perception」の提案

複雑な幾何学的図形を認識できる「Slow Perception」を提案。図形を線と点で段階的に予測し、復元精度を向上させる。人間の視覚認識に近い逐次的認識プロセスを用いて、精度と理解性を向上させるモデルを構築。
言語・LLM

LLMの考えすぎを抑え効率性20%向上する手法

LLMの考えすぎ問題がモデルの効率と精度に与える影響を分析し、Reasoning Preference Optimizationで緩和。提案手法により数学テストの精度と効率が約10%-20%向上。o1やQwQ-32Bなどを用い、数学的問題や一般知識に基づくテストを実施。