論文解説

データセット

【BoostStep】LLMの数学的な推論能力を大幅向上させる手法

数学推論能力を向上させる新手法「BoostStep」を提案。推論プロセスを細かく分解し、各ステップで適切な例を示す学習法を採用。複数の数学ベンチマークで実証済みの性能と誤り率低下を確認。
強化学習

エージェント支援の科学実験フレームワーク「Boxing Gym」

科学実験支援フレームワーク「Boxing Gym」を提案。エージェントが実験設計、結果解釈、新たな仮説を学びつつ、言語モデルで科学データの解釈をサポート。エージェントの限界も報告。
言語・LLM

多言語埋め込みを強化するLUSIFER!低リソース言語にも強い適応性

新手LUSIFERを提案し、多言語埋め込みを強化。ファインチューニングとアライメントで効果的な多言語学習を実現し、低リソース言語にも高い適応性とコスト効率を発揮。
強化学習

グラフGPTで分子構造の生成や物性予測などの科学技術の問題解決へ

新手法「Graph Generative Pre-trained Transformer(GPT)」が登場!Transformerを使いグラフをシーケンス化し、自己教師付きで事前学習。実験で既存手法を超える性能、強化学習で最適化。科学と工学に革新をもたらす予感!
マルチモーダル

視覚言語モデル活用を活用しロボ操作を改善する「OmniManip」

新アプローチ「OmniManip」を提案し、ロボットの物体操作を改善。視覚言語モデルを活用してタスク情報を抽出し、インタラクションプリミティブを生成。日常的なタスクで高い成功率を確認した。
マルチモーダル

動画に対応したRAG手法「VideoRAG」で視覚情報の活用の質が向上

動画応答生成手法「VideoRAG」を提案!動画とテキスト情報を統合し、質問に適した外部情報を活用。従来のRAGと比べ、視覚情報の利用により応答の質が向上。これで動画への質問ももっとスムーズに!
マルチモーダル

データ拡張で進化する数理モデルURSA!数式処理や幾何学的問題でGTP-4を上回る?

数学的推論に特化した多モーダルモデルURSAが登場!新しいデータ拡張技術と誤答例を活用し、推論能力を向上。数式処理や幾何学的問題でGTP-4を上回る?
強化学習

【Meta-CoT】高難度な数学タスクに優れたフレームワークでLLMの推論能力を向上

新たなフレームワーク「Meta-CoT」で複雑な推論能力を向上!自己強化型学習法とバックトラッキング機能を活用し、モデルの正確性と自己修正能力を強化。特に高難度の数学タスクで優れた性能、「Big MATH」が貢献。
言語・LLM

【rStar-Math】小型LLMの数学力を向上!モンテカルロ木探索を使って最適解を選択

小型LLMの数学的思考を向上させる新フレームワーク「rStar-Math」を提案。モンテカルロ木探索と自己進化型深層思考を組み合わせることで、計算コストを抑えつつ高い性能を実現した実験結果が報告されました。
強化学習

LLM性能向上手法「REINFORCE++」がPPOを超える效果!

REINFORCE++は、トークンレベルのKL正則化と簡素な方策更新を用いて、LLMの性能を向上させる手法です。PPOに匹敵する一般化性能とコスト効率を実験で示しています。