AI-Papers

AI最前線コラム

AI-PapersAI論文解説・ニュースブログ

検索運営者情報お問い合わせプライバシーポリシー利用規約

言語・LLM の記事一覧 (3ページ目) | AI-Papers

ホーム
論文解説
言語・LLM

言語・LLM

論文解説言語・LLM

LongTraceRLとは？知識グラフ探索とルーブリック報酬で長文脈推論を強化するRL手法

知識グラフのランダムウォークと検索軌跡を訓練データとするRL手法「LongTraceRL」が提案されました。ルーブリック報酬で推論の質を直接最適化し、4B〜30Bモデルで5つの長文脈ベンチマークを上回る性能を達成しています。

2026年6月1日

LongTraceRLとは？知識グラフ探索とルーブリック報酬で長文脈推論を強化するRL手法

論文解説言語・LLM

OmniRetrievalとは？テキスト・テーブル・知識グラフを横断検索する新フレームワーク

テキスト・テーブル・知識グラフを各形式のまま横断検索する「OmniRetrieval」を解説します。13データセット・309知識ベースで検証し、既存RAGの均質化問題を解決した新フレームワークです。

2026年5月31日

OmniRetrievalとは？テキスト・テーブル・知識グラフを横断検索する新フレームワーク

論文解説言語・LLM

AgentDoG 1.5とは？8B以下の軽量モデルでGPT-5.4級エージェント安全を実現する新手法

AgentDoG 1.5は、コード実行エージェントの安全性を評価する軽量フレームワークです。影響関数ベースのデータ浄化で、0.8B〜8Bの小型モデルがGPT-5.4と同等の安全判定精度を達成しました。

2026年5月29日

AgentDoG 1.5とは？8B以下の軽量モデルでGPT-5.4級エージェント安全を実現する新手法

論文解説言語・LLM

MobileMoEとは？Metaが提案するオンデバイスMoEのスケーリング則と3倍高速モバイル推論

Metaが発表したMobileMoEは、モバイル向けMixture-of-Experts（MoE）アーキテクチャのスケーリング則を体系化した研究です。密モデル比2〜4倍少ない推論FLOPsを実現し、実機で最大3.8倍の高速デコードを達成した手法と成果を解説します。

2026年5月27日

MobileMoEとは？Metaが提案するオンデバイスMoEのスケーリング則と3倍高速モバイル推論

論文解説言語・LLM

MiniMax-M2とは？全体の4%の起動で実現するフロンティア性能の超疎MoEモデル

229.9Bパラメータのうちトークンあたり9.8B（約4.3%）のみ起動する超疎MoEモデルMiniMax-M2を解説します。AIME 2026で94.2%、GPQA-Diamondで89.8%を達成し、大幅に少ない計算量でフロンティアAIと同等の性能を実現しました。

2026年5月27日

MiniMax-M2とは？全体の4%の起動で実現するフロンティア性能の超疎MoEモデル

論文解説言語・LLM

RTPurboとは？数百ステップの学習で全注意を疎注意に変換し1Mコンテキスト推論を9倍高速化

全注意LLMに内在する疎性を活用して数百ステップの軽量学習で疎注意モデルへ変換するRTPurboを解説します。100万トークンのプリフィルで最大9.36倍の高速化を達成しながら精度をほぼ維持します。

2026年5月23日

RTPurboとは？数百ステップの学習で全注意を疎注意に変換し1Mコンテキスト推論を9倍高速化

論文解説言語・LLM

Gated DeltaNet-2とは？消去・書き込みゲートを分離してMambaを超える線形注意LLM改良手法

NVIDIAが提案するGated DeltaNet-2は、線形注意の消去ゲートと書き込みゲートをチャネル単位で独立させ、1.3BモデルでMamba-2・KDAを複数ベンチマークで上回る性能を実現しました。

2026年5月22日

Gated DeltaNet-2とは？消去・書き込みゲートを分離してMambaを超える線形注意LLM改良手法

論文解説言語・LLM

HRM-Textとは？1,500ドルの学習コストで7Bモデルに匹敵するLLM事前学習フレームワーク

階層型再帰モデル（HRM）を採用した新事前学習フレームワーク「HRM-Text」が提案されました。1Bモデルを約1,500ドルで学習し、MMLU 60.7%・GSM8K 84.5%を達成。2〜7Bクラスと同等の性能を最大432倍少ない計算量で実現します。

2026年5月21日

HRM-Textとは？1,500ドルの学習コストで7Bモデルに匹敵するLLM事前学習フレームワーク

論文解説言語・LLM

OScaRとは？KVキャッシュINT2量子化でLLMを3倍高速化する軽量フレームワーク

KVキャッシュ量子化の根本課題「Token Norm Imbalance（TNI）」を定義・解決する軽量フレームワーク「OScaR」を解説。INT2量子化でBF16比3倍高速・5.3倍省メモリを実現し、KIVI等の既存手法を精度で上回ります。

2026年5月21日

OScaRとは？KVキャッシュINT2量子化でLLMを3倍高速化する軽量フレームワーク

論文解説言語・LLM

Darwin Familyとは？訓練不要の進化的モデルマージでGPQA Diamond 86.9%を達成

訓練不要の進化的モデルマージフレームワーク「Darwin Family」が、GPQA Diamondで86.9%（1252モデル中6位）を達成。14次元ゲノムとMRI-Trust Fusionで複数LLMを重み空間で交配させ、追加学習なしに推論性能を高める革新的手法を解説します。

2026年5月16日

Darwin Familyとは？訓練不要の進化的モデルマージでGPQA Diamond 86.9%を達成

論文解説言語・LLM

SU-01とは？IMO・USAMO金メダルを達成した30B推論モデルの訓練レシピを解説

30Bパラメータ（3B active）のMoEモデル「SU-01」がIMO 2025・USAMO 2026で金メダルラインを達成。逆パープレキシティカリキュラムSFTから二段階RL・テスト時スケーリングへの統一レシピとその成果を解説します。

2026年5月15日

SU-01とは？IMO・USAMO金メダルを達成した30B推論モデルの訓練レシピを解説

論文解説言語・LLM

δ-memとは？凍結LLMに8×8連想記憶を付加する軽量オンラインメモリ機構

LLMのバックボーンを凍結したまま8×8の連想記憶行列をDelta則で学習させる新手法「δ-mem」を解説。MemoryAgentBenchで1.31倍、LoCoMoで1.20倍の性能向上を達成しました。

2026年5月13日

言語・LLM

LongTraceRLとは？知識グラフ探索とルーブリック報酬で長文脈推論を強化するRL手法

OmniRetrievalとは？テキスト・テーブル・知識グラフを横断検索する新フレームワーク

AgentDoG 1.5とは？8B以下の軽量モデルでGPT-5.4級エージェント安全を実現する新手法

MobileMoEとは？Metaが提案するオンデバイスMoEのスケーリング則と3倍高速モバイル推論

MiniMax-M2とは？全体の4%の起動で実現するフロンティア性能の超疎MoEモデル

RTPurboとは？数百ステップの学習で全注意を疎注意に変換し1Mコンテキスト推論を9倍高速化

Gated DeltaNet-2とは？消去・書き込みゲートを分離してMambaを超える線形注意LLM改良手法

HRM-Textとは？1,500ドルの学習コストで7Bモデルに匹敵するLLM事前学習フレームワーク

OScaRとは？KVキャッシュINT2量子化でLLMを3倍高速化する軽量フレームワーク

Darwin Familyとは？訓練不要の進化的モデルマージでGPQA Diamond 86.9%を達成

SU-01とは？IMO・USAMO金メダルを達成した30B推論モデルの訓練レシピを解説

δ-memとは？凍結LLMに8×8連想記憶を付加する軽量オンラインメモリ機構

人気記事