AI最前線コラム

AI-PapersAI論文解説・ニュースブログ

検索運営者情報お問い合わせプライバシーポリシー利用規約

© 2026 AI-Papers. All rights reserved.

ホーム
論文解説
言語・LLM

言語・LLM

論文解説言語・LLM

AI Co-Mathematicianとは？数学研究を支援するマルチエージェントの仕組みと成果

Google DeepMindが開発した数学研究支援エージェント「AI Co-Mathematician」を解説します。非同期マルチエージェントで仮説立案から定理証明まで一貫支援し、FrontierMath Tier 4で全AIシステム中最高の48%を達成しました。

2026年5月9日

AI Co-Mathematicianとは？数学研究を支援するマルチエージェントの仕組みと成果

論文解説言語・LLM

DCIとは？grepとシェルで直接コーパスを探索するエージェント検索の新手法

埋め込みモデルとベクトル検索を使わず、grepやシェルで生コーパスを直接探索するDCI（Direct Corpus Interaction）がBRIGHTとBEIRで既存手法を大幅に上回ることを示した論文を解説します。

2026年5月8日

DCIとは？grepとシェルで直接コーパスを探索するエージェント検索の新手法

論文解説言語・LLM

Cola DLMとは？連続潜在拡散でARに挑む階層型テキスト生成の新手法

Text VAE・ブロック因果DiT・条件付きデコードの3段階で構成されるCola DLMを解説します。連続潜在拡散によって自己回帰パラダイムとは異なるアプローチを提案し、約2Bパラメータで8ベンチマークにわたる強いスケーリング特性を示しました。

2026年5月8日

Cola DLMとは？連続潜在拡散でARに挑む階層型テキスト生成の新手法

論文解説言語・LLM

長文脈LLMの不可能性三角形とは？Transformer・Mambaに課される根本的制約を解説

Transformer・Mamba等52のアーキテクチャを対象に、長文脈LLMが効率性・コンパクト性・想起能力の3条件を同時に実現できないことを情報理論で証明した基礎研究を解説します。

2026年5月7日

長文脈LLMの不可能性三角形とは？Transformer・Mambaに課される根本的制約を解説

論文解説言語・LLM

OpenSeeker-v2とは？SFTのみで産業界のRL学習パイプラインを超えた検索エージェント

上海交通大学の学術チームによるOpenSeeker-v2は、SFTのみで4ベンチマークSoTAを達成。CPT+SFT+RLを使うTongyi DeepResearchを全指標で上回った「データ品質が鍵」という逆説的な知見を解説します。

2026年5月6日

OpenSeeker-v2とは？SFTのみで産業界のRL学習パイプラインを超えた検索エージェント

論文解説言語・LLM

ARISとは？敵対的マルチエージェント協調でML研究を自動化するオープンソースフレームワーク

異なるモデルファミリーの実行者と評価者が相互批評する敵対的マルチエージェント設計で、ML研究ワークフローを自律実行するオープンソースフレームワーク「ARIS」を解説します。

2026年5月6日

ARISとは？敵対的マルチエージェント協調でML研究を自動化するオープンソースフレームワーク

論文解説言語・LLM

WeightFormerとは？Attentionを線形時間に置き換える動的MLP手法を解説

清華大学提案のWeightFormerは、Attention機構を動的パラメータMLPとして再定式化し、線形時間でグローバル視覚モデリングを実現。高解像度入力でDeiT比7.7倍の速度を達成した新手法を解説します。

2026年5月5日

WeightFormerとは？Attentionを線形時間に置き換える動的MLP手法を解説

論文解説言語・LLM

Ctx2Skillとは？マルチエージェント自己対戦でLLMのコンテキスト学習を強化する新手法

清華大学らが提案するCtx2Skillは、3つのLLMエージェントによるSelf-Playでコンテキスト固有スキルを人間監督なしに自動精錬するフレームワーク。CL-benchで既存手法を一貫して上回る性能向上を達成しました。

2026年5月5日

Ctx2Skillとは？マルチエージェント自己対戦でLLMのコンテキスト学習を強化する新手法

論文解説言語・LLM

RoundPipeとは？コンシューマーGPU複数台でLLMファインチューニングを最大2.16倍高速化する新スケジューリング手法

パイプライン並列化の「weight binding問題」を解消する新手法RoundPipeを解説します。GPUをステートレスなワーカープールとして扱うラウンドロビン方式で8×RTX 4090でのLLMファインチューニングを最大2.16倍高速化し、単一コンシューマーサーバーでQwen3-235BのLoRAチューニングを実現します。

2026年5月4日

RoundPipeとは？コンシューマーGPU複数台でLLMファインチューニングを最大2.16倍高速化する新スケジューリング手法

論文解説言語・LLM

Abstract Chain-of-Thoughtとは？抽象トークン推論でCoTを最大11.6倍効率化

推論ステップに64種の抽象トークンを使う「Abstract CoT」を解説。Qwen3-8BでMATH-500精度90.8%を保ちながら推論コストを最大11.6倍削減する後学習手法です。

2026年4月28日

Abstract Chain-of-Thoughtとは？抽象トークン推論でCoTを最大11.6倍効率化

論文解説言語・LLM

Agent-Worldとは？MCPで1,978環境を自律合成し商用モデルを超える自己進化型エージェント

ByteDance Seedが発表したAgent-Worldは、MCPを活用して1,978の実世界環境を自律合成し、自己進化型の強化学習ループで23ベンチマークでGPT-4oなど商用モデルを上回る性能を実現しました。

2026年4月22日

Agent-Worldとは？MCPで1,978環境を自律合成し商用モデルを超える自己進化型エージェント

論文解説言語・LLM

推論SFTの一般化とは？「SFTは暗記のみ」を覆す条件付き実験分析

「SFTは暗記、RLは一般化」という通説を再考。長いCoTによる推論SFTでも最適化・データ品質・モデル能力の3条件が揃えばドメイン横断的な一般化が可能であることを解説します。

2026年4月12日

推論SFTの一般化とは？「SFTは暗記のみ」を覆す条件付き実験分析

前へ
1
2
3
4
5
次へ

カテゴリ

論文解説
- 音楽
- 音声
- 言語・LLM
- 画像
- 強化学習
- 動画
- マルチモーダル
- データセット
ニュース
- 技術
- ビジネス
AI最前線コラム

人気記事

HY-World 2.0とは？テキスト・画像・動画から3D世界を生成するマルチモーダルワールドモデル
2026年4月17日
Anthropic、Coefficient Bioを約4億ドルで買収、AI創薬に本格参入
2026年4月4日
ベクトルデータベース比較【2026年版】Pinecone・Qdrant・Weaviate・Milvusを徹底解説
2026年2月23日
Absolicsのガラス基板とは？AIチップ性能を10倍高密度化する次世代パッケージング
2026年3月15日
AIエージェントフレームワーク比較【2026】LangGraph・CrewAI・OpenAI Agents SDKの選び方
2026年2月19日