AI最前線コラム

AI-PapersAI論文解説・ニュースブログ

検索運営者情報お問い合わせプライバシーポリシー利用規約

© 2026 AI-Papers. All rights reserved.

論文解説の記事一覧 (5ページ目) | AI-Papers

ホーム
論文解説

論文解説

論文解説マルチモーダル

Future-L1とは？視覚潜在空間で「想像」してから予測するVLM動画推論の新手法

視覚言語モデルの動画イベント予測に、言語トークンと視覚潜在スパンを交互生成する「Future-L1」を紹介。FutureBenchでQwen3-VL-8Bを61.0→85.4（+24.4点）に改善した手法の仕組みを解説します。

2026年6月6日

Future-L1とは？視覚潜在空間で「想像」してから予測するVLM動画推論の新手法

論文解説言語・LLM

CLSAとは？ルーティング共有で128Kコンテキスト推論を17倍高速化するスパースアテンション

ルーティングインデックスをクロスレイヤーで共有するCLSAが、128Kコンテキストでスループット17.1倍・デコーディング7.6倍を実現。精度劣化はほぼゼロで長文脈LLMに広く適用可能な新手法を解説します。

2026年6月5日

CLSAとは？ルーティング共有で128Kコンテキスト推論を17倍高速化するスパースアテンション

論文解説言語・LLM

MLEvolveとは？自己進化LLMエージェントがMLアルゴリズムを自動発見する新手法

自律的にMLアルゴリズムを発見する新フレームワーク「MLEvolve」を解説。12時間の予算でMLE-Benchにて65.3%のメダル率を達成し、AlphaEvolveを上回る汎用性を示しました。

2026年6月5日

MLEvolveとは？自己進化LLMエージェントがMLアルゴリズムを自動発見する新手法

論文解説動画

LoomVideoとは？MLLMバックボーンで動画生成・編集を統合し5.41倍高速化する新手法

北京大学発の5Bパラメータ動画モデル「LoomVideo」は、MLLMをバックボーンに採用して動画生成と編集を統合。Scale-and-Add条件付けにより類似性能帯モデル比5.41倍の推論高速化を実現しています。

2026年6月5日

LoomVideoとは？MLLMバックボーンで動画生成・編集を統合し5.41倍高速化する新手法

論文解説言語・LLM

ThoughtFoldとは？推論チェーンの冗長ステップを56%削減する内省的選好学習

強化学習で学んだ推論チェーンの冗長なステップを内省的に特定し、マスク付き選好最適化で圧縮する新手法「ThoughtFold」。DeepSeek-R1-Distill-Qwen-7Bでトークン使用量を約56%削減しながら最先端の精度を維持します。

2026年6月4日

ThoughtFoldとは？推論チェーンの冗長ステップを56%削減する内省的選好学習

論文解説動画

AAD-1とは？非対称敵対的蒸留で自己回帰動画生成を1ステップ化する新手法

自己回帰動画生成を1ステップに圧縮するAAD-1を解説します。因果的な生成器と双方向識別器の非対称設計で動きの崩壊を克服し、VBenchで既存の4ステップ手法を上回るSOTAを達成しました。

2026年6月4日

AAD-1とは？非対称敵対的蒸留で自己回帰動画生成を1ステップ化する新手法

論文解説動画

Echo-Infinityとは？学習可能な進化型メモリで24時間超の無限動画をリアルタイム生成

24時間超・130万フレーム以上の動画をリアルタイム生成する初のフレームワーク「Echo-Infinity」を解説。人間の記憶統合に着想した学習可能メモリと改良版RoPEで、短尺・長尺の両タスクでSoTAを達成しました。

2026年6月4日

Echo-Infinityとは？学習可能な進化型メモリで24時間超の無限動画をリアルタイム生成

論文解説言語・LLM

OCC-RAGとは？0.6B小型LLMで忠実なマルチホップQAを実現する専門特化フレームワーク

0.6B・1.7Bの小型モデルで自身の2〜6倍サイズの汎用LLMと同等以上の性能を達成したOCC-RAGを解説します。325万件の合成データで訓練し、逐語引用による構造化推論と回答不能時の棄権機能を備えた忠実性重視の設計が特徴です。

2026年6月3日

OCC-RAGとは？0.6B小型LLMで忠実なマルチホップQAを実現する専門特化フレームワーク

論文解説画像

ByGとは？ペアデータ不要で画像・動画編集を実現するブートストラップ学習フレームワーク

ペアデータなしで画像・動画編集モデルを訓練できるフレームワーク「ByG」がICML 2026に採択されました。凍結した基盤モデルのEMAコピーで疑似ターゲットを生成し、循環一貫性と勾配ルーティングで100万ペアの教師あり手法を上回る性能を実証しています。

2026年6月3日

ByGとは？ペアデータ不要で画像・動画編集を実現するブートストラップ学習フレームワーク

論文解説言語・LLM

Hopeとは？人間の睡眠を模した記憶統合でLLM継続学習を実現する新フレームワーク

人間の睡眠中の記憶統合を着想源に、LLM向け「Sleep」パラダイムを提案。Knowledge SeedingとDreamingの2段階で壊滅的忘却を抑制し、数学推論・長文脈理解など複数タスクで既存手法を上回ることを実証した。

2026年6月3日

Hopeとは？人間の睡眠を模した記憶統合でLLM継続学習を実現する新フレームワーク

論文解説マルチモーダル

Crafterとは？多エージェント協調で論文品質の科学図表を自動生成するフレームワーク

複数の専門エージェントが役割分担して科学図表を自動生成する「Crafter」を解説。従来手法比+39ポイントの性能向上と、ラスター画像をSVGに変換するCraftEditorも同時公開。

2026年6月2日

Crafterとは？多エージェント協調で論文品質の科学図表を自動生成するフレームワーク

論文解説言語・LLM

Dominoとは？因果モデリングとドラフト生成を分離してLLM推論を5.8倍高速化

投機的デコーディングの新手法「Domino」を解説します。並列ドラフト生成と軽量な因果補正の2段構成で、Qwen3-8BのLLM推論を最大5.8倍高速化しました。

2026年6月2日

Dominoとは？因果モデリングとドラフト生成を分離してLLM推論を5.8倍高速化

前へ
1
…
4
5
6
…
24
次へ

カテゴリ

論文解説
ニュース
- 技術
- ビジネス
AI最前線コラム

人気記事

LLMはなぜ日本文化に偏る？欧州研究が明かすAIの隠れた文化バイアス
2026年4月30日
MolmoAct2とは？GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
2026年5月5日
GitHub Copilot がトークン課金制へ移行、一部ユーザーで月額29ドルが750ドルに急騰
2026年5月31日
arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化
2026年5月17日
Absolicsのガラス基板とは？AIチップ性能を10倍高密度化する次世代パッケージング
2026年3月15日