Uniform Diffusion LMを7Bパラメータ・1.5兆トークンでフルスクラッチ訓練し、知識・推論・コーディングで自己回帰モデルと同等性能を実証した初の大規模研究を紹介します。
7BパラメータのループTransformer「LoopCoder-v2」が2ループ動作でSWE-bench Verified 64.4点を達成しました。ループ3回以上で性能が逆に低下する非単調効果の仕組みを解説します。
ヴィゴツキーの教育理論「最近接発達領域(ZPD)」をAI訓練に応用したNVIDIAの手法「ZPPO」を解説します。BCQ・NCQの2つのプロンプト戦略で教師の知識を転移し、Qwen3.5の小規模モデルでVLMベンチマーク最大+9.3ppを達成しています。
トランスフォーマーの均一幅設計を問い直す「><former」を解説。×字型アーキテクチャとパラメータ不要の残差リサイジングにより、FLOPs 22%・KVキャッシュ 15%削減を達成します。
JD.comが開発したJoyAI-VL-Interactionは、映像ストリームを1秒単位で監視し「沈黙・応答・委譲」を自律的に判断するプロアクティブVLMです。DouBaoに77.6%、Geminiに87.9%の勝率を達成し、モデルと学習レシピを全公開しました。
フル再計算のレイテンシが文脈長とともに最大17.6倍に膨らむのに対し、KVEraserはわずか24%の増加のみで同等精度を実現する局所消去手法です。ICML 2026 Workshop Oral採択。
NVIDIAが公開したMoE×Mambaハイブリッドの大規模言語モデル「Nemotron 3 Ultra」を解説。550億パラメータながら推論スループットが最大6倍に向上した仕組みを詳しく紹介します。
LLMエージェントの長期記憶を「検索」から「能動的な再構成」へ転換するMRAgentを解説します。Cue-Tag-ContentグラフとLLMによる多段階推論で、LoCoMoで23.3%、LongMemEvalで約32.8%の精度改善とトークン削減を同時に達成しました。
ICML 2026採択。軽量な予測ネットワークがLLMの各レイヤーをスキップ・反復する「Program-of-Layers(PoLar)」を動的生成し、訓練不要で数学推論の精度と計算効率を同時に改善する手法を解説します。
わずか 1.5M〜34.5M のパラメータを持つ軽量 OCR システム PP-OCRv6 が Qwen3-VL-235B や GPT-5.5 を検出・認識の両面で上回りました。MetaFormer 設計と構造的再パラメータ化による技術的な仕組みを解説します。
動的に変化する環境でLLMエージェントを評価するベンチマークEvoArenaと、記憶の更新履歴をパッチ形式で管理するEvoMemを解説します。最先端エージェントでも平均正解率39.6%という厳しい現実と改善策を紹介。
自己回帰型拡散モデルで生じる長尺動画の品質ドリフトを、追加学習なしで抑える「TetherCache」を解説します。GRABとTAMEの2機構により、240秒生成での品質ドリフトスコアを7.84から1.33に大幅削減しました。
LLMはなぜ日本文化に偏る? 欧州研究が明かすAIの隠れた文化バイアス
arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
GitHub Copilot がトークン課金制へ移行、一部ユーザーで月額29ドルが750ドルに急騰
SANA-WMとは?単一GPUで720p・60秒動画を生成するNVIDIAの効率的世界モデル