ロボット行動制御にビデオ生成は必要か、を実験で問い直したImageWAM。画像編集のKVキャッシュを行動予測に活用するだけでFLOPs 1/6・遅延1/4(263ms)を達成し、実機ロボットでも84.5%の成功率を記録しました。
AlphaFoldでノーベル化学賞を受賞したジョン・ジャンパー氏がDeepMindを退職しAnthropicへ移籍。AI企業間の人材獲得競争が研究最高水準にまで達している実態を示す動きとして注目されている。
ルターガース大学のチームが発表したSSDは、画像トークンの2次元空間構造を活かした投機的デコードで自己回帰型画像生成を最大13.3倍に高速化。DPG-BenchとGenEvalで生成品質を維持したまま高速化を達成しています。
2026年6月、OpenAIがGPT-5.5 Instantと医師監修の評価基準を導入し、ChatGPTの健康・ウェルネス応答を全ユーザー向けに改善。推論強化・文脈理解・情報の明瞭さの3本柱で医療AIの信頼性向上を図ります。
人間の一人称視点映像(エゴセントリック映像)を適切に処理すると実ロボットデータを凌駕することを実証した「HumanScale」を解説。分布外タスクで90%の成功率向上を達成し、身体的AIのデータ収集コスト問題に新たな解法を示します。
マイアミ発スタートアップSubquadraticが、LLMの計算ボトルネックを解消する疎注意技術「SubQ」を発表しました。FlashAttention比56倍高速化と1200万トークンのコンテキストウィンドウを主張しています。
わずか0.22Bパラメータで産業用10Bモデル「FLUX.1-Fill-Dev」に匹敵する画像修復品質を実現する軽量フレームワーク「Moebius」を紹介します。LλMIブロックと適応的多粒度蒸留により推論速度15倍超を達成し、個人開発者のGPUでも高品質な画像修復が可能です。
HuggingFace PEFTチームがLoRA・OFT・GraLoRAなど6手法を画像生成と数学推論の2タスクで実測比較。OFTが画像生成でLoRAを精度・VRAM効率ともに上回る結果を詳しく解説します。
ServiceNow Researchが実証したMosaicLeaks研究を解説します。社内文書と外部検索を組み合わせるAIエージェントが検索クエリを通じて機密情報を漏洩させるリスクと、漏洩率を34%から9.9%に削減するPA-DR手法を紹介します。
物理AI向け世界モデル「Kairos」は、3種の注意機構を組み合わせたハイブリッド時間アーキテクチャで誤差蓄積の上限を理論的に証明し、RoboTwin 2.0など複数ベンチマークで最高水準の性能を達成しました。
Cursor・Claude Code・GitHub Copilot・Windsurfの4大AIコーディングツールを、MCP統合・エージェント機能・SWE-benchベンチマーク・価格体系の観点から徹底比較し、ワークフロー別の選び方を解説します。
HuggingFaceが公開した「agent-eval」は、AIエージェントのライブラリ操作能力を正答率だけでなくトークン消費・エラー回数・実行時間でも評価するベンチマークです。大規模モデルにはCLI補助が有効でも小規模モデルには逆効果になるという実証知見を解説します。
LLMはなぜ日本文化に偏る? 欧州研究が明かすAIの隠れた文化バイアス
arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
GitHub Copilot がトークン課金制へ移行、一部ユーザーで月額29ドルが750ドルに急騰
Absolicsのガラス基板とは?AIチップ性能を10倍高密度化する次世代パッケージング