動的に変化する環境でLLMエージェントを評価するベンチマークEvoArenaと、記憶の更新履歴をパッチ形式で管理するEvoMemを解説します。最先端エージェントでも平均正解率39.6%という厳しい現実と改善策を紹介。
MetaによるAIスタートアップManus買収が北京の命令で解除に向かっています。成立済みの20億ドル取引が中国政府の介入で覆された経緯と、AI産業が直面する地政学リスクを解説します。
自己回帰型拡散モデルで生じる長尺動画の品質ドリフトを、追加学習なしで抑える「TetherCache」を解説します。GRABとTAMEの2機構により、240秒生成での品質ドリフトスコアを7.84から1.33に大幅削減しました。
複数の米州司法長官がOpenAIに召喚状を送付し、広告ポリシー・健康データ・未成年者保護など5つの領域を調査対象としました。ChatGPTへの広告モデル導入後の規制リスクを解説します。
MoVerse は1枚の写真から360°パノラマ生成・3D空間再構成を経て、RTX 4090で8 FPSのリアルタイム動画を出力する新手法です。VR/ARやゲーム、ロボティクスへの応用が期待されます。
OpenAIが2026年6月、業務特化の学習コース3本をOpenAI Academyで公開しました。繰り返し作業のワークフロー化からエージェント活用まで、コーディング不要で即実践できる内容を解説します。
単一のDiTモデルで画像と深度マップを同時生成する「Modality Forcing」を解説。疎な実世界深度データで学習し、従来手法比AbsRelエラーを57%削減した仕組みと成果を紹介します。
米政府は2026年6月12日、ジェイルブレイクの懸念を根拠にAnthropicの上位2モデルの即時停止を命令しました。安全性を声高に訴えてきた同社が規制の標的となった構図と、業界全体への影響を解説します。
既存の画像生成モデル(FLUX等)を改変せずに活用し、テキストと画像を交互生成する能力を付与するマルチエージェントフレームワーク「InterleaveThinker」を解説。WISEスコアが0.47から0.73へ大幅に改善しました。
FAANGに代わる新造語「MANGOS」が2026年のテック産業を象徴します。未上場AI企業のIPO動向と、NvidiaのGPUを核とした企業間の経済的依存関係について詳しく解説します。
MiniMaxが開発した数学証明AI「MaxProof」の仕組みを解説。証明生成・検証・修復を統合したM3モデルが、IMO 2025で35/42問、USAMO 2026で36/42問を解き、いずれも金メダル基準を超えました。
OpenAIがコーディングAI基盤スタートアップのOnaを買収し、Codexに永続クラウド実行環境を統合すると発表しました。単発タスク完了型から複数日稼働の自律型エージェントへと進化し、企業のソフトウェア開発ワークフロー全体をAIがこなせる環境が整います。
LLMはなぜ日本文化に偏る? 欧州研究が明かすAIの隠れた文化バイアス
SANA-WMとは?単一GPUで720p・60秒動画を生成するNVIDIAの効率的世界モデル
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化
GitHub Copilot がトークン課金制へ移行、一部ユーザーで月額29ドルが750ドルに急騰