視覚言語モデルが苦手とする3D空間推論を、階層的ツールと二重メモリで克服する「S-Agent」が登場。8Bの小型モデルでもGPT-5.4やGemini 3と同等の空間知能スコアを達成した仕組みを解説します。
トランプ政権がAnthropicの最新モデルを強制オフライン化。Amazon CEOの告発が引き金となったこの措置が、OpenAIやGoogleへの需要シフトと、逆にClaudeブランドを高める逆説的効果の両面から競争地図を読み解きます。
UC Berkeleyが提案するRATs(Robotics Agent Teams)は、タスク前の「遊び」で自律的にスキルを習得するロボット学習手法です。LIBERO-PROで+20.6ポイントの精度向上を実証しました。
iOS 27では「Apple Intelligence」がOSの深部に統合され、レシート自動分割・漏洩パスワードの自動更新・通話中コンテキスト表示など実用的なAI機能が7つ追加されます。処理はすべてデバイス上で完結します。
1枚の画像からカメラ移動・物体の動き・天気変化を単一モデルで独立制御してビデオを生成する「Holo-World」を解説。新データセットと統合アダプターにより、従来は困難だった複合制御を実現しました。
SignalのメレディスウィッタカーCEOがBloombergのインタビューで「AIチャットボットは友人でも意識もない」と警告。感情的依存を演出するAI設計の問題点とプライバシーリスクを解説します。
ロボット行動制御にビデオ生成は必要か、を実験で問い直したImageWAM。画像編集のKVキャッシュを行動予測に活用するだけでFLOPs 1/6・遅延1/4(263ms)を達成し、実機ロボットでも84.5%の成功率を記録しました。
AlphaFoldでノーベル化学賞を受賞したジョン・ジャンパー氏がDeepMindを退職しAnthropicへ移籍。AI企業間の人材獲得競争が研究最高水準にまで達している実態を示す動きとして注目されている。
ルターガース大学のチームが発表したSSDは、画像トークンの2次元空間構造を活かした投機的デコードで自己回帰型画像生成を最大13.3倍に高速化。DPG-BenchとGenEvalで生成品質を維持したまま高速化を達成しています。
2026年6月、OpenAIがGPT-5.5 Instantと医師監修の評価基準を導入し、ChatGPTの健康・ウェルネス応答を全ユーザー向けに改善。推論強化・文脈理解・情報の明瞭さの3本柱で医療AIの信頼性向上を図ります。
人間の一人称視点映像(エゴセントリック映像)を適切に処理すると実ロボットデータを凌駕することを実証した「HumanScale」を解説。分布外タスクで90%の成功率向上を達成し、身体的AIのデータ収集コスト問題に新たな解法を示します。
マイアミ発スタートアップSubquadraticが、LLMの計算ボトルネックを解消する疎注意技術「SubQ」を発表しました。FlashAttention比56倍高速化と1200万トークンのコンテキストウィンドウを主張しています。
LLMはなぜ日本文化に偏る? 欧州研究が明かすAIの隠れた文化バイアス
GitHub Copilot がトークン課金制へ移行、一部ユーザーで月額29ドルが750ドルに急騰
Qwen-AgentWorldとは?LLMを環境シミュレーターに変換するエージェント向け言語世界モデル
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化