拡散言語モデルの並列デコードを活かし、画像内の複数マスク領域を一括でキャプション生成するPerceptionDLMを解説します。スループット3.44倍を達成し、新ベンチマークParaDLC-Benchで62.4%の精度を記録しています。
Samsung Electronicsが全世界の従業員にChatGPT EnterpriseとCodexを一斉展開。OpenAI史上最大規模のエンタープライズ導入として、製造業のAI全社活用の先例を示します。
視覚言語モデルが苦手とする3D空間推論を、階層的ツールと二重メモリで克服する「S-Agent」が登場。8Bの小型モデルでもGPT-5.4やGemini 3と同等の空間知能スコアを達成した仕組みを解説します。
トランプ政権がAnthropicの最新モデルを強制オフライン化。Amazon CEOの告発が引き金となったこの措置が、OpenAIやGoogleへの需要シフトと、逆にClaudeブランドを高める逆説的効果の両面から競争地図を読み解きます。
UC Berkeleyが提案するRATs(Robotics Agent Teams)は、タスク前の「遊び」で自律的にスキルを習得するロボット学習手法です。LIBERO-PROで+20.6ポイントの精度向上を実証しました。
iOS 27では「Apple Intelligence」がOSの深部に統合され、レシート自動分割・漏洩パスワードの自動更新・通話中コンテキスト表示など実用的なAI機能が7つ追加されます。処理はすべてデバイス上で完結します。
1枚の画像からカメラ移動・物体の動き・天気変化を単一モデルで独立制御してビデオを生成する「Holo-World」を解説。新データセットと統合アダプターにより、従来は困難だった複合制御を実現しました。
SignalのメレディスウィッタカーCEOがBloombergのインタビューで「AIチャットボットは友人でも意識もない」と警告。感情的依存を演出するAI設計の問題点とプライバシーリスクを解説します。
ロボット行動制御にビデオ生成は必要か、を実験で問い直したImageWAM。画像編集のKVキャッシュを行動予測に活用するだけでFLOPs 1/6・遅延1/4(263ms)を達成し、実機ロボットでも84.5%の成功率を記録しました。
AlphaFoldでノーベル化学賞を受賞したジョン・ジャンパー氏がDeepMindを退職しAnthropicへ移籍。AI企業間の人材獲得競争が研究最高水準にまで達している実態を示す動きとして注目されている。
ルターガース大学のチームが発表したSSDは、画像トークンの2次元空間構造を活かした投機的デコードで自己回帰型画像生成を最大13.3倍に高速化。DPG-BenchとGenEvalで生成品質を維持したまま高速化を達成しています。
2026年6月、OpenAIがGPT-5.5 Instantと医師監修の評価基準を導入し、ChatGPTの健康・ウェルネス応答を全ユーザー向けに改善。推論強化・文脈理解・情報の明瞭さの3本柱で医療AIの信頼性向上を図ります。
LLMはなぜ日本文化に偏る? 欧州研究が明かすAIの隠れた文化バイアス
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
GitHub Copilot がトークン課金制へ移行、一部ユーザーで月額29ドルが750ドルに急騰
arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化
Absolicsのガラス基板とは?AIチップ性能を10倍高密度化する次世代パッケージング