2026年5月19日、日立製作所とAnthropicが共同組織「Frontier AI Deployment Center」を設立。フィジカルAIとAIエージェントの融合で100兆円超の市場を目指す戦略を解説します。
NVIDIAが提案するPiDは、潜在拡散モデルのVAEデコーダをピクセル空間の拡散プロセスに置き換え、512×512の潜在変数から2048×2048の高解像度画像を生成する新手法です。SeedVR2比で5.9倍の速度向上を達成しつつ、視覚品質の改善も示されています。
IBMがThink 2026で提示した「AIオペレーティングモデル」は、急増するAIエージェントを統制する4層フレームワークです。各柱を担う製品群の役割とエンタープライズ導入への示唆を解説します。
Microsoftが提案する3.8BパラメータのT2Iモデル「Lens」。GPT-4.1生成の高密度キャプション8億件と計算量換算19.3%という効率的な学習を実現した仕組みを解説します。
スクーデリア・フェラーリとIBMが2026年に提携し、AIでF1ファンアプリを全面刷新。レース週末のエンゲージメントが62%増加した成果と実装モデルを解説します。
ライブ演奏向けのリアルタイム音楽生成フレームワーク「Live Music Diffusion Models」を解説。KVキャッシングとARC-Forcingにより、消費者向けGPUで30ms以下の低遅延生成を実現した手法を紹介します。
NTSBの公開するスペクトログラム画像からAIが死亡パイロットの音声を復元できることが判明しました。NTSBは調査ドケットへのアクセスを一時遮断。連邦法の抜け穴となった技術的背景と今後の対応を解説します。
KAISTが提案するWorldKVは、カメラ・行動情報に基づくKVキャッシュの取得と類似度ベースの圧縮により、動画世界モデルのスループットを訓練不要で約2倍に高めながらフルキャッシュ保持と同等の映像品質を維持します。
Gemini・Claude Code・Codexを組織全体に展開するための5つのポイントを解説します。プロンプト設計からAIエージェントの本番導入まで、段階別に実践的な手法を紹介します。
人手によるステップラベルを一切使わずにプロセス報酬モデルを構築する新手法「uPRM」を解説。LLMの次トークン確率から誤り推論ステップを検出し、ProcessBenchで最大15%の精度向上とRL訓練の安定化を実現します。
Virgin AtlanticはOpenAI Codexをモバイルアプリ刷新に活用し、繁忙期前という固定納期内でP1バグゼロとユニットテスト網羅率ほぼ100%を達成した事例を解説します。
剛体・変形体・関節体を統一的に扱うシミュレーション対応3D生成フレームワーク「PhysX-Omni」を解説。新データセット「PhysXVerse」と評価ベンチマーク「PhysX-Bench」も同時公開。
LLMはなぜ日本文化に偏る? 欧州研究が明かすAIの隠れた文化バイアス
Qwen-AgentWorldとは?LLMを環境シミュレーターに変換するエージェント向け言語世界モデル
GitHub Copilot がトークン課金制へ移行、一部ユーザーで月額29ドルが750ドルに急騰
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化