KAISTが提案するWorldKVは、カメラ・行動情報に基づくKVキャッシュの取得と類似度ベースの圧縮により、動画世界モデルのスループットを訓練不要で約2倍に高めながらフルキャッシュ保持と同等の映像品質を維持します。
Gemini・Claude Code・Codexを組織全体に展開するための5つのポイントを解説します。プロンプト設計からAIエージェントの本番導入まで、段階別に実践的な手法を紹介します。
人手によるステップラベルを一切使わずにプロセス報酬モデルを構築する新手法「uPRM」を解説。LLMの次トークン確率から誤り推論ステップを検出し、ProcessBenchで最大15%の精度向上とRL訓練の安定化を実現します。
Virgin AtlanticはOpenAI Codexをモバイルアプリ刷新に活用し、繁忙期前という固定納期内でP1バグゼロとユニットテスト網羅率ほぼ100%を達成した事例を解説します。
剛体・変形体・関節体を統一的に扱うシミュレーション対応3D生成フレームワーク「PhysX-Omni」を解説。新データセット「PhysXVerse」と評価ベンチマーク「PhysX-Bench」も同時公開。
GoogleがI/O 2026でAndroid XR搭載AIメガネのプロトタイプを発表。Geminiによるリアルタイム翻訳・ナビ・物体認識が視野内に直接表示される実機体験を解説します。
全注意LLMに内在する疎性を活用して数百ステップの軽量学習で疎注意モデルへ変換するRTPurboを解説します。100万トークンのプリフィルで最大9.36倍の高速化を達成しながら精度をほぼ維持します。
NVIDIAが「Nemotron-Labs Diffusion」(3B〜14B)を2026年5月23日に公開。1つの重みで3モードを切り替え可能で、TPF指標で最大6.4倍の推論効率向上とQwen3比1.2%の精度向上を両立します。
Flux・SD3などのDiTモデルが抱える高解像度生成時の構造崩壊を、追加学習なしで解決するSEGAを解説。潜在空間のスペクトルエネルギーでRoPEを動的スケーリングし、4096²超の高品質生成を実現します。
Gartner 2026年版AIコーディングアシスタントMQでOpenAI CodexがLeader認定。評価の核となったエージェント機能と企業IT調達への影響を解説します。
NVIDIAが提案するGated DeltaNet-2は、線形注意の消去ゲートと書き込みゲートをチャネル単位で独立させ、1.3BモデルでMamba-2・KDAを複数ベンチマークで上回る性能を実現しました。
DeepMind CEOのDemis HassabisがGoogle I/Oで「特異点の麓に立っている」と宣言。AlphaFoldのような専門ツールから自律的な研究エージェントへの構造転換と逆説的リスクを解説します。
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
SANA-WMとは?単一GPUで720p・60秒動画を生成するNVIDIAの効率的世界モデル
HY-World 2.0とは?テキスト・画像・動画から3D世界を生成するマルチモーダルワールドモデル
ベクトルデータベース比較【2026年版】Pinecone・Qdrant・Weaviate・Milvusを徹底解説
Sapiens2とは?MetaのヒューマンAI基盤モデルが5Bパラメータ・4K解像度で姿勢・法線・点群推定を統合