Dream.exeは8種類の動画生成モデルを101件のロボット操作タスクで評価し、視覚的品質と物理的実行成功率が無相関(r=−0.03)という事実を実証した新評価フレームワークです。
トランプ政権がOpenAIへの株式取得を協議していると報じられました。政府がAI企業に直接出資する前例なき動きの背景と、インテル出資との比較や各方面の反応を解説します。
Goedel-ArchitectはLean 4形式証明エージェント。補題の依存グラフを生成・洗練し、IMO 2025の6問中4問・MiniF2F-testで99.2%を達成。類似システムより最大500倍コスト効率に優れます。
OpenAIが「Lockdown Mode」を発表しました。ウェブ閲覧やエージェントモードを無効化することで、プロンプトインジェクション攻撃から機密データを守る企業向けの新機能です。
世界シミュレーターを外部ツールとして呼び出し「未見視点の画像」を生成してから推論するVLMフレームワーク「Astra」を解説。2段階の強化学習でMMSI-Benchの精度を+9.0点改善した仕組みを紹介します。
ケンブリッジ大学とDIOSynVaxが機械学習で設計した人工抗原ワクチンが、健康成人39人への第1相臨床試験で安全性と免疫応答を確認しました。AI設計の抗原がヒト体内で機能した世界初の事例を解説します。
ハイパーネットワークがリポジトリ固有のLoRAアダプターを自動生成する「Code2LoRA」を解説。推論時のトークンオーバーヘッドなしに+5.2ポイントの改善を達成した仕組みと、604リポジトリのベンチマーク「RepoPeftBench」を紹介します。
GoogleがSpaceXと月9億2000万ドルの計算資源賃借契約を締結しました。Alphabetの巨額インフラ投資計画があっても外部調達が必要になった背景と、AI産業のインフラ調達構造の変化を解説します。
視覚言語モデルの動画イベント予測に、言語トークンと視覚潜在スパンを交互生成する「Future-L1」を紹介。FutureBenchでQwen3-VL-8Bを61.0→85.4(+24.4点)に改善した手法の仕組みを解説します。
AIトークン費用が約9か月で18.6倍に急増し、Uberが年間AI予算を4月時点で使い果たすなど業界全体に衝撃が広がっています。急増するコストの実態、企業の対応策、今後の見通しを解説します。
ルーティングインデックスをクロスレイヤーで共有するCLSAが、128Kコンテキストでスループット17.1倍・デコーディング7.6倍を実現。精度劣化はほぼゼロで長文脈LLMに広く適用可能な新手法を解説します。
MetaのAIサポートエージェントがVPN偽装と単純な依頼だけで悪用され、Instagramアカウントが乗っ取られた事件を解説。Obama公式も被害を受けたこの事例が示すAIエージェントのセキュリティ上の根本的な問題とは。
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
SANA-WMとは?単一GPUで720p・60秒動画を生成するNVIDIAの効率的世界モデル
LLMはなぜ日本文化に偏る? 欧州研究が明かすAIの隠れた文化バイアス
GitHub Copilot がトークン課金制へ移行、一部ユーザーで月額29ドルが750ドルに急騰
arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化