自己回帰型ストリーミング動画拡散モデルの蒸留フレームワーク「Stream-R1」を解説。ロールアウト単位の信頼性と空間・時間的複雑度を単一の報酬モデルで制御し、全ベンチマーク指標で品質を向上させます。
Google DeepMindのAlphaEvolveは、Geminiを基盤にアルゴリズムを自律的に生成・改良するコーディングエージェントです。TPU設計から組合せ数学の未解決問題まで、実環境での具体的な成果を解説します。
Tencent Hunyuanが提案するマルチモーダル深層検索エージェント「OpenSearch-VL」の完全公開訓練レシピを解説。致命的意識GRPOと多ツール環境により7ベンチマークで10ポイント超の改善を達成しています。
Milken会議でASMLからPerplexityまでAI産業の各層を代表する5人のリーダーが、チップ不足・エネルギー制約・地政学リスクなどサプライチェーン全体の課題を率直に語りました。
Transformer・Mamba等52のアーキテクチャを対象に、長文脈LLMが効率性・コンパクト性・想起能力の3条件を同時に実現できないことを情報理論で証明した基礎研究を解説します。
中国AIスタートアップのDeepSeekが初の外部資金調達ラウンドで評価額450億ドルに達する見通しです。国家ファンドやテンセント、アリババの参加交渉も進んでおり、米中AI覇権争いに新たな局面をもたらしています。
上海交通大学の学術チームによるOpenSeeker-v2は、SFTのみで4ベンチマークSoTAを達成。CPT+SFT+RLを使うTongyi DeepResearchを全指標で上回った「データ品質が鍵」という逆説的な知見を解説します。
OpenAIがAMD・Broadcom・Intel・Microsoft・NVIDIAと共同開発した新ネットワークプロトコル「MRC」の仕組みを解説。パケットスプレーとSRv6で大規模AI訓練の耐障害性を大幅に向上します。
異なるモデルファミリーの実行者と評価者が相互批評する敵対的マルチエージェント設計で、ML研究ワークフローを自律実行するオープンソースフレームワーク「ARIS」を解説します。
Marc LoreのWonderが、ロボットキッチンをAI駆動の「レストラン工場」に転換する「Wonder Create」を発表。プロンプト入力1分以内で誰でも仮想飲食ブランドを開業できる構想とその仕組みを解説します。
マルチモーダルRLのSFT後に生じる分布ドリフトを、知覚・推論の専門家を持つMoEディスクリミネータで修正する新パイプライン「PRISM」を解説します。Qwen3-VLで全ベンチマーク平均+4.4〜+6.0ポイントの改善を達成しました。
OpenAIが2026年5月5日、ChatGPTのデフォルトモデルをGPT-5.5 Instantに更新。医療・法律・金融などの高リスク領域でのハルシネーションを52.5%削減し、過去チャットを活用したパーソナライゼーションも強化されました。
LLMはなぜ日本文化に偏る? 欧州研究が明かすAIの隠れた文化バイアス
Qwen-AgentWorldとは?LLMを環境シミュレーターに変換するエージェント向け言語世界モデル
GitHub Copilot がトークン課金制へ移行、一部ユーザーで月額29ドルが750ドルに急騰
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化