ピクセル空間の自己回帰(AR)画像生成が抱える2つの根本課題を並列ロールアウト近似(PRA)で解決。ImageNet 256×256でFID 1.94という新たな最高性能を511Mパラメータの実用的なモデルで達成した北京大学の研究を解説します。
ファナックがAWS EC2 P5 GPUインスタンスを活用し、ロボット模倣学習の所要時間を60時間から4.8時間へ約92%短縮。VLAモデルと仮想空間学習を組み合わせた製造現場でのフィジカルAI活用事例を解説します。
安全ポリシーをモデルに埋め込まず実行時に切り替える新しいガードレール手法「SingGuard」を紹介します。fast-slow分離RLで3段階推論を最適化し、56,340例・80超のリスク分類を含むベンチマークで35ベンチマークファミリーにてSOTAを達成しました。
「AIに設計要件を入力すれば高品質製品が生まれる」という誤解がフォードの品質低下を招きました。350人のベテランエンジニア再雇用後、10億ドル削減とJDパワー首位を達成した事例を解説します。
RL後訓練の方策モデルと参照モデルの対数確率比が、理論的に最適な優位関数と等価であることを証明した研究を紹介します。追加アノテーションなしで専用プロセス報酬モデルを上回る精度を達成し、テスト時スケーリング・不確実性定量化・失敗原因特定に即座に応用可能な Progress Advantage を解説します。
ソフトバンク孫CEOが軌道上データセンター構想を「コスト効果が乏しく時間がかかりすぎる」と批判。AI競争の勝負は今後数年であり、10年先の宇宙構想とは時間軸が合わないと指摘しています。
ByteDance Seedが提案するDanceOPDは、Flow MatchingモデルでT2I生成・ローカル編集・グローバル編集を1つのモデルに統合する際の能力干渉を、オンポリシー蒸留で解決するフレームワークです。
Apple副社長でVision Proを統括したポール・ミードがOpenAIのハードウェアチームへ移籍します。ジョニー・アイブとのAIデバイス開発が本格化する中、世界屈指のハードウェア人材獲得の背景と影響を解説します。
Tencent HunyuanのViQは、視覚特徴をテキスト空間で整合させてから離散コードに変換する2段階フレームワークです。マルチモーダル訓練を最大70%高速化しながら、連続エンコーダと同等の理解性能と高精度な画像再構成を実現しています。
トランプ政権のAnthropicへの輸出禁止が長引くなか、日本のSakana AIや中国の360がMythos相当モデルを発表。米国AI企業が規制対応に追われる間に、アジア勢が非米国市場のシェアを着実に伸ばしつつある。
67モデル・21プロバイダの実験から、全LLMが同時に失敗する確率βが組み合わせシステムの性能上限を決定することが判明。ペアワイズ相関はこの上限を2.5倍過小評価していました。
ギリシャを拠点とする起業家が非ホジキンリンパ腫との闘病でClaudeを活用し、PETスキャンの曖昧な輝点を「胸腺再活性化」と特定。不要な放射線療法を回避した実例をTechCrunchが報道。
LLMはなぜ日本文化に偏る? 欧州研究が明かすAIの隠れた文化バイアス
Qwen-AgentWorldとは?LLMを環境シミュレーターに変換するエージェント向け言語世界モデル
GitHub Copilot がトークン課金制へ移行、一部ユーザーで月額29ドルが750ドルに急騰
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化