ByteDance Seedが提案するDanceOPDは、Flow MatchingモデルでT2I生成・ローカル編集・グローバル編集を1つのモデルに統合する際の能力干渉を、オンポリシー蒸留で解決するフレームワークです。
Apple副社長でVision Proを統括したポール・ミードがOpenAIのハードウェアチームへ移籍します。ジョニー・アイブとのAIデバイス開発が本格化する中、世界屈指のハードウェア人材獲得の背景と影響を解説します。
Tencent HunyuanのViQは、視覚特徴をテキスト空間で整合させてから離散コードに変換する2段階フレームワークです。マルチモーダル訓練を最大70%高速化しながら、連続エンコーダと同等の理解性能と高精度な画像再構成を実現しています。
トランプ政権のAnthropicへの輸出禁止が長引くなか、日本のSakana AIや中国の360がMythos相当モデルを発表。米国AI企業が規制対応に追われる間に、アジア勢が非米国市場のシェアを着実に伸ばしつつある。
67モデル・21プロバイダの実験から、全LLMが同時に失敗する確率βが組み合わせシステムの性能上限を決定することが判明。ペアワイズ相関はこの上限を2.5倍過小評価していました。
ギリシャを拠点とする起業家が非ホジキンリンパ腫との闘病でClaudeを活用し、PETスキャンの曖昧な輝点を「胸腺再活性化」と特定。不要な放射線療法を回避した実例をTechCrunchが報道。
Oxford大学が提案するPhysiFormerは、3Dメッシュの物理挙動を世界座標系で直接予測する拡散トランスフォーマーです。剛体・弾性体を単一モデルで統一的に扱い、軌跡精度など全指標で自己回帰ベースラインを上回ります。
トランプ政権が約2週間で方針を転換し、Mythos 5の利用禁止措置を解除しました。商務長官が「適切なセーフガードが整っている」と判断した経緯と、依然対象外となっているFable 5の現状を解説します。
OpenAIがGPT-5.6シリーズ(Sol/Terra/Luna)をプレビュー。コーディング・科学分野で性能を強化した3モデルの詳細と、政府要請による異例の限定公開の背景を解説します。
視覚的ワールドモデルの幻覚を初めて体系化した研究。65,600軌跡・427時間・23Mフレームの大規模MMBench2を構築し、知覚型など3種の幻覚モードを定義。PSNR +0.88 dBの改善を達成し、ロボット制御の信頼性向上に貢献します。
HuggingFace が2026年6月に発表した機能で、vLLM の OpenAI 互換推論サーバーをコマンド1つで起動できる。サーバー構築や Kubernetes の知識は不要で、A10G から H200×8 まで GPU を選択して秒単位課金で利用可能です。
LLM推論を高速化する投機的デコーディングの根本的な限界を克服した「JetFlow」が登場。ツリー因果注意マスクにより、MATH-500で最大9.64倍の高速化を達成しています。
LLMはなぜ日本文化に偏る? 欧州研究が明かすAIの隠れた文化バイアス
Qwen-AgentWorldとは?LLMを環境シミュレーターに変換するエージェント向け言語世界モデル
GitHub Copilot がトークン課金制へ移行、一部ユーザーで月額29ドルが750ドルに急騰
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化