NVIDIAが提案するAnyFlowは、ステップ増加で品質が低下するConsistency Distillationの問題を解消した初の任意ステップ動画蒸留フレームワークです。1.3Bから14Bパラメータのモデルでテスト時スケーリングを実証しました。
LLMのバックボーンを凍結したまま8×8の連想記憶行列をDelta則で学習させる新手法「δ-mem」を解説。MemoryAgentBenchで1.31倍、LoCoMoで1.20倍の性能向上を達成しました。
米CMSが2026年7月5日に開始するACCESSプログラムは、AIエージェントによる診察間患者モニタリングに初めて公的報酬を設けます。150機関が参加する10年間の試験的プログラムの全容と医療AIへの影響を解説します。
商湯科技が発表したSenseNova-U1は、独立した視覚エンコーダとVAEを排除したNEO-unifyアーキテクチャで理解と生成を単一モデルに統合。視覚推論からVLA・世界モデルまで幅広いタスクで高性能を達成します。
OpenAIの公式調査によると、2026年Q1にChatGPT利用者の年齢・性別・地域が多様化。35歳以上や女性ユーザーの比率が上昇し、AIが一般社会へ定着しつつある実態を解説します。
64人の数学者が設計した研究レベル数学ベンチマーク「Soohak」を解説します。最先端モデルでもGemini-3-Proが30.4%、GPT-5が26.4%止まりで、不当な問題を見抜く「Refusal Subset」ではいかなるモデルも50%未満でした。
AI音声スタートアップVapiが5000万ドルのシリーズBを調達し、評価額5億ドルを達成しました。Amazon Ringが40社超を評価した末に採用した理由と、累計10億件超の通話を処理するプラットフォームの成長戦略を解説します。
QwenチームのQwen-Image-2.0はQwen3-VLとMultimodal Diffusion Transformerを組み合わせ、生成と編集を1モデルに統合。1,000トークン対応で多言語タイポグラフィも大幅改善しました。
元OpenAI CTOが設立したThinking Machines Labが、話しながら同時にユーザーの声を聞ける全二重AIモデルを発表。応答速度0.40秒でOpenAIとGoogleを上回るベンチマーク結果を示します。
Flow Matchingを言語生成に初めて本格適用した拡散言語モデル「ELF」を解説します。最終ステップまで連続埋め込み空間にとどまる設計でCFGが自然に転用可能となり、少ないトレーニングで既存DLMを上回る性能を達成しました。
2024年ノーベル経済学賞のアセモグル教授が、AIエージェントの限界・経済学者採用の利益相反・アプリ普及の遅れという3つの課題を指摘。楽観論が先行するAI議論に、実証データに基づく慎重な視点を提供します。
拡散モデルの超深層化で発生するトークン均質化崩壊「Mean Mode Screaming」を初特定。MV-Split残差で世界初の1000層DiT安定学習とFID 2.68を達成した研究を解説します。
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
HY-World 2.0とは?テキスト・画像・動画から3D世界を生成するマルチモーダルワールドモデル
Absolicsのガラス基板とは?AIチップ性能を10倍高密度化する次世代パッケージング
AIエージェントフレームワーク比較【2026】LangGraph・CrewAI・OpenAI Agents SDKの選び方
ベクトルデータベース比較【2026年版】Pinecone・Qdrant・Weaviate・Milvusを徹底解説