階層型再帰モデル(HRM)を採用した新事前学習フレームワーク「HRM-Text」が提案されました。1Bモデルを約1,500ドルで学習し、MMLU 60.7%・GSM8K 84.5%を達成。2〜7Bクラスと同等の性能を最大432倍少ない計算量で実現します。
Nvidiaのフアン氏が2026年5月20日の決算説明会で、AIエージェント専用CPU「Vera」が2000億ドルの新市場を創出すると発表した。今年だけで200億ドルの販売実績があり、主要クラウド事業者全社がパートナーに参画している。
KVキャッシュ量子化の根本課題「Token Norm Imbalance(TNI)」を定義・解決する軽量フレームワーク「OScaR」を解説。INT2量子化でBF16比3倍高速・5.3倍省メモリを実現し、KIVI等の既存手法を精度で上回ります。
OpenAIの推論特化型AIモデルが、離散幾何学の「単位距離問題」に関する80年間未解決の予想を反例の発見により否定しました。AIが人間の数学的直観を超える発見主体となり得る新たな事例を紹介します。
動画AIモデルが映像から音を推測する「音のClever Hans効果」を診断するThudフレームワークを解説。Shift・Mute・Swapの3種の介入で欠陥を体系的に暴き、わずか1万サンプルで28ポイントの性能向上を達成した最新研究です。
SNSで見る画像がAI生成かどうか、誰でも即座に確認できるようになります。OpenAIがContent CredentialsとSynthIDを導入し、偽情報対策を強化しました。
単一24GB GPUで10億個超の3Dガウシアンを訓練するフレームワーク「TideGS」を解説。ブロック仮想化・非同期パイプライン・差分ストリーミングの3技術でVRAMの壁を突破し、ICML 2026 Spotlightに採択されました。
Google I/O 2026でSundar PichaiがAI戦略の転換点を宣言しました。月間処理トークン数が3200兆(前年比7倍)に達し、24時間稼働の個人エージェント「Gemini Spark」など具体的な製品群を解説します。
テキストから1億画素(100MP)の超高解像度画像をネイティブ生成するフレームワーク「PixVerve」を解説。9.5万枚のデータセットと8指標の評価ベンチを合わせて紹介します。
GoogleがGemini 3.5 Flashを発表。競合フロンティアモデル比4倍の出力速度と最高水準のエージェント性能を両立し、並列サブエージェント実行で複雑な開発タスクの処理時間を大幅に短縮します。
ByteDanceが提案するLanceは、画像・動画の理解・生成・編集を単一モデルで統合するフレームワークです。3Bの活性化パラメータで7BクラスのShow-o2やBAGELを複数ベンチマークで上回る性能を発揮します。
凍結した視覚基盤モデル(VFM)を画像トークナイザーへ転用するVFMTokを解説します。領域適応的量子化とセマンティック再構成目標により、ImageNetでgFID 1.36を達成し、収束速度3倍・推論速度最大4倍の高速化も実現します。
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
SANA-WMとは?単一GPUで720p・60秒動画を生成するNVIDIAの効率的世界モデル
HY-World 2.0とは?テキスト・画像・動画から3D世界を生成するマルチモーダルワールドモデル
ベクトルデータベース比較【2026年版】Pinecone・Qdrant・Weaviate・Milvusを徹底解説
AIエージェントフレームワーク比較【2026】LangGraph・CrewAI・OpenAI Agents SDKの選び方