投機的デコーディングの新手法「Domino」を解説します。並列ドラフト生成と軽量な因果補正の2段構成で、Qwen3-8BのLLM推論を最大5.8倍高速化しました。
AlphabetがAIインフラ強化に向け800億ドルの資金調達計画を発表しました。AI需要が供給能力を超えているとAlphabet自身が認め、バークシャー・ハサウェイも100億ドルを引き受けることが明らかになっています。
標準的な次トークン予測(NTP)に浅い層の表現を自己教師信号とした連続監督を追加するNITPが提案されました。0.5B〜9BパラメータのLLMでMMLP-Proに5.7%・C3に6.4%の精度向上を実現しながら推論コストはゼロです。
スタンフォード大学発スタートアップWindBorne Systemsが、欧州気象機関ECMWFの予報精度を上回るAIモデルを発表。400機の観測気球と独自AIで1時間更新・3km解像度の高精細予報を実現しています。
VAEを排除し、デコーダが視覚表現を自己回帰的に予測するRepresentation Forcing(RF)。画像生成でVAEベース手法と同等スコアを達成し、理解タスクでも8指標中6指標で上回った。
NVIDIAがGTC Taipei 2026でWindows PC向けプロセッサ「RTX Spark」を発表。Blackwell GPU+128GBユニファイドメモリで、LLMのローカル推論環境を一般PCで実現します。
MetaとPrinceton大学が提案するVLM3は、焦点距離統一・テキストでのピクセル参照・データスケーリングの3要素のみで、深度推定δ₁精度0.90・カメラポーズ推定AUC94%など多様な3Dタスクを専門モデル並みに解けることを実証した研究を解説します。
NVIDIAが世界生成・物理推論・行動生成を単一モデルに統合した初のオープン統合AIモデル「Cosmos 3」を公開しました。
知識グラフのランダムウォークと検索軌跡を訓練データとするRL手法「LongTraceRL」が提案されました。ルーブリック報酬で推論の質を直接最適化し、4B〜30Bモデルで5つの長文脈ベンチマークを上回る性能を達成しています。
Hugging Faceが公開したAIエージェント用語集では、「ハーネス」「スキャフォールド」など開発者間で混乱しやすい13の基本概念を定義。Claude CodeやOpenAI Codexとの用語の違いも明示し、共通言語の確立を促す実用的な内容となっている。
BaiduのERNIEグループが提案するNAVAは、音声と映像を専用空間で対応付けてから文脈条件付けを行う「Align-then-Fuse」方式を採用し、6.3Bパラメータで大規模な既存手法を超える音声映像同期精度と映像品質を実現します。
GitHub Copilotが6月1日より定額制からトークン消費量ベースの従量課金制に移行しました。一部ユーザーで月額29ドルが750ドルに急騰するケースが報告され、開発者コミュニティで強い批判が相次いでいます。
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
SANA-WMとは?単一GPUで720p・60秒動画を生成するNVIDIAの効率的世界モデル
Sapiens2とは?MetaのヒューマンAI基盤モデルが5Bパラメータ・4K解像度で姿勢・法線・点群推定を統合
arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化
Absolicsのガラス基板とは?AIチップ性能を10倍高密度化する次世代パッケージング