HuggingFace が2026年6月に発表した機能で、vLLM の OpenAI 互換推論サーバーをコマンド1つで起動できる。サーバー構築や Kubernetes の知識は不要で、A10G から H200×8 まで GPU を選択して秒単位課金で利用可能です。
LLM推論を高速化する投機的デコーディングの根本的な限界を克服した「JetFlow」が登場。ツリー因果注意マスクにより、MATH-500で最大9.64倍の高速化を達成しています。
Proposer・Solver・Generatorの3役割が循環し、人間アノテーションなしに自己一貫性信号だけでモデルを改善するASGフレームワークを解説。MMMUで+3.5%、GenEvalで82%→85%の改善を達成しました。
AIスタートアップのGeneral Intuitionが3.2億ドルを調達。数百万時間のゲームプレイデータを活用してAIエージェントに人間的な直感を習得させる独自手法と、評価額23億ドルのビジネスモデルを解説します。
RoPE(回転位置エンコーディング)の数学的構造を活かしKVキャッシュをブロック単位で量子化するBlock-GTQを解説。MAE(平均絶対誤差)を32〜80%削減し、fp16比3.24倍の圧縮と1.34倍の高速化を両立します。
OpenAIが2026年6月25日に公開した研究が、AIエージェントの複雑タスク処理能力と複数職種での生産性向上を定量的に示しました。実務普及フェーズへの移行と残された課題を解説します。
被写体駆動型の動画生成に新たなアプローチを提案する「DomainShuttle」を解説します。Domain-MoT・VR-DualRoPE・CCLの3コンポーネントで、クロスドメインスコアSOTA比18.7%向上を実現しています。
米議会のMATCH法案が旧世代DUV露光装置まで禁輸対象を拡大しようとしていることに対し、EUV装置の唯一のメーカーであるASMLを抱えるオランダが正式に反発。AI半導体調達を左右する地政学リスクの最前線を解説します。
ByteDance Seedが開発したiLLaDA 8Bは、完全双方向Attentionと12兆トークン学習でLLaDAをBBH+21.6点で大幅に上回り、自己回帰型Qwen2.5 7Bと競合水準を達成した拡散型言語モデルです。
GoogleがGemini 3.5 FlashにComputer Useを統合、ブラウザ・デスクトップを自動操作するAIエージェントをGemini API経由で構築できます。敵対的学習によるプロンプトインジェクション対策も搭載しています。
Googleの研究チームが提案するFLATは、動画拡散モデルの潜在空間から三角形プリミティブを直接デコードし、幾何精度の高い3Dシーンを単一パスで生成します。ゲームエンジン対応のリアルタイムレンダリングも可能です。
OpenAIとBroadcomが共同開発したLLM推論特化チップ「Jalapeño」を正式発表。GPU調達コストの削減とNVIDIA依存リスクの低減を目的に、9カ月という短期間で設計を完了した独自シリコン戦略を解説します。
LLMはなぜ日本文化に偏る? 欧州研究が明かすAIの隠れた文化バイアス
GitHub Copilot がトークン課金制へ移行、一部ユーザーで月額29ドルが750ドルに急騰
Qwen-AgentWorldとは?LLMを環境シミュレーターに変換するエージェント向け言語世界モデル
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化