エンタープライズAI検索プラットフォームのGleanが年間収益3億ドルを突破。15か月で3倍成長を達成した背景と、Google・OpenAIとの競争を勝ち抜く「コスト削減」戦略を解説します。
Qwenチームが発表したVLAモデル「Qwen-VLA」は、DiTベースのアクションデコーダと体型認識プロンプトにより、物体操作・ナビゲーション・軌跡予測を単一モデルで統合。実世界ロボットでのOOD成功率76.9%を達成しました。
OpenAIがフロンティアAIモデルのガバナンス枠組みを公式公開しました。EUのAI法やカリフォルニア州規制への整合性を明示した本文書は、AI活用企業のリスク管理とコンプライアンス判断の参照基準として注目されています。
VLM事前学習に深度マップ生成を補助タスクとして組み込む「GEM」フレームワークを解説。LIBEROで平均96.1%、実世界ロボット実験で43%の成功率を達成した新しいVLA訓練パラダイムを紹介します。
AI論文の構造・効率的な読む順序・arXivの活用法を初心者向けに体系解説します。AbstractとIntroductionの優先読みからベンチマーク表の見方・批判的読解まで一通り紹介します。
ターミナルツールWarpがGPT-5.5を採用し、ローカル・クラウド・OSSの3層にまたがるマルチエージェントシステムを実装。開発ワークフローの自動化が実用段階に達した事例として、OpenAI公式ブログで詳しく紹介されています。
NVIDIAが提案するGamma-Worldは、生成的世界モデルを任意のN人マルチエージェント環境へ拡張する新手法です。SRAEで順列対称性を保ち、SHAで計算量を線形化し、24FPSのリアルタイム推論を実現します。
DockerのAIエージェント「Gordon」が2026年5月19日に正式公開。Docker Desktop 4.74以降で無料利用可能で、コンテナログやComposeファイルを自動読み込みし、汎用AIツールでは難しいコンテナ固有のデバッグと操作支援を実現します。
外部ビジョンエンコーダとアダプタを一切使わないネイティブ設計VLM「NEO-ov」を解説します。Native RoPEによる時空間統合と3段階学習で、8BモデルがMindCube空間知能ベンチマーク90.0を達成しました。
IBMとArtificial Analysisが企業のITオペレーション向け初のAIエージェントベンチマーク「ITBench-AA」を公開。最先端8モデルの最高正解率は47%で、全モデルが50%を下回りました。
Metaが発表したMobileMoEは、モバイル向けMixture-of-Experts(MoE)アーキテクチャのスケーリング則を体系化した研究です。密モデル比2〜4倍少ない推論FLOPsを実現し、実機で最大3.8倍の高速デコードを達成した手法と成果を解説します。
OpenAI Codexを活用した自己改善型税務エージェントの実例を解説します。Thrive社・Crete社が構築したエージェントはエラー検出時にCodexが修正コードを自動生成するループを持ち、精度を継続的に高める設計です。
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
SANA-WMとは?単一GPUで720p・60秒動画を生成するNVIDIAの効率的世界モデル
Sapiens2とは?MetaのヒューマンAI基盤モデルが5Bパラメータ・4K解像度で姿勢・法線・点群推定を統合
arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化
HY-World 2.0とは?テキスト・画像・動画から3D世界を生成するマルチモーダルワールドモデル