「知覚(証拠の特定)」と「推論(回答生成)」を明示的に切り離した2段階フレームワークP2Rを提案。4BモデルでV-Star 93.2%・HR-Bench-4K 81.9%のSOTA性能を達成しました。
中国のAGIBOTが人型ロボット「AGIBOT G2」をタブレット量産ラインに投入し、6日間・64時間超の連続稼働で作業成功率99.99%を実証しました。実験室外での長時間検証が示す製造現場の実用化水準を解説します。
ストリーミング動画生成に特化した専用サービングシステム「TurboServe」が提案されました。マイグレーション対応の配置制御器とGPUオートスケーリングを組み合わせ、チャンクレイテンシを37.5%・GPU運用コストを37.2%削減します。
「1〜10の数字を選んで」と頼むと、主要なLLMはほぼ必ず「7」を返します。AIの出力が平均的なパターンに収束する「グループシンク」問題の実態と、Qwen 3ベースの「Flint」で多様性を高めるSpringboardsの技術的アプローチを解説します。
ByteDanceが開発した環境不要なコード検証フレームワーク「Dockerless」を紹介します。SWE-bench Verifiedで62.0%の解決率を実現しました。
Anthropicが科学研究向け自律AIエージェント「Claude Science」を発表。Claude Codeと同じ設計思想で創薬・計算生物学の研究タスクを自律実行する、科学特化の初フラッグシップ製品です。
57名が共同提案する世界基盤モデル「Orca」を解説します。「次状態予測」という統一パラダイムでテキスト・画像・ロボット行動を1つのモデルに統合し、同規模の特化型モデルを複数のベンチマークで上回ることを実証しました。
MetaのFAIRが非侵襲型BCI「Brain2Qwerty v2」を発表しました。頭部装着型MEGセンサーで脳波を取得し、手術不要で連続キーボード入力を最大78%の精度で解読します。
CoLTはテキストによる推論ステップを潜在思考ベクトルに置き換えることで、マルチモーダルLLMの推論時間を10.1倍短縮、テキスト生成を22.6倍高速化します。8ベンチマークで平均精度79.1%を達成し、既存の潜在推論手法を大幅に上回りました。
GoogleはNano Banana 2 LiteとGemini Omni Flashを同時公開しました。画像4秒・1000枚0.034ドルと動画1秒0.10ドルの低コストAPIで、マルチメディア生成が手軽になります。
ECCV 2026採択のLiveEditは、拡散モデルを3段階蒸留で軽量化し、AR指向マスクキャッシュと組み合わせることで12.66 FPSのリアルタイムストリーミング動画編集を実現した新フレームワークです。
AIモデル評価の乱立問題を解決へ。EEEとHuggingFaceが2026年6月30日に連携を発表し、22,000以上のモデルを対象にした229,000件の評価結果を統一スキーマで整理、モデルページへの自動反映を実現しました。
LLMはなぜ日本文化に偏る? 欧州研究が明かすAIの隠れた文化バイアス
Qwen-AgentWorldとは?LLMを環境シミュレーターに変換するエージェント向け言語世界モデル
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化
PP-OCRv6: わずか34Mパラメータで235B超の大規模VLMを超えた軽量OCRシステム