57名が共同提案する世界基盤モデル「Orca」を解説します。「次状態予測」という統一パラダイムでテキスト・画像・ロボット行動を1つのモデルに統合し、同規模の特化型モデルを複数のベンチマークで上回ることを実証しました。
MetaのFAIRが非侵襲型BCI「Brain2Qwerty v2」を発表しました。頭部装着型MEGセンサーで脳波を取得し、手術不要で連続キーボード入力を最大78%の精度で解読します。
CoLTはテキストによる推論ステップを潜在思考ベクトルに置き換えることで、マルチモーダルLLMの推論時間を10.1倍短縮、テキスト生成を22.6倍高速化します。8ベンチマークで平均精度79.1%を達成し、既存の潜在推論手法を大幅に上回りました。
GoogleはNano Banana 2 LiteとGemini Omni Flashを同時公開しました。画像4秒・1000枚0.034ドルと動画1秒0.10ドルの低コストAPIで、マルチメディア生成が手軽になります。
ECCV 2026採択のLiveEditは、拡散モデルを3段階蒸留で軽量化し、AR指向マスクキャッシュと組み合わせることで12.66 FPSのリアルタイムストリーミング動画編集を実現した新フレームワークです。
AIモデル評価の乱立問題を解決へ。EEEとHuggingFaceが2026年6月30日に連携を発表し、22,000以上のモデルを対象にした229,000件の評価結果を統一スキーマで整理、モデルページへの自動反映を実現しました。
「エージェントが適切に諦められるか」を3環境・28,000件超タスクで検証。大規模化でも棄権タイミングは改善されにくい実態と、ファインチューニング不要でAbsRec@1を2倍超に高めるCONVOLVEを紹介します。
CognitionがAIコーディングエージェントDevinの新機能「Devin Fusion」を発表。複数モデルを動的に切り替えるマルチモデルハーネスで、フロンティアモデル比最大41%のコスト削減を実現します。
35Bパラメータのモデルが平均45Kトークンの長期軌跡を学習する「エージェント水平スケーリング」により、Kimi-K2.6など1兆パラメータ超のモデルを複数ベンチマークで超えたAgents-A1を解説します。
サムスンとSKハイニクスが計570億ドル超の設備投資を発表。AI需要が急増するなか、HBM(広帯域メモリ)の需給逼迫「RAMageddon」の実態と投資の詳細を解説します。
NVIDIAらが提案するPhysisForcing は、ロボット操作ビデオ生成モデルに2段階の物理的整合性損失を導入し、R-Benchを最大22.3%改善。クローズドループ成功率も16.0%→24.0%に向上させた学習フレームワークです。
OpenAIが2026年6月にEU全域の労働市場を分析したレポートを公開。データ入力や一般事務の自動化リスクから、AIガバナンスや医療技術の成長機会まで職種別に可視化しています。
LLMはなぜ日本文化に偏る? 欧州研究が明かすAIの隠れた文化バイアス
Qwen-AgentWorldとは?LLMを環境シミュレーターに変換するエージェント向け言語世界モデル
arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
PP-OCRv6: わずか34Mパラメータで235B超の大規模VLMを超えた軽量OCRシステム