OpenAIがAmazon・NVIDIA・SoftBankから総額1,100億ドルの資金調達を発表しました。企業価値は7,300億ドルに達し、合計5GW規模の計算資源確保やAmazonとの戦略的パートナーシップも同時に発表されています。
拡散言語モデル(DLM)が並列デコードを謳いながら自己回帰的に収束する根本原因を特定。訓練データの逐次的構造が問題と診断し、独立推論軌跡を使うNAP手法でGSM8Kの256ステップ精度を14.4ポイント改善しました。
予測的双シミュレーション指標を活用し、疎報酬下の視覚強化学習でタスク関連表現と探索を統合するTEBを解説します。MetaWorldでStick-pull成功率87.9%を達成し、最先端ベースラインを大きく上回りました。
ICLR 2026採択のEMPO²は、LLMエージェントのRL訓練にメモリ拡張とオン/オフポリシーのハイブリッド最適化を導入した新フレームワークです。ScienceWorldではGRPO比128.6%の性能向上を実現しています。
DPEは、LMMの弱点をマルチエージェントで診断・標的データ生成・強化学習のループで自律的に改善するフレームワークです。Qwen3-VLで11ベンチマーク全てで継続的な性能向上を達成しています。
OpenAIが2026年2月25日、AIモデルの悪用事例をまとめた最新脅威レポートを公開しました。複数プラットフォームを横断するハイブリッド攻撃の実態から、カンボジア発ロマンス詐欺、中国・ロシアの情報工作まで7つの事例を解説します。
AnthropicがAIコーディングエージェント「Claude Code」の新機能「Remote Control」をリサーチプレビューで公開。スマートフォンやタブレットからローカルマシンのセッションを遠隔操作でき、コードはクラウドに渡らない設計です。
エッジデバイス向け統合マルチモーダルモデル「Mobile-O」が発表されました。新設計のMobile Conditioning Projector(MCP)でiPhone上での画像生成を約3秒で実現し、GenEvalで74%のスコアを達成します。
OpenAIが2026年2月、コーディングAI評価の業界標準「SWE-bench Verified」の廃止を公式発表。審査した問題の過半数にテスト欠陥があり、主要3モデルすべてで学習データへの汚染が確認されたことが理由です。
LLMの強化学習訓練で問題となるポリシー陳腐化に対処するVESPOを解説します。変分定式化と分散削減を統合した閉形式カーネルにより、gbs/mbs=64という極端な条件でもGRPOを14ポイント上回る安定訓練を実現します。
RAGアプリやAI開発に欠かせないベクトルデータベース(Pinecone・Qdrant・Weaviate・Milvus・ChromaDB)を性能・コスト・ユースケース別に徹底比較し、最適な選び方を解説します。
2026年2月のカナダ銃乱射事件で、容疑者のChatGPTチャットが事件8か月前に検知されていたことが判明。OpenAIは通報基準を満たさないと判断して警察への連絡を見送っており、AI企業によるユーザー監視と通報義務のあり方に関する議論が高まっています。
ゴールドマン・サックスがClaude AIを会計業務に導入 — 金融AI活用の最前線
NVIDIAが日本語特化LLM「Nemotron 2 Nano 9B」を公開 — ソブリンAI実現に向けた性能を解説
開発者向け検索AI「Phind 2」登場、視覚的検索強化!
Step 3.5 Flashとは?110億パラメータでGPT-5.2級の性能を達成したオープンモデル
AIエージェントフレームワーク比較【2026】LangGraph・CrewAI・OpenAI Agents SDKの選び方