AnthropicがAIコーディングエージェント「Claude Code」の新機能「Remote Control」をリサーチプレビューで公開。スマートフォンやタブレットからローカルマシンのセッションを遠隔操作でき、コードはクラウドに渡らない設計です。
OpenAIが2026年2月、コーディングAI評価の業界標準「SWE-bench Verified」の廃止を公式発表。審査した問題の過半数にテスト欠陥があり、主要3モデルすべてで学習データへの汚染が確認されたことが理由です。
OpenAIが数学コンペ「First Proof」の全10問にAIモデルで挑戦し、専門家評価で少なくとも5問が正解の可能性ありと判定。研究レベルの定理証明における形式的推論能力の到達点と今後の展望を解説します。
llama.cppの作者Georgi Gerganov氏とGGMLチームがHugging Faceに参加。プロジェクトの独立性・オープンソース方針を維持しつつ、transformersとの統合によりローカルAI推論のワンクリック実行を目指します。
GoogleがARC-AGI-2で77.1%を達成した「Gemini 3.1 Pro」を発表。前世代比2倍超の推論性能向上が確認され、API料金は据え置きでGemini APIとVertex AI経由での即日利用が可能となった。
GoogleがDeepMindの最新AI音楽生成モデル「Lyria 3」をGeminiアプリに統合。テキストや写真から30秒のオリジナル楽曲を生成する機能の詳細と、著作権保護の仕組みを解説します。
NVIDIAが日本語特化の90億パラメータLLM「Nemotron-Nano-9B-v2-Japanese」を公開。Nejumi Leaderboard 4の10B以下カテゴリで1位を獲得し、最大6倍のスループット向上とエージェント能力を両立したソブリンAI向けモデルの詳細を解説します。
OpenAIのGPT-5.2 Proが、教科書で「ゼロになる」とされてきたグルーオン散乱振幅のシングルマイナス配置について一般公式を発見。内部モデルが12時間で形式的証明を完成させ、IAS・ハーバード等の物理学者と共同プレプリントとしてarXivに公開された。AI支援科学研究の新たなマイルストーンとなる成果。
AWSが新推論エンジン「Project Mantle」を発表し、DeepSeek V3.2やQwen3 Coder Nextなど6つのオープンウェイトモデルへの対応を開始しました。主要クラウドでのオープンモデル対応が拡大し、AI開発の選択肢と民主化がさらに進みます。
2026年2月、AnthropicとOpenAIがわずか30分差でコーディング特化AIモデルを発表。Claude Sonnet 5はSWE-Bench 82.1%を達成し、GPT-5.3 Codexは25%の高速化を実現。OpenAI初のサイバーセキュリティ「High」分類も注目を集めている。
NVIDIAがCosmos世界モデルやIsaac GR00T N1.6など、ロボット向けPhysical AIモデル群をオープンソース公開。Caterpillar建設機械やLEM Surgical手術ロボットなどの実用化事例を解説します。
Perplexityが発表した「Model Council」を解説。Claude Opus 4.6、GPT-5.2、Gemini 3.0を同時実行し、合成モデルが矛盾を解消するマルチモデル合議方式の仕組みを紹介します。
AIエージェントフレームワーク比較【2026】LangGraph・CrewAI・OpenAI Agents SDKの選び方
ゴールドマン・サックスがClaude AIを会計業務に導入 — 金融AI活用の最前線
Step 3.5 Flashとは?110億パラメータでGPT-5.2級の性能を達成したオープンモデル
ベクトルデータベース比較【2026年版】Pinecone・Qdrant・Weaviate・Milvusを徹底解説
開発者向け検索AI「Phind 2」登場、視覚的検索強化!