IBMとArtificial Analysisが企業のITオペレーション向け初のAIエージェントベンチマーク「ITBench-AA」を公開。最先端8モデルの最高正解率は47%で、全モデルが50%を下回りました。
OpenAI Codexを活用した自己改善型税務エージェントの実例を解説します。Thrive社・Crete社が構築したエージェントはエラー検出時にCodexが修正コードを自動生成するループを持ち、精度を継続的に高める設計です。
2026年5月27日の参院本会議でデジタル担当大臣が「この答弁もAIが原案を作成した」と公言しました。全府省庁で運用を始めた行政AI基盤「源内」の概要と、職員の確認・決裁プロセスを解説します。
AIゲートウェイのOpenRouterがGoogle傘下CapitalG主導のシリーズBで1.13億ドルを調達し、評価額は1年で2倍超の13億ドルへ到達。400以上のモデルへ単一APIでアクセスできるマルチモデル基盤の急成長を解説します。
AnthropicのProject Glasswingが1カ月で1万件超の重大な脆弱性を自動検出。AIの発見速度が人間のパッチ適用を大幅に上回る新たな課題と、企業向け対応ツールの取り組みを解説します。
タスク管理SaaSを提供するClickUpが従業員の22%を解雇し、3,000体のAIエージェントへと移行しました。大規模な人間業務代替の実例から「仕事の未来」を解説します。
2026年5月19日、日立製作所とAnthropicが共同組織「Frontier AI Deployment Center」を設立。フィジカルAIとAIエージェントの融合で100兆円超の市場を目指す戦略を解説します。
IBMがThink 2026で提示した「AIオペレーティングモデル」は、急増するAIエージェントを統制する4層フレームワークです。各柱を担う製品群の役割とエンタープライズ導入への示唆を解説します。
スクーデリア・フェラーリとIBMが2026年に提携し、AIでF1ファンアプリを全面刷新。レース週末のエンゲージメントが62%増加した成果と実装モデルを解説します。
NTSBの公開するスペクトログラム画像からAIが死亡パイロットの音声を復元できることが判明しました。NTSBは調査ドケットへのアクセスを一時遮断。連邦法の抜け穴となった技術的背景と今後の対応を解説します。
Gemini・Claude Code・Codexを組織全体に展開するための5つのポイントを解説します。プロンプト設計からAIエージェントの本番導入まで、段階別に実践的な手法を紹介します。
Virgin AtlanticはOpenAI Codexをモバイルアプリ刷新に活用し、繁忙期前という固定納期内でP1バグゼロとユニットテスト網羅率ほぼ100%を達成した事例を解説します。
LLMはなぜ日本文化に偏る? 欧州研究が明かすAIの隠れた文化バイアス
arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
GitHub Copilot がトークン課金制へ移行、一部ユーザーで月額29ドルが750ドルに急騰
SANA-WMとは?単一GPUで720p・60秒動画を生成するNVIDIAの効率的世界モデル