※ AIによる要約
OpenAIは2月3日、ChatGPTにオンライン上の情報を収集し、分析・統合する新機能「Deep research」を搭載すると発表。この機能は、OpenAIの推論モデル「o3」をベースに開発されたAIエージェントであり、インターネットを活用して情報を検索し、複数のステップを経て調査を行うことが可能。
Deep researchの主な機能として、「コンテンツの発見」「コンテンツの統合」「情報の推論」の3つが挙げられています。さらに、検索途中で新たな情報を発見すると、それに応じて調査計画を動的に更新する能力も備えているとのこと。
また、o3推論モデルを活用し、エンドツーエンドの強化学習を通じて開発されたため、複数の検索プロセスを計画・実行可能。さらに、ユーザーがアップロードしたファイルの閲覧や、Pythonツールを使用した計算、画像・グラフの作成、ウェブ上の画像の埋め込みにも対応。
この新機能の精度について、Deep researchはCenter for AI SafetyとScale AIが発表した「Humanity’s Last Exam」ベンチマークにおいて26.6%の正確性を記録。これは他のAIモデルを大きく上回る成果であり、GPT-4o(3.3%)、Claude 3.5 Sonnet(4.3%)、Gemini Thinking(6.2%)などの結果を大幅に超えている。
さらに、AIの実践的な性能を測る「GAIA」ベンチマークでも記録を更新。この結果についてOpenAIは、Deep researchの推論能力やツール使用の熟練度が、市場調査や学術研究などで実際に応用可能な水準に達していることを示していると説明。
また、従来のモデルよりも処理時間の制約を取り払った点も特徴です。Deep researchは最大30分かけて詳細な調査を行うことがあるが、OpenAIはこれを高度な自律的タスク実行の一環と捉えており、長期的には汎用人工知能(AGI)の開発にも寄与するとみています。
出力される分析結果についても、従来のAIが生成する一般的な回答とは異なり、専門家による詳細な研究レポートに相当するとのこと。