Anthropic、新AI「Claude 3.7 Sonnet」発表！推論強化で性能向上

Claude 3.7 Sonnet発表、高精度な推論モデル
「Claude Code」で開発業務効率化を支援
ゲームプレイ能力検証、ジムリーダー撃破

※ AIによる要約

米Anthropicは2月25日、最新のAIモデル「Claude 3.7 Sonnet」と、AIエージェントを搭載したコーディングツール「Claude Code」を発表。

Claude 3.7 Sonnetは、OpenAIのo1やDeepSeek-R1を上回る性能を持つとされ、ベンチマークでも高い精度を記録。

Introducing Claude 3.7 Sonnet: our most intelligent model to date. It's a hybrid reasoning model, producing near-instant responses or extended, step-by-step thinking.

One model, two ways to think.

We’re also releasing an agentic coding tool: Claude Code. pic.twitter.com/jt7qQmFWuC
— Anthropic (@AnthropicAI) February 24, 2025

Claude 3.7 Sonnetは、「市場初のハイブリッド推論モデル」として設計されたもので、リアルタイムな回答と、より推論を重ねた熟考型の回答を切り替えて利用できることが特徴。

使用モードは「Normal（標準）」と「Extended（拡張）」の2種類があり、Extendedモードでは推論を反復させながら回答を生成するため、数学やコーディングなど専門的なタスクでのパフォーマンス向上が期待されます。

興味深い試みとして、Claude 3.7 Sonnetはゲームボーイ版「ポケットモンスター赤」でジムリーダーに挑むベンチマークも実施。その結果、最大で「クチバシティ」に到達し、ジムリーダー・マチスを倒すまで進めたことが確認。この過程でClaude 3.7 Sonnetは3万5000回のアクションを実行しており、AIのゲームプレイ能力の向上が示されました。

同時に発表された「Claude Code」は、コード検索や編集、テスト実行、GitHubへのコミットなど、多岐にわたる開発業務を支援するAIエージェント搭載ツールです。現在は研究プレビューの段階ですが、Anthropicは、通常45分以上かかる開発タスクを1回の処理で完了できるよう今後の改良を進めていくといいます。

Claude 3.7 Sonnetは、無料プランからエンタープライズプランまで幅広いプランで利用可能。Anthropic APIやAmazon Bedrockなどのプラットフォームでも提供されています。Extendedモードは有料プラン限定となり、API利用時の料金は入力トークン100万あたり3ドル、出力トークン100万あたり15ドルに設定。

Claude 3.7 Sonnet and Claude Code

Today, we’re announcing Claude 3.7 Sonnet, our most intelligent model to date and the first hybrid reasoning model gener...