※ AIによる要約
米Anthropicは2月25日、最新のAIモデル「Claude 3.7 Sonnet」と、AIエージェントを搭載したコーディングツール「Claude Code」を発表。
Claude 3.7 Sonnetは、OpenAIのo1やDeepSeek-R1を上回る性能を持つとされ、ベンチマークでも高い精度を記録。
Claude 3.7 Sonnetは、「市場初のハイブリッド推論モデル」として設計されたもので、リアルタイムな回答と、より推論を重ねた熟考型の回答を切り替えて利用できることが特徴。
使用モードは「Normal(標準)」と「Extended(拡張)」の2種類があり、Extendedモードでは推論を反復させながら回答を生成するため、数学やコーディングなど専門的なタスクでのパフォーマンス向上が期待されます。
興味深い試みとして、Claude 3.7 Sonnetはゲームボーイ版「ポケットモンスター 赤」でジムリーダーに挑むベンチマークも実施。その結果、最大で「クチバシティ」に到達し、ジムリーダー・マチスを倒すまで進めたことが確認。この過程でClaude 3.7 Sonnetは3万5000回のアクションを実行しており、AIのゲームプレイ能力の向上が示されました。
同時に発表された「Claude Code」は、コード検索や編集、テスト実行、GitHubへのコミットなど、多岐にわたる開発業務を支援するAIエージェント搭載ツールです。現在は研究プレビューの段階ですが、Anthropicは、通常45分以上かかる開発タスクを1回の処理で完了できるよう今後の改良を進めていくといいます。
Claude 3.7 Sonnetは、無料プランからエンタープライズプランまで幅広いプランで利用可能。Anthropic APIやAmazon Bedrockなどのプラットフォームでも提供されています。Extendedモードは有料プラン限定となり、API利用時の料金は入力トークン100万あたり3ドル、出力トークン100万あたり15ドルに設定。
