2025年2月25日、Anthropicは最新のAIモデル「Claude 3.7 Sonnet」を発表しました。このモデルは市場初のハイブリッド推論モデルとして、瞬時の応答とユーザーに見える段階的な思考プロセスの両方を提供します。特にコーディングとフロントエンドウェブ開発において顕著な進化を遂げており、さらに開発者を支援するコマンドラインツール「Claude Code」も限定研究プレビューとして公開されました。
「Claude 3.7 Sonnet」は、通常の会話モードと長時間思考モードを兼ね備えたユニークな設計が特徴です。通常モードでは、前モデル「Claude 3.5 Sonnet」のアップグレード版として機能し、迅速な応答を提供します。一方、長時間思考モードでは、自己反省を交えた詳細な思考プロセスを経て、数学や物理、コーディングなどのタスクで高いパフォーマンスを発揮します。API利用者は思考時間の上限をトークン単位で細かく制御でき、スピードと品質のバランスを調整可能です。価格は従来と変わらず、入力トークン100万につき3ドル、出力トークン100万につき15ドルで提供されます。
同時に発表された「Claude Code」は、開発者がターミナルから直接大規模なエンジニアリングタスクをClaudeに委任できるツールです。コードの検索や編集、テストの実行、GitHubへのコミットなど、開発プロセス全体をサポートします。初期テストでは、通常45分以上かかる作業を一度の処理で完了し、開発時間を大幅に短縮しました。現在は研究プレビュー段階ですが、今後ツールの信頼性向上や長時間実行コマンドのサポートなどが計画されています。
「Claude 3.7 Sonnet」は、SWE-bench VerifiedやTAU-benchといった現実的なソフトウェア課題を評価するベンチマークで最高性能を記録しています。

企業事例では、Cursorが複雑なコードベースの処理でトップクラスと評価し、Vercelはエージェントワークフローの精度を称賛しています。また、ReplitやCanvaでは、洗練されたウェブアプリや生産準備が整ったコードを生成する能力が実証されました。
Anthropicは、Claude 3.7 SonnetとClaude Codeを通じて、AIが人間の創造性や生産性を最大化する未来を目指しています。現在、Claude 3.7 Sonnetは無料版を含むすべてのClaudeプラン、およびAnthropic API、Amazon Bedrock、Google CloudのVertex AIで利用可能です(拡張思考モードは無料プランでは利用不可)。
今後のアップデートでは、さらなる安全性の向上、推論の透明性確保、エージェント型AIの拡張が予定されており、AIがより実用的な形で開発者や企業の業務を支援することが期待されています。
引用
