Anthropicは2025年5月23日、次世代AIモデル「Claude Opus 4」と「Claude Sonnet 4」を正式発表した。両モデルは、コーディングや高度な推論、AIエージェント分野で従来モデルを大幅に上回る性能を示し、AI業界の新たなベンチマークとなることが期待されている。
今回発表されたClaude Opus 4は「世界最高峰のコーディングモデル」と位置付けられ、複雑かつ長時間にわたるタスクやエージェントワークフローにおいて、持続的かつ高精度なパフォーマンスを発揮する。一方、Claude Sonnet 4は従来のSonnet 3.7から大幅な性能向上を実現し、より高精度な推論と指示追従性を兼ね備えている。両モデルはAPIを通じて提供されるほか、Amazon BedrockやGoogle Cloud Vertex AIでも利用可能だ。
新モデルの特徴として、「拡張思考モード(Extended Thinking with Tool Use)」のβ版が搭載された。これにより、ClaudeはWeb検索などの外部ツールを並行利用しながら、長時間・複雑な思考過程を維持できる。また、ローカルファイルへのアクセス権限が付与された場合には、重要な事実を記録・保存し、タスクの連続性や暗黙知を強化する機能も導入された。これによりエージェント型AIとしての長期的な記憶・判断力が大幅に向上した。
開発者向けには、Claude Codeの一般提供開始も発表。これは、VS CodeやJetBrainsなど主要IDEとの連携や、GitHub Actions対応を通じて、シームレスなペアプログラミングや自動化タスク実行を実現する。また、API側でも「コード実行ツール」「MCPコネクタ」「Files API」「プロンプトキャッシュ(1時間)」といった新機能が追加され、AIエージェント開発の自由度と拡張性が飛躍的に高まった。
Opus 4はSWE-bench(72.5%)、Terminal-bench(43.2%)といった実践的なソフトウェアエンジニアリングベンチマークでトップクラスの成績を記録し、長時間の自律型タスク遂行でも高い持続力を実証。複数のAIスタートアップや大手企業も導入事例を公表し、複雑なコードリファクタや自動テスト、ナビゲーションガイドの作成といった分野で先進的な実績を挙げている。Sonnet 4もまた、コーディングと推論タスクで実用性とパフォーマンスのバランスを実現し、GitHub Copilotの新モデルとして採用予定とされている。


価格は従来モデルを踏襲し、Opus 4が100万トークンあたり入力15ドル/出力75ドル、Sonnet 4は入力3ドル/出力15ドル。Pro、Max、Team、Enterpriseプランには両モデルと拡張思考機能が含まれ、Sonnet 4は無料ユーザーにも開放される。
今回の発表により、AnthropicはAIエージェントや開発業務の自動化分野で他社に先駆ける形となった。今後は更なるAI安全性レベル(ASL-3)対応や、開発者向けの詳細な思考ログ提供(Developer Mode)など、ユーザーの多様なニーズに応じた進化が期待される。
引用
