Anthropicは新しいClaude 3.5 SonnetとHaiku、そして「computer use」ベータ版の発表

2024年10月23日、AI開発企業Anthropicは、次世代AIモデル「Claude 3.5」に関する最新アップデートを発表しました。
今回のアップデートでは、性能が大幅に向上した「Claude 3.5 Sonnet」、コスト効率を重視した「Claude 3.5 Haiku」、そしてAIによるコンピュータ操作を可能にする新機能「computer use」のベータ版が発表されました。

今回発表された内容は以下のようになります。

Claude 3.5 Sonnet

Claude 3.5 Sonnetは、前世代モデルに比べて大幅な性能向上を遂げており、特にソフトウェア開発やコーディングの分野で高い評価を得ています。SWE-bench Verifiedのスコアは33.4%から49.0%に改善され、他の公開されているモデルを凌駕する結果を示しました。また、TAU-benchなどのツール使用タスクでも、小売業界や航空業界において重要な進展が見られています。

この新モデルは、GitLabやThe Browser Companyをはじめとする複数の企業でテストが実施され、コーディングやプランニング、複数ステップを要する開発プロセスの効率向上が確認されました。米国および英国のAI安全機関によるリスク評価においても、安全性が十分に確認されています。

Claude 3.5 Haiku

Claude 3.5 Haikuは、前モデル「Claude 3 Haiku」と同等のコストと速度でありながら、全体的な性能がさらに向上しています。
特にコーディングタスクにおいては、SWE-bench Verifiedで40.6%のスコアを記録し、Claude 3.5 Sonnetや他の競合モデルを凌駕しました。
指示の精度やツール使用の効率も改善されており、迅速な応答性が求められるユーザー向けの製品や、カスタマイズされたエクスペリエンスを提供する場面で効果を発揮します。

computer use機能のベータ版

「computer use」は、AIが人間のようにコンピュータを操作するという新しい機能です。
この機能により、Claudeは画面を見てカーソルを動かし、ボタンをクリックしてテキストを入力するなど、日常的なPC作業を自動化できます。

現在、この技術は実験段階にあり、一部の操作においてはまだ不安定な部分やエラーが発生することもありますが、今後のフィードバックをもとに改善が進められる予定です。
AsanaやReplitなどの企業はすでにこの技術を活用し、多数のステップを要するタスクの自動化に挑戦しています。

Claude 3.5 Sonnetは、この「computer use」機能を最初に導入したAIモデルであり、開発者向けに公開されています。Amazon BedrockやGoogle CloudのVertex AIを通じて、広く利用可能です。

引用

あわせて読みたい
Introducing computer use, a new Claude 3.5 Sonnet, and Claude 3.5 Haiku A refreshed, more powerful Claude 3.5 Sonnet, Claude 3.5 Haiku, and a new experimental AI capability: computer use.
よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

AI・DX・LowCodeなど企業に役立つ情報を発信しています。

目次