OpenAI、新「ChatGPTエージェント」公開

OpenAIは7月18日、ChatGPTに新たな機能「ChatGPTエージェント」を追加した。このエージェントモードを有効にすると、AIが仮想PC環境内でウェブサイト閲覧やコードの実行、資料作成など、一連の作業を自律的に進められるようになる。ユーザーは必要に応じて途中で介入し、作業内容を調整することも可能だ。この機能は有料プラン(Pro/Plus/Team)のユーザーから順次利用できるようになります。

従来の機能では、ウェブサイトの閲覧や操作に特化した「Operator」と、情報収集や要約に強みを持つ「deep research」が別個に提供されていた。OpenAIは今回、これらの機能を統合し、さらにAPIとの連携やターミナル操作を組み合わせることで、単なる情報収集だけでなく、行動まで伴う統合的なエージェント機能として完成させた。

具体的には、ChatGPTエージェントは視覚ブラウザやテキストベースのブラウザ、ターミナル、APIコネクタなどのツールを自由に組み合わせ、与えられたタスクに対して最適な処理方法を自ら判断する。仮想環境内ではユーザーがログイン済みのウェブサイトにアクセスして情報を収集するほか、スプレッドシートやスライドの作成・編集まで可能だ。OpenAIによると、社内評価においてデータ分析系ベンチマーク「DSBench」で人間を大きく上回り、財務モデリングのような複雑な業務においても従来モデル「o3」の性能を凌駕したという。



さらにセキュリティ面でも配慮されており、重要な操作の実行前にユーザーの明示的な承認を求める仕組みや、ユーザーが随時監視できる「Watch Mode」、さらにプロンプトインジェクション攻撃への対策強化などが盛り込まれた。

ChatGPTエージェントはビジネスシーンでの週次レポートの作成、競合他社の分析、日程調整など、知的労働の自動化に大きく貢献すると期待される。また、個人用途としても旅行計画や買い物リスト作成など、日常的なタスクの効率化が見込まれている。OpenAIは「これはあくまで始まりに過ぎない」と述べており、今後もスライド作成の精度向上やユーザーの監視負担の軽減などを段階的に実施していくとしている。

このように、ChatGPTエージェントの登場により、会話型AIは「ユーザーの指示に従って動くアシスタント」から、「与えられたタスクを能動的に完遂できるエージェント」へと進化を遂げました。

引用

Introducing ChatGPT agent: bridging research and action | OpenAI

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

AI・DX・LowCodeなど企業に役立つ情報を発信しています。

目次