ウェブ操作を自動化するAIエージェント「Proxy」とは?特徴と使い方を解説

今回は直近注目を集めているAIエージェントの分野から、イギリスのスタートアップ企業であるConvergence AIが開発したAIエージェント「Proxy」を紹介します。。
本記事では、Proxyの概要、その革新的な機能、料金プラン、利用方法について詳しく解説します。

目次

Proxyとは?

Proxyは、Convergence AIが2024年末に提供開始したウェブ操作特化型のAIエージェントであり、単なるチャットボットを超えて、人間がブラウザで行う操作を直接再現することを目的としています。
具体的には、ウェブページのクリック、スクロール、フォーム入力などをAI自身が実行し、オンライン上の複雑なタスクを自律的に処理します。

Proxyの特徴と機能

高度なウェブ自動操作

Proxyは直接のウェブサイトの操作を直接実行です。Amazonでの価格比較やホテルの予約、さらにはJiraやGitHub、LinkedInなどのWebアプリケーションでの作業も自動化できます。

Generative Tree SearchとWeb-World Models

高度なプランニングを可能にする技術として「Generative Tree Search」アルゴリズムと「Web-World Models」が採用されています。これにより、AIが行動の未来を予測し、最適な手順を選択してタスクを遂行します。OpenAIのOperatorが失敗した場合でも、Proxyが問題を回避し成功するなど、高い問題解決能力が確認されています。

外部ツール利用とRAG機能

Proxyは必要に応じて外部ツール(ニュース検索や地図サービス)を利用して最新の情報を取得し、回答に反映するRetrieval Augmented Generation(RAG)機能を備えています。基本的にはブラウザ内で完結する設計ですが、必要に応じて外部APIを柔軟に活用します。

複数エージェントの並行処理

タスクを細分化し、複数のエージェントに並行処理させることが可能です。例えば、複雑な市場調査レポート作成なども短時間で実行できます。この機能は「Parallel Agents」と呼ばれ、高度な作業である「Deep Work」モードにおいて特に有効です。

長期記憶と継続的学習

ProxyはLarge Meta Learning Models(LMLMs)を採用し、ユーザーとのやり取りや過去の操作履歴を長期記憶し、それらを基に継続的に自己改善を行います。使い込むほど、ユーザーに特化した振る舞いを示します。

エラー耐性と自己修復

ウェブ操作における予期せぬエラーやCAPTCHAなどの障害に対し、自動で迂回したり自己修正したりするレジリエンスを持っています。実際の運用における安定性と実用性が高く評価されています。

Proxyの利用料金

Proxyは用途や目的に応じて3種類の料金プランを用意しています。:

  • 無料プラン:1日5セッションまで、最大2つの同時タスク
  • Proプラン:月額20ドル、セッション無制限、最大20の同時タスク
  • Enterpriseプラン:大規模組織向け、要問い合わせ

Proxyの利用方法

1.アカウントの作成

Proxyの公式ウェブサイトにアクセスします。
​トップページ右上の「Try Proxy for Free」をクリックし、表示されるログイン画面で「Sign up」を選択します。 ​

Googleアカウントを使用するか、メールアドレスとパスワードを入力してアカウントを作成します。

ログイン後、Proxyのダッシュボードが表示されます。​
ここでは、タスクの作成や管理、実行状況の確認が可能です。​

2.タスクの実行

ダッシュボードのチャット欄に自然言語で指示を入力することで、タスクを実行できます。

最初に以下のプロンプトを実行します。

プロンプト:最新の生成AIのNEWSを収集してください。

実行結果:

情報の取得は上手くいっていますが、結果は一部で中国語で表示されました。

次にもう少し難しいプロンプトを試してみます。

プロンプト:価格.comで『ノートパソコン』のうち、AMD Ryzen7搭載モデルを調べ、3機種の価格と評価を比較表にしてください。

実行結果:

指定された「AMD Ryzen 7搭載ノートパソコン」の情報収集と比較がしっかりと行われています。
また下記が価格コムのスクリーンショットになりますが、同一モデルは自動的に弾いてくれています。

おわりに

本記事では、Convergence AIが開発した次世代AIエージェント「Proxy」について紹介しました。
ウェブ操作の自律実行や複数エージェントによる並列処理など、AIエージェントの可能性を感れるツールです。
今後有料プランで利用できる、認証情報を含むサイトでのAIエージェントの活用も試してみたいと思います。


よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

AI・DX・LowCodeなど企業に役立つ情報を発信しています。

目次