目次
「browser-use」とは?
「browser-use」 は、AIエージェントをブラウザーに接続し、ウェブサイト操作を自動化するためのPythonライブラリです。
このツールは、以下のような特徴を備えています:
- 視覚 + HTML抽出: ページ内容を解析し、必要なデータを取得。
- 自動マルチタブ管理: 複数のタスクを同時に実行可能。
- 高いカスタマイズ性: 独自のアクションを登録・拡張できる仕組み。
- 自己修正機能: タスク中のエラーをAIが自動的に修正。
- 並列化: 複数のエージェントを効率よく同時実行。
これにより、手動では困難なウェブ上の複雑なタスクをAIエージェントが簡単にこなせるようになります。
「browser-use」の利用方法
前提としてPythonがインストールされている必要があります。
されていない場合は、Python公式サイトからインストールしてください。
1. インストール
「browser-use」のインストールは簡単で、以下のコマンドを実行するだけです。
pip install browser-use
LLMを利用するのための、Langchainのライブラリをインストールします。
pip install Langchain
さらにブラウザ操作の自動化のために、playwrightもインストールします。
playwright install
2. 環境設定
AIエージェントに必要なAPIキーを .env
ファイルに設定します。
OPENAI_API_KEY=your_openai_api_key
your_openai_api_key
を実際のkeyに置き換えてください。
OpenAIのAPIキーはの取得方法は次の記事を参考にして下さい。
3. エージェントの作成と実行
以下のPythonコードを使えば、簡単なタスクをエージェントに実行させることができます。
今回は任天堂スイッチの価格を調べてもらいました。
from langchain_openai import ChatOpenAI
from browser_use import Agent
import asyncio
async def main():
agent = Agent(
task="AmazonでNintendo Switch(有機ELモデル)の価格を調べて教えて下さい",
llm=ChatOpenAI(model="gpt-4o"),
)
result = await agent.run()
print(result)
asyncio.run(main())
動作中の画面
結果:
- Nintendo Switch (OLED model) Joy-Con (L)/(R) ホワイト – ¥37,784
- Nintendo Switch (OLED model) Joy-Con (L) ネオンブルー/(R) ネオンレッド – ¥37,979
- Nintendo Switch (OLED model) スプラトゥーン3エディション – ¥45,980
- Nintendo Switch (OLED model) 本体のみ – ¥26,980
まとめ
「browser-use」は、AIエージェントをブラウザーに接続し、自動化タスクを簡単に実現できる強力なツールです。
数行のコードで、簡単に実装できるのは魅力ですね。
特にページのスクレイピングやテスト自動化に活用できそうかなと思いました。
【PC操作を自動化】Anthropicが公開した「Computer Use」を使ってみた
Computer Useとは? 「computer use」は、AIが人間のようにコンピュータを操作するという新しい機能です。この機能により、Claudeは画面を見てカーソルを動かし、ボタン...