ブラウザー操作を自動化!AIエージェント「browser-use」とは?

目次

「browser-use」とは?

「browser-use」 は、AIエージェントをブラウザーに接続し、ウェブサイト操作を自動化するためのPythonライブラリです。
このツールは、以下のような特徴を備えています:

  • 視覚 + HTML抽出: ページ内容を解析し、必要なデータを取得。
  • 自動マルチタブ管理: 複数のタスクを同時に実行可能。
  • 高いカスタマイズ性: 独自のアクションを登録・拡張できる仕組み。
  • 自己修正機能: タスク中のエラーをAIが自動的に修正。
  • 並列化: 複数のエージェントを効率よく同時実行。

これにより、手動では困難なウェブ上の複雑なタスクをAIエージェントが簡単にこなせるようになります。

「browser-use」の利用方法

前提としてPythonがインストールされている必要があります。
されていない場合は、Python公式サイトからインストールしてください。

1. インストール

「browser-use」のインストールは簡単で、以下のコマンドを実行するだけです。

pip install browser-use

LLMを利用するのための、Langchainのライブラリをインストールします。

pip install Langchain

さらにブラウザ操作の自動化のために、playwrightもインストールします。

playwright install

2. 環境設定

AIエージェントに必要なAPIキーを .env ファイルに設定します。

OPENAI_API_KEY=your_openai_api_key

your_openai_api_keyを実際のkeyに置き換えてください。
OpenAIのAPIキーはの取得方法は次の記事を参考にして下さい。

あわせて読みたい
OpenAIのAPIとは?概要からAPIキーを取得する方法まで 今回の記事ではOpenAIのAPIキーの取得方法を解説します。OpenAIのAPIキーを取得することで、OpenAIが提供するChatGPTなどさまざまなAIサービスを自身んのアプリケーショ...

3. エージェントの作成と実行

以下のPythonコードを使えば、簡単なタスクをエージェントに実行させることができます。
今回は任天堂スイッチの価格を調べてもらいました。

from langchain_openai import ChatOpenAI
from browser_use import Agent
import asyncio

async def main():
    agent = Agent(
        task="AmazonでNintendo Switch(有機ELモデル)の価格を調べて教えて下さい",
        llm=ChatOpenAI(model="gpt-4o"),
    )
    result = await agent.run()
    print(result)

asyncio.run(main())

動作中の画面

結果:

  1. Nintendo Switch (OLED model) Joy-Con (L)/(R) ホワイト – ¥37,784
  2. Nintendo Switch (OLED model) Joy-Con (L) ネオンブルー/(R) ネオンレッド – ¥37,979
  3. Nintendo Switch (OLED model) スプラトゥーン3エディション – ¥45,980
  4. Nintendo Switch (OLED model) 本体のみ – ¥26,980

まとめ

「browser-use」は、AIエージェントをブラウザーに接続し、自動化タスクを簡単に実現できる強力なツールです。
数行のコードで、簡単に実装できるのは魅力ですね。
特にページのスクレイピングやテスト自動化に活用できそうかなと思いました。

PC操作を自動化できるツールについて詳しく知りたい方は、こちらの記事もご覧ください。

あわせて読みたい
【PC操作を自動化】Anthropicが公開した「Computer Use」を使ってみた Computer Useとは? 「computer use」は、AIが人間のようにコンピュータを操作するという新しい機能です。この機能により、Claudeは画面を見てカーソルを動かし、ボタン...
よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

AI・DX・LowCodeなど企業に役立つ情報を発信しています。

目次