Browse.sh
AIエージェント向けブラウザCLI「Browserbase」:ブラウザ自動化とスキル管理の決定版
BrowserbaseはAIエージェント専用のブラウザCLIで、ウェブ操作の自動化、スキルの追加、デバッグ、クラウドセッション管理を1つのツールで提供します。オープンウェブカタログを活用した50倍のコスト削減や、多様なAPI・ブラウザスキルの統合が特徴です。AIエージェントに「ウェブを操作するスキル」を付与し、複雑なワークフローを簡素化します。
2026-06-13
--K
Browse.sh 製品情報
Browserbase:AIエージェントのための次世代ブラウザCLI
今日のAI開発において、AIエージェントがウェブサイトを直接操作し、情報を取得・処理する能力は不可欠です。Browserbaseは、AIエージェントがオープンウェブを自在に駆け巡るための強力なブラウザCLIを提供します。1つのCLIで、スキル管理、ブラウザプリミティブ、デバッグ、そしてクラウドセッションを完結させることが可能です。
What's Browserbase?
Browserbaseは、AIエージェントによるウェブ自動化を支援するために設計されたブラウザCLIプラットフォームです。開発者は browse コマンドを使用することで、AIエージェントに特定のウェブサイトを操作する「スキル」を付与できます。これにより、従来のブラウザ自動化における複雑なスクリプト記述や、高いトークンコストといった課題を解決します。
Browserbaseの核心は「オープンウェブカタログ」にあります。これは、多様なウェブサイトに対応した事前定義済みのスキルの集合体であり、AIエージェントはこれを利用して即座にタスクを実行できます。また、Browserbaseは、推奨されるDOMセレクターやXHRリクエストを活用することで、AIエージェントのトークンコストを最大50倍削減することに成功しています。
Features
Browserbaseは、AIエージェントの能力を最大限に引き出すための多くの機能を備えています。
1. オープンウェブカタログとスキル管理
AIエージェントに対して、特定のウェブサイト(Amazon、Airbnb、Governmentサイトなど)を操作する「スキル」を簡単に追加できます。カタログには、API、Hybrid、Fetch、Browserといった異なるメソッドによる自動化手法が登録されており、用途に応じて最適な方法が選択されます。
2. トークンコストの最適化
AIエージェントがウェブページを解析する際、不要なデータを排除し、最適なDOMセレクターやXHRリクエストを提案することで、処理に必要なトークン数を劇的に減らします。これにより、従来の50倍という圧倒的なコストパフォーマンスを実現しています。
3. 高度なデバッグとトレーサビリティ
browser-trace などのコマンドを使用して、ブラウザ操作の全行程をDevToolsプロトコルベースで追跡できます。スクリーンショットやDOMダンプを含め、失敗した原因の特定や改善が容易になります。
4. クラウドセッションと関数
ローカル環境だけでなく、クラウド上でのブラウザセッション管理が可能です。Browserbase Functionsを利用することで、スケジュール実行やウェブフックを介した自動化をクラウド上で展開できます。
5. セキュリティと認証
cookie-sync 機能により、ローカルのChromeからクッキーを同期し、認証が必要なサイトへのアクセスをAIエージェントに許可することができます。また、指紋認証(Verified browsers)や住宅用プロキシ(residential proxies)のサポートにより、bot対策の厳しいサイトでも安定した操作が可能です。
How to Use
Browserbaseの導入と基本的な使用方法は非常にシンプルです。
インストール
まず、npmを使用してグローバルにインストールします。
npm i -g browse
スキルの追加
特定のサイトに対応するスキルをAIエージェントに追加します。
$ browse skills add alltrails.com
$ browse skills add recreation.gov
$ browse skills add weather.gov
AIエージェントとの連携例
例えば、ClaudeなどのAIモデルに対して、追加したスキルを駆使した複雑な命令を出すことができます。
"Utahへのロードトリップを計画して。毎晩のEV充電スタンドとキャンプ場を予約し、費用をRampで精算して。"
Use Case
Browserbaseは、あらゆる業界の自動化ニーズに対応します。以下は代表的な活用例です。
旅行とライフスタイル
- Airbnb & Booking.com: 特定の条件に合致する宿泊施設を検索し、詳細な情報を取得します。
- Ticketmaster & Resy: コンサートチケットやレストランの予約空き状況を確認します。
- AllTrails: ハイキングコースの難易度やルート情報を取得し、計画を立てます。
金融とコマース
- Amazon & eBay: 商品価格の比較、在庫確認、詳細スペックの抽出を行います。
- Bankrate: 預金金利や住宅ローンレートを比較し、最新データを取得します。
- Ramp: 従業員の経費精算を自動化し、レシート抽出やポリシー検証を行います。
政府・公共データ
- SAM.gov: 連邦政府の契約機会を検索し、詳細な案件情報を収集します。
- IRS: 税金の還付状況を確認します。
- NASA APOD: 今日の天文写真をメタデータとともに取得します。
採用とリサーチ
- Indeed & LinkedIn: 特定の条件に基づいた求人情報の収集とスコアリングを行います。
- Glassdoor: 企業の評判やCEOの承認率などを抽出し、企業分析に役立てます。
- Ashby: 候補者のプロファイルを管理し、面接のフィードバックを自動入力します。
FAQ
Q: Browserbaseを使用するとどのくらいコストが削減できますか?
A: 推奨されるDOMセレクターとXHRリクエストを優先的に使用することで、AIエージェントのトークンコストを最大50倍削減できます。
Q: JavaScriptを多用する動的なサイトでも動作しますか?
A: はい。Browserbaseはリモートブラウザセッションをサポートしており、JavaScriptヘビーなページや、CAPTCHA解決が必要な保護されたウェブサイトでも操作が可能です。
Q: デバッグ機能はありますか?
A: はい。browser-trace コマンドを使用することで、ネットワーク、コンソール、DOMのアクティビティを詳細に記録し、ブラウザ操作のトラブルシューティングを強力にサポートします。
Q: どのようなウェブサイトのスキルがありますか?
A: オープンウェブカタログには、Amazon、eBay、Airbnb、Google Flightsといった大手サイトから、政府系サイト(SAM.gov)、採用ツール(Ashby)、専門サイト(FanGraphs, Discogs)まで、数百のサイトに対応したスキルが含まれています。








