Browse.sh
Browserbase:专为 AI 代理设计的开源网络目录与浏览器 CLI 自动化工具
Browserbase 是一款专为 AI 代理(AI Agents)打造的浏览器 CLI 和技能平台。它通过“开源网络目录”为 Agent 提供自动化网页交互、数据提取、云端会话及调试功能。借助优化的 DOM 选择器和 XHR 请求,Browserbase 可将 AI 的 Token 成本降低 50 倍。无论是政府合同搜索、航班追踪、电商产品抓取还是复杂的公司调研,Browserbase 都能通过其强大的技能库和自动化原始指令,帮助开发者构建高效的智能网络代理系统。
2026-06-13
--K
Browse.sh 产品信息
Browserbase:面向 AI 代理的开源网络目录与浏览器 CLI 自动化方案
在人工智能技术飞速发展的今天,如何让 AI 代理(AI Agents)高效、精准地与万维网进行交互成为了一个核心挑战。Browserbase 应运而生,它不仅仅是一个工具,更是一个为 AI 代理量身定制的开源网络目录(The Open Web Catalog)和浏览器 CLI 基础设施。Browserbase 旨在为开发者提供统一的接口,使 AI 代理能够像人类一样操作浏览器,执行从简单的网页抓取到复杂的自动化流程等一系列任务。
什么是 Browserbase?
Browserbase 是一个专为 AI 代理设计的浏览器 CLI 工具,集成了技能(Skills)、浏览器原语(Browser Primitives)、调试功能以及云端会话管理。它的核心定位是作为 AI 代理的执行层,通过一套简洁的命令,赋予 AI 自动化操作开放互联网上任何网站的能力。
Browserbase 的独特之处在于其提供的开源网络目录。这个目录包含了针对数以百计流行网站(如 Amazon, Airbnb, LinkedIn, GitHub 等)预定义的“技能”。通过建议的 DOM 选择器和 XHR 请求优化,Browserbase 能够显著减少 AI 代理在解析网页时的 Token 消耗,最高可降低 50 倍的成本。
Browserbase 的核心功能
1. 强大的浏览器自动化 (Browser Automation)
Browserbase 允许通过自然语言指令驱动浏览器。利用其 CLI 工具,开发者可以轻松实现页面导航、数据提取、截图捕获、表单填充以及按钮点击。它支持远程会话、自动验证码识别以及住宅代理,确保即使是受到严格保护或重度依赖 JavaScript 的页面也能被顺利访问。
2. 丰富的开源网络目录技能 (Web Skills)
Browserbase 内置了跨行业的自动化技能,涵盖了:
- 政务与合规:搜索 SAM.gov 联邦合同机会、查询 IRS 退税状态、核对 CA DMV 车辆登记。
- 金融与研究:比较 Bankrate 储蓄利率、抓取 Glassdoor 公司评价、提取 Yahoo Finance 股票数据。
- 旅游与地产:在 Booking.com 或 Airbnb 搜索住宿、追踪 FlightAware 航班、查询 Realtor.com 房源及学校评分。
- 电商与零售:在 Amazon, eBay, Best Buy 检查库存或搜索产品,甚至在 Vuori 等网站执行“加入购物车”操作。
3. 高级调试与追踪 (Debugging & Trace)
通过 browser-trace 功能,Browserbase 可以捕获完整的 DevTools 协议追踪,包括屏幕截图和 DOM 转储。开发者可以逐页审计网络、控制台和 DOM 活动,这对于调试失败的 AI 运行流程至关重要。
4. 浏览器到 API 的转换 (Browser-to-API)
Browserbase 具备将观察到的 HTTP 流量转换为 OpenAPI 3.1 规范的能力。这意味着开发者可以分析浏览器会话中的 XHR/Fetch 请求,从而为第三方网站构建标准化的 API 文档。
5. 云端函数与调度 (Cloud Functions)
支持将浏览器自动化流程部署为无服务器云函数。您可以根据计划任务(Cron)或通过 Webhook 触发自动化任务,无需在本地维护复杂的运行环境。
典型使用场景 (Use Case)
AI 驱动的旅游规划
用户可以指示 Claude 等 AI 模型:“规划一次去犹他州的公路旅行,包含每晚的电动汽车充电站和营地,并通过 Ramp 进行预订和报销。”Browserbase 会调用 recreation.gov 检查营地可用性,使用 plugshare.com 查找充电桩,并通过 ramp.com 的技能处理财务流程。
深度公司调研与获客
利用 company-research 技能,Browserbase 可以研究特定公司的产品和目标客户画像(ICP),从网络上发现潜在客户,并生成带有评分的研究报告。这对于市场销售团队寻找精准线索非常有帮助。
自动化招聘与求职
通过 linkedin.com 技能,AI 代理可以自动筛选符合特定关键词的最新职位;而 ashbyhq.com 技能则允许招聘人员读取候选人档案并提交面试反馈。
UI 自动化测试
AI 驱动的对手方 UI 测试功能可以分析 Git 差异,针对性地测试受影响的功能模块,审计网页的辅助功能(Accessibility)和响应式布局,确保产品质量。
如何使用 Browserbase (How to Use)
安装
首先,通过 npm 全局安装 Browserbase CLI:
npm i -g browse
添加技能
您可以根据需要为您的 AI 代理添加特定的网站技能:
$ browse skills add weather.gov
$ browse skills add amazon.com
$ browse skills add sam.gov
执行交互任务
使用 browse 命令直接驱动 AI 进行网页操作:
- 打开网页:
browse open [URL] - 提取数据:使用
fetch技能获取静态页面的 HTML 或 JSON。 - 同步状态:使用
cookie-sync将本地 Chrome 的登录状态同步到云端,以便访问需要身份验证的网站。
自动化调研示例
您可以运行内置的调研脚本来寻找潜在客户:
"find companies to sell to"
常见问题解答 (FAQ)
Q: Browserbase 是如何降低 Token 成本的? A: Browserbase 通过精确的 DOM 选择器建议和直接拦截 XHR 请求,避免了将整个网页杂乱的 HTML 传给 AI 模型。这种精准的上下文提取能减少约 98% 的冗余数据,从而实现 50 倍的 Token 节省。
Q: 它能否处理复杂的验证码? A: 是的,Browserbase 提供了“验证浏览器(Verified Browsers)”和自动验证码解决方案,配合住宅代理,可以有效应对复杂的反爬虫机制。
Q: 我可以使用自己的登录账号吗?
A: 可以。通过 cookie-sync 工具,您可以将本地的身份验证信息同步到 Browserbase 的持久化上下文中,从而让 AI 代理代表您在已登录状态下执行任务。
Q: Browserbase 支持哪些开发语言? A: 其官方模板支持 TypeScript、Python 和 Go。此外,它还提供了 MCP(Model Context Protocol)服务器,方便与 Claude Code 或开源 AI 环境集成。
Browserbase 正在重塑人类与 AI 协作探索互联网的方式。无论您是希望构建一个自动化的数据采集器,还是一个能独立完成复杂业务流程的 AI 助手,Browserbase 都是您不可或缺的技术基石。








