面向 Claude Code 的浏览器自动化技能插件集,支持自然语言驱动本地或远程 Browserbase 云端浏览器执行复杂 Web 操作。
Browserbase Skills 是一组专为 Claude Code 设计的技能插件,安装后允许用户通过自然语言直接操控浏览器。该项目包含 10 个核心技能:browser(通过 CLI 自动化浏览器交互,支持远程 Browserbase 会话的反机器人隐身、CAPTCHA 自动解决、住宅代理)、browserbase-cli(操作 Browserbase 平台 API)、functions(无服务器浏览器自动化云端部署)、site-debugger(诊断自动化失败并生成站点 Playbook)、browser-trace(捕获完整 CDP 追踪与 DOM 转储)、bb-usage(终端用量统计与成本预测)、cookie-sync(本地 Chrome Cookies 同步至 Browserbase 持久上下文)、fetch(无浏览器会话获取静态页面)、search(结构化网页搜索)、ui-test(AI 驱动的对抗性 UI 测试)。
双模式运行#
支持本地隔离 Chrome 环境与远程 Browserbase 云端会话。远程模式提供反机器人隐身、自动 CAPTCHA 解决、覆盖 201 个国家的住宅代理以及会话持久化。通过 cookie-sync 可将本地 Chrome 的 Cookies 同步到 Browserbase 持久上下文,实现免登录访问已认证站点。
典型场景#
- 对具备反爬防护的网站进行数据采集(利用云端隐身与代理)
- AI 驱动的对抗性 UI 自动化测试与 Bug 发现
- 跨站点的端到端工作流自动化(如自动登录并执行业务操作)
- 浏览器自动化脚本的失败诊断与 CDP 级别追踪调试
- 将本地浏览器自动化脚本无服务器化部署至 Browserbase 云端
架构与实现#
每个技能以 skills/<name>/SKILL.md 文件定义,采用结构化元数据(name、description、compatibility、bins、allowed-tools: [Bash] 等)。执行链路:Claude Code 识别自然语言 → 匹配 Skill → 触发 Bash 工具 → 执行底层 CLI(browse 或 bb)→ CLI 通过 CDP 协议与浏览器通信。主要语言为 JavaScript/TypeScript,通过 tsc 编译,postinstall 自动构建。
安装与使用#
# Claude Code marketplace 安装
/plugin marketplace add browserbase/skills
/plugin install browse@browserbase
# 通用安装
npx skills add browserbase/skills
# 浏览器 CLI 依赖
which browse || npm install -g @browserbasehq/browse-cli
远程模式需设置 BROWSERBASE_API_KEY 环境变量。
CLI 核心命令#
- 环境切换:
browse env local/browse env remote - 导航:
browse open <url>、browse reload、browse back、browse forward - 状态获取:
browse snapshot(可访问性树)、browse screenshot(截图)、browse get title - 元素交互:
browse click @0-5、browse type、browse fill、browse select、browse press、browse drag、browse scroll - 会话管理:
browse stop、browse status、browse pages、browse tab_switch
待确认事项#
- SKILL.md 标注 MIT 许可,但仓库根目录未发现 LICENSE 文件
- 当前版本号为 0.0.1,处于早期阶段
bbCLI 的具体 npm 包名和安装来源未在 README 中明确fetch、search、ui-test技能的详细命令文档尚不完整,可能仍在开发中- 与 Anthropic Claude Code 是否为官方合作伙伴关系待确认