BrowserWing 完全指南:用 MCP 命令让 AI 编码 Agent 自动操作浏览器
AI 编码 Agent(如 Claude Code、Cursor、OpenClaw)擅长写代码,但有一个明显的短板——它们无法在浏览器中”看见”你的应用。当你希望 Agent 自动登录后台验证页面、抓取某个 SaaS 平台的数据、或者测试一个表单的完整提交流程时,如果只有代码能力,Agent 就无能为力了。BrowserWing 填补了这个缺口:它是一个浏览器自动化平台,通过 MCP(Model Context Protocol)和 Skills 协议,让你的 AI 编码 Agent 获得完整的浏览器操控能力。
项目概览
- GitHub: browserwing/browserwing
- Star: 1308 ⭐ | License: MIT | 语言: Go + TypeScript
- 内置脚本: 78 个开箱即用的数据抓取脚本(覆盖 GitHub Trends、Hacker News、Bilibili、Reuters、Bloomberg 等 10+ 大类)
- 核心定位: 将浏览器操作转化为结构化数据和 MCP 命令,供 AI Agent 直接调用
安装
npm 全局安装(推荐)
npm install -g browserwing browserwing --port 8080
一键安装脚本
curl -fsSL https://raw.githubusercontent.com/browserwing/browserwing/main/install.sh | bash browserwing --port 8080
源码构建
git clone https://github.com/browserwing/browserwing.git cd browserwing make install make build-embedded ./build/browserwing --port 8080
启动后访问 http://localhost:8080 即可进入 Web 管理界面。
功能详解
1. MCP 服务端集成:让 Claude Code 和 Cursor 获得浏览器能力
这是 BrowserWing 最核心的用法。将 BrowserWing 配置为 MCP 服务端后,你的 AI Agent 可以直接调用它来操作浏览器:
{
"mcpServers": {
"browserwing": {
"type": "http",
"url": "http://localhost:8080/api/v1/mcp/message"
}
}
}
将这段配置粘贴到 Claude Code 或 Cursor 的 MCP 设置中,Agent 就可以通过自然语言控制浏览器了。例如:
“帮我打开 github.com/trending,抓取今天的前 10 个趋势项目,提取名称和描述”
Agent 会调用 BrowserWing 的 MCP 工具完成导航、抓取和提取。
2. CLI 模式:78 个内置脚本即拿即用
BrowserWing 内置了一套完整的 CLI,专为 AI Agent 和 Shell 管道设计:
browserwing ls --format=json browserwing run github-trending browserwing run hackernews-top | jq '.[0:5]' browserwing run bilibili-hot browserwing run jd-search --keyword="机械键盘"
CLI 还有结构化的退出码供 Agent 判断执行结果:
| 退出码 | 含义 |
|---|---|
| 0 | 成功 |
| 1 | 一般错误 |
| 2 | 服务器连接错误 |
| 3 | 脚本不存在 |
| 4 | 脚本执行失败 |
| 64 | 参数错误 |
3. 内置 AI Agent 界面
如果你不想折腾 MCP 配置,BrowserWing 的 Web 界面自带一个 AI Agent 对话面板:
- 打开
http://localhost:8080进入”AI Agent”面板 - 配置 LLM API Key(支持 OpenAI、Claude、DeepSeek 等)
- 直接用自然语言下达浏览器操作指令
它会自动将你的指令翻译为浏览器操作序列并执行。
4. 可视化脚本录制
对于没有 CLI 脚本覆盖的网站,你可以手动录制操作:
- 在 Web 界面中启动录制
- 执行点击、输入、导航等操作
- 录制完成后导出为 MCP 命令或 Skills 文件
- 之后就可以像内置脚本一样重复使用
curl -X POST 'http://localhost:8080/api/v1/scripts/export/skill' \
-H 'Content-Type: application/json' \
-d '{"script_ids": []}' \
-o MY_CUSTOM_SCRIPTS.md
5. CloakBrowser 隐身集成
对于需要绕过反爬检测的场景,BrowserWing 支持与 CloakBrowser(一个经过源码级指纹修补的 Chromium 发行版)配合使用:
pip install cloakbrowser python -c "from cloakbrowser import ensure_binary; ensure_binary()" python /path/to/cloakbrowser/bin/cloakserve --port=9222 export BROWSER_CONTROL_URL="http://localhost:9222" browserwing --port 8080
CloakBrowser 在 C++ 源码层对 Canvas、WebGL、Audio、Fonts 等 49-57 个指纹点做了修补,能通过 Cloudflare Turnstile 和 reCAPTCHA v3 等主流反爬检测。
排错
macOS 下提示 “killed” 错误
这是 macOS 的代码签名隔离机制导致的:
xattr -d com.apple.quarantine $(which browserwing)
端口被占用
browserwing --port 9090
Chrome 未安装
BrowserWing 依赖 Chrome 或 Chromium。确保你的环境中已有 Chrome 浏览器,并可在 PATH 中访问到。
FAQ
Q: BrowserWing 和 Playwright MCP 有什么区别?
Playwright MCP 侧重无头浏览器的低级操控(点击、输入、截图),适合测试场景。BrowserWing 更强调”开箱即用的数据脚本 + AI Agent 集成”,78 个内置脚本让你无需编写任何配置即可从热门网站获取数据。
Q: 需要 Chrome 吗?
是的,BrowserWing 通过 Chrome DevTools Protocol(CDP)控制浏览器。它不仅支持标准 Chrome,还支持 CloakBrowser 等定制版本。
Q: 内置脚本支持哪些网站?
Bilibili、GitHub、Reddit、Hacker News、YouTube、Steam、BBC、Bloomberg、Reuters、Google Scholar、Binance、Amazon、微博、知乎、知网、Yahoo Finance 等 10+ 大类共 78 个脚本。
Q: 是否免费?
完全免费开源,MIT 许可证,无需注册或 API Key。
总结
BrowserWing 解决了 AI 编码 Agent 的一个核心局限——”写代码但看不见浏览器”。通过 MCP 协议、CLI 工具、78 个内置脚本和录制功能,Agent 可以像人类一样操作浏览器、抓取数据、验证页面。如果你经常让 AI Agent 处理涉及网页交互的任务,BrowserWing 是一个值得加入工具箱的项目。
相关链接