2026年7月3日 2 分钟阅读

BrowserWing 完全指南:用 MCP 命令让 AI 编码 Agent 自动操作浏览器

tinyash 0 条评论

AI 编码 Agent(如 Claude Code、Cursor、OpenClaw)擅长写代码,但有一个明显的短板——它们无法在浏览器中”看见”你的应用。当你希望 Agent 自动登录后台验证页面、抓取某个 SaaS 平台的数据、或者测试一个表单的完整提交流程时,如果只有代码能力,Agent 就无能为力了。BrowserWing 填补了这个缺口:它是一个浏览器自动化平台,通过 MCP(Model Context Protocol)和 Skills 协议,让你的 AI 编码 Agent 获得完整的浏览器操控能力。

项目概览

  • GitHub: browserwing/browserwing
  • Star: 1308 ⭐ | License: MIT | 语言: Go + TypeScript
  • 内置脚本: 78 个开箱即用的数据抓取脚本(覆盖 GitHub Trends、Hacker News、Bilibili、Reuters、Bloomberg 等 10+ 大类)
  • 核心定位: 将浏览器操作转化为结构化数据和 MCP 命令,供 AI Agent 直接调用

安装

npm 全局安装(推荐)

npm install -g browserwing
browserwing --port 8080

一键安装脚本

curl -fsSL https://raw.githubusercontent.com/browserwing/browserwing/main/install.sh | bash
browserwing --port 8080

源码构建

git clone https://github.com/browserwing/browserwing.git
cd browserwing
make install
make build-embedded
./build/browserwing --port 8080

启动后访问 http://localhost:8080 即可进入 Web 管理界面。

功能详解

1. MCP 服务端集成:让 Claude Code 和 Cursor 获得浏览器能力

这是 BrowserWing 最核心的用法。将 BrowserWing 配置为 MCP 服务端后,你的 AI Agent 可以直接调用它来操作浏览器:

{
  "mcpServers": {
    "browserwing": {
      "type": "http",
      "url": "http://localhost:8080/api/v1/mcp/message"
    }
  }
}

将这段配置粘贴到 Claude Code 或 Cursor 的 MCP 设置中,Agent 就可以通过自然语言控制浏览器了。例如:

“帮我打开 github.com/trending,抓取今天的前 10 个趋势项目,提取名称和描述”

Agent 会调用 BrowserWing 的 MCP 工具完成导航、抓取和提取。

2. CLI 模式:78 个内置脚本即拿即用

BrowserWing 内置了一套完整的 CLI,专为 AI Agent 和 Shell 管道设计:

browserwing ls --format=json

browserwing run github-trending
browserwing run hackernews-top | jq '.[0:5]'
browserwing run bilibili-hot

browserwing run jd-search --keyword="机械键盘"

CLI 还有结构化的退出码供 Agent 判断执行结果:

退出码含义
0成功
1一般错误
2服务器连接错误
3脚本不存在
4脚本执行失败
64参数错误

3. 内置 AI Agent 界面

如果你不想折腾 MCP 配置,BrowserWing 的 Web 界面自带一个 AI Agent 对话面板:

  1. 打开 http://localhost:8080 进入”AI Agent”面板
  2. 配置 LLM API Key(支持 OpenAI、Claude、DeepSeek 等)
  3. 直接用自然语言下达浏览器操作指令

它会自动将你的指令翻译为浏览器操作序列并执行。

4. 可视化脚本录制

对于没有 CLI 脚本覆盖的网站,你可以手动录制操作:

  • 在 Web 界面中启动录制
  • 执行点击、输入、导航等操作
  • 录制完成后导出为 MCP 命令或 Skills 文件
  • 之后就可以像内置脚本一样重复使用
curl -X POST 'http://localhost:8080/api/v1/scripts/export/skill' \
  -H 'Content-Type: application/json' \
  -d '{"script_ids": []}' \
  -o MY_CUSTOM_SCRIPTS.md

5. CloakBrowser 隐身集成

对于需要绕过反爬检测的场景,BrowserWing 支持与 CloakBrowser(一个经过源码级指纹修补的 Chromium 发行版)配合使用:

pip install cloakbrowser
python -c "from cloakbrowser import ensure_binary; ensure_binary()"

python /path/to/cloakbrowser/bin/cloakserve --port=9222

export BROWSER_CONTROL_URL="http://localhost:9222"
browserwing --port 8080

CloakBrowser 在 C++ 源码层对 Canvas、WebGL、Audio、Fonts 等 49-57 个指纹点做了修补,能通过 Cloudflare Turnstile 和 reCAPTCHA v3 等主流反爬检测。

排错

macOS 下提示 “killed” 错误

这是 macOS 的代码签名隔离机制导致的:

xattr -d com.apple.quarantine $(which browserwing)

端口被占用

browserwing --port 9090

Chrome 未安装

BrowserWing 依赖 Chrome 或 Chromium。确保你的环境中已有 Chrome 浏览器,并可在 PATH 中访问到。

FAQ

Q: BrowserWing 和 Playwright MCP 有什么区别?

Playwright MCP 侧重无头浏览器的低级操控(点击、输入、截图),适合测试场景。BrowserWing 更强调”开箱即用的数据脚本 + AI Agent 集成”,78 个内置脚本让你无需编写任何配置即可从热门网站获取数据。

Q: 需要 Chrome 吗?

是的,BrowserWing 通过 Chrome DevTools Protocol(CDP)控制浏览器。它不仅支持标准 Chrome,还支持 CloakBrowser 等定制版本。

Q: 内置脚本支持哪些网站?

Bilibili、GitHub、Reddit、Hacker News、YouTube、Steam、BBC、Bloomberg、Reuters、Google Scholar、Binance、Amazon、微博、知乎、知网、Yahoo Finance 等 10+ 大类共 78 个脚本。

Q: 是否免费?

完全免费开源,MIT 许可证,无需注册或 API Key。

总结

BrowserWing 解决了 AI 编码 Agent 的一个核心局限——”写代码但看不见浏览器”。通过 MCP 协议、CLI 工具、78 个内置脚本和录制功能,Agent 可以像人类一样操作浏览器、抓取数据、验证页面。如果你经常让 AI Agent 处理涉及网页交互的任务,BrowserWing 是一个值得加入工具箱的项目。

相关链接

发表评论

你的邮箱地址不会被公开,带 * 的为必填项。