AI Agent 驱动的浏览器自动化实战:用 Intuned 让网页抓取永不失效
场景:你接手了一个 50 条浏览器脚本的维护清单
想象一下这个场景:你的团队用 Playwright 写了 50 个数据抓取脚本,每天早上跑一次,把竞品价格、政采数据、行业报告汇总到数据仓库。前三个月一切顺利,然后网站改版了——
CSS 选择器变了、登录流程改了、分页 URL 结构换了。你花了三天修好 20 个,修的同时又有 10 个新的崩溃了。
这不是你一个人的痛点。Intuned 的创始人在 YC S22 期间采访了 20 多位创业者,发现自动化脚本的维护成本远高于编写成本。网站每周都可能变,selectors 对 class 名、DOM 结构的依赖天然脆弱。他们决定用 AI Agent 来解决这个问题。
Intuned 是什么
Intuned 是一个浏览器自动化的 AI 平台:你告诉它需要抓什么数据,它的 AI Agent 生成 Playwright 代码并部署到托管运行时。网站如果发生变化,Agent 自动检测失败、分析根因、生成修复补丁。
本质上是三合一的架构:
AI Agent(生成 + 维护)
||
托管运行时(调度 + 监控 + 日志)
||
Playwright 代码(TypeScript/Python)
实战:构建一个永不失效的电商价格抓取器
第一步:用 AI Agent 生成抓取器
打开 Intuned 控制台,描述需求即可,无需手写任何代码:
"Get the product name, price, and availability status from example.com/products. The data should be in JSON format."
Intuned Agent 自动分析目标网站的 DOM 结构,生成完整的 Playwright 代码,包含导航、等待、数据提取和错误处理逻辑。
第二步:审核并部署
生成的代码在 Intuned IDE 中展示,支持 TypeScript 和 Python 两种语言。你可以:
- 直接修改生成的代码(全量控制)
- 用 Agent 对话式调整(”把 price 字段从文本改为数字格式”)
- 添加自定义验证(”如果价格低于 $10 标记为异常”)
确认无误后一键部署。平台在隔离的独立 VM 中运行每个项目,自动处理认证复用、会话管理、调度执行。
第三步:配置自愈机制
这是 Intuned 的核心差异化能力。部署时开启 Self-healing:
scheduling: cron: "0 6 * * *" # 每天早上 6 点执行 timezone: Asia/Shanghai self_healing: enabled: true max_retries: 3 auto_deploy: false # 仅生成补丁,人工审核后再部署 notify: email
当脚本执行失败时,Intuned 的 Agent 会:
- 捕获失败的运行上下文(参数、结果、追踪日志)
- 启动一个 Agent 会话分析根因
- 生成修复补丁(通常是更新 CSS selector 或 URL pattern)
- 如果开启
auto_deploy: true,自动部署修复
第四步:API 化集成
Intuned 提供 Web Task API,将任何浏览器自动化封装为一个 REST API 端点:
POST /api/v1/tasks
{
"project_id": "price-tracker-123",
"params": { "url": "https://example.com/products/456" }
}
Response:
{
"status": "completed",
"result": {
"product": "Wireless Headphones Pro",
"price": 89.99,
"available": true
}
}
这意味着你的 AI Agent(Claude Code、Codex 等)可以通过普通 HTTP 调用触发浏览器自动化——Agent 的 Agent。
与传统方案的横向对比
| 维度 | 纯 Playwright 方案 | Intuned |
|---|---|---|
| 编写成本 | 每脚本 1-3 小时 | Prompt 描述,1 分钟内生成 |
| 网站变更处理 | 手动定位故障 → 改代码 → 测试 | Agent 自动检测 + 修复提案 |
| 运行时管理 | 自建 cron + Docker | 内置调度 + 隔离 VM |
| 认证处理 | 手动管理 session/cookie | 内置生命周期(create/check/reuse) |
| 并发规模 | 需自己写队列 | 自动并发控制 |
| 反爬应对 | 需集成 proxy/captcha | 内置 Stealth 模式 |
| 源码拥有权 | 完全属于你 | 完全属于你(无锁定) |
更深层的设计理念
Intuned 的团队在早期尝试过”刚性管线”——收集需求 → 分析网站 → 生成代码 → 修复失败。但他们发现真实网站的杂乱程度远超固定路径的承受能力。直到 Claude Agent SDK 等开放性编码 Agent 出现,他们才找到正确的方向:
“我们重建了 Agent,围绕三个组件:一个能长时间稳定运行 Agent 会话的执行环境、一个向 Agent 暴露平台能力的 CLI、以及一个基于 Skills + MCP 的自定义插件系统。”
这个基础设施与 Agent 的深度耦合才是 Intuned 真正的技术壁垒——运行时不仅仅是任务执行器,它捕获每次运行的全量上下文(参数、结果、追踪、日志),这些上下文恰恰是 Agent 诊断和修复所需的关键信息。
适用场景与限制
适合:电商数据监控、政采信息采集、竞品价格追踪、报表自动化、需要高可靠性的定期数据抓取。
不适合:一次性的简单数据提取(用 curl/selenium 更快)、需要极低延迟的实时抓取(API 方式有启动开销)、目标网站有极强的反爬机制(Captcha 解决是内置的,但非万能)。
Intuned 对应的是这样一个问题:当你的浏览器自动化脚本数量超过两位数,维护成本的增长曲线会超过编写成本。而 Intuned 的 AI Agent + 托管运行时架构,让这条曲线的斜率从指数回归到线性。
免费层包含试用积分,可以直接在 app.intuned.io 上创建一个爬虫体验一下从 Prompt 到自愈部署的完整流程。