2026年6月15日 1 分钟阅读

AI Agent 驱动的浏览器自动化实战:用 Intuned 让网页抓取永不失效

tinyash 0 条评论

场景:你接手了一个 50 条浏览器脚本的维护清单

想象一下这个场景:你的团队用 Playwright 写了 50 个数据抓取脚本,每天早上跑一次,把竞品价格、政采数据、行业报告汇总到数据仓库。前三个月一切顺利,然后网站改版了——

CSS 选择器变了、登录流程改了、分页 URL 结构换了。你花了三天修好 20 个,修的同时又有 10 个新的崩溃了。

这不是你一个人的痛点。Intuned 的创始人在 YC S22 期间采访了 20 多位创业者,发现自动化脚本的维护成本远高于编写成本。网站每周都可能变,selectors 对 class 名、DOM 结构的依赖天然脆弱。他们决定用 AI Agent 来解决这个问题。

Intuned 是什么

Intuned 是一个浏览器自动化的 AI 平台:你告诉它需要抓什么数据,它的 AI Agent 生成 Playwright 代码并部署到托管运行时。网站如果发生变化,Agent 自动检测失败、分析根因、生成修复补丁。

本质上是三合一的架构:

AI Agent(生成 + 维护)
        ||
托管运行时(调度 + 监控 + 日志)
        ||
Playwright 代码(TypeScript/Python)

实战:构建一个永不失效的电商价格抓取器

第一步:用 AI Agent 生成抓取器

打开 Intuned 控制台,描述需求即可,无需手写任何代码:

"Get the product name, price, and availability status
from example.com/products. The data should be in JSON format."

Intuned Agent 自动分析目标网站的 DOM 结构,生成完整的 Playwright 代码,包含导航、等待、数据提取和错误处理逻辑。

第二步:审核并部署

生成的代码在 Intuned IDE 中展示,支持 TypeScript 和 Python 两种语言。你可以:

  • 直接修改生成的代码(全量控制)
  • 用 Agent 对话式调整(”把 price 字段从文本改为数字格式”)
  • 添加自定义验证(”如果价格低于 $10 标记为异常”)

确认无误后一键部署。平台在隔离的独立 VM 中运行每个项目,自动处理认证复用、会话管理、调度执行。

第三步:配置自愈机制

这是 Intuned 的核心差异化能力。部署时开启 Self-healing:

scheduling:
  cron: "0 6 * * *"       # 每天早上 6 点执行
  timezone: Asia/Shanghai

self_healing:
  enabled: true
  max_retries: 3
  auto_deploy: false      # 仅生成补丁,人工审核后再部署
  notify: email

当脚本执行失败时,Intuned 的 Agent 会:

  1. 捕获失败的运行上下文(参数、结果、追踪日志)
  2. 启动一个 Agent 会话分析根因
  3. 生成修复补丁(通常是更新 CSS selector 或 URL pattern)
  4. 如果开启 auto_deploy: true,自动部署修复

第四步:API 化集成

Intuned 提供 Web Task API,将任何浏览器自动化封装为一个 REST API 端点:

POST /api/v1/tasks
{
  "project_id": "price-tracker-123",
  "params": { "url": "https://example.com/products/456" }
}

Response:
{
  "status": "completed",
  "result": {
    "product": "Wireless Headphones Pro",
    "price": 89.99,
    "available": true
  }
}

这意味着你的 AI Agent(Claude Code、Codex 等)可以通过普通 HTTP 调用触发浏览器自动化——Agent 的 Agent。

与传统方案的横向对比

维度纯 Playwright 方案Intuned
编写成本每脚本 1-3 小时Prompt 描述,1 分钟内生成
网站变更处理手动定位故障 → 改代码 → 测试Agent 自动检测 + 修复提案
运行时管理自建 cron + Docker内置调度 + 隔离 VM
认证处理手动管理 session/cookie内置生命周期(create/check/reuse)
并发规模需自己写队列自动并发控制
反爬应对需集成 proxy/captcha内置 Stealth 模式
源码拥有权完全属于你完全属于你(无锁定)

更深层的设计理念

Intuned 的团队在早期尝试过”刚性管线”——收集需求 → 分析网站 → 生成代码 → 修复失败。但他们发现真实网站的杂乱程度远超固定路径的承受能力。直到 Claude Agent SDK 等开放性编码 Agent 出现,他们才找到正确的方向:

“我们重建了 Agent,围绕三个组件:一个能长时间稳定运行 Agent 会话的执行环境、一个向 Agent 暴露平台能力的 CLI、以及一个基于 Skills + MCP 的自定义插件系统。”

这个基础设施与 Agent 的深度耦合才是 Intuned 真正的技术壁垒——运行时不仅仅是任务执行器,它捕获每次运行的全量上下文(参数、结果、追踪、日志),这些上下文恰恰是 Agent 诊断和修复所需的关键信息。

适用场景与限制

适合:电商数据监控、政采信息采集、竞品价格追踪、报表自动化、需要高可靠性的定期数据抓取。

不适合:一次性的简单数据提取(用 curl/selenium 更快)、需要极低延迟的实时抓取(API 方式有启动开销)、目标网站有极强的反爬机制(Captcha 解决是内置的,但非万能)。

Intuned 对应的是这样一个问题:当你的浏览器自动化脚本数量超过两位数,维护成本的增长曲线会超过编写成本。而 Intuned 的 AI Agent + 托管运行时架构,让这条曲线的斜率从指数回归到线性。

免费层包含试用积分,可以直接在 app.intuned.io 上创建一个爬虫体验一下从 Prompt 到自愈部署的完整流程。

发表评论

你的邮箱地址不会被公开,带 * 的为必填项。