2026年6月29日 1 分钟阅读

Intuned 实战教程:用 AI Agent 构建可靠的浏览器自动化

tinyash 0 条评论

问题:浏览器自动化的”最后一公里”难题

过去两年,AI Agent 在编码、文档、数据分析上已经足够可靠,但到了浏览器自动化这里,大多数 Agent 还是翻车。原因很直接:网页没有 API。你用 Anthropic Computer Use 或 OpenAI CUA 让 Agent 去爬个数据、填个表单——第一次可能成功,第二次同一网站改了 DOM 结构就挂了。更糟的是,这些 AI 驱动的浏览器操作每次调用都消耗大量 Token,成本不可控,结果不可复现。

Intuned(YC S22) 就是来解决这个问题的:一个代码优先的浏览器自动化平台,让 AI Agent 生成生产级的 Playwright 代码,部署后自动维护,网站变了自动修复。每步操作都是确定性的代码,而不是黑盒的 AI 推理。

核心架构:Agent → 代码 → 基础设施

Intuned 的架构分为三层:

第一层:Intuned Agent(AI 生成层)。你用自然语言描述任务,加上一个输出 Schema,Intuned Agent 就生成 Playwright 代码。它不只是写一个 page.goto() 脚本——它能理解网站结构、处理分页、管理 session、处理验证码。关键特性是 reuseKey:给任务加一个 reuseKey,它记住了之前的执行路径,后续每次运行都更快更便宜。

第二层:代码执行层。生成的代码是标准 Playwright(TypeScript 或 Python),你在 Intuned 平台上注册为 Job,可以选择定时调度(scheduled jobs)或 API 调用。代码在这里以确定性的方式运行,不依赖 Agent 的推理能力。

第三层:基础设施层。Intuned 内置了:反检测(stealth mode)、验证码求解(captcha solving)、登录态管理、并发控制、Session 录制回放。这些是 AI Agent 自己处理不了但实际部署时必须面对的问题。

上手:三分钟跑通第一个自动化

安装与注册

访问 intunedhq.com 注册账号。Intuned 提供 CLI 工具:

npm install -g @intuned/cli
intuned auth login

或者设置环境变量:

export INTUNED_API_KEY="your-api-key"
export INTUNED_WORKSPACE_ID="your-workspace-id"

创建第一个 Web Task

Intuned Agent(平台 Web UI)是最快的入门方式——用自然语言描述任务,它自动生成 Playwright 代码:

  1. 登录 Intuned Dashboard,创建一个新 Project
  2. 在 Intuned Agent 界面输入:”Scrape YC companies. Return name, batch, description, and URL.”
  3. Agent 自动生成 Playwright 代码,你只需确认后部署
  4. 通过 CLI 查看运行结果:
intuned platform runs list --project-name yc-scraper

用 Python 写自定义自动化

对于更复杂的场景,Intuned 支持直接用 Python 写 Playwright 脚本并注册为 Job:

from playwright.sync_api import sync_playwright
import json

def run():
    with sync_playwright() as p:
        browser = p.chromium.launch()
        page = browser.new_page()
        page.goto("https://news.ycombinator.com")
        
        stories = []
        for item in page.query_selector_all(".athing"):
            title_el = item.query_selector(".titleline a")
            if title_el:
                stories.append({
                    "title": title_el.inner_text(),
                    "url": title_el.get_attribute("href")
                })
        
        browser.close()
        return json.dumps(stories[:10])

部署为可调度 Job:

cat > job-config.json << 'EOF'
{
  "type": "scheduled",
  "script": "scraper.py",
  "schedule": "0 */6 * * *",
  "name": "hn_top_stories"
}
EOF

intuned dev provision --project-name hn-scraper
intuned dev deploy --project-name hn-scraper

关键功能拆解

1. 混合模式:代码 + AI 推理

Intuned 最强的设计是在同一个自动化 workflow 中混合确定性代码和 AI 推理。比如你要爬一个电商网站的商品页——用 Playwright 代码处理分页(确定性的),但商品描述的提取用 AI 来做(需要理解语义)。Intuned 允许你在 Intuned Agent 中为每个步骤选择执行方式:

2. 内置反检测(Stealth Mode)

多数网站的防爬机制对 AI Agent 越来越严。Intuned 内置了多种反检测技术:修改指纹(User-Agent、WebGL、canvas fingerprint)、代理 IP 轮换、模拟人类操作时序(鼠标移动和点击的时间间隔)。在 Dashboard 中创建 Project 时启用 Stealth Mode 即可,无需额外配置。

3. Auth Session 管理

需要登录的网站最难自动化。Intuned 提供了 auth 生命周期:你写 create.ts(登录逻辑)和 check.ts(验证登录状态是否有效),Intuned 自动管理 session 生命周期——验证、复用、失效后重建。在 Dashboard 中配置 AuthSession 后,所有 Job 共享这个登录态,不需要每个任务都重新登录。

4. 监控与回放

每个 Job 执行后自动生成完整日志和 Session 录像,可以在 Intuned Dashboard 上回放浏览器的每一步操作。对于排查「这里为什么没抓到数据」非常有用。

对比:Intuned vs 其他方案

维度纯 PlaywrightAnthropic Computer UseIntuned
确定性✅ 高(代码可控)❌ 低(每次都推理)✅ 高(代码 + AI 混合)
网站变化适应❌ 手动修❌ 不可控✅ Agent 自动修复
反检测❌ 自己配⚠️ 部分支持✅ 内置
成本✅ 低❌ 高(每次推理)✅ 中间(缓存复用)
部署运维❌ 自建❌ 无✅ 内置调度与扩缩

适用场景

  1. 电商数据抓取:商品信息、价格监控、库存跟踪
  2. SaaS 集成:没有 API 的第三方工具,通过浏览器自动化做数据同步
  3. 内容聚合:多源新闻、博客、论坛的内容定时聚合
  4. UI 测试:AI 驱动的端到端测试,网站改版时不用重写 case
  5. RPA 替换:替代传统的低代码 RPA 工具,用代码 + AI 获得更好的可控性

注意事项

  • 不是免费的:AI 调用按量计费(参考 Intuned Agent 生成一个抓取任务通常 $0.3-1.0),基础设施按 compute hrs 计费。不过对于生产级自动化这点成本远低于自建。
  • 不适合实时交互:因为涉及 Playwright 代码执行,最小延迟在秒级,不适合需要毫秒级响应的场景。
  • 不是全开源:Intuned Agent 部分是闭源的,但你可以拿到生成的 Playwright 代码(你的数据,你的代码,无 lock-in)。

总结

Intuned 解决的是 AI Agent 生态中一个被低估的基础设施问题:浏览器自动化怎么在生产环境跑稳。它用「Agent 生成代码 + 确定性执行 + 自动维护」的组合,让 AI 驱动的浏览器操作从「演示能跑」变成「每天跑几年不出错」。如果你正在构建需要和网页打交道的 AI 应用,值得一试。

官网:intunedhq.com YC S22 | 支持 TypeScript 和 Python | Playwright 原生

相关链接

发表评论

你的邮箱地址不会被公开,带 * 的为必填项。