AI Agent 悄悄做了什么?用 Spotlight 看清 Claude Code 和 Codex 的每一个操作
你有过这种感觉吗?让 Claude Code 跑一个”简单的重构”,十分钟后回来发现它改了 30 个文件、装了两个 npm 包、还往生产环境发了个请求。你完全不知道这期间发生了什么——CLI 输出刷得太快,等你回来已经翻不到了。
这不是你的问题。AI 编码 Agent 本质上是一个黑箱:给一个任务,等几分钟,得到结果。中间到底做了什么——改了什么文件、调了什么 API、有没有访问不该访问的地址——没有人知道。如果 Agent 跑错了方向,十分钟就白费了。如果它犯了安全错误(比如误删文件或泄露密钥),你甚至可能几天后才意识到。
最近发布的 Spotlight by Backplanes 试图解决这个可见性问题。它自动读取 Claude Code 和 Codex 的 session 记录,生成一份结构化的报告——包含改了哪些文件、执行了哪些命令、访问了哪些外部域名、scope 有没有漂移。
为什么 Agent 可见性是个真问题
当你亲自写代码时,每一步都是可控的。你对运行了什么、改了什么信息有一清二楚的感知。
AI Agent 模式下,这个感知完全消失了。你输入 prompt,Agent 开始自主操作。它可能:
- 修改了不该改的模块——重构时波及到核心库
- 触发了外部 API——无意识调用了付费服务或外部端点
- 偏离了原始目标——scope 漂移,做了和任务无关的操作
- 做了不可逆操作——删文件、改数据库、推送到生产分支
这些问题在实践中很常见。Spotlight 的 HN 帖子提到的一个例子:Claude Code 在某个任务中误执行了 rm -rf /——如果没有及时发现,后果严重。另一个例子是 Agent 把生产环境的 feature flag 误当作 staging 环境来做切换。
你需要的不是一个”更好的 prompt 技术”,而是一个能告诉你 Agent 实际做了什么的可视化层。
Spotlight 能告诉你什么
Spotlight 自动读取 Claude Code 和 Codex 的 session 输出,生成一份包含三个维度的报告:
Security 视图:Agent 访问了哪些外部域名?有没有发出可疑的网络请求?MCP 工具调用是否越界?数据有没有被发送到意料之外的端点?
Engineering 视图:改了哪些文件?每个文件做了哪些改动?命令行执行了什么?scope 是否从原始任务偏移了?这相当于一份完整的 agent 操作日志,而不是 CLI 上的滚动输出。
Spend 视图:跑了多少 token?调用了哪些模型?每个任务花了多少钱?对于团队管理者,还能看到每个成员的 AI 使用量。
报告格式是一个完整的 dashboard 页面,包含时间线、文件变更列表、网络请求记录和风险标记。
上手体验
Spotlight 目前免费开放给个人和团队使用,无需绑定信用卡。到 backplanes.com 注册后,它会连接到你的 Claude Code 或 Codex 运行记录——不需要安装额外的 Agent 或修改现有工作流程。
对于日常使用场景:
- 普通开发者:每次让 Agent 跑完任务后,扫一眼 Spotlight 报告确认没有异常操作,再提交 PR
- 团队管理者:了解团队在 AI Agent 上的时间花在哪里、主要做哪些类型的任务、token 消耗是否合理
- 安全团队:监控 Agent 的对外网络请求,确保没有数据泄露风险
一些思考
Spotlight 的价值不在于它是一个”更好的监控工具”,而在于它揭示了 AI Agent 使用中的一个结构性盲区——当你把执行权交给 Agent 时,你需要一个与之对等的可见性层。
这和 CI/CD 的发展路径很像。早期开发者也是在终端跑命令、看输出。后来有了 CI pipeline 和构建日志,才有了结构化的反馈。Agent 模式才刚刚开始,类似的可见性基础设施必然会出现。
免费的入门门槛意味着现在就可以尝试——哪怕只是跑一次,看看你的 Agent 到底在做什么,也值得。
- 官网:https://www.backplanes.com
- HN 讨论:https://news.ycombinator.com/item?id=48545168