2026年6月7日 2 分钟阅读

Uber 四个月烧光全年 AI 预算?用 Cost.dev 让编码 Agent 学会「算钱」

tinyash 0 条评论

2026 年 6 月初,一则新闻在开发者社区炸开了锅:Uber 在短短四个月内烧光了 2026 全年的 AI 编程工具预算,起因竟是工程师大规模使用 Claude Code 等 Agent 工具产生的 API 费用失控。紧接着,LA Times 报道 Uber 开始限制员工使用 AI 编码工具——不是出于安全考虑,而是「真的付不起账单了」。

这不是 Uber 一家的问题。从「Corporate America Is Starting to Ration AI as Cost Skyrockets」到「Uber’s COO says it’s getting harder to justify money spent on tokenmaxxing」,2026 年中正在出现一个清晰的趋势:AI 编程工具的成本失控正在从个别工程师的「隐形账单」变成 CFO 的「红色警报」

问题出在哪里?

AI 编程 Agent 的费用失控通常来自三个黑洞:

  1. 无意识的上下文膨胀:Agent 在处理一个文件时会反复读取、分析整个代码库,每次 claudecodex 调用都在烧 Token
  2. 冗余的输出 Token:Agent 在向 CLI 工具提问时,会构建复杂的 curl | jq | python | wc 管道,每个阶段都在产生大量 JSON 输出被 Agent 重新解析
  3. 信息密度过低:Agent 调用一个 CLI 工具读取价格时,获取的是 20KB 的 JSON 数据,但 Agent 只需要其中一行数字——剩下 19.9KB 的冗余数据既浪费 Token 也浪费 API 费用

这些问题单独看都不大——一次调用多花几美分——但当 Agent 在全公司数百名工程师的日常工作中持续运行,积少成多就成了 Uber 遭遇的「四个月烧光全年预算」级别的成本。

Cost.dev:让 Agent 学会「算钱」

Cost.dev(cost.dev)来自Infracost 团队(YC W21,主仓库 13k+⭐),这个团队以给 Terraform 做成本估算闻名——五年前他们推出了 infracost CLI,能在 PR 阶段就告诉你「这个变更每月增加 $400」。今年他们发现了一个新趋势:编码 Agent 正在大量调用他们的 CLI,但那个 CLI 根本不是为 Agent 设计的。

于是他们从零打造了 Cost.dev——一个专为 AI 编码 Agent 优化的成本感知 CLI。核心宣称数据很震撼:减少 Claude 输出 Token 高达 79%,API 费用降低多达 67%

安装

Cost.dev 是一个 Go 语言编写的单一二进制文件,安装极其简单:

brew install cost-dev/tap/cost

curl -fsSL https://cost.dev/install.sh | sh

cost --version

安装完成后,运行一次配置命令让它了解你的云环境:

cost init

这个命令会自动检测你的 ~/.aws/credentials~/.azure/~/.config/gcloud/ 配置,无需手动输入 API Key。

平台配置

Claude Code:在 Claude Code 会话中,你可以直接通过 MCP 工具或 shell 命令调用 cost

> cost estimate --path ./terraform/main.tf

> cost diff --path ./terraform/

GitHub Copilot / Cursor:Cost.dev 支持 VS Code 和 JetBrains 插件,在 IDE 侧边栏直接显示成本估算,也有对应的 MCP Server:

cost mcp

OpenAI Codex / Gemini CLI:作为独立 CLI 工具,可以嵌入到任何自动化脚本或 Agent 工作流中:

cost estimate --format compact --path .

关键设计细节:Cost.dev 的输出格式针对 Agent 解析做了专门优化。它使用谓词标志(predicate flags) 而非复杂的嵌套格式,让 Agent 能零解析成本地判断「这个变更是否超预算」:

cost check --budget 500 --path ./terraform/

cost estimate --format compact --path ./terraform/main.tf

优化原理

Cost.dev 是怎么做到 79% Token 节省的?关键在于三个设计决策:

1. 去 JSON 冗余:传统 CLI 输出 JSON 会包含字段名、类型定义、版本号等大量元数据。Cost.dev 的输出格式直接去掉所有冗余字段名——{"resource":"aws_instance","cost":42.5} 变成 aws_instance 42.5,Agent 需要的信息没有丢失,但 Token 消耗降低了 60%+。

2. 谓词代替管道:Agent 不需要 cost estimate | jq '.resources[] | select(.cost > 100)' | wc -l 这种复杂管道——直接调用 cost check --budget 500 返回 true/false,Agent 一步完成原本需要三步的工作。

3. 静态分析代替 API 调用:所有价格数据在本地缓存,CLI 在本地做静态分析,不触发任何外部 API 调用。这意味着 Agent 不需要「去查一下 AWS 的定价页面然后自己算」——CLI 已经算好了。

日常使用场景

场景一:Terraform PR 成本审查

当开发者提交一个 Terraform PR 时,CI 中运行:

cost diff --path ./terraform/ --format markdown

输出直接贴在 PR 评论中。如果 Agent 参与代码审查,可以进一步调用:

cost check --budget 200 --path ./terraform/

让 Agent 在合并前自动拒绝超预算的变更。

场景二:Agent 生成 IaC 时的实时指引

当 Claude Code 在生成 main.tf 时,可以在 prompt 中植入一个规则:「每次生成资源定义后,调用 cost estimate 检查总成本」。这样 Agent 在写代码的同时就在「算账」,而不是等 PR 阶段才发现成本问题。

场景三:多云环境下的统一成本视图

cost estimate --all-providers --format compact

cost estimate --group-by resource-type

与已有方案的对比

维度Cost.dev自己写脚本估算依赖 Agent 记忆
Token 消耗极低(79%节省)高(全 JSON 解析)极高(每次重新查)
精度本地静态分析+最新价格取决于实现质量随机(LLM 会编造价格)
多平台Claude/Copilot/Cursor/Codex需每个平台适配只适用于单一工具
更新频率自动同步云厂商价格需要手动维护每次需要重新提示
价格准确性✅ 准确⚠️ 可能过时❌ 会编造

实用技巧

  1. 集成到 CI/CD:在 GitHub Actions 或 GitLab CI 中加入 cost check 步骤,让每次 PR 自动做成本门禁
  2. 自定义预算规则:不同项目可以设置不同的月度预算阈值,cost.yaml 配置文件支持按目录/资源类型设置
  3. 与 FinOps 流程结合:输出 CSV 格式的成本报告,导入到内部的 FinOps dashboard 中统一管理
  4. 注意:这不是 API 代理:Cost.dev 是一个成本估算和感知工具,不是 API 代理/路由工具(如 OpenRouter 或 NerfGuard)。它让 Agent 知道成本,但不拦截和路由请求。如果需求是「自动路由到最便宜的模型」,需要配合专门的路由层使用

总结

Uber 的案例是一个警示:AI 编码工具的生产力提升是真实的,但如果不对成本做管理,这种提升是不可持续的。Cost.dev 的价值不在于它是一个「省钱工具」,而在于它让成本成为 Agent 决策循环中的一个可感知维度——一个 Agent 在写 t2.medium 之前就知道它每月要花多少钱,比事后看账单再限制更合理。

Install: curl -fsSL https://cost.dev/install.sh | sh

Docs: https://cost.dev/docs(Infracost 团队,13k+⭐)

发表评论

你的邮箱地址不会被公开,带 * 的为必填项。