Uber 四个月烧完全年 AI 预算之后:Cost.dev 让编程 Agent 学会看价格标签
新闻背景:Uber 的 AI 预算危机
2026 年 6 月初,LA Times 报道了一个让整个开发者社区震动的事件:Uber 因为 AI 编程工具预算严重超支,不得不限制员工的 Claude Code 使用量。相关帖子和讨论在 HN 上引发了连锁反应——此前已有帖子揭示 Uber 在前 4 个月就把全年的 Claude Code 许可费用烧光了。
这不是 Uber 的孤例。Uber COO 公开表示”越来越难 justify 在 tokenmaxxing 上的支出”,而 Corporate America 也在普遍开始配额管理和限制 AI 工具使用。一句话:AI 编程工具的便利性,正在被失控的成本吞噬。
为什么预算会爆掉?因为当前的主流 AI 编程工具以 token 消费为计价模型——你用的 prompt 越长、Agent 循环的对话轮次越多、输出的工具调用越啰嗦,账单就越高。一个 Agent 在 Terraform PR 上多跑几次 jq | python | wc 管道组合,就能无意义地烧掉数百美元。
问题在哪里
AI 编程 Agent 在基础设施即代码(IaC)场景下的成本失控尤为突出。当你对 Claude Code 说”优化这个 Terraform 配置的成本”,Agent 会怎么做?
它首先会加载大量代码和策略上下文到对话里,然后去猜测 AWS 上十万种实例类型的价格。猜对了是运气,猜错了你压根发现不了——因为约 1000 万个价格点分散在 AWS、Azure、Google Cloud 上,没有任何人能凭记忆验证价格是否正确。
这还没算上 token 浪费的问题:Agent 在猜测和纠错的过程中不断输出长回复、组合管道命令、加载重复上下文——每一步都在烧钱。
破局者:Cost.dev
就在这个背景下,Infracost 团队(YC W21,主仓库 GitHub 13,000+ ⭐)推出了专为 AI Agent 设计的成本感知 CLI:Cost.dev。
如果说五年前 Infracost 让工程师在部署前就知道 Terraform PR 增加了 $400/月的成本,那么 Cost.dev 的使命是:让 AI Agent 在做出变更前就能看到价格标签。
它的设计哲学很清晰——CLI 做确定性工作(查价格、扫描代码、验证修复),Agent 做自然语言工作(理解上下文、生成配置)。两者各司其职,不互相替代。
核心数据:79% Token 缩减 + 67% 费用降低
Cost.dev 团队在 blog 中分享了一组关键数字:通过对 CLI 输出格式的全面优化,他们让 Claude 的输出 Token 消耗降低了 79%,API 成本降低了 67%。
如何在 CLI 设计中为 Agent 节约 token?几个要点:
- 谓词标志(predicate flags):让 Agent 不问问题,直接拿答案,不再需要用
jq | python | wc组合管道来处理 JSON 输出 - 紧凑输出格式:剥离 JSON 中冗余的字段名,让 Agent 一眼看到关键数据
- 避免不必要的上下文加载:CLI 做所有的确定性工作,Agent 只需接收精简结果
安装与配置
Cost.dev 的安装非常简单:
brew install cost-dev/tap/cost curl -fsSL https://cost.dev/install.sh | sh
它支持当前所有主流 AI 编程工具:
- Claude Code
- GitHub Copilot
- Cursor
- Windsurf
- OpenAI Codex
- Gemini CLI
- VS Code 与 JetBrains IDE
一个安装,全局生效,不需要为每个工具单独配置。
实战场景:让 Terraform 不再”盲人摸象”
假设你在 Cursor 中编写 Terraform 配置,想用 r6i.8xlarge 实例类型部署一个新的 EC2 集群。正常情况下,Agent 会说”好的,r6i.8xlarge 实例不错”——但它不知道这会带来多少成本。
有了 Cost.dev,Agent 的工作流程变成了这样:
- 你输入 prompt:”帮我创建一个 3 节点的 EC2 集群,用 r6i.8xlarge”
- Agent 自动调用
cost estimate命令获取价格 - CLI 返回:”r6i.8xlarge 按需价格为 $1.3056/小时,3 节点每月约 $2,821″
- Agent 意识到成本较高,提示你:“r6i.8xlarge 每月约 $2,821,是否考虑用 r6i.4xlarge($1,411/月)替代?性能差异约 50%,但成本减半”
- 你决定降级,Agent 根据真实价格数据重新生成配置
整个过程,Agent 不需要去猜测价格,也不需要加载 AWS 定价页面。所有数据都在本地通过 CLI 静态分析完成——代码不会离开你的机器,也不会因为 API 调用而增加额外的 token 消耗。
这就是”成本感知编程”的核心理念:不是让 Agent 更聪明地去猜,而是给 Agent 一个可靠的价格参照系。
多工具一致性
Cost.dev 另一个值得一提的设计是规则层的一致性。不管你在 VS Code 中写 IaC,还是在 Claude Code 中让 Agent 生成配置,你得到的是同一个价格数据库和同样的验证逻辑。这意味着:
- 你不用维护多个定价源
- Agent 和 IDE 之间的成本估算不会有分歧
- 团队的所有工具共享同一个评估标准
写在最后
Uber 的 AI 预算危机很可能只是个开始。随着更多企业将 AI 编程工具投入生产环境,”成本感知”将成为 Agent 设计的必修课——就像今天没有人会写不关心性能的代码一样,未来没有人会写不关心成本的 Agent 配置。
Cost.dev 不是一个颠覆性的 AI 工具,而是一个基础设施层的基础设施——它解决的不是”做什么”,而是”做这件事要花多少钱”。在 AI 编程从实验走向生产的过程中,这种透明度和确定性,比多一个花哨的功能重要得多。
相关链接:Cost.dev 官网 | Infracost 团队博客:如何将 Claude 的 Token 消耗降低 79% | GitHub 仓库(Infracost)