AI 2026年6月6日 1 分钟阅读

Uber 四个月烧完全年 AI 预算之后：Cost.dev 让编程 Agent 学会看价格标签

tinyash 0 条评论

文章信息

发布时间 2026年6月6日
作者 tinyash
阅读时长 1 分钟阅读

新闻背景：Uber 的 AI 预算危机

2026 年 6 月初，LA Times 报道了一个让整个开发者社区震动的事件：Uber 因为 AI 编程工具预算严重超支，不得不限制员工的 Claude Code 使用量。相关帖子和讨论在 HN 上引发了连锁反应——此前已有帖子揭示 Uber 在前 4 个月就把全年的 Claude Code 许可费用烧光了。

这不是 Uber 的孤例。Uber COO 公开表示”越来越难 justify 在 tokenmaxxing 上的支出”，而 Corporate America 也在普遍开始配额管理和限制 AI 工具使用。一句话：AI 编程工具的便利性，正在被失控的成本吞噬。

为什么预算会爆掉？因为当前的主流 AI 编程工具以 token 消费为计价模型——你用的 prompt 越长、Agent 循环的对话轮次越多、输出的工具调用越啰嗦，账单就越高。一个 Agent 在 Terraform PR 上多跑几次 jq | python | wc 管道组合，就能无意义地烧掉数百美元。

问题在哪里

AI 编程 Agent 在基础设施即代码（IaC）场景下的成本失控尤为突出。当你对 Claude Code 说”优化这个 Terraform 配置的成本”，Agent 会怎么做？

它首先会加载大量代码和策略上下文到对话里，然后去猜测 AWS 上十万种实例类型的价格。猜对了是运气，猜错了你压根发现不了——因为约 1000 万个价格点分散在 AWS、Azure、Google Cloud 上，没有任何人能凭记忆验证价格是否正确。

这还没算上 token 浪费的问题：Agent 在猜测和纠错的过程中不断输出长回复、组合管道命令、加载重复上下文——每一步都在烧钱。

破局者：Cost.dev

就在这个背景下，Infracost 团队（YC W21，主仓库 GitHub 13,000+ ⭐）推出了专为 AI Agent 设计的成本感知 CLI：Cost.dev。

如果说五年前 Infracost 让工程师在部署前就知道 Terraform PR 增加了 $400/月的成本，那么 Cost.dev 的使命是：让 AI Agent 在做出变更前就能看到价格标签。

它的设计哲学很清晰——CLI 做确定性工作（查价格、扫描代码、验证修复），Agent 做自然语言工作（理解上下文、生成配置）。两者各司其职，不互相替代。

核心数据：79% Token 缩减 + 67% 费用降低

Cost.dev 团队在 blog 中分享了一组关键数字：通过对 CLI 输出格式的全面优化，他们让 Claude 的输出 Token 消耗降低了 79%，API 成本降低了 67%。

如何在 CLI 设计中为 Agent 节约 token？几个要点：

谓词标志（predicate flags）：让 Agent 不问问题，直接拿答案，不再需要用 jq | python | wc 组合管道来处理 JSON 输出
紧凑输出格式：剥离 JSON 中冗余的字段名，让 Agent 一眼看到关键数据
避免不必要的上下文加载：CLI 做所有的确定性工作，Agent 只需接收精简结果

安装与配置

Cost.dev 的安装非常简单：

brew install cost-dev/tap/cost

curl -fsSL https://cost.dev/install.sh | sh

它支持当前所有主流 AI 编程工具：

Claude Code
GitHub Copilot
Cursor
Windsurf
OpenAI Codex
Gemini CLI
VS Code 与 JetBrains IDE

一个安装，全局生效，不需要为每个工具单独配置。

实战场景：让 Terraform 不再”盲人摸象”

假设你在 Cursor 中编写 Terraform 配置，想用 r6i.8xlarge 实例类型部署一个新的 EC2 集群。正常情况下，Agent 会说”好的，r6i.8xlarge 实例不错”——但它不知道这会带来多少成本。

有了 Cost.dev，Agent 的工作流程变成了这样：

你输入 prompt：”帮我创建一个 3 节点的 EC2 集群，用 r6i.8xlarge”
Agent 自动调用 cost estimate 命令获取价格
CLI 返回：”r6i.8xlarge 按需价格为 $1.3056/小时，3 节点每月约 $2,821″
Agent 意识到成本较高，提示你：“r6i.8xlarge 每月约 $2,821，是否考虑用 r6i.4xlarge（$1,411/月）替代？性能差异约 50%，但成本减半”
你决定降级，Agent 根据真实价格数据重新生成配置

整个过程，Agent 不需要去猜测价格，也不需要加载 AWS 定价页面。所有数据都在本地通过 CLI 静态分析完成——代码不会离开你的机器，也不会因为 API 调用而增加额外的 token 消耗。

这就是”成本感知编程”的核心理念：不是让 Agent 更聪明地去猜，而是给 Agent 一个可靠的价格参照系。

多工具一致性

Cost.dev 另一个值得一提的设计是规则层的一致性。不管你在 VS Code 中写 IaC，还是在 Claude Code 中让 Agent 生成配置，你得到的是同一个价格数据库和同样的验证逻辑。这意味着：

你不用维护多个定价源
Agent 和 IDE 之间的成本估算不会有分歧
团队的所有工具共享同一个评估标准

写在最后

Uber 的 AI 预算危机很可能只是个开始。随着更多企业将 AI 编程工具投入生产环境，”成本感知”将成为 Agent 设计的必修课——就像今天没有人会写不关心性能的代码一样，未来没有人会写不关心成本的 Agent 配置。

Cost.dev 不是一个颠覆性的 AI 工具，而是一个基础设施层的基础设施——它解决的不是”做什么”，而是”做这件事要花多少钱”。在 AI 编程从实验走向生产的过程中，这种透明度和确定性，比多一个花哨的功能重要得多。

相关链接：Cost.dev 官网 | Infracost 团队博客：如何将 Claude 的 Token 消耗降低 79% | GitHub 仓库（Infracost）

AI AI 工具 AI 编程 YC 开发工具教程