你的 AI 编程 Agent 在偷偷烧钱吗?Cost.dev 让 API 成本下降 67%
最近 Uber 内部限制员工使用 AI 编程工具的消息在开发者社区引起热议——原因是季度预算严重超支。这背后有一个被很多人忽视的问题:AI 编程 Agent 调用的 API Token 成本,正在成为很多团队的「隐形第二大开支」。
以 Claude Code 或 Cursor 为例,Agent 在生成 IaC 代码时不是只调一次 API 就结束——它需要反复读取云厂商的价格表、分析 Terraform 配置、跑管道命令(jq | python | wc),每一步都在烧 Token。而 Token 就是实实在在的真金白银。
6 月 4 日,Infracost 团队(YC W21,主仓库 13k+⭐)推出了专为 AI 编程 Agent 设计的成本感知 CLI——Cost.dev。它不仅能让 Agent 的云成本预估更准确,还通过 CLI 设计优化把 Token 使用量缩减 79%,API 成本降低 67%。
本文从实战角度带你上手 Cost.dev,看看它是怎么做到的。
Cost.dev 是什么
Cost.dev 是一个给 AI 编程 Agent 用的成本感知 CLI。它不做 Agent 该做的事(自然语言推理、代码生成),而是做 Agent 不擅长的两件事:
- 确定性计算:从云厂商 API 拉取实时价格、扫描 Terraform/CloudFormation 代码、做精确的成本估算
- Token 优化:用精心设计的 CLI 输出格式,让 Agent 不用再写
jq | python | wc管道解析 JSON
一句话定位:让 Agent 知道你的代码要花多少钱,且 Agent 用 Cost.dev 比自己去查便宜 67%。
安装
Cost.dev 支持通过 Homebrew 或 npm 安装:
brew install cost-dev/tap/cost npm install -g @infracost/cost
安装后验证:
cost --help
输出应该显示 cost estimation、resource comparison 等子命令列表。
实战 1:让 Agent 知道 Terraform 要花多少钱
Cost.dev 最核心的场景是给 Claude Code / Codex 等 AI 编程 Agent 提供价格感知能力。传统做法是 Agent 自己从 AWS 定价页面爬数据——Token 浪费大且准确性无保障。
使用 Cost.dev,Agent 只需一行命令就能获取精确估算:
cost estimate --file main.tf
输出示例:
Project: main.tf Region: us-east-1 Monthly estimate: $425.32 Resources: aws_instance.app_server m6g.large $84.23/mo aws_rds_cluster.main db.r6g.large $198.50/mo aws_alb.main ALB $142.59/mo
Agent 不再需要自己去拼价格——Cost.dev 返回的数据已经是整理好的。更重要的是,这个 CLI 做了谓词标志(predicate flag)设计:Agent 可以用 --filter、--format compact 等标志精确控制输出粒度,不必自己写管道。
cost estimate --file main.tf --format total-only cost estimate --file main.tf --service RDS --format compact
实战 2:多方案成本对比
另一个 Agent 常遇到的场景:开发者问「这套三层的应用在 AWS 和 GCP 上分别要多少钱?」
用 Cost.dev 可以一行搞定:
cost compare --file aws-main.tf --file gcp-main.tf
输出:
Comparison: AWS vs GCP (us-east-1, on-demand, 24/7) AWS: ALB + ECS Fargate + RDS Postgres $523.18/mo GCP: Load Balancer + Cloud Run + Cloud SQL $412.65/mo Cloud Run scale-to-zero saves on idle compute. Caveat: AWS becomes cheaper above ~80% utilization.
Agent 拿到这个输出后,不仅能告诉用户「GCP 更便宜」,还能给出利用率的边界条件——这些都是从 Cost.dev 的结构化输出中直接提取的,不是 Agent 自己胡猜的。
实战 3:自然语言成本查询
Cost.dev 还支持自然语言查询式的资源对比,适合在 Cursor/Copilot Chat 中使用:
用户:「can we hit <$400/mo on this 3-tier app?」 Agent → cost estimate --budget 400 --file main.tf Agent ← m6g.large meets your performance budget at the target price.
Cost.dev 内部做了充足的优化:返回的输出不是冗余 JSON,而是经过压缩的紧凑格式,Agent 读起来快,Token 也省得多。
为什么 Cost.dev 能省 79% 的 Token?
这个问题其实反映了当前 AI Agent 工具生态的一个普遍问题:大多数 CLI 工具的设计没有考虑 Agent 调用者。
传统的 CLI 输出设计思路是「给人看的」——彩色表格、JSON 包裹、冗长的字段名。Agent 调用这种 CLI 需要:
- 先执行命令 → 获取完整 JSON(大量冗余字段名)
- 再写
jq/python管道解析 → 消耗更多 Token - 如果有多个步骤,重复上面的循环
Cost.dev 的设计哲学相反——CLI 输出应该直接是 Agent 能消费的格式:
- 谓词标志:用
--format total-only或--filter service=RDS直接从源头过滤,Agent 不用再写| jq - 紧凑 JSON:字段名从
estimated_monthly_cost缩减到cost→ 每条记录省 20+ 字符 - 省略冗余包层:不输出
{"data": {"result": ...}}这种多层嵌套
这些看起来是小改动,但在 Agent 循环中反复调用时,累计效果非常显著。
与主流 Agent 的集成
Cost.dev 当前支持以下工具:
- Claude Code:直接在 Agent 的
~/.claude/settings.json中添加 Cost.dev 命令作为 MCP 工具 - GitHub Copilot / Cursor:通过
@terminal或 inline 命令执行 - OpenAI Codex / Gemini CLI:直接 shell 调用
- VS Code / JetBrains:作为终端插件使用
总结
AI 编程 Agent 的 API 成本管理正在从「没人关心」变成「团队必须关注」的问题。Cost.dev 不是第一个做云成本估算的工具,但它是第一个专门为 Agent 调用者设计的成本工具——它的价值不仅在于「算出价格」,更在于「让 Agent 花最少的 Token 算出价格」。
对于正在把 AI Agent 引入 IaC 工作流的团队来说,Cost.dev 的 ROI 是立竿见影的:省 67% 的钱 + 79% 的 Token + 更准确的成本数据。三赢。
- 项目主页:https://cost.dev/
- GitHub(Infracost):https://github.com/infracost/infracost
- 技术博客:https://www.infracost.io/resources/blog/we-cut-claude-s-token-usage-79-by-redesigning-our-cli-for-agents