如何精准预估 AI 编程 Agent 的任务耗时?Agent-estimate 实战指南
当你在终端里同时运行 3-4 个 AI 编码 Agent,每个都在不同的分支上并行推进功能开发,你面临的最大难题是什么?不是代码质量,不是合并冲突——而是时间估算。
你问 AI Agent “这个功能大概多久能完成?” 它会用人类的节奏来回答你:”大概一个下午。” 而实际上,以 Agent 的编码速度,可能 20 分钟就搞定了。反过来,你以为一个小改动只需要几分钟,Agent 却花了整整两小时重构了整个模块。
这种时间感知的错位,正是 Agent-estimate 要解决的核心问题。
Agent-estimate 是什么?
Agent-estimate 是首个专为 AI 编程 Agent 设计的工作量估算工具。它由开发者 haoranchg 在 2026 年 2 月创建(Apache-2.0 开源协议),核心理念很简单:用 Agent 的速度来估算 Agent 的工时,而不是用人类的速度。
这个工具的诞生背景非常务实:作者每天都并行运行 3-4 个编码 Agent,每天早上都需要跟协调 Agent 一起制定当天的任务队列,然后逐个估算每项任务耗时。他发现传统估算方法完全不适合 Agent——于是自己造了一个轮子。
核心方法论:PERT + METR + Wave Planning
Agent-estimate 融合了三种成熟的工程估算方法:
PERT(计划评审技术):对每个任务计算三个估值——最乐观时间(O)、最可能时间(M)、最悲观时间(P),然后加权平均得出期望耗时。公式简单但有效:(O + 4M + P) / 6。
METR(可衡量且可追踪的估算):强调估算的可衡量性和可追踪性,将大任务拆解为可独立估算的子任务,每个子任务的估算结果都有明确的评估标准。
Wave Planning(波浪式规划):不试图一次性规划所有任务,而是按”波次”逐步推进——本周细化下周的任务,下周细化下下周的任务。这种方法天然适合多 Agent 并行的工作场景。
快速上手
安装
pip install agent-estimate git clone https://github.com/kiloloop/agent-estimate.git cd agent-estimate pip install -e .
基本用法
Agent-estimate 提供 CLI 接口,可以直接在终端中使用:
agent-estimate estimate "将用户认证模块从 JWT 迁移到 OAuth 2.0" agent-estimate estimate --from-file tasks.yaml agent-estimate start
输出示例:
Task: 将用户认证从 JWT 迁移到 OAuth 2.0 ├── Optimistic: 15 min ├── Most likely: 35 min ├── Pessimistic: 1h 20min ├── Expected (PERT): 39 min └── Confidence: MEDIUM
CI/CD 集成
Agent-estimate 支持 GitHub Actions,可以在 CI 流水线中自动估算 Pull Request 的工作量:
name: Agent Estimate
on: [pull_request]
jobs:
estimate:
runs-on: ubuntu-latest
steps:
- uses: actions/checkout@v4
- name: Estimate PR effort
uses: kiloloop/agent-estimate@main
with:
diff-threshold: '50'
使用场景
场景一:每日任务队列规划
这是 Agent-estimate 最核心的使用方式。每天早上,让协调 Agent 列出当天的所有待办事项,然后逐个估算耗时:
agent-estimate batch \ "重构搜索接口,支持多字段排序" \ "添加缓存层到用户查询路径" \ "修复日志系统的时间戳格式问题" \ "编写 API 文档的 OpenAPI 规范"
输出结果会按预期耗时排序,让你可以合理分配不同 Agent 的工作量。
场景二:Sprint 规划校准
在敏捷开发中,Sprint 规划依赖准确的时间估算。Agent-estimate 可以结合历史数据,校准估算偏差:
agent-estimate history --last-sprint Sprint 12 估算准确度: 78.5% Top underestimated: "添加数据库索引" (实际 45min, 估算 15min) Top overestimated: "实现登录页面" (实际 12min, 估算 1h)
场景三:多 Agent 并行调度
当你同时运行多个 Agent 处理不同任务时,Agent-estimate 可以帮助你做资源分配决策:
agent-estimate milestone MILESTONE.md --agents 3 ├── Agent 1: 功能 A + 功能 B(估算: 45min) ├── Agent 2: 功能 C(估算: 30min) └── Agent 3: 功能 D + 测试覆盖(估算: 40min) 预计总时长: 45min(并行)
实用技巧
- 先拆解再估算:一个大任务(如”实现支付功能”)的估算结果往往不准确。先拆解为子任务(”对接 Stripe API”、”实现退款逻辑”、”添加结算页面”),再逐个估算,精度明显提升。
- 结合 Agent 的类型调整参数:不同 Agent 在不同类型任务上的速度差异很大。Claude Code 在重构和测试方面更快,而 Cursor 在 UI 开发上更得心应手。Agent-estimate 支持设置 Agent 类型参数来校准估算。
- 用历史数据不断校准:每次实际完成时间与估算的偏差,都是一个学习机会。定期运行
agent-estimate history查看偏差模式,能帮你逐步提升估算精度。
- 不要过度依赖单次估算:估算只是参考,不是承诺。Agent-estimate 提供的是概率分布而非确定值——35-45 分钟代表一个置信区间,而不是精确到分钟的承诺。
结语
Agent-estimate 解决的不是技术难题,而是认知错位问题。当 AI Agent 以非人类的速度编码时,用传统的人力工时估算方法已经失效。Agent-estimate 提供的是一种全新的、以 Agent 为中心的估算范式——让开发者能更合理地规划时间、分配资源、管理预期。
对于每天运行多个编码 Agent 的开发者来说,这是一个小而美的工具,值得放入日常工具箱。