场景:AI Agent 只能写代码不能打电话?AgentLine 开源电话 API 让 Agent 直接打通 PSTN
问题:AI Agent 的能力边界缺了一个「电话」
你的 AI 编码 Agent 能读写文件、能用 MCP 工具调用外部 API、能部署代码、能分析日志——但有一个场景它完全无能为力:打电话。
想象以下场景:
- 你的 Agent 在自动化部署流水线中检测到生产环境异常,需要立即通知值班工程师——发 Slack 消息不够紧急,需要直接打电话
- 客服场景中,用户通过聊天窗口提交了复杂问题,Agent 分析后需要致电用户确认细节
- 自动化流程中,Agent 需要做电话身份验证(OOB 验证),给用户手机打一个语音电话
传统的解决方案是接入 Twilio 或 Vonage——但这些平台面向的开发者人群是「懂电信的后端工程师」,配置流程包含 SIP trunk、TwiML、webhook 回调——对 AI Agent 来说门槛太高。你需要写上百行代码才能让 Agent 完成一次电话拨打。
AgentLine 用一种极简的方式解决了这个问题:一个 API、一个技能文件、5 分钟,让任何 AI Agent 拥有真实的电话号码。
痛点对比:传统方案 vs AgentLine
| 对比维度 | 传统方案(Twilio/Vonage) | AgentLine |
|---|---|---|
| 专为 AI Agent 设计 | ❌ 面向呼叫中心开发者 | ✅ 原生 MCP + Skill 文件 |
| 安装时间 | 数小时(配置 SIP/TwiML) | 5 分钟(Docker 或托管版) |
| MCP 服务器 | ❌ 无原生支持 | ✅ 内置 13 个 MCP 工具 |
| 语音管线 | ❌ 需要自己拼接 STT+TTS+LLM | ✅ 内置 Deepgram + GPT-4o + Cartesia |
| 开源 | ❌ 专有软件 | ✅ MIT 许可证 |
| 事件推送 | 需要 webhook 端点 | ✅ 轮询式 Event Mailbox(Agent 无需公网端点) |
快速上手:两种方式 5 分钟搞定
方式一:使用托管版(最快)
注册 agentline.cloud,获取 API Key,然后将技能文件添加到你的 Agent:
方式二:自托管(Docker)
git clone https://github.com/agentlineHQ/AgentLine.git cd AgentLine cp .env.example .env docker-compose up -d
启动后 API 服务器运行在 http://localhost:8000,自动附带 Swagger 文档。
向 Agent 添加电话能力
自托管模式下,通过 MCP 协议将电话能力暴露给 Agent:
{
"mcpServers": {
"agentline": {
"command": "npx",
"args": [
"-y", "mcp-remote@latest",
"http://localhost:8000/mcp",
"--header", "Authorization: Bearer $(AGENTLINE_API_KEY)"
]
}
}
}
配置完成后,你只需要告诉你的 Agent:「给王工打个电话,告诉他生产环境已经恢复」——Agent 会自动调用 make_outbound_call MCP 工具完成任务。
核心功能:AgentLine 的四个关键能力
1. 电话外呼与接听(Voice Calls)
AgentLine 的核心是让 AI Agent 通过 REST API 或 MCP 工具发起和接听电话。
创建一个语音 Agent:
curl -X POST https://api.agentline.cloud/v1/agents \
-H "Authorization: Bearer $(AGENTLINE_API_KEY)" \
-H "Content-Type: application/json" \
-d '{"name": "Deploy Notifier", "prompt": "你是一个友好的通知助手", "voice": "alloy"}'
购买电话号码并拨出电话:
curl -X POST https://api.agentline.cloud/v1/numbers \
-H "Authorization: Bearer $(AGENTLINE_API_KEY)" \
-H "Content-Type: application/json" \
-d '{"area_code": "415"}'
curl -X POST https://api.agentline.cloud/v1/calls \
-H "Authorization: Bearer $(AGENTLINE_API_KEY)" \
-H "Content-Type: application/json" \
-d '{"to": "+14155551234", "agent_id": "agt_xxx", "prompt": "你好,系统检测到异常已自动修复,请确认收到通知"}'
2. 内置 AI 语音管线(Hybrid Relay)
AgentLine 最独特的设计是 Hybrid Relay 架构——不同于传统的实时 WebSocket 流,它采用异步中继模式:
用户拨入 Agent 号码 → SignalWire 接听电话 → 播放 TTS 问候语(Cartesia Sonic) → 录制用户语音 → Deepgram 转写(Nova-2 模型) → GPT-4o 生成回复 → Cartesia 语音合成回复 → 循环直到通话结束 → 全文转写存储可检索
这个设计的好处是 Agent 不需要维持长连接 WebSocket,用简单的 REST 轮询就能处理完整的通话生命周期。
3. MCP 服务器:13 个电话工具即开即用
AgentLine 内置了完整的 MCP 协议服务器,AI Agent 可以直接调用电话功能而无需理解 REST API 细节。可用 MCP 工具包括:
| MCP 工具 | 功能 |
|---|---|
create_agent | 创建语音 Agent 配置 |
list_agents | 列出所有语音 Agent |
update_agent | 更新 Agent 提示词/语音 |
make_outbound_call | 发起电话外呼 |
list_calls | 查看通话记录 |
get_call_transcript | 获取通话完整转写 |
hangup_call | 结束进行中的通话 |
buy_phone_number | 购买新号码 |
list_phone_numbers | 管理已购号码 |
list_available_voices | 查看可用语音预设 |
poll_events | 轮询事件邮箱(消费模式) |
peek_events | 预览事件(非破坏性) |
get_account_balance | 查询账户余额 |
4. 事件邮箱:Agent 无需公网端点
传统电话平台依赖 webhook 回调——Agent 需要有一个公网可达的 HTTP 端点来接收来电通知、通话结束事件等。但本地运行的 Agent(如 Claude Code)通常没有公网 IP。
AgentLine 的 Event Mailbox 解决了这个问题:Agent 定期轮询事件队列(类似邮件 POP3),消费事件而无需暴露公网服务:
curl -X GET https://api.agentline.cloud/v1/events \ -H "Authorization: Bearer $(AGENTLINE_API_KEY)" curl -X GET https://api.agentline.cloud/v1/events/peek \ -H "Authorization: Bearer $(AGENTLINE_API_KEY)"
横向对比:为什么选 AgentLine 而非 Twilio
| 能力 | AgentLine | Twilio | 自己搭建 |
|---|---|---|---|
| AI Agent 适配 | ✅ 原生 MCP + Skill 文件 | ❌ 需自行封装 | ❌ 需大量代码 |
| 安装时间 | 5 分钟 | 数小时 | 数周 |
| 语音管线(STT+TTS+LLM) | ✅ 内置 | ❌ 需单独集成 | ❌ 需单独集成 |
| 事件推送(无 webhook 方案) | ✅ Event Mailbox | ❌ 仅 webhook | ❌ 需自建 |
| 开源许可 | ✅ MIT | ❌ 专有 | ✅ 你的代码 |
| 通话成本 | $0.10/分钟(按秒计费) | $0.014/分钟 + 额外服务费 | 取决于供应商 |
自托管模式下,你只需支付底层供应商费用(SignalWire + Deepgram + OpenAI),AgentLine 本身完全免费。
注意事项
- 需要多个 API Key:即使使用托管版,AgentLine 背后依赖 SignalWire(电话网络)、Deepgram(语音转文字)、Cartesia(文字转语音)、OpenAI(LLM)——每个都需要单独注册和付费。
- 仅支持美国号码(目前):SignalWire 主要覆盖北美地区,国际号码支持需要通过提供商扩展。
- 自托管有基础设施成本:需要 PostgreSQL + Redis,适合有一定运维能力的团队。
- 通话质量依赖网络:自托管模式下的 Hybrid Relay 延迟(转录→LLM→合成)约 2-3 秒,对实时对话可接受但不够低。
总结
AgentLine 解决了一个 AI Agent 社区中长期被忽视的需求——让 Agent 能打电话。它没有试图重新发明电话协议栈,而是在 Twilio/SignalWire 等成熟基础设施之上封装了一层 AI 友好的 API 和 MCP 接口。如果你已经有 AI Agent 运行在你的工作流中,需要它具备电话通知、身份验证或简单的语音交互能力,AgentLine 是目前最简单且开源的选择。
相关链接: