2026年7月5日 2 分钟阅读

场景:AI Agent 只能写代码不能打电话?AgentLine 开源电话 API 让 Agent 直接打通 PSTN

tinyash 0 条评论

问题:AI Agent 的能力边界缺了一个「电话」

你的 AI 编码 Agent 能读写文件、能用 MCP 工具调用外部 API、能部署代码、能分析日志——但有一个场景它完全无能为力:打电话

想象以下场景:

  • 你的 Agent 在自动化部署流水线中检测到生产环境异常,需要立即通知值班工程师——发 Slack 消息不够紧急,需要直接打电话
  • 客服场景中,用户通过聊天窗口提交了复杂问题,Agent 分析后需要致电用户确认细节
  • 自动化流程中,Agent 需要做电话身份验证(OOB 验证),给用户手机打一个语音电话

传统的解决方案是接入 Twilio 或 Vonage——但这些平台面向的开发者人群是「懂电信的后端工程师」,配置流程包含 SIP trunk、TwiML、webhook 回调——对 AI Agent 来说门槛太高。你需要写上百行代码才能让 Agent 完成一次电话拨打。

AgentLine 用一种极简的方式解决了这个问题:一个 API、一个技能文件、5 分钟,让任何 AI Agent 拥有真实的电话号码

痛点对比:传统方案 vs AgentLine

对比维度传统方案(Twilio/Vonage)AgentLine
专为 AI Agent 设计❌ 面向呼叫中心开发者✅ 原生 MCP + Skill 文件
安装时间数小时(配置 SIP/TwiML)5 分钟(Docker 或托管版)
MCP 服务器❌ 无原生支持✅ 内置 13 个 MCP 工具
语音管线❌ 需要自己拼接 STT+TTS+LLM✅ 内置 Deepgram + GPT-4o + Cartesia
开源❌ 专有软件✅ MIT 许可证
事件推送需要 webhook 端点✅ 轮询式 Event Mailbox(Agent 无需公网端点)

快速上手:两种方式 5 分钟搞定

方式一:使用托管版(最快)

注册 agentline.cloud,获取 API Key,然后将技能文件添加到你的 Agent:


方式二:自托管(Docker)

git clone https://github.com/agentlineHQ/AgentLine.git
cd AgentLine
cp .env.example .env
docker-compose up -d

启动后 API 服务器运行在 http://localhost:8000,自动附带 Swagger 文档。

向 Agent 添加电话能力

自托管模式下,通过 MCP 协议将电话能力暴露给 Agent:

{
  "mcpServers": {
    "agentline": {
      "command": "npx",
      "args": [
        "-y", "mcp-remote@latest",
        "http://localhost:8000/mcp",
        "--header", "Authorization: Bearer $(AGENTLINE_API_KEY)"
      ]
    }
  }
}

配置完成后,你只需要告诉你的 Agent:「给王工打个电话,告诉他生产环境已经恢复」——Agent 会自动调用 make_outbound_call MCP 工具完成任务。

核心功能:AgentLine 的四个关键能力

1. 电话外呼与接听(Voice Calls)

AgentLine 的核心是让 AI Agent 通过 REST API 或 MCP 工具发起和接听电话。

创建一个语音 Agent:

curl -X POST https://api.agentline.cloud/v1/agents \
  -H "Authorization: Bearer $(AGENTLINE_API_KEY)" \
  -H "Content-Type: application/json" \
  -d '{"name": "Deploy Notifier", "prompt": "你是一个友好的通知助手", "voice": "alloy"}'

购买电话号码并拨出电话:

curl -X POST https://api.agentline.cloud/v1/numbers \
  -H "Authorization: Bearer $(AGENTLINE_API_KEY)" \
  -H "Content-Type: application/json" \
  -d '{"area_code": "415"}'

curl -X POST https://api.agentline.cloud/v1/calls \
  -H "Authorization: Bearer $(AGENTLINE_API_KEY)" \
  -H "Content-Type: application/json" \
  -d '{"to": "+14155551234", "agent_id": "agt_xxx", "prompt": "你好,系统检测到异常已自动修复,请确认收到通知"}'

2. 内置 AI 语音管线(Hybrid Relay)

AgentLine 最独特的设计是 Hybrid Relay 架构——不同于传统的实时 WebSocket 流,它采用异步中继模式:

用户拨入 Agent 号码
  → SignalWire 接听电话
  → 播放 TTS 问候语(Cartesia Sonic)
  → 录制用户语音
  → Deepgram 转写(Nova-2 模型)
  → GPT-4o 生成回复
  → Cartesia 语音合成回复
  → 循环直到通话结束
  → 全文转写存储可检索

这个设计的好处是 Agent 不需要维持长连接 WebSocket,用简单的 REST 轮询就能处理完整的通话生命周期。

3. MCP 服务器:13 个电话工具即开即用

AgentLine 内置了完整的 MCP 协议服务器,AI Agent 可以直接调用电话功能而无需理解 REST API 细节。可用 MCP 工具包括:

MCP 工具功能
create_agent创建语音 Agent 配置
list_agents列出所有语音 Agent
update_agent更新 Agent 提示词/语音
make_outbound_call发起电话外呼
list_calls查看通话记录
get_call_transcript获取通话完整转写
hangup_call结束进行中的通话
buy_phone_number购买新号码
list_phone_numbers管理已购号码
list_available_voices查看可用语音预设
poll_events轮询事件邮箱(消费模式)
peek_events预览事件(非破坏性)
get_account_balance查询账户余额

4. 事件邮箱:Agent 无需公网端点

传统电话平台依赖 webhook 回调——Agent 需要有一个公网可达的 HTTP 端点来接收来电通知、通话结束事件等。但本地运行的 Agent(如 Claude Code)通常没有公网 IP。

AgentLine 的 Event Mailbox 解决了这个问题:Agent 定期轮询事件队列(类似邮件 POP3),消费事件而无需暴露公网服务:

curl -X GET https://api.agentline.cloud/v1/events \
  -H "Authorization: Bearer $(AGENTLINE_API_KEY)"

curl -X GET https://api.agentline.cloud/v1/events/peek \
  -H "Authorization: Bearer $(AGENTLINE_API_KEY)"

横向对比:为什么选 AgentLine 而非 Twilio

能力AgentLineTwilio自己搭建
AI Agent 适配✅ 原生 MCP + Skill 文件❌ 需自行封装❌ 需大量代码
安装时间5 分钟数小时数周
语音管线(STT+TTS+LLM)✅ 内置❌ 需单独集成❌ 需单独集成
事件推送(无 webhook 方案)✅ Event Mailbox❌ 仅 webhook❌ 需自建
开源许可✅ MIT❌ 专有✅ 你的代码
通话成本$0.10/分钟(按秒计费)$0.014/分钟 + 额外服务费取决于供应商

自托管模式下,你只需支付底层供应商费用(SignalWire + Deepgram + OpenAI),AgentLine 本身完全免费。

注意事项

  1. 需要多个 API Key:即使使用托管版,AgentLine 背后依赖 SignalWire(电话网络)、Deepgram(语音转文字)、Cartesia(文字转语音)、OpenAI(LLM)——每个都需要单独注册和付费。
  2. 仅支持美国号码(目前):SignalWire 主要覆盖北美地区,国际号码支持需要通过提供商扩展。
  3. 自托管有基础设施成本:需要 PostgreSQL + Redis,适合有一定运维能力的团队。
  4. 通话质量依赖网络:自托管模式下的 Hybrid Relay 延迟(转录→LLM→合成)约 2-3 秒,对实时对话可接受但不够低。

总结

AgentLine 解决了一个 AI Agent 社区中长期被忽视的需求——让 Agent 能打电话。它没有试图重新发明电话协议栈,而是在 Twilio/SignalWire 等成熟基础设施之上封装了一层 AI 友好的 API 和 MCP 接口。如果你已经有 AI Agent 运行在你的工作流中,需要它具备电话通知、身份验证或简单的语音交互能力,AgentLine 是目前最简单且开源的选择。

相关链接

发表评论

你的邮箱地址不会被公开,带 * 的为必填项。