2026年6月29日 1 分钟阅读

同时用 Claude Code、Codex 和 Cursor?Workweave Router 自动帮你选最优模型

tinyash 0 条评论

场景:多工具、多模型的认知过载

想象一下你的日常开发流程:上午用 Claude Code 写架构文档,需要 Sonnet 的深度推理;下午切到 Codex 快速重构代码,GPT-4o Mini 就够了;晚上用 Cursor 做前端调试,Gemini 的视觉能力更好。

每个工具绑定不同模型,你要记住哪个模型适合什么任务。更麻烦的是——同一个工具内,简单代码补全和复杂架构分析需要的模型也完全不同。手动换来换去,不仅打断思维流,还白白浪费 API 预算。

这就是 模型路由(Model Routing) 要解决的问题:让一个智能代理自动判断每个请求该由哪个模型处理,开发者只管写代码。

Workweave Router 是什么

Workweave Router 是一个 ELv2 许可的本地模型路由代理。它运行在你的开发机上,作为一个本地代理(localhost:8080),拦截 Claude Code、Codex、Cursor 和 opencode 的 API 请求,然后根据请求的具体内容自动选择最合适的模型。

它的核心是 Avengers-Pro 路由算法——一个基于嵌入向量的集群评分器。简单说,它不是靠「感觉」选模型,而是把每个请求映射到高维向量空间,与模型的能力特征做匹配,选出最佳组合。

关键特性:

  • 每请求路由:不是简单分发,而是根据每个请求的内容特征选择模型
  • 多协议支持:同时理解 Anthropic Messages API、OpenAI Chat Completions 和 Gemini 原生格式
  • BYOK 架构:你的 API 密钥留在本地加密存储,路由器只做转发决策
  • 可观测性:内置 OTLP 追踪,可通过本地仪表盘查看路由决策
  • 快速开关:随时打开/关闭路由,不影响现有配置

30 秒快速体验

Workweave Router 的安装出奇简单。如果你只想用托管版本(不需要本地部署 Postgres),一条命令就够了:

npx @workweave/router

这个命令会自动检测你已安装的 AI 编码工具(Claude Code、Codex、opencode),引导你选择作用范围(用户级或项目级),然后自动配置好路由。你也可以指定目标工具:

npx @workweave/router --claude              # 只配 Claude Code
npx @workweave/router --codex               # 只配 Codex
npx @workweave/router --opencode            # 只配 opencode
npx @workweave/router --scope project       # 项目级配置,团队共享

如果你倾向完全自托管,流程也很直接:

echo "OPENROUTER_API_KEY=你的密钥" >> .env.local

make full-setup

完成后路由器运行在 http://localhost:8080,仪表盘在 http://localhost:8080/ui/

实际使用场景

场景一:复杂架构分析 → 深度推理模型

用 Claude Code 分析大型代码库的架构依赖时,需要 Sonnet 级别的推理能力;但同样的工具在执行简单文件操作时,用更便宜的 Mini 模型就足够。Workweave Router 会自动区分这两种请求,不会在简单任务上浪费昂贵模型。

场景二:多工具统一入口

团队中有人用 Claude Code、有人用 Codex、有人用 Cursor——但公司只想对接一个模型提供商?路由器可以统一所有工具的入口,后端只维护一组模型池和密钥。路由决策在本地完成,延迟增加不到 50ms。

场景三:预算控制与模型实验

想测试新模型的效果,又不想修改每个工具的配置?路由器提供一个 /v1/route 端点,返回路由决策但不转发请求,方便做 A/B 测试和成本分析。仪表盘上的 OTLP 追踪数据可以清楚看到每个模型的使用量和路由分布。

路由 API 速查

Workweave Router 兼容主流的 API 格式,替换起来没有学习成本:

curl http://localhost:8080/v1/messages \
  -H "Authorization: Bearer rk_你的路由器密钥" \
  -d '{"model":"claude-sonnet-4-5","max_tokens":256,
       "messages":[{"role":"user","content":"分析这段代码的性能瓶颈"}]}'

curl http://localhost:8080/v1/chat/completions \
  -H "Authorization: Bearer rk_你的路由器密钥" \
  -d '{"model":"gpt-4o-mini",
       "messages":[{"role":"user","content":"重写这个函数"}]}'

curl http://localhost:8080/v1/route \
  -H "Authorization: Bearer rk_你的路由器密钥" \
  -d '{"prompt":"为这个 React 组件写测试"}'

两个密钥,不要搞混

Workweave Router 使用两套密钥体系:

密钥用途示例
sk-or-... / sk-ant-... / sk-...上游提供商密钥,存在 .env.localAnthropic、OpenAI、OpenRouter
rk_...路由器密钥,客户端发送的 Bearer Token由路由器自动生成

与同类对比

和 LangChain 等框架的路由方案不同,Workweave Router 是「零侵入式」的——不需要改代码,不需要引入 SDK,直接作为代理层接入。它特别适合已经有多个 AI 编码工具在用的开发者,只想加一层智能路由而不想重构现有工作流。

另一个优势是 Claude Code 原生集成:安装后,你可以在 Claude Code 中用 /router-on/router-off/router-status 三个斜杠命令动态切换路由状态,不用退出编辑器。

写在最后

在 AI 编码工具遍地开花的今天,模型选择已经成为开发效率的一个隐形瓶颈。Workweave Router 用一个本地代理解决了这个「选择疲劳」问题——让每个请求自动匹配最优模型,开发者只需要专心写代码。

对于已经在使用 Claude Code、Codex 或 Cursor 的开发者来说,花两分钟安装路由器,可能就是你效率提升最快的一笔投入。

相关链接

发表评论

你的邮箱地址不会被公开,带 * 的为必填项。