同时用 Claude Code、Codex 和 Cursor?Workweave Router 自动帮你选最优模型
场景:多工具、多模型的认知过载
想象一下你的日常开发流程:上午用 Claude Code 写架构文档,需要 Sonnet 的深度推理;下午切到 Codex 快速重构代码,GPT-4o Mini 就够了;晚上用 Cursor 做前端调试,Gemini 的视觉能力更好。
每个工具绑定不同模型,你要记住哪个模型适合什么任务。更麻烦的是——同一个工具内,简单代码补全和复杂架构分析需要的模型也完全不同。手动换来换去,不仅打断思维流,还白白浪费 API 预算。
这就是 模型路由(Model Routing) 要解决的问题:让一个智能代理自动判断每个请求该由哪个模型处理,开发者只管写代码。
Workweave Router 是什么
Workweave Router 是一个 ELv2 许可的本地模型路由代理。它运行在你的开发机上,作为一个本地代理(localhost:8080),拦截 Claude Code、Codex、Cursor 和 opencode 的 API 请求,然后根据请求的具体内容自动选择最合适的模型。
它的核心是 Avengers-Pro 路由算法——一个基于嵌入向量的集群评分器。简单说,它不是靠「感觉」选模型,而是把每个请求映射到高维向量空间,与模型的能力特征做匹配,选出最佳组合。
关键特性:
- 每请求路由:不是简单分发,而是根据每个请求的内容特征选择模型
- 多协议支持:同时理解 Anthropic Messages API、OpenAI Chat Completions 和 Gemini 原生格式
- BYOK 架构:你的 API 密钥留在本地加密存储,路由器只做转发决策
- 可观测性:内置 OTLP 追踪,可通过本地仪表盘查看路由决策
- 快速开关:随时打开/关闭路由,不影响现有配置
30 秒快速体验
Workweave Router 的安装出奇简单。如果你只想用托管版本(不需要本地部署 Postgres),一条命令就够了:
npx @workweave/router
这个命令会自动检测你已安装的 AI 编码工具(Claude Code、Codex、opencode),引导你选择作用范围(用户级或项目级),然后自动配置好路由。你也可以指定目标工具:
npx @workweave/router --claude # 只配 Claude Code npx @workweave/router --codex # 只配 Codex npx @workweave/router --opencode # 只配 opencode npx @workweave/router --scope project # 项目级配置,团队共享
如果你倾向完全自托管,流程也很直接:
echo "OPENROUTER_API_KEY=你的密钥" >> .env.local make full-setup
完成后路由器运行在 http://localhost:8080,仪表盘在 http://localhost:8080/ui/。
实际使用场景
场景一:复杂架构分析 → 深度推理模型
用 Claude Code 分析大型代码库的架构依赖时,需要 Sonnet 级别的推理能力;但同样的工具在执行简单文件操作时,用更便宜的 Mini 模型就足够。Workweave Router 会自动区分这两种请求,不会在简单任务上浪费昂贵模型。
场景二:多工具统一入口
团队中有人用 Claude Code、有人用 Codex、有人用 Cursor——但公司只想对接一个模型提供商?路由器可以统一所有工具的入口,后端只维护一组模型池和密钥。路由决策在本地完成,延迟增加不到 50ms。
场景三:预算控制与模型实验
想测试新模型的效果,又不想修改每个工具的配置?路由器提供一个 /v1/route 端点,返回路由决策但不转发请求,方便做 A/B 测试和成本分析。仪表盘上的 OTLP 追踪数据可以清楚看到每个模型的使用量和路由分布。
路由 API 速查
Workweave Router 兼容主流的 API 格式,替换起来没有学习成本:
curl http://localhost:8080/v1/messages \
-H "Authorization: Bearer rk_你的路由器密钥" \
-d '{"model":"claude-sonnet-4-5","max_tokens":256,
"messages":[{"role":"user","content":"分析这段代码的性能瓶颈"}]}'
curl http://localhost:8080/v1/chat/completions \
-H "Authorization: Bearer rk_你的路由器密钥" \
-d '{"model":"gpt-4o-mini",
"messages":[{"role":"user","content":"重写这个函数"}]}'
curl http://localhost:8080/v1/route \
-H "Authorization: Bearer rk_你的路由器密钥" \
-d '{"prompt":"为这个 React 组件写测试"}'
两个密钥,不要搞混
Workweave Router 使用两套密钥体系:
| 密钥 | 用途 | 示例 |
|---|---|---|
sk-or-... / sk-ant-... / sk-... | 上游提供商密钥,存在 .env.local 中 | Anthropic、OpenAI、OpenRouter |
rk_... | 路由器密钥,客户端发送的 Bearer Token | 由路由器自动生成 |
与同类对比
和 LangChain 等框架的路由方案不同,Workweave Router 是「零侵入式」的——不需要改代码,不需要引入 SDK,直接作为代理层接入。它特别适合已经有多个 AI 编码工具在用的开发者,只想加一层智能路由而不想重构现有工作流。
另一个优势是 Claude Code 原生集成:安装后,你可以在 Claude Code 中用 /router-on、/router-off、/router-status 三个斜杠命令动态切换路由状态,不用退出编辑器。
写在最后
在 AI 编码工具遍地开花的今天,模型选择已经成为开发效率的一个隐形瓶颈。Workweave Router 用一个本地代理解决了这个「选择疲劳」问题——让每个请求自动匹配最优模型,开发者只需要专心写代码。
对于已经在使用 Claude Code、Codex 或 Cursor 的开发者来说,花两分钟安装路由器,可能就是你效率提升最快的一笔投入。
相关链接