自动为每个 LLM 请求路由到最便宜但仍能胜任的模型的本地代理服务
UncommonRoute 是一个完全本地运行的 LLM 模型路由代理,核心目标是在不牺牲任务完成率的前提下大幅降低 LLM 调用成本。它以每个请求/每个 agent step 为粒度进行独立路由决策,通过 Metadata、Embedding(基于 BGE)、Structural 三路信号的集成投票机制,自动将请求分配到 economy / balanced / premium 三个层级中最便宜且满足能力的模型。
智能路由引擎
- 多信号集成投票:Metadata(<1ms)、Embedding(~25–35ms CPU warm)、Structural(<1ms)三路信号融合决策
- Embedding 分类器:基于 BGE 训练,对用户请求、近期 agent 状态和元数据进行嵌入分类,不确定时 KNN 回退
- 三种路由模式:
auto(平衡性价比)、fast(成本优先)、best(质量优先) - 自适应学习:本地反馈调整信号权重;高置信一致时扩展嵌入索引,低置信预测升级而非静默降级
代理与兼容
- Drop-in OpenAI 代理:兼容
/v1/chat/completions,可直接替换OPENAI_BASE_URL - Drop-in Anthropic 代理:兼容 Anthropic API,可直接替换
ANTHROPIC_BASE_URL - 已验证客户端:Claude Code、Codex、Cursor、OpenAI SDK、OpenClaw(插件方式,待确认)
运维与治理
- 支出限制:按日设定消费上限(
uncommon-route spend set daily 20.00) - 实时仪表盘:
http://localhost:8403/dashboard/,含监控、playground、成本追踪、路由配置 - 诊断支持包:
uncommon-route support bundle导出日志/追踪/配置快照 - 隐私优先:数据默认不离开本机,遥测可选开启
上游提供商:支持 8 家上游提供商(commonstack、openai、anthropic、google、xai、minimax、moonshot、deepseek),连接路径支持 Commonstack 托管、本地/自定义上游、或 BYOK。
基准表现(CommonRouterBench,970 条真实 agent 任务轨迹,held-out 196 条):
| 指标 | 值 |
|---|---|
| Task pass rate | 91.8% |
| Tier match accuracy | 74.0% |
| Cost-savings score | 81.9 |
| Overall score | 76.7 |
| Warm routing overhead | p50 25.6ms / p90 32.1ms (CPU) |
快速开始
pipx install uncommon-route
uncommon-route init
uncommon-route doctor
uncommon-route serve
客户端配置示例:
- Claude Code:
export ANTHROPIC_BASE_URL="http://localhost:8403" - Codex / Cursor / OpenAI SDK:
export OPENAI_BASE_URL="http://localhost:8403/v1"
架构要点
- 核心包
uncommon_route/(Python 89%),前端仪表盘frontend/(TypeScript 8.7%) - 路由流程:请求到达 → 并行提取三路信号 → 集成投票决定层级 → 按模式选最便宜模型 → 转发至上游 → 收集反馈调整权重
- v1 在真实多轮 agent 对话中准确率仅 43%,v2 从零重建提升至 74% tier match accuracy
- 包管理:
pyproject.toml+uv.lock,支持 Docker 容器化部署
待确认信息:Commonstack AI 团队背景无详细公开资料;嵌入模型具体 BGE 版本未明确;"Commonstack" 托管上游定价与条款未公开;Dashboard 界面无截图验证;OpenClaw 集成细节待验证。