UncommonRoute

自动为每个 LLM 请求路由到最便宜但仍能胜任的模型的本地代理服务

UncommonRoute 是一个完全本地运行的 LLM 模型路由代理，核心目标是在不牺牲任务完成率的前提下大幅降低 LLM 调用成本。它以每个请求/每个 agent step 为粒度进行独立路由决策，通过 Metadata、Embedding（基于 BGE）、Structural 三路信号的集成投票机制，自动将请求分配到 economy / balanced / premium 三个层级中最便宜且满足能力的模型。

智能路由引擎

多信号集成投票：Metadata（<1ms）、Embedding（~25–35ms CPU warm）、Structural（<1ms）三路信号融合决策
Embedding 分类器：基于 BGE 训练，对用户请求、近期 agent 状态和元数据进行嵌入分类，不确定时 KNN 回退
三种路由模式：auto（平衡性价比）、fast（成本优先）、best（质量优先）
自适应学习：本地反馈调整信号权重；高置信一致时扩展嵌入索引，低置信预测升级而非静默降级

代理与兼容

Drop-in OpenAI 代理：兼容 /v1/chat/completions，可直接替换 OPENAI_BASE_URL
Drop-in Anthropic 代理：兼容 Anthropic API，可直接替换 ANTHROPIC_BASE_URL
已验证客户端：Claude Code、Codex、Cursor、OpenAI SDK、OpenClaw（插件方式，待确认）

运维与治理

支出限制：按日设定消费上限（uncommon-route spend set daily 20.00）
实时仪表盘：http://localhost:8403/dashboard/，含监控、playground、成本追踪、路由配置
诊断支持包：uncommon-route support bundle 导出日志/追踪/配置快照
隐私优先：数据默认不离开本机，遥测可选开启

上游提供商：支持 8 家上游提供商（commonstack、openai、anthropic、google、xai、minimax、moonshot、deepseek），连接路径支持 Commonstack 托管、本地/自定义上游、或 BYOK。

基准表现（CommonRouterBench，970 条真实 agent 任务轨迹，held-out 196 条）：

指标	值
Task pass rate	91.8%
Tier match accuracy	74.0%
Cost-savings score	81.9
Overall score	76.7
Warm routing overhead	p50 25.6ms / p90 32.1ms (CPU)

快速开始

pipx install uncommon-route
uncommon-route init
uncommon-route doctor
uncommon-route serve

客户端配置示例：

Claude Code: export ANTHROPIC_BASE_URL="http://localhost:8403"
Codex / Cursor / OpenAI SDK: export OPENAI_BASE_URL="http://localhost:8403/v1"

架构要点

核心包 uncommon_route/（Python 89%），前端仪表盘 frontend/（TypeScript 8.7%）
路由流程：请求到达 → 并行提取三路信号 → 集成投票决定层级 → 按模式选最便宜模型 → 转发至上游 → 收集反馈调整权重
v1 在真实多轮 agent 对话中准确率仅 43%，v2 从零重建提升至 74% tier match accuracy
包管理：pyproject.toml + uv.lock，支持 Docker 容器化部署

待确认信息：Commonstack AI 团队背景无详细公开资料；嵌入模型具体 BGE 版本未明确；"Commonstack" 托管上游定价与条款未公开；Dashboard 界面无截图验证；OpenClaw 集成细节待验证。

相关项目

Genkit

Gobii Platform

Semble

保持更新