发现 AI 代理的未来

UncommonRoute

收录于 2026年5月7日
智能体与应用工具
开源
Python大语言模型AI代理CLI智能体与应用工具模型与推理框架模型训练/推理协议/API/集成

自动为每个 LLM 请求路由到最便宜但仍能胜任的模型的本地代理服务

UncommonRoute 是一个完全本地运行的 LLM 模型路由代理,核心目标是在不牺牲任务完成率的前提下大幅降低 LLM 调用成本。它以每个请求/每个 agent step 为粒度进行独立路由决策,通过 Metadata、Embedding(基于 BGE)、Structural 三路信号的集成投票机制,自动将请求分配到 economy / balanced / premium 三个层级中最便宜且满足能力的模型。

智能路由引擎

  • 多信号集成投票:Metadata(<1ms)、Embedding(~25–35ms CPU warm)、Structural(<1ms)三路信号融合决策
  • Embedding 分类器:基于 BGE 训练,对用户请求、近期 agent 状态和元数据进行嵌入分类,不确定时 KNN 回退
  • 三种路由模式:auto(平衡性价比)、fast(成本优先)、best(质量优先)
  • 自适应学习:本地反馈调整信号权重;高置信一致时扩展嵌入索引,低置信预测升级而非静默降级

代理与兼容

  • Drop-in OpenAI 代理:兼容 /v1/chat/completions,可直接替换 OPENAI_BASE_URL
  • Drop-in Anthropic 代理:兼容 Anthropic API,可直接替换 ANTHROPIC_BASE_URL
  • 已验证客户端:Claude Code、Codex、Cursor、OpenAI SDK、OpenClaw(插件方式,待确认)

运维与治理

  • 支出限制:按日设定消费上限(uncommon-route spend set daily 20.00
  • 实时仪表盘:http://localhost:8403/dashboard/,含监控、playground、成本追踪、路由配置
  • 诊断支持包:uncommon-route support bundle 导出日志/追踪/配置快照
  • 隐私优先:数据默认不离开本机,遥测可选开启

上游提供商:支持 8 家上游提供商(commonstack、openai、anthropic、google、xai、minimax、moonshot、deepseek),连接路径支持 Commonstack 托管、本地/自定义上游、或 BYOK。

基准表现(CommonRouterBench,970 条真实 agent 任务轨迹,held-out 196 条):

指标
Task pass rate91.8%
Tier match accuracy74.0%
Cost-savings score81.9
Overall score76.7
Warm routing overheadp50 25.6ms / p90 32.1ms (CPU)

快速开始

pipx install uncommon-route
uncommon-route init
uncommon-route doctor
uncommon-route serve

客户端配置示例:

  • Claude Code: export ANTHROPIC_BASE_URL="http://localhost:8403"
  • Codex / Cursor / OpenAI SDK: export OPENAI_BASE_URL="http://localhost:8403/v1"

架构要点

  • 核心包 uncommon_route/(Python 89%),前端仪表盘 frontend/(TypeScript 8.7%)
  • 路由流程:请求到达 → 并行提取三路信号 → 集成投票决定层级 → 按模式选最便宜模型 → 转发至上游 → 收集反馈调整权重
  • v1 在真实多轮 agent 对话中准确率仅 43%,v2 从零重建提升至 74% tier match accuracy
  • 包管理:pyproject.toml + uv.lock,支持 Docker 容器化部署

待确认信息:Commonstack AI 团队背景无详细公开资料;嵌入模型具体 BGE 版本未明确;"Commonstack" 托管上游定价与条款未公开;Dashboard 界面无截图验证;OpenClaw 集成细节待验证。

保持更新

获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。