开源 AI Agent 可观测性与工程平台,提供自动故障聚类、人机对齐评估与 CI 级别模拟测试。
Latitude 是一个专为 AI Agent 和大语言模型设计的可观测性与工程平台。其核心基于 Span → Trace → Session 三级追踪模型,能够完整捕获多轮会话与工具调用路径。
在故障诊断方面,平台无需配置正则或规则,即可自动将失败的 trace 聚类为可追踪的 Issue,精准识别幻觉、上下文丢失等 Agent 特有故障模式。在质量保障方面,Latitude 提供了标准化的 0-1 评分系统,支持从人工标注自动生成评估脚本,并持续追踪机器评估与人工判断的漂移情况。生成的评估脚本可直接用于本地或 CI/CD 流水线中的模拟测试,防止回归问题到达生产环境。
项目底层采用 DDD 分层架构的 Monorepo 设计,数据层结合 PostgreSQL(OLTP)、ClickHouse(OLAP)与 Weaviate(向量检索)处理不同维度的负载。接入方式灵活,支持 TypeScript、Python 原生 SDK 以及标准的 OpenTelemetry 协议,并与 OpenAI、Anthropic、Vercel AI SDK、LangChain 及 Claude Code 等主流工具链实现了深度集成。
注意:当前 GitHub
main分支为 Latitude v2 Alpha,API 和数据格式可能变动,生产环境推荐使用latitude-v1分支。