面向 AI Agent 管道的持久化共享记忆后端服务,提供 REST API、MCP 协议与知识图谱,支持混合搜索、自主记忆整合与多 Agent 协作,完全自托管、零云成本。
核心能力#
- 持久化语义记忆:跨会话持久存储 AI 上下文,基于语义搜索实现约 5ms 的快速上下文检索
- 混合搜索:BM25 + 向量语义搜索(Hybrid Search)
- 本地嵌入:使用 ONNX Runtime + sentence-transformers(MiniLM-L6-v2)在本地生成嵌入,数据不出基础设施
- 自主记忆整合:自动压缩旧记忆,基于衰减机制管理记忆生命周期
- 知识图谱:带类型化边(causes、fixes、contradicts 等)的知识图谱,Agent 可共享因果链而不仅是事实
- SHODH 生态兼容:兼容 SHODH Unified Memory API Specification v1.0.0,支持情感元数据、情景记忆、来源追踪
协议与接口#
- MCP 协议:原生支持 Model Context Protocol,同时支持 Remote MCP(Streamable HTTP),可直接连接 claude.ai 浏览器版
- REST API:15 个 REST 端点,任何 HTTP 客户端均可调用,无需 MCP 客户端库
- SSE 事件推送:实时通知任何 Agent 存储或删除记忆的事件
多 Agent 协作与安全#
- 通过
X-Agent-ID头自动标记记忆来源,支持按 Agent 身份进行范围检索 - 标签系统可用作 Agent 间通信总线(如
msg:cluster) - OAuth 2.0 + DCR(动态客户端注册),企业级认证
数据导入与可视化#
- 支持 PDF 等文档的自动分块和向量化导入(pypdf)
- 内置 Web Dashboard:语义搜索、标签浏览器、文档导入、分析、质量评分和 API 文档
存储后端#
- 默认 SQLite-vec(推荐,轻量级零配置)
- 可选 Milvus / Milvus Lite / Zilliz Cloud
典型场景#
- AI 编程助手持久记忆(Claude Desktop / Cursor / VS Code 等跨会话上下文持久化)
- 多 Agent 管道共享状态(LangGraph / CrewAI / AutoGen 等框架)
- Agent 间通信总线
- 自托管企业部署(Docker + Cloudflare Tunnel + OAuth 2.0)
- 零云成本 RAG 系统与文档知识库
客户端兼容性#
Claude Desktop、Claude Code、Claude.ai(浏览器)、VS Code、Cursor、Windsurf、ChatGPT(Developer Mode)、Gemini CLI、OpenCode、Goose、Aider、GitHub Copilot CLI 等 14+ 客户端。
快速开始#
pip install mcp-memory-service
MCP_ALLOW_ANONYMOUS_ACCESS=true memory server --http
# 服务运行于 http://localhost:8000
可选安装:
pip install mcp-memory-service[sqlite]— SQLite-vec + ONNX 嵌入(推荐)pip install mcp-memory-service[milvus]— Milvus 后端pip install mcp-memory-service[full]— 全部依赖
架构要点#
- Web 服务层:FastAPI + Uvicorn + SSE-Starlette
- MCP 协议层:基于
mcp>=1.8.0,<2.0.0SDK - 存储与检索层:SQLite-vec(aiosqlite)或 Milvus,BM25 + 向量混合检索
- 嵌入计算层:sentence-transformers MiniLM-L6-v2 + ONNX Runtime
- 记忆生命周期:独立 consolidation 模块 + APScheduler 调度
- 服务发现:zeroconf(mDNS / Bonjour)
- 安全认证:Authlib + PyJWT + cryptography
待确认信息#
- 独立官网/文档站:README 未提供,文档可能在 GitHub Wiki 或
docs/目录中 - SHODH 规范原文链接未在 README 中提供
- ChatGPT Developer Mode MCP 支持为第三方平台功能,需验证当前可用性
- LongMemEval 基准数据未独立验证
当前版本 10.48.0,作者 Heinrich Krupp,Apache-2.0 许可,截至 2025 年 7 月已累计 2,551+ commits,成熟度为 Production/Stable。