自学习向量数据库,集成图神经网络搜索优化、本地 LLM 推理、Cypher 图查询与 PostgreSQL 向量扩展,支持从 WASM 嵌入式到 Raft 分布式集群的多形态部署。
RuVector 是一个以 Rust 为核心构建的高度模块化向量数据库,当前版本 v2.2.2,采用 MIT 许可。其核心差异化在于"自学习"能力——通过 SONA(Self-Optimizing Neural Architecture)引擎与 GNN 搜索学习机制,索引会随每次查询自动优化,形成"查询→响应→反馈→学习信号(<1ms)→GNN 索引更新"的闭环。
向量检索引擎#
- HNSW 索引 + SIMD 加速:兼容 OpenAI / Cohere / 本地 ONNX 嵌入
- 混合搜索(RRF):稀疏 + 稠密向量 Reciprocal Rank Fusion(自述检索提升 20–49%,未经第三方验证)
- Graph RAG:知识图谱 + Leiden 社区检测 + 多跳查询(自述提升 30–60%,未经第三方验证)
- DiskANN / Vamana:SSD 级十亿向量 ANN 搜索(自述 <10ms 延迟)
- ColBERT 多向量:逐 token 延迟交互(MaxSim / AvgSim / SumMax)
- Matryoshka 嵌入:自适应维度漏斗搜索
- OPQ 乘积量化(自述误差降低 10–30%)
- TurboQuant:2–4 bit KV-cache 量化(自述 6–8x 内存节省、<0.5% 质量损失)
- LSM compaction:面向写密集型向量工作负载
图数据库#
- Cypher 引擎:类 Neo4j 语法,支持超边(hyperedges)
- 图变换器:8 个已验证模块,覆盖物理、生物、流形、时序、经济等域
- 双曲 HNSW:Poincaré 球空间层次搜索
自学习系统#
- SONA:LoRA 微调 + EWC++ 记忆保持(自述 <1ms 适应)
- GNN 搜索学习:每次查询训练 GNN 层,索引随使用自动改进
- 跨域迁移学习与夜间自动训练
- 50+ 注意力机制(数量待逐 crate 核实):FlashAttention-3、MLA、Mamba SSM、图注意力、双曲注意力、mincut-gated 等
本地 AI 推理#
- ruvllm:加载 GGUF 模型,后端覆盖 Metal / CUDA / ANE / WebGPU
- 稀疏推理引擎:PowerInfer 风格,仅激活所需神经元
- RuvLTRA 模型:预训练 GGUF(自述路由和嵌入 <10ms)
- Tiny Dancer:基于 FastGRNN 的轻量级 agent 路由
分布式与一致性#
Raft 共识 + 多主复制 + 自动分片;Delta 共识(CRDT + 因果排序)。
认知容器(RVF 格式)#
单 .rvf 文件打包向量 + 模型 + Linux 内核(自述 125ms 启动),WASM 运行时 5.5 KB 支持浏览器内查询,COW 分支、密码学见证链、后量子签名(ML-DSA-65)。
PostgreSQL 扩展#
230+ SQL 函数,drop-in pgvector 替代,SQL 内子线性求解器(PageRank、共轭梯度、拉普拉斯求解器)。
部署形态#
单文件 .rvf → 服务器 / 浏览器(WASM) / 手机 / IoT / 裸金属,后端加速覆盖 Metal / CUDA / ANE / WebGPU / eBPF / FPGA。支持 ESP32-S3 等嵌入式平台。
前沿 / 实验性模块#
基因组学(变异检测、蛋白质翻译、HNSW k-mer 搜索)、量子相干性(ruQu,实际量子关联度待确认)、意识度量(IIT Φ,理论严谨性待确认)、FPGA 变换器、机器人学、神经交易策略等。
安装方式#
curl -fsSL https://raw.githubusercontent.com/ruvnet/ruvector/main/install.sh | bash
npx ruvector
cargo install ruvector-cli
npm install -g ruvector
注意事项#
- 性能基准数据(检索提升、延迟、内存节省等百分比)均来自 README 自述,未见独立第三方基准验证
- 量子相干性、意识度量等模块的实际成熟度和实用性有待独立评估
- 未发现正式发表的同行评审论文
- 关联产品 Cognitum 声称获 CES 2026 创新奖,但 CES 2026 尚未举办,需核实