verl
🧠面向大语言模型的灵活、高效、生产可用的强化学习后训练框架
面向大语言模型的灵活、高效、生产可用的强化学习后训练框架
衡量 AI 模型是否会挑战无意义提示词而非自信回答的基准测试工具,包含 100 道覆盖 5 个领域的无意义问题,采用三级评判体系与多裁判面板机制。
斯坦福出品的本地优先个人 AI 代理框架,通过五大可组合原语实现离线智能体编排、技能导入与 trace 驱动持续学习,支持 10+ 推理后端与四种交互方式。
面向具身智能与智能体 AI 后训练场景的灵活可扩展强化学习训练基础设施,通过 M2Flow 范式实现逻辑工作流构建与高效物理执行解耦。
面向大语言模型的全流程数据准备系统,支持通过可复现的算子流水线进行数据生成、清洗、评估与过滤。
面向大语言模型的强化学习训练环境构建库,提供从开发、测试到规模化 Rollout 采集的完整基础设施,内置丰富的 RLVR 场景与工具调用支持。
面向 Agent、LLM 与传统 ML 模型的开源 AI 工程平台,提供实验追踪、模型注册、LLM 可观测性、评估、提示词优化及统一 API 网关等全生命周期管理能力。
自学习向量数据库,集成图神经网络搜索优化、本地 LLM 推理、Cypher 图查询与 PostgreSQL 向量扩展,支持从 WASM 嵌入式到 Raft 分布式集群的多形态部署。
一款开源的通用多智能体框架,支持通过自然语言构建、评估和训练自主智能体舰队。具备分布式强化学习训练管道,支持网页浏览、操作系统控制等复杂环境交互,在 GAIA、OSWorld、VisualWebArena 等权威基准测试中名列前茅。
哈佛大学出品的机器学习系统工程教材,集成 TinyTorch 框架与边缘设备部署实验,覆盖从 ML 基础到系统优化的完整知识体系。
第 1 / 2 页 · 共 16 条
获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。