verl
🧠面向大语言模型的灵活、高效、生产可用的强化学习后训练框架
面向大语言模型的灵活、高效、生产可用的强化学习后训练框架
全解耦多模态模型推理与服务框架,扩展 vLLM 支持任意到任意模态的统一推理与高性能部署。
NVIDIA 出品的 LLM 全流程开发管线工具集,覆盖合成数据生成、多后端推理、模型训练与 11 大类 benchmark 评测,支持从单 GPU 到万卡 Slurm 集群的弹性扩展。
面向 Apple Silicon 的本地 OpenAI 兼容多模态 API 服务器,支持文本、视觉、音频转录与图像生成/编辑模型的统一部署。
在本地设备集群上运行前沿大模型的分布式推理框架,基于 Apple MLX 与 libp2p,支持自动设备发现、拓扑感知并行与多 API 兼容。
面向大语言模型的强化学习训练环境构建库,提供从开发、测试到规模化 Rollout 采集的完整基础设施,内置丰富的 RLVR 场景与工具调用支持。
即插即用的多目标跟踪(MOT)Python库,提供SORT和ByteTrack等经典算法的模块化实现。采用检测器无关设计,可配合任意目标检测模型(YOLO、DETR等)使用,支持视频文件、摄像头、RTSP流等多种输入源。提供统一CLI工具与Python API,内置CLEAR、HOTA、Identity等标准MOT评估指标计算功能。
哈佛大学出品的机器学习系统工程教材,集成 TinyTorch 框架与边缘设备部署实验,覆盖从 ML 基础到系统优化的完整知识体系。
基于InvisPose研究的生产级WiFi穿墙人体姿态估计系统,利用商用Mesh路由器的CSI信号实现无需摄像头的实时全身追踪,支持多人追踪、跌倒检测等高级分析功能。
清华大学 THUDM 推出的 LLM 强化学习后训练框架,深度融合 Megatron-LM 训练能力与 SGLang 推理引擎,支持大规模 RL Scaling,适用于 GLM、Qwen、DeepSeek、Llama 等大模型的分布式强化学习训练。
第 1 / 4 页 · 共 33 条
获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。