promptfoo
✨面向 LLM 应用的本地化评估与红队测试工具,通过声明式 YAML 配置实现 prompt、模型、Agent 及 RAG 管道的系统化评测与安全漏洞扫描。
TypeScriptNode.js大语言模型
面向 LLM 应用的本地化评估与红队测试工具,通过声明式 YAML 配置实现 prompt、模型、Agent 及 RAG 管道的系统化评测与安全漏洞扫描。
开源 LLM 与智能体应用测试平台,支持 AI 驱动的测试生成、对抗性红队测试及 60+ 评估指标,适用于 RAG 幻觉检测与对话一致性验证。
第 1 / 1 页 · 共 2 条
获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。