发现 AI 代理的未来

全部项目

2 个项目

BullshitBench

衡量 AI 模型是否会挑战无意义提示词而非自信回答的基准测试工具,包含 100 道覆盖 5 个领域的无意义问题,采用三级评判体系与多裁判面板机制。

Python大语言模型CLI

Local Deep Research

🧠

可本地运行的 AI 深度研究助手,支持多 LLM、20+ 研究策略、多搜索引擎与 212K+ 学术来源自动评分,生成带引用的 PDF/Markdown 研究报告,提供 CLI、Web、REST API 及 MCP Server 多种交互方式。

Python知识库FastAPI
每页

第 1 / 1 页 · 共 2 条

保持更新

获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。