发现 AI 代理的未来

全部项目

21 个项目

EvoScientist

自进化多智能体 AI 科学家框架,实现从研究想法到论文产出的端到端科学发现自动化。

MCP多智能体系统AI代理

npcpy

面向多模态大语言模型、Agentic AI 与知识图谱研究的 Python 函数式原语库,提供统一模型调用、多智能体协作辩论、知识图谱生命周期管理及多模态生成等完整工具链。

模型与推理框架大语言模型多模态

ClawProBench

面向 OpenClaw 运行时的 LLM Agent 评测基准,支持实时执行、确定性评分与多维度能力评估。

模型与推理框架大语言模型AI代理

verl

🧠

面向大语言模型的灵活、高效、生产可用的强化学习后训练框架

其他深度学习多模态

BullshitBench

衡量 AI 模型是否会挑战无意义提示词而非自信回答的基准测试工具,包含 100 道覆盖 5 个领域的无意义问题,采用三级评判体系与多裁判面板机制。

模型与推理框架自然语言处理大语言模型

ARIS — 自主科研睡眠工作流

基于纯 Markdown 技能定义的零依赖自主 ML 科研工作流系统,通过跨模型对抗协作覆盖从创意发现到论文 rebuttal 的完整科研生命周期。

模型与推理框架大语言模型机器学习

PaperFarm

AI Agent 驱动的自动化实验框架,指向任意代码仓库自主分析、设计、运行实验并保留有效改进

模型与推理框架机器学习多智能体系统

Local Deep Research

🧠

可本地运行的 AI 深度研究助手,支持多 LLM、20+ 研究策略、多搜索引擎与 212K+ 学术来源自动评分,生成带引用的 PDF/Markdown 研究报告,提供 CLI、Web、REST API 及 MCP Server 多种交互方式。

其他RAGMCP

models

终端内的 AI 生态全景浏览器,一站式浏览模型、基准、编程代理与提供商状态

模型与推理框架大语言模型Rust

last30days-skill

AI agent 驱动的近 30 天多平台聚合搜索引擎,以社交互动量排序,覆盖 Reddit、X、YouTube、HN、Polymarket 等 15+ 数据源。

AI代理PythonCLI
每页

第 1 / 3 页 · 共 21 条

保持更新

获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。