Agent Park - Agent 项目导航

全部项目

21 个项目

EvoScientist

✨

自进化多智能体 AI 科学家框架，实现从研究想法到论文产出的端到端科学发现自动化。

MCP多智能体系统AI代理

查看详情 →

npcpy

✨

面向多模态大语言模型、Agentic AI 与知识图谱研究的 Python 函数式原语库，提供统一模型调用、多智能体协作辩论、知识图谱生命周期管理及多模态生成等完整工具链。

模型与推理框架大语言模型多模态

查看详情 →

ClawProBench

✨

面向 OpenClaw 运行时的 LLM Agent 评测基准，支持实时执行、确定性评分与多维度能力评估。

模型与推理框架大语言模型AI代理

查看详情 →

verl

🧠

面向大语言模型的灵活、高效、生产可用的强化学习后训练框架

其他深度学习多模态

查看详情 →

BullshitBench

✨

衡量 AI 模型是否会挑战无意义提示词而非自信回答的基准测试工具，包含 100 道覆盖 5 个领域的无意义问题，采用三级评判体系与多裁判面板机制。

模型与推理框架自然语言处理大语言模型

查看详情 →

ARIS — 自主科研睡眠工作流

✨

基于纯 Markdown 技能定义的零依赖自主 ML 科研工作流系统，通过跨模型对抗协作覆盖从创意发现到论文 rebuttal 的完整科研生命周期。

模型与推理框架大语言模型机器学习

查看详情 →

PaperFarm

✨

AI Agent 驱动的自动化实验框架，指向任意代码仓库自主分析、设计、运行实验并保留有效改进

模型与推理框架机器学习多智能体系统

查看详情 →

Local Deep Research

🧠

可本地运行的 AI 深度研究助手，支持多 LLM、20+ 研究策略、多搜索引擎与 212K+ 学术来源自动评分，生成带引用的 PDF/Markdown 研究报告，提供 CLI、Web、REST API 及 MCP Server 多种交互方式。

其他RAGMCP

查看详情 →

models

✨

终端内的 AI 生态全景浏览器，一站式浏览模型、基准、编程代理与提供商状态

模型与推理框架大语言模型Rust

查看详情 →

last30days-skill

✨

AI agent 驱动的近 30 天多平台聚合搜索引擎，以社交互动量排序，覆盖 Reddit、X、YouTube、HN、Polymarket 等 15+ 数据源。

AI代理PythonCLI

查看详情 →

每页

第 1 / 3 页 · 共 21 条

按分类筛选

固定项目分类

按领域筛选

按产品形态筛选

全部项目

EvoScientist

npcpy

ClawProBench

verl

BullshitBench

ARIS — 自主科研睡眠工作流

PaperFarm

Local Deep Research

models

last30days-skill

保持更新