Agent Park - Agent 项目导航

模型与推理框架

17 个项目

npcpy

✨

面向多模态大语言模型、Agentic AI 与知识图谱研究的 Python 函数式原语库，提供统一模型调用、多智能体协作辩论、知识图谱生命周期管理及多模态生成等完整工具链。

模型与推理框架大语言模型多模态

查看详情 →

ClawProBench

✨

面向 OpenClaw 运行时的 LLM Agent 评测基准，支持实时执行、确定性评分与多维度能力评估。

模型与推理框架大语言模型AI代理

查看详情 →

verl

🧠

面向大语言模型的灵活、高效、生产可用的强化学习后训练框架

其他深度学习多模态

查看详情 →

BullshitBench

✨

衡量 AI 模型是否会挑战无意义提示词而非自信回答的基准测试工具，包含 100 道覆盖 5 个领域的无意义问题，采用三级评判体系与多裁判面板机制。

模型与推理框架自然语言处理大语言模型

查看详情 →

ARIS — 自主科研睡眠工作流

✨

基于纯 Markdown 技能定义的零依赖自主 ML 科研工作流系统，通过跨模型对抗协作覆盖从创意发现到论文 rebuttal 的完整科研生命周期。

模型与推理框架大语言模型机器学习

查看详情 →

PaperFarm

✨

AI Agent 驱动的自动化实验框架，指向任意代码仓库自主分析、设计、运行实验并保留有效改进

模型与推理框架机器学习多智能体系统

查看详情 →

agents-radar

✨

AI 生态系统每日自动聚合与摘要生成工具，覆盖 GitHub、HN、ArXiv、HuggingFace 等 10+ 数据源，经 LLM 分析后输出中英双语日报，支持 Issues、Web UI、RSS、MCP Server 等多渠道分发。

模型与推理框架大语言模型MCP

查看详情 →

Designing Multi-Agent Systems

✨

教学导向的多智能体系统框架 PicoAgents，配套同名书籍，覆盖从零构建到生产部署的全链路，含 50+ 示例、DAG 工作流引擎、自主编排、Computer Use Agent 与评估框架。

模型与推理框架RAG多智能体系统

查看详情 →

models

✨

终端内的 AI 生态全景浏览器，一站式浏览模型、基准、编程代理与提供商状态

模型与推理框架大语言模型Rust

查看详情 →

Rankify

✨

由因斯布鲁克大学开发的模块化Python工具包，整合信息检索、重排序与RAG生成功能，内置40+预处理数据集，支持一行代码构建完整RAG管道。

模型与推理框架自然语言处理SDK

查看详情 →

每页

第 1 / 2 页 · 共 17 条

按分类筛选

固定项目分类

按领域筛选

按产品形态筛选

模型与推理框架

npcpy

ClawProBench

verl

BullshitBench

ARIS — 自主科研睡眠工作流

PaperFarm

agents-radar

Designing Multi-Agent Systems

models

Rankify

保持更新