发现 AI 代理的未来

模型与推理框架

17 个项目

npcpy

面向多模态大语言模型、Agentic AI 与知识图谱研究的 Python 函数式原语库,提供统一模型调用、多智能体协作辩论、知识图谱生命周期管理及多模态生成等完整工具链。

模型与推理框架大语言模型多模态

ClawProBench

面向 OpenClaw 运行时的 LLM Agent 评测基准,支持实时执行、确定性评分与多维度能力评估。

模型与推理框架大语言模型AI代理

verl

🧠

面向大语言模型的灵活、高效、生产可用的强化学习后训练框架

其他深度学习多模态

BullshitBench

衡量 AI 模型是否会挑战无意义提示词而非自信回答的基准测试工具,包含 100 道覆盖 5 个领域的无意义问题,采用三级评判体系与多裁判面板机制。

模型与推理框架自然语言处理大语言模型

ARIS — 自主科研睡眠工作流

基于纯 Markdown 技能定义的零依赖自主 ML 科研工作流系统,通过跨模型对抗协作覆盖从创意发现到论文 rebuttal 的完整科研生命周期。

模型与推理框架大语言模型机器学习

PaperFarm

AI Agent 驱动的自动化实验框架,指向任意代码仓库自主分析、设计、运行实验并保留有效改进

模型与推理框架机器学习多智能体系统

agents-radar

AI 生态系统每日自动聚合与摘要生成工具,覆盖 GitHub、HN、ArXiv、HuggingFace 等 10+ 数据源,经 LLM 分析后输出中英双语日报,支持 Issues、Web UI、RSS、MCP Server 等多渠道分发。

模型与推理框架大语言模型MCP

Designing Multi-Agent Systems

教学导向的多智能体系统框架 PicoAgents,配套同名书籍,覆盖从零构建到生产部署的全链路,含 50+ 示例、DAG 工作流引擎、自主编排、Computer Use Agent 与评估框架。

模型与推理框架RAG多智能体系统

models

终端内的 AI 生态全景浏览器,一站式浏览模型、基准、编程代理与提供商状态

模型与推理框架大语言模型Rust

Rankify

由因斯布鲁克大学开发的模块化Python工具包,整合信息检索、重排序与RAG生成功能,内置40+预处理数据集,支持一行代码构建完整RAG管道。

模型与推理框架自然语言处理SDK
每页

第 1 / 2 页 · 共 17 条

保持更新

获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。