发现 AI 代理的未来

全部项目

74 个项目

Skyvern

基于视觉 LLM 驱动浏览器自动化的 AI Agent 平台,通过 Playwright 扩展实现自然语言操控网页,支持工作流编排与结构化数据提取。

模型与推理框架多模态AI代理

Second Brain

本地优先的 AI 个人代理操作系统,基于文件智能、事件驱动工作流与 LLM 实现跨模态任务执行与多平台交互。

其他多模态RAG

Peekaboo 🫣

基于 AI 视觉理解的 macOS GUI 自动化工具,通过屏幕截图与多供应商大模型实现元素检测、语义理解与自然语言驱动的界面操作

模型与推理框架多模态MCP

vllm-mlx

🧠

面向 Apple Silicon 的 vLLM 风格推理服务器,基于原生 MLX 后端,单进程同时暴露 OpenAI 与 Anthropic 兼容 API,支持多模态统一服务、Continuous Batching、Paged KV Cache、SSD 分级缓存等生产级特性。

多模态大语言模型Python

Pipecat

面向实时语音与多模态对话 AI Agent 的开源 Python 框架,通过可组合 Pipeline 架构实现端到端语音流式交互。

多模态多智能体系统AI代理

OpenMontage

首个开源 Agent-first 视频制作系统,提供 12 条结构化管线与 52 个生产工具,在 AI 编程助手中以自然语言驱动端到端视频生产。

自然语言处理多模态AI代理

screenpipe

将电脑变为个人 AI,持续记录屏幕与音频,构建可搜索的本地 AI 记忆系统。

文档教程与资源RAG多模态

Rapid-MLX

Apple Silicon 本地 AI 推理引擎,提供 OpenAI 兼容 API,支持多模态、Tool Calling 和智能云端路由。

AI代理大语言模型MCP

CyberVerse

开源数字人智能体平台,通过单张照片创建可实时视频通话的 AI Agent,支持 RAG 知识导入、声音克隆与模块化插件架构。

文档教程与资源多模态RAG

Sparrow

面向生产环境的结构化文档数据提取系统,支持多模态大模型与可插拔工作流编排,可处理发票、银行对账单、金融表格等多种业务文档。

模型与推理框架大语言模型多模态
每页
...

第 1 / 8 页 · 共 74 条

保持更新

获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。