发现 AI 代理的未来

全部项目

13 个项目

Peekaboo 🫣

基于 AI 视觉理解的 macOS GUI 自动化工具,通过屏幕截图与多供应商大模型实现元素检测、语义理解与自然语言驱动的界面操作

模型与推理框架多模态MCP

screenpipe

将电脑变为个人 AI,持续记录屏幕与音频,构建可搜索的本地 AI 记忆系统。

文档教程与资源RAG多模态

Project N.E.K.O.(猫娘计划)

主动式 AI 桌面伙伴平台,具备全模态对话、三层记忆系统、Agent 自动化操控、Live2D/VRM/MMD 多形态 Avatar 及 Steam 创意工坊 UGC 生态。

多模态AI代理Electron

Ghost OS

面向 AI Agent 的 macOS 全桌面操控系统,通过 29 个 MCP 工具实现结构化感知、视觉定位、合成输入与自学习 Recipe 工作流。

文档教程与资源多模态MCP

RCLI

面向 macOS Apple Silicon 的全链路端侧语音 AI 助手,集成 STT、LLM、TTS、VLM、RAG 与系统操作控制,完全离线运行。

模型与推理框架大语言模型多模态

Cherry Studio

跨平台桌面 AI 生产力客户端,统一接入多家 LLM 提供商,支持多模型对比对话、知识库构建、AI 绘图与 MCP 扩展。

其他AI代理多模态

NagaAgent

四服务协同的 AI 桌面助手框架,支持流式工具调用、GRAG 知识图谱记忆、Live2D 虚拟形象、语音交互

RAG多模态AI代理

Rodel Agent

🧠

Rodel Agent是一款Windows桌面应用程序,整合聊天、文本转语音、图像生成和翻译功能。支持主流AI服务和MCP服务器插件,采用AOT编译,为用户提供优秀的桌面AI体验。

智能体与应用工具C#LangChain

My-Neuro: AI个人助手

一个可自定义的AI桌面伴侣项目,支持角色设定、语音对话、长期记忆等功能,响应时间低于1秒,可集成Live2D模型。

智能体与应用工具PythonElectron

ScreenAgent:基于视觉语言大模型的计算机控制代理

一个由视觉语言大模型驱动的计算机控制代理,能够让AI通过观察屏幕截图并输出鼠标键盘操作来与GUI交互,完成多步骤任务。

智能体与应用工具PythonPyTorch
每页

第 1 / 2 页 · 共 13 条

保持更新

获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。