发现 AI 代理的未来

全部项目

7 个项目

Peekaboo 🫣

基于 AI 视觉理解的 macOS GUI 自动化工具,通过屏幕截图与多供应商大模型实现元素检测、语义理解与自然语言驱动的界面操作

模型与推理框架多模态MCP

Project N.E.K.O.(猫娘计划)

主动式 AI 桌面伙伴平台,具备全模态对话、三层记忆系统、Agent 自动化操控、Live2D/VRM/MMD 多形态 Avatar 及 Steam 创意工坊 UGC 生态。

多模态AI代理Electron

Ghost OS

面向 AI Agent 的 macOS 全桌面操控系统,通过 29 个 MCP 工具实现结构化感知、视觉定位、合成输入与自学习 Recipe 工作流。

文档教程与资源多模态MCP

RCLI

面向 macOS Apple Silicon 的全链路端侧语音 AI 助手,集成 STT、LLM、TTS、VLM、RAG 与系统操作控制,完全离线运行。

模型与推理框架大语言模型多模态

ScreenAgent:基于视觉语言大模型的计算机控制代理

一个由视觉语言大模型驱动的计算机控制代理,能够让AI通过观察屏幕截图并输出鼠标键盘操作来与GUI交互,完成多步骤任务。

智能体与应用工具PythonPyTorch

autoMate - AI驱动的本地自动化助手

一款基于自然语言驱动的AI本地自动化工具,能够像人类一样理解屏幕内容并自主操作计算机,无需编程知识即可实现复杂自动化流程。

智能体与应用工具PythonAI代理

UI-TARS:开源多模态 AI 智能体框架

由字节跳动开发的开源多模态 AI 智能体(Agent)堆栈,包含通用智能体框架 Agent TARS 和桌面客户端 UI-TARS Desktop,通过视觉语言模型实现基于自然语言的计算机控制、浏览器自动化及 CLI 交互。

智能体与应用工具TypeScriptNode.js
每页

第 1 / 1 页 · 共 7 条

保持更新

获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。