Peekaboo 🫣
✨基于 AI 视觉理解的 macOS GUI 自动化工具,通过屏幕截图与多供应商大模型实现元素检测、语义理解与自然语言驱动的界面操作
模型与推理框架多模态MCP
基于 AI 视觉理解的 macOS GUI 自动化工具,通过屏幕截图与多供应商大模型实现元素检测、语义理解与自然语言驱动的界面操作
将电脑变为个人 AI,持续记录屏幕与音频,构建可搜索的本地 AI 记忆系统。
主动式 AI 桌面伙伴平台,具备全模态对话、三层记忆系统、Agent 自动化操控、Live2D/VRM/MMD 多形态 Avatar 及 Steam 创意工坊 UGC 生态。
面向 AI Agent 的 macOS 全桌面操控系统,通过 29 个 MCP 工具实现结构化感知、视觉定位、合成输入与自学习 Recipe 工作流。
面向 macOS Apple Silicon 的全链路端侧语音 AI 助手,集成 STT、LLM、TTS、VLM、RAG 与系统操作控制,完全离线运行。
跨平台桌面 AI 生产力客户端,统一接入多家 LLM 提供商,支持多模型对比对话、知识库构建、AI 绘图与 MCP 扩展。
四服务协同的 AI 桌面助手框架,支持流式工具调用、GRAG 知识图谱记忆、Live2D 虚拟形象、语音交互
Rodel Agent是一款Windows桌面应用程序,整合聊天、文本转语音、图像生成和翻译功能。支持主流AI服务和MCP服务器插件,采用AOT编译,为用户提供优秀的桌面AI体验。
一个可自定义的AI桌面伴侣项目,支持角色设定、语音对话、长期记忆等功能,响应时间低于1秒,可集成Live2D模型。
一个由视觉语言大模型驱动的计算机控制代理,能够让AI通过观察屏幕截图并输出鼠标键盘操作来与GUI交互,完成多步骤任务。
第 1 / 2 页 · 共 13 条
获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。