Skyvern
✨基于视觉 LLM 驱动浏览器自动化的 AI Agent 平台,通过 Playwright 扩展实现自然语言操控网页,支持工作流编排与结构化数据提取。
模型与推理框架多模态AI代理
基于视觉 LLM 驱动浏览器自动化的 AI Agent 平台,通过 Playwright 扩展实现自然语言操控网页,支持工作流编排与结构化数据提取。
本地优先的 AI 个人代理操作系统,基于文件智能、事件驱动工作流与 LLM 实现跨模态任务执行与多平台交互。
基于 AI 视觉理解的 macOS GUI 自动化工具,通过屏幕截图与多供应商大模型实现元素检测、语义理解与自然语言驱动的界面操作
面向实时语音与多模态对话 AI Agent 的开源 Python 框架,通过可组合 Pipeline 架构实现端到端语音流式交互。
首个开源 Agent-first 视频制作系统,提供 12 条结构化管线与 52 个生产工具,在 AI 编程助手中以自然语言驱动端到端视频生产。
将电脑变为个人 AI,持续记录屏幕与音频,构建可搜索的本地 AI 记忆系统。
开源数字人智能体平台,通过单张照片创建可实时视频通话的 AI Agent,支持 RAG 知识导入、声音克隆与模块化插件架构。
面向生产环境的结构化文档数据提取系统,支持多模态大模型与可插拔工作流编排,可处理发票、银行对账单、金融表格等多种业务文档。
面向多模态大语言模型、Agentic AI 与知识图谱研究的 Python 函数式原语库,提供统一模型调用、多智能体协作辩论、知识图谱生命周期管理及多模态生成等完整工具链。
节点式可视化 AI 工作流与 LLM Agent 构建平台,支持本地运行模型与多模态编排,提供桌面端、Web、CLI、移动端全矩阵交付形态。
第 1 / 6 页 · 共 57 条
获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。