发现 AI 代理的未来

全部项目

4 个项目

Skyvern

基于视觉 LLM 驱动浏览器自动化的 AI Agent 平台,通过 Playwright 扩展实现自然语言操控网页,支持工作流编排与结构化数据提取。

Python工作流自动化多模态

hCaptcha 验证码挑战者

一个使用多模态大语言模型优雅解决 hCaptcha 验证码挑战的项目,不依赖用户脚本或第三方验证码服务。

Python大语言模型多模态

SeeAct: 通用网页智能代理系统

SeeAct 是一个基于大型多模态模型(如 GPT-4V)的通用网页智能代理系统,能够自主在任何网站上执行任务。它包含一个稳健的代码库和创新的框架,支持在实时网站上运行网页智能代理。

Python工作流自动化多模态

UI-TARS:开源多模态 AI 智能体框架

由字节跳动开发的开源多模态 AI 智能体(Agent)堆栈,包含通用智能体框架 Agent TARS 和桌面客户端 UI-TARS Desktop,通过视觉语言模型实现基于自然语言的计算机控制、浏览器自动化及 CLI 交互。

TypeScriptNode.js桌面应用
每页

第 1 / 1 页 · 共 4 条

保持更新

获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。