Skyvern
✨基于视觉 LLM 驱动浏览器自动化的 AI Agent 平台,通过 Playwright 扩展实现自然语言操控网页,支持工作流编排与结构化数据提取。
基于视觉 LLM 驱动浏览器自动化的 AI Agent 平台,通过 Playwright 扩展实现自然语言操控网页,支持工作流编排与结构化数据提取。
基于 AI 视觉理解的 macOS GUI 自动化工具,通过屏幕截图与多供应商大模型实现元素检测、语义理解与自然语言驱动的界面操作
面向 Apple Silicon 的 vLLM 风格推理服务器,基于原生 MLX 后端,单进程同时暴露 OpenAI 与 Anthropic 兼容 API,支持多模态统一服务、Continuous Batching、Paged KV Cache、SSD 分级缓存等生产级特性。
Apple Silicon 本地 AI 推理引擎,提供 OpenAI 兼容 API,支持多模态、Tool Calling 和智能云端路由。
面向生产环境的结构化文档数据提取系统,支持多模态大模型与可插拔工作流编排,可处理发票、银行对账单、金融表格等多种业务文档。
面向多模态大语言模型、Agentic AI 与知识图谱研究的 Python 函数式原语库,提供统一模型调用、多智能体协作辩论、知识图谱生命周期管理及多模态生成等完整工具链。
节点式可视化 AI 工作流与 LLM Agent 构建平台,支持本地运行模型与多模态编排,提供桌面端、Web、CLI、移动端全矩阵交付形态。
基于 VLM 驱动的 Android 端侧 AI 智能助手,支持本地模型推理与屏幕级自动化操控。
Intel 官方的大语言模型与视觉-语言模型后训练量化工具包,基于 SignRound 算法支持 2-4 bit 极低比特量化与自动混合精度方案生成,可跨 Intel CPU/GPU、NVIDIA GPU、Habana Gaudi 部署。
融合 LLM Agent、RAG 混合检索、多模态理解与营养分析的个性化饮食管理平台
第 1 / 3 页 · 共 21 条
获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。