CyberVerse
✨开源数字人智能体平台,通过单张照片创建可实时视频通话的 AI Agent,支持 RAG 知识导入、声音克隆与模块化插件架构。
文档教程与资源多模态RAG
开源数字人智能体平台,通过单张照片创建可实时视频通话的 AI Agent,支持 RAG 知识导入、声音克隆与模块化插件架构。
节点式可视化 AI 工作流与 LLM Agent 构建平台,支持本地运行模型与多模态编排,提供桌面端、Web、CLI、移动端全矩阵交付形态。
融合 LLM Agent、RAG 混合检索、多模态理解与营养分析的个性化饮食管理平台
基于 LiveKit 构建的可学习、可配置、高度插件化的全能型实时交互虚拟助手框架,支持多模态记忆、用户画像与外部工具集成。
基于InvisPose研究的生产级WiFi穿墙人体姿态估计系统,利用商用Mesh路由器的CSI信号实现无需摄像头的实时全身追踪,支持多人追踪、跌倒检测等高级分析功能。
一个基于 GPT 的视频搜索和检索增强生成(RAG)系统,支持视频上传、实时搜索和摘要,可将视频库发布到 ChatGPT 商店。
一个智能代理系统,用于处理和展示4K视频内容,提供高质量的视频处理能力。
微软开发的视频内容发现工具,利用深度学习技术从视频中自动识别和提取关键内容,帮助用户高效浏览和理解视频信息。
Nekro Agent 是一款集代码执行能力与高度可扩展性为一体的多人跨平台聊天机器人框架,采用沙盒驱动架构,支持可视化界面,提供多模态交互能力。
LLaVA-Plus是一个能够学习和使用工具的多模态助手系统,通过将大型语言模型与视觉技术结合,使AI代理能够执行通用视觉任务。
第 1 / 2 页 · 共 15 条
获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。