发现 AI 代理的未来

OpenMontage

收录于 2026年5月7日
智能体与应用工具
开源
TypeScriptNode.js工作流自动化React多模态AI代理智能体框架CLI自然语言处理智能体与应用工具自动化/工作流/RPA计算机视觉/多模态

首个开源 Agent-first 视频制作系统,提供 12 条结构化管线与 52 个生产工具,在 AI 编程助手中以自然语言驱动端到端视频生产。

OpenMontage 是首个开源的智能体驱动视频制作系统,采用 Agent-first 架构设计,无需传统代码编排器,AI 编程助手直接作为编排核心。系统提供 12 条覆盖讲解动画、纪录片蒙太奇、虚拟人演讲、电影级预告片、播客转视频、多语言本地化等场景的结构化生产管线,每条管线遵循 research → proposal → script → scene_plan → assets → edit → compose 的统一七阶段流程,各阶段由专属"导演技能"指令指导 Agent 执行。

底层配备 52 个 Python 生产工具,分布在视频生成与合成、语音合成与音乐、图像与图形生成、画质增强、内容分析、虚拟人驱动、字幕生成七大模块,并拥有 Remotion(React)与 HyperFrames(HTML/CSS/GSAP)双合成引擎。系统支持零 API Key 免费工作流——Piper 离线 TTS 提供旁白,免费素材库(Archive.org、NASA、Wikimedia Commons 等)通过 CLIP 索引提供真实运动素材,配合 FFmpeg 后期完成成片输出。按需接入时可覆盖 14 个视频生成、10 个图像生成、4 个 TTS 共计 28 个 Provider。

系统内置生产级质量门控(Pre-compose 交付承诺校验 + Post-render ffprobe/帧提取/音频分析自检)、7 维加权评分 Provider 选择机制(任务匹配度 30%、输出质量 20% 等)、预算治理(默认 $10 上限)以及完整的决策审计日志。三层知识架构(工具层 + 技能层 + 外部知识包)配合 15 个 JSON Schema 合约验证与可恢复状态检查点,确保生产过程可追溯、可中断恢复。兼容 Claude Code、Cursor、GitHub Copilot、Windsurf、Codex 五大 AI 编程助手平台,内置 YouTube/Instagram/TikTok/LinkedIn/Cinematic 等主流渲染 Profile。

保持更新

获取最新的 AI 工具和趋势,直接发送到您的收件箱。没有垃圾邮件,只有智能。