基于大模型、RAG 与 Agent 循环的下一代全能 AI 助手平台,支持多渠道网关、BPMN 工作流编排与企业级多租户隔离。
项目概述#
OpenAgent 是一个全栈 AI 助手平台,旨在解决企业和个人在采用大模型时面临的私有化部署难、知识库接入缺失、多平台消息渠道割裂、复杂任务难以自动化编排等痛点。项目采用 Go 语言单体后端 + Web 前端架构,支持完全自托管部署。
核心能力#
Agent 循环与工具调用#
- Browser-Use:驱动真实浏览器完成导航、点击、表单填写、页面抓取和截图
- Web Search & Fetch:执行网页搜索并将内容直接拉入 Agent 上下文
- Shell Execution:在 Agent 循环内运行 Shell 命令和脚本
- Office Automation:支持读写 Word、Excel、PowerPoint 文件
- MCP(Model Context Protocol):通过 SSE / Stdio / StreamableHTTP 连接任何 MCP 兼容服务器,将外部工具暴露给 Agent
- Transparent Tool Calls:逐步展示工具调用的参数和返回值,过程透明可控
RAG 与知识库管理#
- Document Ingestion:支持上传 PDF、Word、Excel 等文档,自动完成分块、嵌入和索引
- Semantic Search:每次对话自动从知识库检索最相关段落
- Pluggable Embedding Providers:支持 OpenAI、Azure、Gemini、Qwen、Cohere、Jina、HuggingFace 及本地模型等
- Per-Store Isolation:将知识组织到独立 Store,按对话或应用进行分配隔离
- 向量数据库支持:兼容 Qdrant、Pinecone、Milvus、PgVector、Redis
模型接入与调度#
- 支持 30+ 模型提供商:OpenAI、Azure OpenAI、Claude (Anthropic)、Gemini (Google)、DeepSeek、Mistral、Grok、Qwen、Doubao、Moonshot、ChatGLM、Baichuan、Ernie、iFlytek、HuggingFace、Cohere、Amazon Bedrock、OpenRouter 及本地模型等
工作流自动化#
- Visual Workflow Builder:提供 BPMN 风格可视化编辑器,编排多步骤 Agent 管道
- Conditional & Parallel Execution:支持工作流内的条件分支和并行任务执行
- Task Scheduling:支持定时或周期性运行工作流或 Agent 任务
多渠道消息网关#
- 涵盖 20+ 消息渠道:Telegram、Discord、Slack、WhatsApp、Microsoft Teams、WeChat、LINE、Matrix、Signal、飞书等
- 一次部署,全平台同时在线运行
平台级与企业级特性#
- 认证与隔离:通过 Casdoor 集成 SSO(OIDC / OAuth2 / LDAP / SAML),支持按用户/组织进行 Multi-tenant 隔离
- 多媒体处理:内置文件、图片、视频存储管理,以及 STT(语音转文字)和 TTS(文字转语音)能力
- 可观测性:提供完整 Audit Logs、使用统计(含交互式图表和热力图)、活动监控及请求日志(完整 JSON Payload 调试)
- REST API + Swagger UI:所有功能可通过 RESTful API 访问
架构要点#
- 后端入口为
main.go,请求通过proxy/代理层进入,由routers/分发至controllers/处理 chain/实现 Agent 循环与链式调用逻辑,结合tool/具体工具集完成动作执行mcp/负责 Model Context Protocol 对接,embedding/调用可插拔嵌入模型生成向量bpmn/实现基于 BPMN 规范的解析与调度引擎- 前端位于
web/(Yarn 构建),支持多语言国际化(i18n/),提供 CLI 入口(internal/cli/) - 包含
pkgdocker/和pkgkubernetes/提供容器化与云原生部署支撑
安装部署#
预编译二进制(推荐)
- macOS / Linux / WSL:
curl -fsSL --proto '=https' --tlsv1.2 \ https://raw.githubusercontent.com/the-open-agent/openagent/master/scripts/install.sh | bash - Windows (PowerShell):
irm https://raw.githubusercontent.com/the-open-agent/openagent/master/scripts/install.ps1 | iex - 可选环境变量:
OPENAGENT_VERSION、INSTALL_DIR、BIN_DIR - 启动后访问:
http://localhost:14000
从源码构建
go build
cd web && yarn install && yarn start
Docker 部署
仓库内提供 Dockerfile、docker-compose.yml、docker-entrypoint.sh,支持标准容器化部署。
典型应用场景#
- 自托管私有 ChatGPT 替代方案
- 企业级知识库管理与语义搜索
- 多渠道智能客服统一部署
- 自动化办公(文档与浏览器操作)
- 复杂业务流可视化编排
- 开发辅助与 MCP 工具集成
待确认信息#
- 向量数据库默认选择未明确
- 默认嵌入模型未在 README 中明确
- 仓库 Topic 标注 A2A (Agent-to-Agent) 支持,但具体实现待确认
- Topic 中包含
openclaw,README 未提及,关联关系待确认 the-open-agent组织的背景、成员和资金来源未公开