本地优先的自主 AI 操作系统,支持桌面控制、多模型路由与 1400+ 可组合技能。
定位#
Aiden 是一个本地优先的自主 AI 操作系统(Autonomous AI Operating System),旨在单一运行时内同时完成桌面 GUI 操作、浏览器自动化、终端执行以及跨多通信渠道的统一调度,解决现有 AI Agent 依赖云端且缺乏本地系统直接控制力的问题。
系统级控制能力#
- 桌面控制:基于 nut-js 的 computer use 模块,支持截屏 + OCR、鼠标/键盘自动化、窗口管理。
- 浏览器自动化:集成 Playwright,支持打开浏览器、点击、输入、内容提取、获取 URL 等工具。
- 终端控制:Shell 命令执行与代码沙箱运行。
智能路由与模型管理#
- 多 Provider 路由:自愈式 Provider 链,支持 Ollama(本地优先)、OpenAI、Anthropic、Groq、Cerebras、NVIDIA NIM、OpenRouter、Mistral 等 15+ 提供商。
- 高可用机制:keepalive 快速缓存(<30s 响应)、指数退避重试、自动故障转移。
- 每日预算控制:通过
DAILY_BUDGET_USD环境变量限制云端 API 支出,默认 $5.00/天。
工具、技能与扩展#
- 内置工具:80+ 内置工具,涵盖网页搜索、文件读写、剪贴板、LocalSend LAN 传输、系统信息、日历、邮件(IMAP/SMTP)等。
- Skills 系统:1,400+ 可组合 Skills(文档自述数字),每个为独立目录(含 SKILL.md 提示词、tools.ts 实现、sandbox.ts 沙箱),Planner 按用户意图自动激活,支持从 Registry 安装。
- Plugin 扩展:放置
.js文件到workspace/plugins/即可注册自定义 slash 命令。
记忆与推理架构#
- 6 层记忆架构:Episodic(上下文窗口)、BM25 关键词(SQLite FTS5)、Vector 语义(SQLite + embeddings)、Procedural(Skill 提示词)、Goal(JSON 持久化)、LESSONS.md(追加式永久失败记录)。
- Subagent Swarm:可并行生成 N 个子 Agent,支持投票、合并与择优机制。
- 身份系统:SOUL/USER/GOALS 体系,每 turn 刷新身份,支持对话中实时编辑 USER.md。
交互与通道集成#
- 多通道适配:统一 Agent Loop 对接 Discord、Slack、Telegram、WhatsApp、Email、Webhook、Twilio、CLI 及 Desktop GUI。
- 语音链路:STT(Groq → OpenAI → 本地 Whisper.cpp)+ TTS(Edge TTS → ElevenLabs → Windows SAPI),支持全离线语音循环。
- MCP Server:可作为 MCP Server 连接 Claude Desktop 等外部客户端。
- OpenAI 兼容 API:Base URL
http://localhost:4200,Modelaiden-3.13,无需 API Key,可接入 Open WebUI / Chatbox / Cursor 等。 - 诚实失败机制:工具失败时明确报告工具名、Provider、重试次数、fallback 链及错误详情。
架构概览#
Channel Input → ChannelAdapter → Planner → AgentLoop
├── ToolDispatcher (80+ tools)
├── SubagentManager (parallel agents)
└── MemoryManager (6-layer memory)
→ ProviderRouter (Ollama priority 0, 15+ providers)
→ Responder → stream back to channel
核心位于 core/agentLoop.ts,基于事件驱动;桌面 GUI 基于 Electron(支持自动更新);Dashboard 基于 Next.js;Landing Page 部署于 Cloudflare Workers。
安装与快速开始#
前置条件:Node.js 18+
零安装启动:npx aiden-os
全局安装:npm install -g aiden-os && aiden
Windows 安装器:irm aiden.taracod.com/install.ps1 | iex
Linux/macOS:curl -fsSL aiden.taracod.com/install.sh | bash
源码部署:克隆仓库后 npm install && npm run build && npm start
首次运行自动引导选择 Provider、验证 API Key 并保存配置。Groq 提供免费额度,Ollama 支持完全离线运行。
适用场景#
- 个人全能本地助理(文件管理、文档总结、每日简报)
- 浏览器自动化 RPA
- 多平台统一 Bot 后端(Discord/Slack/Telegram 等)
- 对隐私要求极高的全离线 AI 环境
- 本地大模型的 API 代理网关
核心采用约束#
- 核心代码采用 AGPL-3.0,Skills 独立采用 Apache-2.0
- 主要语言为 TypeScript/JavaScript (Node.js)
- 当前版本 v3.19.x "ALIVE"
- Windows 10/11 支持 GUI + CLI,Linux/WSL 2/macOS 支持 Headless API + CLI
- Skill 数量(1,400+)为文档自述,未经独立验证
- 项目可能由 devos-ai 更名而来,确切迁移历史待确认
- 安全审计状态未知