OpenClaw 与 Hermes Agent 是 2026 年开源 AI 智能体领域的两大标杆项目,均采用 MIT 开源协议,支持本地自托管、多模型接入、多消息通道适配与工具自动化能力。本报告从七大维度深度拆解对比,给出分场景选型建议。
一、核心定位
1.1 定位对比
| 项目 |
核心定位 |
设计哲学 |
Slogan |
| OpenClaw |
完全运行在自有硬件上的开源个人 AI 助手,单用户、始终在线的自托管 AI 网关 |
本地优先、多通道统一、插件可扩展,做用户的「私有 AI 操作员」 |
Your own private AI operator, always on, always yours |
| Hermes Agent |
Nous Research 打造的自进化 AI 智能体,具备闭环学习循环的模型无关代理运行时 |
从每一次交互中学习沉淀、自主优化,做用户的「持久化 AI 成长伙伴」 |
The agent that grows with you |
1.2 设计理念核心差异
- 能力锚点不同:OpenClaw 以「接入与控制」为核心;Hermes 以「学习与进化」为核心
- 会话范式不同:OpenClaw 以通道为中心,会话独立隔离;Hermes 以用户为中心,跨会话共享记忆
- 用户目标不同:OpenClaw 面向「随时可用」,主打 7×24 小时在线;Hermes 面向「长期搭档」,主打越用越懂你
二、架构设计
2.1 OpenClaw:Hub-and-Spoke 中心辐射型
OpenClaw 采用中心辐射型架构,核心是 Gateway 网关(WebSocket 控制平面),所有消息、AI 调用、客户端连接、工具执行全量通过单一进程流转。
- 核心中枢层(
src/):网关、代理运行时、通道抽象、配置管理、会话生命周期、上下文引擎
- 扩展插件层(
extensions/):100+ 独立插件,覆盖模型提供商、消息通道、工具能力
- 终端适配层(
apps/):macOS / iOS / Android 原生客户端,与网关 WebSocket 配对
- 能力封装层(
skills/):50+ 预制模块化技能,通过 ClawHub 分发
单进程 · 单配置 · 单 WebSocket 端点 · 默认绑定本地回环 · 数据默认本地留存
2.2 Hermes Agent:分层解耦代理循环架构
Hermes Agent 采用分层解耦架构,核心是 AIAgent 类的同步会话循环,CLI、网关、TUI、定时任务均为表现层,仅负责输入输出转发。
- 核心代理层(
agent/):提示词构建、上下文压缩、内存管理、智能模型路由、技能管理,30+ 模块
- 工具执行层(
tools/):60+ 工具实现,支持 6 种执行后端(本地、Docker、SSH、Modal、Daytona、Singularity)
- 接入表现层:CLI、TUI、网关、VS Code 扩展,所有入口复用同一核心代理逻辑
- 记忆存储层:SQLite + FTS5 本地数据库,全会话全文检索、跨会话记忆召回
- 网关适配层(
gateway/):15+ 消息平台适配器
核心逻辑强内聚 · 平台无关 · 自学习闭环原生实现 · 并行子代理调度
2.3 架构对比小结
| 对比维度 |
OpenClaw |
Hermes Agent |
| 核心中枢 |
Gateway 网关(流量控制中枢) |
AIAgent 代理循环(逻辑决策中枢) |
| 架构模式 |
中心辐射型,插件化松耦合 |
分层解耦型,核心逻辑强内聚 |
| 会话管理 |
通道级会话隔离,Docker 沙箱 |
用户级跨会话记忆,SQLite 全检索 |
| 能力扩展 |
插件接入网关 |
核心循环原生支持 + 工具扩展 |
| 数据流转 |
所有流量必经网关 |
表现层 → 核心循环 → 表现层 |
三、能力矩阵
本节是两者差异最密集的部分,拆分为多个子维度逐一对比。
3.1 消息通道
| 维度 |
OpenClaw |
Hermes Agent |
| 支持数量 |
20+ 平台 |
15+ 平台 |
| 国内 IM |
微信、企业微信、飞书、原生适配 |
v0.9.0 补齐上述支持 |
| 海外 IM |
WhatsApp、Telegram、Discord、Slack、iMessage、Matrix |
同左主流平台 |
| IoT / 办公 |
— |
Home Assistant、邮件、钉钉 |
| 媒体附件 |
全通道适配 |
部分适配 |
| 群组路由 |
支持(群组路由、提及规则、回复线程) |
基础支持 |
小结:OpenClaw 通道广度更优,国内 IM 适配成熟度高;Hermes 通道偏向场景化,与记忆能力结合更紧密。
3.2 AI 模型支持
| 维度 |
OpenClaw |
Hermes Agent |
| 模型提供商 |
30+(OpenAI、Anthropic、Google、Ollama 等) |
OpenRouter(200+)、Anthropic、NVIDIA NIM、OpenAI 等 OpenAI 兼容端点 |
| 累计模型数 |
— |
400+ |
| 高可用机制 |
故障转移系统,多提供商轮转兜底 |
智能强弱模型自动路由、降级链 |
| 并行处理 |
— |
并行子代理,任务自动拆分委托 |
| 本地模型 |
Ollama 全面支持 |
支持本地模型接入 |
小结:OpenClaw 强调高可用(故障自动切换);Hermes 强调精细化调度(按任务难度选择模型),使用成本更优。
3.3 记忆与自学习
| 维度 |
OpenClaw |
Hermes Agent |
| 记忆架构 |
插件化(LanceDB、Wiki),会话级上下文,无原生跨会话闭环 |
三层架构(短期 + 长期 + 技能),FTS5 全检索 |
| 跨会话记忆 |
❌ 需手动配置扩展 |
✅ 原生支持 |
| 自主学习 |
插件化,无原生进化能力 |
闭环学习循环,自主沉淀技能与记忆 |
| 技能生成 |
人工开发静态包 |
从交互中自动创建可复用技能 |
| 上下文压缩 |
会话级窗口控制 |
自动上下文压缩 |
小结:这是两者最核心的分水岭。OpenClaw 记忆是可选插件能力;Hermes 记忆与学习是原生核心能力,实现「越用越聪明」。
3.4 工具与自动化
| 维度 |
OpenClaw |
Hermes Agent |
| 内置工具数 |
50+ |
60+ |
| 核心优势 |
CDP 浏览器自动化、Canvas 可视化工作区、端侧设备控制(相机、录屏、定位、通知) |
沙箱代码执行、多环境远程操作、MCP 集成 |
| 执行后端 |
Docker 会话级沙箱 |
6 种(本地、Docker、SSH、Modal、Daytona、Singularity) |
| 定时任务 |
Cron + Webhook |
内置 Cron 调度器,自然语言定义定时任务 |
| 结果分发 |
— |
跨平台自动分发 |
3.5 客户端与交互体验
| 维度 |
OpenClaw |
Hermes Agent |
| 客户端 |
CLI、Web UI、macOS / iOS / Android 原生客户端 |
CLI、Ink 终端 TUI、Web Dashboard、VS Code 扩展 |
| 移动端 |
✅ 原生支持,语音唤醒 |
❌ 无原生 App |
| 语音能力 |
ElevenLabs + 系统 TTS,macOS/iOS/Android 全端覆盖 |
语音备忘录转录、Discord 语音接入,TTS 依赖模型提供商 |
| 技能系统 |
50+ 预制,ClawHub 分发,静态指令集 |
20+ 内置分类,代理自主创建可复用技能 |
| 多代理协同 |
会话间代理发现、消息互通 |
并行子代理,复杂任务自动拆分委托 |
四、技术栈与开发生态
4.1 技术栈对比
| 技术维度 |
OpenClaw |
Hermes Agent |
| 核心语言 |
TypeScript (ESM) |
Python |
| 最低运行环境 |
Node.js 22.16+(推荐 24+) |
Python 3.11+ |
| 工程化 |
pnpm monorepo,tsdown 构建 |
模块化结构,pip 管理 |
| 测试 |
Vitest(单元 + 集成) |
~3000 个测试用例,高覆盖 |
| 前端技术 |
Vite Web UI、Swift(macOS/iOS)、Kotlin(Android) |
Ink TUI、React Dashboard |
| 容器化 |
Docker / Docker Compose,会话级沙箱 |
Docker + 6 种远程执行后端 |
| 目标用户 |
全栈/前端/TypeScript 开发者 |
AI/算法/Python 开发者 |
4.2 生态对比
| 生态维度 |
OpenClaw |
Hermes Agent |
| GitHub 星标 |
34.5 万+,27+ 活跃贡献者,月均 2-3 次迭代 |
3.5 万+(上线仅 2 个月),增速迅猛,Nous Research 背书 |
| 插件/技能 |
ClawHub 3 万+ 技能插件,52000+ 工具 |
20+ 内置分类,MCP 工具集成,快速成长期 |
| 文档本地化 |
全中文,12 国语言,国内社区丰富 |
中文资源较少,v0.9.0 补齐国内平台适配 |
| 迁移工具 |
❌ 无 |
✅ hermes claw migrate 一键迁移 OpenClaw 配置与密钥 |
| 二次开发 |
TypeScript 插件 SDK 标准化,前端开发者友好 |
Python AI 工具链无缝集成,AI 研发门槛低 |
五、部署与运维
| 运维维度 |
OpenClaw |
Hermes Agent |
| 快速安装 |
npm 全局一键,openclaw onboard 交互向导,5 分钟上线 |
curl 一键脚本,hermes setup 向导 |
| 跨平台 |
原生 Windows / macOS / Linux |
Linux / macOS / WSL2 / Android Termux(Windows 需 WSL2) |
| 常驻运行 |
--install-daemon 一键注册系统服务(launchd / systemd) |
需手动配置 systemd / launchd |
| 运行管理 |
单进程 · 单配置 · 运维极简 |
单进程,配置与密钥分离,门槛低 |
| 版本更新 |
stable / beta / dev 三通道,openclaw update |
hermes update 一键升级,偶有破坏性变更 |
| 自检工具 |
openclaw doctor 安全配置审计 |
hermes doctor 诊断权限与密钥风险 |
| 最低硬件 |
笔记本、家用服务器、低配 VPS |
5 美元/月 VPS,Android Termux |
六、安全与隐私
| 安全维度 |
OpenClaw |
Hermes Agent |
| 安全原则 |
本地优先,网关默认绑定本地回环,显式配置才对外开放 |
最小权限原则,高风险操作默认人工审批 |
| 输入防护 |
消息通道入站视为不可信,配对审批机制 |
会话隔离,自动内存刷新,未知消息默认拦截 |
| 隔离能力 |
Docker 沙箱,工具访问白名单,2026-04 重构审批系统 |
五层纵深防御(用户授权 → 命令审批 → 容器沙箱 → 权限隔离 → 超时拒绝) |
| 隐私保护 |
全量数据在自有硬件,可完全离线运行,100% 可控 |
本地 SQLite,无云端强制依赖,可完全离线 |
| 安全审计 |
全链路审计,2026 年修复 SSRF、媒体上传高危漏洞 |
操作审计日志,高风险操作默认留痕 |
| 历史事件 |
2026-02 CVE-2026-25253 高危漏洞(13.5 万公网暴露),已完成安全加固 |
无大规模高危安全事件 |
七、选型建议
7.1 选 OpenClaw
| 场景 |
说明 |
| 个人普通用户 |
需要 7×24 小时在线 AI 助手,跨微信/Telegram/WhatsApp 多 IM 统一使用 |
| 高隐私需求 |
所有数据全量在自有硬件,完全离线,无云端依赖 |
| 移动端深度集成 |
需要 macOS/iOS 语音唤醒、Android 设备控制(SMS/通知/定位/日历) |
| 浏览器自动化 |
CDP 原生浏览器控制、网页操作、数据抓取 |
| 全栈/前端开发者 |
熟悉 TypeScript,希望基于插件 SDK 快速二次开发 |
| 短期使用 |
使用周期 < 3 个月,期望开箱即用、生态成熟 |
7.2 选 Hermes Agent
| 场景 |
说明 |
| 长期 AI 伙伴 |
需要跨会话记忆,越用越懂你的偏好与工作流,长期 ROI 更高 |
| 开发者/极客 |
复杂代码开发、远程运维、Docker/SSH/Modal 多环境支持 |
| 复杂任务处理 |
并行子代理调度、强弱模型智能路由,兼顾效率与成本 |
| AI / Python 开发者 |
自定义代理逻辑、记忆策略,与 LLM 研发工具链深度集成 |
| 跨平台自动化 |
定时日报生成、数据备份、系统巡检,多平台结果推送 |
| 长期使用 |
使用周期 > 6 个月,能力随使用时长指数级增长 |
八、总结
核心差异一览
| 维度 |
OpenClaw |
Hermes Agent |
| 核心灵魂 |
「本地优先的统一 AI 网关」 |
「自进化的闭环学习代理」 |
| 核心关键词 |
接入、统一、可控 |
学习、记忆、进化 |
| 能力重心 |
多端接入、端侧融合、开箱即用 |
智能推理、自学习、复杂任务处理 |
| 技术栈 |
TypeScript / Node.js,全栈生态 |
Python / AI 研发工具链 |
| 记忆能力 |
插件化,可选能力 |
原生核心能力,三层架构 |
| 长期价值 |
随社区生态线性增长 |
随使用时长指数增长 |
未来趋势
- OpenClaw:持续强化接入能力与安全合规,补齐自学习短板,巩固多通道网关市场地位
- Hermes Agent:优化自学习闭环与模型调度,补齐客户端与通道覆盖,成为个人长期 AI 伙伴标杆
两者代表两条不同路线,没有绝对优劣,只有场景适配。
数据来源:项目官方文档、2026 年最新版本迭代日志、社区技术分析资料