| 编辑推荐: |
本文主要介绍了Hermes
Agent 小白完全指南相关内容。希望对你的学习有帮助。
本文来自于微信公众号AI学霸,由火龙果软件Alice编辑,推荐。 |
|
2026年AI开源圈最火的词,不是模型,而是Agent。
两个月前,开发者们还在热烈讨论OpenClaw(俗称“龙虾”)这个AI操作系统新物种;两个月后,风向突然转向了一个名字听起来就很贵的开源项目——Hermes
Agent。因为和奢侈品牌撞名,国内开发者亲切地喊它“爱马仕”。
上线仅六周,Hermes就在GitHub上狂揽超6.4万颗星,连续多日霸榜全球开源榜单第一,增速是同期OpenClaw的三倍有余。YC
CEO Garry Tan亲自上手后直呼“彻底回不去了”,Anthropic甚至被指控在“复制”它的功能。
打开今日头条查看图片详情 这匹“爱马仕”到底凭什么?
一句话记住它:OpenClaw是养龙虾(),Hermes是养马()。龙虾需要你喂,马会自己找草吃,越骑越顺。
下面,我们就来深度解剖这匹会“自进化”的神马。
一、Hermes 是什么?——5 岁小孩也能懂
想象你请了一个数字助手:
- 普通 AI(如 ChatGPT) :每次聊天都是新认识,昨天聊的今天就忘。
- Hermes:越聊越懂你,第 10 次比第 1 次好用得多。
这就像你新认识一个朋友:刚开始只是泛泛之交,相处久了,他知道你喜欢喝什么咖啡、几点起床、说话有什么习惯——然后在你开口之前,他已经帮你准备好了。
官方用一句话精准概括了这个定位:"The Agent That Grows With You"(和你一起成长的
Agent)。它不是“用完即走”的工具,而是会积累、会进步的数字分身。
Hermes Agent由知名开源大模型机构Nous Research于2026年2月底推出。这家机构成立于2023年,团队约20人,核心成员来自StabilityAI,此前推出的Hermes、Nomos系列模型累计下载超5000万次。“训模人做Agent”的基因,让他们比单纯做工具的人更懂大模型的能力边界——这也是Hermes能在技术上超越前任王者OpenClaw的深层原因。
核心配方一览:
| 维度 |
数据 |
| 最低成本 |
$5/月 VPS,24 小时在线 |
| GitHub Stars |
突破 7 万(发布两个月) |
| 内置工具 |
40+ |
| 支持平台 |
16 个(Telegram/Discord/Slack/微信/飞书/钉钉等) |
| MCP 可接入 |
6,000+ 应用 |
| 迭代速度 |
平均不到一周一个大版本 |
二、为什么叫“养马”?和“养虾”有什么区别?
这个比喻非常形象,正好打中了两个产品最核心的设计差异。
养虾(OpenClaw) :
你养了一池龙虾
每只龙虾都听你指挥
数量多、好管理
但每只都不认识你,每次都要重新教
OpenClaw本质上是一个“广连接”的网关系统,强调多平台接入和多Agent编排,它的技能完全依赖人工编写或从社区下载,缺乏自我进化能力。
养马(Hermes) :
你养了一匹马
刚开始不熟悉,跑得不快
骑多了它懂你的习惯、脾气、偏好
第 10 次比第 1 次顺多了
用一句业内广为流传的总结来说:Hermes 是教 AI “怎么把活干好”;OpenClaw 是在解决
“怎么管好这帮干活的 AI” 。
两者的本质区别在于“自进化闭环”。Hermes完成复杂任务后,会自动把解决方案提炼成可复用的技能文件;使用中发现不足,还能自动“打补丁”优化。而OpenClaw是静态的——你教它什么,它就只会什么,技能需要人工编写、安装、维护。
社区验证了一个重要事实:两者并非水火不容,而是可以协同使用。Hermes负责记住偏好、积累技能、沉淀记忆;OpenClaw负责利用其庞大的技能生态执行具体任务。甚至社区已催生出专门的桥接工具HermesClaw,让一个微信机器人同时接入两个Agent。
三、Hermes 是怎么“长脑子”的?——学习循环五部曲
Hermes的核心竞争力,在于其内建的学习闭环。这个闭环由五个环节组成,持续运转:
干活 → 复盘 → 写手册 → 优化 → 再用
具体拆解:
- 策划记忆:每次任务后,Agent主动判断哪些信息值得存入数据库,而不是被动存储全部内容
- 创建 Skill:发现新套路,自动写成操作手册(Markdown格式)
- Skill 自改进:老手册不好用,自动打补丁优化
- FTS5 召回:需要时通过全文搜索快速找到相关手册
- 用户建模:通过可选的Honcho系统,分析交互行为,推断深层偏好
真实例子:写爬虫
- 第 1 次:你说“帮我写个爬虫抓标题”。Hermes写了一个基础版本,但风格可能不符合你的习惯——变量命名、错误处理方式都需要你手动调整。
- 第 10 次:你说“抓这个网站的标题”。Hermes已经知道:你偏好 httpx 而不是 requests你习惯把错误日志写到文件你的项目结构是
src/ 目录下按模块分你讨厌过长的函数
没人教它这些。它是自己学会的。
更惊艳的是它的进化算法。Hermes内置了一套离线批量进化算法,使用DSPy框架和GEPA(Genetic-Pareto
Prompt Evolution)核心算法——这套方法出自一篇ICLR 2026 Oral论文,标题就叫《反思性提示词进化可以跑赢强化学习》。这已经不是简单的“记忆”,而是真正的“学习”。
四、记忆系统:从“金鱼记忆”到“老友记”
如果说传统AI是只有7秒记忆的金鱼,那Hermes就是一个对你知根知底的老朋友。它的记忆架构从最初的三层演进到了更精密的五层漏斗模型。
传统三层记忆(官方基础模型)
第一层:情景记忆(发生了什么)
- 存对话记录
- 用 SQLite + 全文搜索(FTS5)
- 按需检索,不是每次都加载全部历史
第二层:语义记忆(你是谁)
- 编码偏好、常用工具链、工作时间规律
- 存储在USER.md文件中,约500 tokens
第三层:程序性记忆(怎么做事)
- Skill 文件(Markdown 格式)
- 可编辑、可复用
- 会自我进化
v0.9.0 五层记忆架构(更精密的漏斗模型)
最新版本进一步优化为五层结构:
- L1 核心记忆:存储在MEMORY.md中,严格限制约800 tokens,每次会话冻结为快照注入系统提示词
- L2 用户画像:记录沟通风格、技术栈偏好、工作习惯
- L3 长时记忆:SQLite持久化,支持全文检索
- L4 技能记忆:可复用的方法论沉淀
- L5 血缘追溯:每条记忆都记录来源,确保可解释性
这五层记忆让Agent真正具备了“随时间成长”的能力,而不会像传统的向量检索RAG那样产生“幻觉”或检索漂移。
五、怎么安装?——三种方式,新手不迷路
Hermes的安装门槛极低,一行命令就能搞定。但为了让你少走弯路,这里把三种方式都讲透。
方式一:本地安装(5 分钟)
#
一键安装curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh
| bash# 配置hermes setup# 启动hermes |
支持平台:Linux、macOS、Windows WSL2、Android Termux。原生Windows暂不支持,需要先安装WSL2。
方式二:Docker(干净隔离)
docker
pull nousresearch/hermes-agent:latestdocker
run -v ~/.hermes:/opt/data nousresearch/hermes-agent:latest
|
方式三:$5 VPS 24/7(最推荐)
让Hermes在云端7×24小时运行,这才是它真正的用法。
推荐配置:Ubuntu 22.04 LTS,内存 >500MB
推荐服务商:Hetzner / DigitalOcean / Vultr / 阿里云轻量服务器
装完之后别忘了运行 hermes model 配置大模型API。Hermes兼容GPT、Claude、GLM、DeepSeek、Kimi、Qwen等主流模型,要求模型上下文窗口至少64K。
避坑提示:安装后若提示 hermes: command not found,执行 source ~/.bashrc
或 source ~/.zshrc 重载shell即可。Windows用户务必使用WSL2,原生CMD/PowerShell不支持。
六、v0.9.0 新功能:“无处不在版”
2026年4月13日,Hermes发布了v0.9.0版本,包含487个commit和269个合并PR,是一次以“平台扩展”为主题的大版本更新。
最受瞩目的新功能:
- Termux/Android:手机上跑完整 Hermes
- 微信原生接入:通过腾讯官方iLink Bot API,公网服务器扫码即连
- iMessage:通过 BlueBubbles 接入
- 企业微信回调模式:面向自建应用的完整适配
- Fast Mode:接入OpenAI/Anthropic快速通道,降低推理延迟
- Web 仪表板:在浏览器中配置设置、管理技能、监控会话,无需手改配置文件
- 后台进程监控:实时监控后台进程输出,模式匹配触发通知
- 可插拔上下文引擎:通过插件自定义每轮上下文内容
- 备份导入命令:hermes backup 和 hermes import 完整迁移配置
设计理念很打动人:**“不是你来我家,是我在你家等你”** 。目前Hermes已覆盖16个通讯平台,国内主流IM——钉钉、飞书、企业微信、微信——全部接全。
Nous Research官方还专门发了一条中文推文,用中文跟中国用户互动。中文为什么这么顺?他们自己揭了底:请Hermes帮忙润色的。
七、实战场景:Hermes 能帮你做什么?
理论说了这么多,不如看看实战。以下是四个典型场景,展示Hermes如何真正落地。
场景一:个人知识助手(跨会话记忆的威力)
问题:传统AI每次对话都从零开始,调研一个话题需要反复解释背景。
Hermes方案:假设你在调研AI Agent部署方案,持续三周——
第一周:你问了Docker部署内存占用、VPS价格对比、Daytona免费额度限制。
第二周:你直接说“继续看Serverless方案”——
Hermes记得你在调研什么
主动提醒:“上周你提到Daytona有免费额度限制,要确认最新政策吗?”
不会重新推荐你已排除的方案
第三周:方法论已经沉淀为Skill——
“调研类任务:先列维度→逐个深挖→每轮汇总”
第二个调研项目自动复用
场景二:内容创作(从调研到成稿)
问题:用AI写文章不稀奇,但每次都要重新说明风格偏好。
Hermes方案:连续写5篇AI Agent文章。
风格Skill自改进示例:
初始
Skill:# 写作风格- 别用“综上所述”- 段落保持3-5行- 多用“我觉得”“其实”这类口语词使用一个月后自动进化:#
写作风格(已进化)- 别用“综上所述”、“值得注意的是”- 段落保持3-5行- 多用“我觉得”“其实”这类口语词-
避免用“进行+动词”的句式(把“进行优化”改为“优化一下”)- 结尾不要强行升华- 技术概念首次出现要加一句话解释-
代码示例控制在15行以内 |
子Agent并行调研:写一篇AI Agent对比文章时,同时派出三个子Agent——每个只分配web+browser两个工具,独立调研Claude
Code、Cursor、Hermes Agent,按统一模板输出,最后主Agent汇总。
线性调研:40分钟
并行调研:15分钟
场景三:开发自动化(代码审查到部署)
典型早晨:早上9点打开飞书,收到Hermes发的消息:
“昨晚23:17,main分支有PR合并,新增387行代码。审查了一下有两个问题:auth模块的token过期逻辑没处理边界情况;测试覆盖率从82%掉到76%。详细报告已存到项目Skill里。”
“凌晨2:40,CI流水线跑了一轮回归测试,3个用例失败。2个是昨天那个PR引入的,1个是已知的flaky
test。” “今天的日报初稿已生成,基于昨天的4个commit和2个PR。需要你确认后发送。”
这不是假想场景。这是cron调度+GitHub MCP+记忆系统的组合效果。
关键差异:
传统lint规则是静态的
Hermes的审查标准是活的——你标记了它没发现的问题,下次就会注意同类模式
场景四:多Agent编排(让三匹马同时跑)
适用场景:任务复杂到单Agent上下文不够用,或需要并行加速。
实际案例:竞品分析报告
传统做法:一个一个调研,然后手动整合(90分钟)
Hermes做法:
主Agent拆分任务+定义模板
并行派三个子Agent:调研产品A/B/C
每个子Agent只有web+browser两个工具(最小权限原则)
主Agent汇总整合三份调研结果,生成对比报告
并发上限3个,防止汇总质量下降
八、MCP:连接 6,000+ 应用
MCP(Model Context Protocol,模型上下文协议)是Hermes实现广泛连接的关键。通过MCP,Hermes可以接入GitHub、数据库、Slack、Jira等6,000多个服务。
配置示例:
mcp_servers:
github:
command: "npx"
args: ["-y", "@modelcontextprotocol/server-github"]
env:
GITHUB_PERSONAL_ACCESS_TOKEN: "ghp_xxxxx"
allowed_tools: # 白名单,最小权限
- "list_issues"
- "create_issue"
- "get_pull_request" |
MCP + Skill 组合最佳实践:
MCP 提供读取 PR 的能力
Skill 定义你的审查标准
两者结合 = 按你的标准自动审查代码
v0.6.0版本还新增了MCP Server Mode,允许将Hermes的对话和会话暴露给任何MCP兼容客户端(Claude
Desktop、Cursor、VS Code等)。
九、对比:Claude Code vs OpenClaw vs Hermes
了解三者的差异,能帮你做出更好的选择。
| 维度 |
Claude
Code |
OpenClaw
|
Hermes
Agent |
| 核心定位 |
交互式编码助手 |
多渠道个人助理OS |
自进化Agent运行时 |
| 技术栈 |
- |
Node.js+TypeScript |
Python+FastAPI |
| 记忆能力 |
静态/会话级 |
手动维护Markdown |
五层自动记忆+自进化 |
| 微信接入 |
- |
第三方插件 |
官方原生支持 |
| 学习能力 |
无 |
静态配置 |
自主学习循环 |
| 安全设计 |
- |
需手动配置 |
默认沙盒+审批 |
| 社区迭代 |
稳定 |
放缓 |
极速迭代 |
| 技能生态 |
- |
ClawHub 13,000+ |
起步但增速快 |
关键洞察:很多场景不是一个工具就能搞定的。
长期内容项目:Hermes负责每天自动搜集信息、积累记忆
深度编码开发:Claude Code负责坐下来把东西写出来
多渠道任务调度:OpenClaw利用其成熟技能生态执行
各管一摊,协同作战。
十、什么人适合装 Hermes?
✅ 适合的人
想要后台自主运行的Agent——不是盯着看,是睡觉也干活
对Harness Engineering好奇——看方法论产品化后的样子
数据隐私敏感——自托管,数据不离开自己服务器
内容创作/知识管理——需要积累个人风格的助手
有$5/月预算——Hetzner/DigitalOcean/Vultr VPS即可
❌ 不适合的人
只想快速验证一次性任务 → ChatGPT/Claude Code够了
不想折腾配置 → Claude Code/Cursor订阅更省心
企业合规要完全可审计 → OpenClaw更透明
十一、从 OpenClaw 迁移
如果你已经有OpenClaw(或旧版Clawdbot/Moldbot),Hermes提供了官方迁移工具,一键导入配置。
#
预览将执行的操作(不修改任何文件)hermes claw migrate --dry-run#
执行迁移(默认不包含密钥)hermes claw migrate# 完整迁移,包含API密钥hermes
claw migrate --preset full |
迁移默认从 ~/.openclaw/ 读取配置。如果仍有旧版 ~/.clawdbot/ 或 ~/.moldbot/
目录,系统会自动检测。
迁移内容包括:人格设定、记忆文件、API配置、技能包。OpenClaw的Skill可以直接带过来继续用。
十二、决策框架(截图保存)
选型其实不复杂,一张图帮你快速判断:
只是想快速写代码
→ Claude Code□ 给团队定制Agent,要可审计 → OpenClaw□ 想要24/7在线的私人助手
→ Hermes Agent□ 长期内容项目,要积累风格 → Hermes + Claude
Code□ 数据不能离开自己服务器 → Hermes(MIT自托管)□ 企业合规,SOC2/HIPAA
→ OpenClaw |
Hermes 安装速查路径:
$5/月 VPS(Hetzner/DigitalOcean/Vultr)
curl 一键脚本安装
hermes model 配置API Key
hermes gateway setup 配消息平台
定期审查 ~/.hermes/skills/ 和持久记忆
十三、关键资源
官方资源
GitHub:https://github.com/nousresearch/hermes-agent
官网:https://hermes-agent.nousresearch.com/
官方文档:https://hermes-agent.nousresearch.com/docs/
社区资源
中文文档:https://hermes-doc.aigc.green/
Hermes橙皮书:《Hermes Agent从入门到精通》
Skills Hub:agentskills.io(开源技能标准,社区可共享)
Twitter:@Teknium(创始人)、@NousResearch(官方)
结语
Hermes Agent的出现,标志着AI Agent从“功能堆砌”走向“系统设计”的拐点。
过去我们在争论Agent能调用多少个工具、能接入多少个平台;现在更值得关注的是——Agent能不能在使用中变得更聪明、更懂你。当模型能力越来越强,真正拉开差距的,是模型外面那层“运行时系统”。
Hermes之所以能在两个月内从零冲到7万星,不是因为它功能最多,而是因为它给出了一个值得被反复讨论的答案:AI
Agent不应该是用完即弃的工具,而应该是能陪你一起成长、越用越值钱的伙伴。
$5一个月,养一匹属于你自己的“爱马仕”。它不会一上来就完美,但会随着每一次互动,悄悄变得更好。
这,可能就是开源Agent该有的样子。 |