Hermes Agent 小白完全指南，没人教它，它自己学会了写代码

2720 次浏览

12 次

2026-5-8

编辑推荐:

本文主要介绍了Hermes Agent 小白完全指南相关内容。希望对你的学习有帮助。
本文来自于微信公众号AI学霸，由火龙果软件Alice编辑，推荐。

2026年AI开源圈最火的词，不是模型，而是Agent。

两个月前，开发者们还在热烈讨论OpenClaw（俗称“龙虾”）这个AI操作系统新物种；两个月后，风向突然转向了一个名字听起来就很贵的开源项目——Hermes Agent。因为和奢侈品牌撞名，国内开发者亲切地喊它“爱马仕”。

上线仅六周，Hermes就在GitHub上狂揽超6.4万颗星，连续多日霸榜全球开源榜单第一，增速是同期OpenClaw的三倍有余。YC CEO Garry Tan亲自上手后直呼“彻底回不去了”，Anthropic甚至被指控在“复制”它的功能。打开今日头条查看图片详情这匹“爱马仕”到底凭什么？

一句话记住它：OpenClaw是养龙虾（），Hermes是养马（）。龙虾需要你喂，马会自己找草吃，越骑越顺。

下面，我们就来深度解剖这匹会“自进化”的神马。

一、Hermes 是什么？——5 岁小孩也能懂

想象你请了一个数字助手：

普通 AI（如 ChatGPT）：每次聊天都是新认识，昨天聊的今天就忘。
Hermes：越聊越懂你，第 10 次比第 1 次好用得多。

这就像你新认识一个朋友：刚开始只是泛泛之交，相处久了，他知道你喜欢喝什么咖啡、几点起床、说话有什么习惯——然后在你开口之前，他已经帮你准备好了。

官方用一句话精准概括了这个定位："The Agent That Grows With You"（和你一起成长的 Agent）。它不是“用完即走”的工具，而是会积累、会进步的数字分身。

Hermes Agent由知名开源大模型机构Nous Research于2026年2月底推出。这家机构成立于2023年，团队约20人，核心成员来自StabilityAI，此前推出的Hermes、Nomos系列模型累计下载超5000万次。“训模人做Agent”的基因，让他们比单纯做工具的人更懂大模型的能力边界——这也是Hermes能在技术上超越前任王者OpenClaw的深层原因。

核心配方一览：

维度	数据
最低成本	$5/月 VPS，24 小时在线
GitHub Stars	突破 7 万（发布两个月）
内置工具	40+
支持平台	16 个（Telegram/Discord/Slack/微信/飞书/钉钉等）
MCP 可接入	6,000+ 应用
迭代速度	平均不到一周一个大版本

二、为什么叫“养马”？和“养虾”有什么区别？

这个比喻非常形象，正好打中了两个产品最核心的设计差异。

养虾（OpenClaw）：

你养了一池龙虾

每只龙虾都听你指挥

数量多、好管理

但每只都不认识你，每次都要重新教

OpenClaw本质上是一个“广连接”的网关系统，强调多平台接入和多Agent编排，它的技能完全依赖人工编写或从社区下载，缺乏自我进化能力。

养马（Hermes）：

你养了一匹马

刚开始不熟悉，跑得不快

骑多了它懂你的习惯、脾气、偏好

第 10 次比第 1 次顺多了

用一句业内广为流传的总结来说：Hermes 是教 AI “怎么把活干好”；OpenClaw 是在解决 “怎么管好这帮干活的 AI” 。

两者的本质区别在于“自进化闭环”。Hermes完成复杂任务后，会自动把解决方案提炼成可复用的技能文件；使用中发现不足，还能自动“打补丁”优化。而OpenClaw是静态的——你教它什么，它就只会什么，技能需要人工编写、安装、维护。

社区验证了一个重要事实：两者并非水火不容，而是可以协同使用。Hermes负责记住偏好、积累技能、沉淀记忆；OpenClaw负责利用其庞大的技能生态执行具体任务。甚至社区已催生出专门的桥接工具HermesClaw，让一个微信机器人同时接入两个Agent。

三、Hermes 是怎么“长脑子”的？——学习循环五部曲

Hermes的核心竞争力，在于其内建的学习闭环。这个闭环由五个环节组成，持续运转：

干活 → 复盘 → 写手册 → 优化 → 再用

具体拆解：

策划记忆：每次任务后，Agent主动判断哪些信息值得存入数据库，而不是被动存储全部内容
创建 Skill：发现新套路，自动写成操作手册（Markdown格式）
Skill 自改进：老手册不好用，自动打补丁优化
FTS5 召回：需要时通过全文搜索快速找到相关手册
用户建模：通过可选的Honcho系统，分析交互行为，推断深层偏好

真实例子：写爬虫

第 1 次：你说“帮我写个爬虫抓标题”。Hermes写了一个基础版本，但风格可能不符合你的习惯——变量命名、错误处理方式都需要你手动调整。
第 10 次：你说“抓这个网站的标题”。Hermes已经知道：你偏好 httpx 而不是 requests你习惯把错误日志写到文件你的项目结构是 src/ 目录下按模块分你讨厌过长的函数

没人教它这些。它是自己学会的。

更惊艳的是它的进化算法。Hermes内置了一套离线批量进化算法，使用DSPy框架和GEPA（Genetic-Pareto Prompt Evolution）核心算法——这套方法出自一篇ICLR 2026 Oral论文，标题就叫《反思性提示词进化可以跑赢强化学习》。这已经不是简单的“记忆”，而是真正的“学习”。

四、记忆系统：从“金鱼记忆”到“老友记”

如果说传统AI是只有7秒记忆的金鱼，那Hermes就是一个对你知根知底的老朋友。它的记忆架构从最初的三层演进到了更精密的五层漏斗模型。

传统三层记忆（官方基础模型）

第一层：情景记忆（发生了什么）

存对话记录
用 SQLite + 全文搜索（FTS5）
按需检索，不是每次都加载全部历史

第二层：语义记忆（你是谁）

编码偏好、常用工具链、工作时间规律
存储在USER.md文件中，约500 tokens

第三层：程序性记忆（怎么做事）

Skill 文件（Markdown 格式）
可编辑、可复用
会自我进化

v0.9.0 五层记忆架构（更精密的漏斗模型）

最新版本进一步优化为五层结构：

L1 核心记忆：存储在MEMORY.md中，严格限制约800 tokens，每次会话冻结为快照注入系统提示词
L2 用户画像：记录沟通风格、技术栈偏好、工作习惯
L3 长时记忆：SQLite持久化，支持全文检索
L4 技能记忆：可复用的方法论沉淀
L5 血缘追溯：每条记忆都记录来源，确保可解释性

这五层记忆让Agent真正具备了“随时间成长”的能力，而不会像传统的向量检索RAG那样产生“幻觉”或检索漂移。

五、怎么安装？——三种方式，新手不迷路

Hermes的安装门槛极低，一行命令就能搞定。但为了让你少走弯路，这里把三种方式都讲透。

方式一：本地安装（5 分钟）

# 一键安装curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash# 配置hermes setup# 启动hermes

支持平台：Linux、macOS、Windows WSL2、Android Termux。原生Windows暂不支持，需要先安装WSL2。

方式二：Docker（干净隔离）

docker pull nousresearch/hermes-agent:latestdocker run -v ~/.hermes:/opt/data nousresearch/hermes-agent:latest

方式三：$5 VPS 24/7（最推荐）

让Hermes在云端7×24小时运行，这才是它真正的用法。

推荐配置：Ubuntu 22.04 LTS，内存 >500MB

推荐服务商：Hetzner / DigitalOcean / Vultr / 阿里云轻量服务器

装完之后别忘了运行 hermes model 配置大模型API。Hermes兼容GPT、Claude、GLM、DeepSeek、Kimi、Qwen等主流模型，要求模型上下文窗口至少64K。

避坑提示：安装后若提示 hermes: command not found，执行 source ~/.bashrc 或 source ~/.zshrc 重载shell即可。Windows用户务必使用WSL2，原生CMD/PowerShell不支持。

六、v0.9.0 新功能：“无处不在版”

2026年4月13日，Hermes发布了v0.9.0版本，包含487个commit和269个合并PR，是一次以“平台扩展”为主题的大版本更新。

最受瞩目的新功能：

Termux/Android：手机上跑完整 Hermes
微信原生接入：通过腾讯官方iLink Bot API，公网服务器扫码即连
iMessage：通过 BlueBubbles 接入
企业微信回调模式：面向自建应用的完整适配
Fast Mode：接入OpenAI/Anthropic快速通道，降低推理延迟
Web 仪表板：在浏览器中配置设置、管理技能、监控会话，无需手改配置文件
后台进程监控：实时监控后台进程输出，模式匹配触发通知
可插拔上下文引擎：通过插件自定义每轮上下文内容
备份导入命令：hermes backup 和 hermes import 完整迁移配置

设计理念很打动人：**“不是你来我家，是我在你家等你”** 。目前Hermes已覆盖16个通讯平台，国内主流IM——钉钉、飞书、企业微信、微信——全部接全。

Nous Research官方还专门发了一条中文推文，用中文跟中国用户互动。中文为什么这么顺？他们自己揭了底：请Hermes帮忙润色的。

七、实战场景：Hermes 能帮你做什么？

理论说了这么多，不如看看实战。以下是四个典型场景，展示Hermes如何真正落地。

场景一：个人知识助手（跨会话记忆的威力）

问题：传统AI每次对话都从零开始，调研一个话题需要反复解释背景。

Hermes方案：假设你在调研AI Agent部署方案，持续三周——

第一周：你问了Docker部署内存占用、VPS价格对比、Daytona免费额度限制。

第二周：你直接说“继续看Serverless方案”——

Hermes记得你在调研什么

主动提醒：“上周你提到Daytona有免费额度限制，要确认最新政策吗？”

不会重新推荐你已排除的方案

第三周：方法论已经沉淀为Skill——

“调研类任务：先列维度→逐个深挖→每轮汇总”

第二个调研项目自动复用

场景二：内容创作（从调研到成稿）

问题：用AI写文章不稀奇，但每次都要重新说明风格偏好。

Hermes方案：连续写5篇AI Agent文章。

风格Skill自改进示例：

初始 Skill：# 写作风格- 别用“综上所述”- 段落保持3-5行- 多用“我觉得”“其实”这类口语词使用一个月后自动进化：# 写作风格（已进化）- 别用“综上所述”、“值得注意的是”- 段落保持3-5行- 多用“我觉得”“其实”这类口语词- 避免用“进行+动词”的句式（把“进行优化”改为“优化一下”）- 结尾不要强行升华- 技术概念首次出现要加一句话解释- 代码示例控制在15行以内

子Agent并行调研：写一篇AI Agent对比文章时，同时派出三个子Agent——每个只分配web+browser两个工具，独立调研Claude Code、Cursor、Hermes Agent，按统一模板输出，最后主Agent汇总。

线性调研：40分钟

并行调研：15分钟

场景三：开发自动化（代码审查到部署）

典型早晨：早上9点打开飞书，收到Hermes发的消息：

“昨晚23:17，main分支有PR合并，新增387行代码。审查了一下有两个问题：auth模块的token过期逻辑没处理边界情况；测试覆盖率从82%掉到76%。详细报告已存到项目Skill里。” “凌晨2:40，CI流水线跑了一轮回归测试，3个用例失败。2个是昨天那个PR引入的，1个是已知的flaky test。” “今天的日报初稿已生成，基于昨天的4个commit和2个PR。需要你确认后发送。”

这不是假想场景。这是cron调度+GitHub MCP+记忆系统的组合效果。

关键差异：

传统lint规则是静态的

Hermes的审查标准是活的——你标记了它没发现的问题，下次就会注意同类模式

场景四：多Agent编排（让三匹马同时跑）

适用场景：任务复杂到单Agent上下文不够用，或需要并行加速。

实际案例：竞品分析报告

传统做法：一个一个调研，然后手动整合（90分钟）

Hermes做法：

主Agent拆分任务+定义模板

并行派三个子Agent：调研产品A/B/C

每个子Agent只有web+browser两个工具（最小权限原则）

主Agent汇总整合三份调研结果，生成对比报告

并发上限3个，防止汇总质量下降

八、MCP：连接 6,000+ 应用

MCP（Model Context Protocol，模型上下文协议）是Hermes实现广泛连接的关键。通过MCP，Hermes可以接入GitHub、数据库、Slack、Jira等6,000多个服务。

配置示例：

mcp_servers: github:
command: "npx"
args: ["-y", "@modelcontextprotocol/server-github"]
env:
GITHUB_PERSONAL_ACCESS_TOKEN: "ghp_xxxxx"
allowed_tools: # 白名单，最小权限
- "list_issues"
- "create_issue"
- "get_pull_request"

MCP + Skill 组合最佳实践：

MCP 提供读取 PR 的能力

Skill 定义你的审查标准

两者结合 = 按你的标准自动审查代码

v0.6.0版本还新增了MCP Server Mode，允许将Hermes的对话和会话暴露给任何MCP兼容客户端（Claude Desktop、Cursor、VS Code等）。

九、对比：Claude Code vs OpenClaw vs Hermes

了解三者的差异，能帮你做出更好的选择。

维度	Claude Code	OpenClaw	Hermes Agent
核心定位	交互式编码助手	多渠道个人助理OS	自进化Agent运行时
技术栈	-	Node.js+TypeScript	Python+FastAPI
记忆能力	静态/会话级	手动维护Markdown	五层自动记忆+自进化
微信接入	-	第三方插件	官方原生支持
学习能力	无	静态配置	自主学习循环
安全设计	-	需手动配置	默认沙盒+审批
社区迭代	稳定	放缓	极速迭代
技能生态	-	ClawHub 13,000+	起步但增速快

关键洞察：很多场景不是一个工具就能搞定的。

长期内容项目：Hermes负责每天自动搜集信息、积累记忆

深度编码开发：Claude Code负责坐下来把东西写出来

多渠道任务调度：OpenClaw利用其成熟技能生态执行

各管一摊，协同作战。

十、什么人适合装 Hermes？

✅ 适合的人

想要后台自主运行的Agent——不是盯着看，是睡觉也干活

对Harness Engineering好奇——看方法论产品化后的样子

数据隐私敏感——自托管，数据不离开自己服务器

内容创作/知识管理——需要积累个人风格的助手

有$5/月预算——Hetzner/DigitalOcean/Vultr VPS即可

❌ 不适合的人

只想快速验证一次性任务 → ChatGPT/Claude Code够了

不想折腾配置 → Claude Code/Cursor订阅更省心

企业合规要完全可审计 → OpenClaw更透明

十一、从 OpenClaw 迁移

如果你已经有OpenClaw（或旧版Clawdbot/Moldbot），Hermes提供了官方迁移工具，一键导入配置。

# 预览将执行的操作（不修改任何文件）hermes claw migrate --dry-run# 执行迁移（默认不包含密钥）hermes claw migrate# 完整迁移，包含API密钥hermes claw migrate --preset full

迁移默认从 ~/.openclaw/ 读取配置。如果仍有旧版 ~/.clawdbot/ 或 ~/.moldbot/ 目录，系统会自动检测。

迁移内容包括：人格设定、记忆文件、API配置、技能包。OpenClaw的Skill可以直接带过来继续用。

十二、决策框架（截图保存）

选型其实不复杂，一张图帮你快速判断：

只是想快速写代码 → Claude Code□ 给团队定制Agent，要可审计 → OpenClaw□ 想要24/7在线的私人助手 → Hermes Agent□ 长期内容项目，要积累风格 → Hermes + Claude Code□ 数据不能离开自己服务器 → Hermes（MIT自托管）□ 企业合规，SOC2/HIPAA → OpenClaw

Hermes 安装速查路径：

$5/月 VPS（Hetzner/DigitalOcean/Vultr）

curl 一键脚本安装

hermes model 配置API Key

hermes gateway setup 配消息平台

定期审查 ~/.hermes/skills/ 和持久记忆

十三、关键资源

官方资源

GitHub：https://github.com/nousresearch/hermes-agent

官网：https://hermes-agent.nousresearch.com/

官方文档：https://hermes-agent.nousresearch.com/docs/

社区资源

中文文档：https://hermes-doc.aigc.green/

Hermes橙皮书：《Hermes Agent从入门到精通》

Skills Hub：agentskills.io（开源技能标准，社区可共享）

Twitter：@Teknium（创始人）、@NousResearch（官方）

结语

Hermes Agent的出现，标志着AI Agent从“功能堆砌”走向“系统设计”的拐点。

过去我们在争论Agent能调用多少个工具、能接入多少个平台；现在更值得关注的是——Agent能不能在使用中变得更聪明、更懂你。当模型能力越来越强，真正拉开差距的，是模型外面那层“运行时系统”。

Hermes之所以能在两个月内从零冲到7万星，不是因为它功能最多，而是因为它给出了一个值得被反复讨论的答案：AI Agent不应该是用完即弃的工具，而应该是能陪你一起成长、越用越值钱的伙伴。

$5一个月，养一匹属于你自己的“爱马仕”。它不会一上来就完美，但会随着每一次互动，悄悄变得更好。

这，可能就是开源Agent该有的样子。

2720 次浏览

12 次