体验 Hermes Agent:一个会自我进化的 AI 智能体

本文基于实际安装和使用 Hermes Agent 的真实体验,记录了从安装到核心功能测试的完整过程。
为什么需要自我进化的 AI Agent?
目前市面上的 AI Agent 产品很多,但大多数都有一个共同的痛点:每次对话都是从零开始。你告诉它你的偏好、你的项目背景、你的工作习惯,下次打开又得重新说一遍。
Hermes Agent 是 Nous Research 开源的一个 AI Agent 框架,它的核心卖点是:一个能从经验中学习、在使用中自我改进的 AI 助手。它会自动记住你的信息,自动创建可复用的技能,甚至能跨会话回忆过去的对话。
本文就来实际体验一下,看看它到底有没有宣传的那么神奇。
安装与配置
安装方式选择
Hermes Agent 提供了两种安装方式:
方式一:一键安装(推荐新手)
iex (irm https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.ps1)
这种方式会自动安装所有依赖,包括 uv(Python 包管理器)、Git、Node.js 等。适合环境干净的用户。
方式二:自定义目录安装
如果你不想装到默认的 C 盘,或者想指定安装目录,可以用这种方式:
# 下载安装脚本到临时目录
irm https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.ps1 -OutFile "$env:TEMP\hermes-install.ps1"
# 带参数执行,指定安装目录
& "$env:TEMP\hermes-install.ps1" -HermesHome "F:\software\hermes" -InstallDir "F:\software\hermes\hermes-agent" -SkipSetup
这里有几个参数说明:
-HermesHome:Hermes 的数据目录(配置、日志、记忆等)-InstallDir:源码安装目录-SkipSetup:跳过初始设置向导,后面可以手动配置
安装完成后会提示重启终端,让 PATH 环境变量生效。

验证安装
打开新的 PowerShell 窗口,运行:
hermes --version
看到类似下面的输出,说明安装成功:
Hermes Agent v0.14.0 (2026.5.16)
Project: F:\software\hermes\hermes-agent
Python: 3.12.7
OpenAI SDK: 2.24.0
配置模型
有两种方式配置 API Key 和模型:
方式一:官方向导
hermes setup
这个向导会引导你配置 LLM 提供商、API Key 等信息。支持 OpenRouter、OpenAI、Anthropic 等多种提供商。

方式二:使用 CC Switch(推荐)
CC Switch 是一款跨平台桌面应用,专为使用 AI 编程工具的开发者设计。它帮助你统一管理 Claude Code、Claude Desktop、Codex、Gemini CLI、Hermes 等受管应用的配置。一键切换多个 API 供应商配置,支持预设模板,快速添加常用供应商。
用 CC Switch 配置的好处是:一次配置,多个工具共享,切换供应商也很方便。

核心功能体验
配置完成后,运行 hermes 进入交互式 CLI。这里让他介绍自己,一切正常,说明配置可用。

接下来,我们来体验 Hermes 的几个核心功能。
1. 记忆系统:跨会话记住你的身份
这是 Hermes 最让我惊喜的功能之一。
我用自然语言告诉它:
“记住:我是大数据和AI行业的从业者,有自己的公众号,经常写技术文章。”
它回复说已经记住了。然后我用 /new 开了一个新会话,问它:
“你还记得我是做什么的吗?”
它准确地回答了我的职业信息。

更让我意外的是,当我打开 F:\software\hermes\memories\USER.md 文件时,发现它确实把这条信息写入了记忆文件。
§
用户是大数据和AI行业的从业者,有自己的公众号,经常写技术文章
这个功能的实现原理是:Hermes 会在每次会话开始时,自动将记忆文件注入到系统提示词中。这样 Agent 就能"记住"你的信息,而不需要你每次重复说明。
2. 技能系统:77 个内置技能
Hermes 内置了 77 个技能,覆盖了多个领域:
| 分类 | 技能示例 |
|---|---|
| 自主 AI Agent | Claude Code、Codex、OpenCode 委托编码 |
| 创意 | ASCII 艺术、信息图、漫画、像素艺术 |
| 数据科学 | Jupyter 内核、DSPy、HuggingFace |
| GitHub | Issue 管理、PR 工作流、代码审查 |
| 生产力 | Notion、Obsidian、Google Workspace |
| 研究 | arXiv 论文搜索、博客监控 |
让我印象深刻的是,当我让它写一个 Python 脚本时:
“帮我写一个 Python 脚本,批量读取指定目录下所有 CSV 文件,统计每个文件的行数、列数、文件大小,最后输出一个汇总表并保存为 result.xlsx。”
它不但完成了代码编写,还自动进行了测试。这种"不只是写代码,还要验证代码"的行为,比很多同类产品要靠谱。

3. 网页抓取:自动尝试多种方案
这个功能的体验过程非常有意思。
我让它帮我整理知乎热点:
“打开知乎热榜,帮我整理今天的前10个热点话题,包括标题、热度和一句话摘要。”

有趣的是,他发现知乎不能直接获取。

结果它一共尝试了 5 种方案:
| 步骤 | 方法 | 结果 |
|---|---|---|
| 1 | 直接访问 zhihu.com/hot | ❌ 页面 JS 渲染,60s 超时 |
| 2 | 知乎官方 API | ❌ 需要登录认证 (401) |
| 3 | 第三方聚合 API (vvhan / tenapi) | ❌ 接口不可用 / 502 |
| 4 | tophub.today 网页抓取 | ❌ IP 触发安全验证 |
| 5 | RSSHub RSS 订阅源 | ✅ 成功获取 37KB XML 数据 |
| 6 | sed/grep 解析 XML 提取标题、摘要、链接 | ✅ 输出 TOP10 |
最让我意外的是第 5 步:它自己找到了 RSSHub 的 RSS 订阅源来获取数据。我没有提醒它用 RSS,它完全是自主决策的。
虽然过程有些坎坷,但它最终完成了任务。这种"遇到问题不放弃,自己想办法解决"的能力,正是 Agent 的核心价值所在。
4. 定时任务:自然语言创建自动化
Hermes 内置了 cron 定时任务功能,理论上可以通过命令创建定时任务:
/cron add "every day at 8am" "抓取知乎热榜TOP10"
但实际体验时发现,这种方式很容易出语法错误。我尝试了多种写法都失败了:
/cron add 每天早上8点,通过RSSHub抓取知乎热榜TOP10
(._.) Please provide a prompt or at least one skill
/cron add "every day at 8am" "抓取知乎热榜TOP10"
(._.) Usage: /cron add <schedule> <prompt>
最后,我干脆直接用自然语言问它:
“如何把刚才抓取知乎热榜TOP10的任务放在定时任务里,我想每天8点都看到。”
没想到,这样直接就完成了!

通过 /cron list 查看,确实已经存在这个定时任务。

这给我的启发是:对于 Agent 来说,自然语言交互比命令语法更重要。用户不应该去记忆复杂的命令格式,直接用自然语言描述需求就好。
5. Gateway 网关(跳过)
Hermes 支持通过 Telegram、Discord、Slack 等多个平台进行交互。但这个功能在很多同类产品中都有,差异化不明显,这里就不展开了。
6. 其他值得了解的功能
除了上面详细体验的功能外,Hermes 还有一些值得关注的能力:
Goal(目标系统)
你可以给 Hermes 设置一个长期目标,比如"帮我整理一份 Python 数据处理最佳实践文档"。它会跨多轮对话持续追踪这个目标,直到完成。适合需要多步骤协作的复杂任务。
子 Agent 并行
Hermes 可以 spawn 隔离的子 Agent 来处理并行工作流。比如你让它同时做三件事,它会分配给不同的子 Agent 并行执行,而不是串行等待。这在处理批量任务时能显著提升效率。
模型无关
Hermes 不绑定任何 LLM 厂商。通过 hermes model 命令可以一键切换模型,支持 OpenRouter(200+ 模型)、OpenAI、Anthropic、小米 MiMo、月之暗面 Kimi 等多家提供商。这意味着你可以根据任务类型选择最合适的模型,而不是被锁定在某个平台上。
MCP 集成
Hermes 支持 MCP(Model Context Protocol)协议,可以连接任何 MCP 服务器来扩展能力。这意味着你可以接入各种第三方工具和服务,而不需要 Hermes 本身支持它们。
灵活部署
Hermes 支持六种终端后端:本地、Docker、SSH、Singularity、Modal、Daytona。其中 Modal 和 Daytona 支持 serverless 持久化——空闲时休眠,按需唤醒,几乎零成本。你可以跑在 $5 VPS 上,也可以跑在 GPU 集群上。
整体体验总结
经过实际体验,Hermes Agent 有几个让我印象深刻的地方:
1. 记忆系统真的好用
跨会话记忆是刚需。很多 Agent 产品都有这个功能,但 Hermes 的实现方式很优雅——自动注入系统提示词,用户完全无感。
2. 技能系统有潜力
77 个内置技能覆盖了很多场景,而且 Agent 还能自动创建新技能。虽然这次体验中没有触发自动创建技能的功能,但这个方向很有想象空间。
3. 自主决策能力突出
网页抓取那个案例最能说明问题:遇到 4 次失败后,它自己找到了 RSSHub 这个方案。这种"不依赖用户提示,自己解决问题"的能力,比简单的工具调用更有价值。
4. 自然语言交互是王道
定时任务的创建过程说明,对于 Agent 来说,精确的命令语法不如自然语言交互来得直接。这也是 Agent 产品应该追求的方向。
也有需要改进的地方:
- 安装过程对新手不太友好,需要处理很多环境问题
- 命令语法有时不够直观,容易出错
- 部分功能依赖外部服务(如 RSSHub),稳定性有风险
适合什么场景?
根据我的体验,Hermes Agent 适合以下场景:
- 需要长期协作的开发者:记忆系统让 Agent 能记住你的项目背景和偏好
- 需要自动化工作流的用户:定时任务 + 网页抓取可以实现很多自动化场景
- 喜欢折腾的技术爱好者:丰富的技能系统和插件机制有很多可玩性
与同类产品对比
市面上有不少 AI Agent 产品,这里拿几个有代表性的来对比一下。
Hermes Agent vs OpenClaw
OpenClaw 是另一个开源 AI Agent 项目,Hermes 官方甚至提供了从 OpenClaw 迁移的工具(hermes claw migrate),说明两者定位相似。主要区别:
| 维度 | Hermes Agent | OpenClaw |
|---|---|---|
| 核心理念 | 自我进化(记忆 + 技能自改进) | 工具调用 + 对话 |
| 记忆系统 | 自动注入系统提示词,跨会话持久化 | 有记忆功能,但实现方式不同 |
| 技能系统 | 77 个内置技能 + 自动创建 | 技能体系较轻量 |
| 模型支持 | 200+ 模型,一键切换 | 支持主流模型 |
| 部署方式 | 6 种终端后端(本地/Docker/SSH/云) | 主要本地部署 |
| 社区生态 | Nous Research 维护,活跃度高 | 社区驱动 |
从 OpenClaw 迁移到 Hermes 很方便,官方支持导入设置、记忆、技能和 API Key。
Hermes Agent vs Claude Code / Cursor
这类产品更偏向"编程助手",而 Hermes 是一个通用 Agent:
| 维度 | Hermes Agent | Claude Code / Cursor |
|---|---|---|
| 定位 | 通用 AI Agent | 编程专用助手 |
| 记忆 | 跨会话持久化记忆 | 项目级上下文 |
| 技能 | 77 个跨领域技能 | 专注代码相关 |
| 定时任务 | 内置 cron 调度器 | 无 |
| 多平台 | CLI + Telegram + Discord 等 | IDE 集成 |
| 适用场景 | 编程 + 研究 + 自动化 + 日常 | 编程为主 |
如何选择?
- 如果你主要写代码:Claude Code / Cursor 更专业,IDE 集成更好
- 如果你需要一个"会记住你的全能助手":Hermes Agent 更合适
- 如果你两者都要:Hermes 支持委托 Claude Code 执行编码任务(内置
claude-code技能)
写在最后
Hermes Agent 的核心理念是"自我进化"——通过记忆系统、技能系统和自主决策能力,让 Agent 能够在使用过程中不断学习和改进。虽然目前还有一些体验上的小问题,但这个方向很有前景。
如果你也对 AI Agent 感兴趣,不妨试试 Hermes Agent,体验一下"会记住你的 AI 助手"是什么感觉。
更多推荐


所有评论(0)