本文基于实际安装和使用 Hermes Agent 的真实体验,记录了从安装到核心功能测试的完整过程。

为什么需要自我进化的 AI Agent?

目前市面上的 AI Agent 产品很多,但大多数都有一个共同的痛点:每次对话都是从零开始。你告诉它你的偏好、你的项目背景、你的工作习惯,下次打开又得重新说一遍。

Hermes Agent 是 Nous Research 开源的一个 AI Agent 框架,它的核心卖点是:一个能从经验中学习、在使用中自我改进的 AI 助手。它会自动记住你的信息,自动创建可复用的技能,甚至能跨会话回忆过去的对话。

本文就来实际体验一下,看看它到底有没有宣传的那么神奇。

安装与配置

安装方式选择

Hermes Agent 提供了两种安装方式:

方式一:一键安装(推荐新手)

iex (irm https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.ps1)

这种方式会自动安装所有依赖,包括 uv(Python 包管理器)、Git、Node.js 等。适合环境干净的用户。

方式二:自定义目录安装

如果你不想装到默认的 C 盘,或者想指定安装目录,可以用这种方式:

# 下载安装脚本到临时目录
irm https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.ps1 -OutFile "$env:TEMP\hermes-install.ps1"

# 带参数执行,指定安装目录
& "$env:TEMP\hermes-install.ps1" -HermesHome "F:\software\hermes" -InstallDir "F:\software\hermes\hermes-agent" -SkipSetup

这里有几个参数说明:

  • -HermesHome:Hermes 的数据目录(配置、日志、记忆等)
  • -InstallDir:源码安装目录
  • -SkipSetup:跳过初始设置向导,后面可以手动配置

安装完成后会提示重启终端,让 PATH 环境变量生效。

验证安装

打开新的 PowerShell 窗口,运行:

hermes --version

看到类似下面的输出,说明安装成功:

Hermes Agent v0.14.0 (2026.5.16)
Project: F:\software\hermes\hermes-agent
Python: 3.12.7
OpenAI SDK: 2.24.0

配置模型

有两种方式配置 API Key 和模型:

方式一:官方向导

hermes setup

这个向导会引导你配置 LLM 提供商、API Key 等信息。支持 OpenRouter、OpenAI、Anthropic 等多种提供商。

方式二:使用 CC Switch(推荐)

CC Switch 是一款跨平台桌面应用,专为使用 AI 编程工具的开发者设计。它帮助你统一管理 Claude Code、Claude Desktop、Codex、Gemini CLI、Hermes 等受管应用的配置。一键切换多个 API 供应商配置,支持预设模板,快速添加常用供应商。

用 CC Switch 配置的好处是:一次配置,多个工具共享,切换供应商也很方便。

核心功能体验

配置完成后,运行 hermes 进入交互式 CLI。这里让他介绍自己,一切正常,说明配置可用。

接下来,我们来体验 Hermes 的几个核心功能。

1. 记忆系统:跨会话记住你的身份

这是 Hermes 最让我惊喜的功能之一。

我用自然语言告诉它:

“记住:我是大数据和AI行业的从业者,有自己的公众号,经常写技术文章。”

它回复说已经记住了。然后我用 /new 开了一个新会话,问它:

“你还记得我是做什么的吗?”

它准确地回答了我的职业信息。

更让我意外的是,当我打开 F:\software\hermes\memories\USER.md 文件时,发现它确实把这条信息写入了记忆文件。

§
用户是大数据和AI行业的从业者,有自己的公众号,经常写技术文章

这个功能的实现原理是:Hermes 会在每次会话开始时,自动将记忆文件注入到系统提示词中。这样 Agent 就能"记住"你的信息,而不需要你每次重复说明。

2. 技能系统:77 个内置技能

Hermes 内置了 77 个技能,覆盖了多个领域:

分类 技能示例
自主 AI Agent Claude Code、Codex、OpenCode 委托编码
创意 ASCII 艺术、信息图、漫画、像素艺术
数据科学 Jupyter 内核、DSPy、HuggingFace
GitHub Issue 管理、PR 工作流、代码审查
生产力 Notion、Obsidian、Google Workspace
研究 arXiv 论文搜索、博客监控

让我印象深刻的是,当我让它写一个 Python 脚本时:

“帮我写一个 Python 脚本,批量读取指定目录下所有 CSV 文件,统计每个文件的行数、列数、文件大小,最后输出一个汇总表并保存为 result.xlsx。”

它不但完成了代码编写,还自动进行了测试。这种"不只是写代码,还要验证代码"的行为,比很多同类产品要靠谱。

3. 网页抓取:自动尝试多种方案

这个功能的体验过程非常有意思。

我让它帮我整理知乎热点:

“打开知乎热榜,帮我整理今天的前10个热点话题,包括标题、热度和一句话摘要。”

有趣的是,他发现知乎不能直接获取。

结果它一共尝试了 5 种方案:

步骤 方法 结果
1 直接访问 zhihu.com/hot ❌ 页面 JS 渲染,60s 超时
2 知乎官方 API ❌ 需要登录认证 (401)
3 第三方聚合 API (vvhan / tenapi) ❌ 接口不可用 / 502
4 tophub.today 网页抓取 ❌ IP 触发安全验证
5 RSSHub RSS 订阅源 ✅ 成功获取 37KB XML 数据
6 sed/grep 解析 XML 提取标题、摘要、链接 ✅ 输出 TOP10

最让我意外的是第 5 步:它自己找到了 RSSHub 的 RSS 订阅源来获取数据。我没有提醒它用 RSS,它完全是自主决策的。

虽然过程有些坎坷,但它最终完成了任务。这种"遇到问题不放弃,自己想办法解决"的能力,正是 Agent 的核心价值所在。

4. 定时任务:自然语言创建自动化

Hermes 内置了 cron 定时任务功能,理论上可以通过命令创建定时任务:

/cron add "every day at 8am" "抓取知乎热榜TOP10"

但实际体验时发现,这种方式很容易出语法错误。我尝试了多种写法都失败了:

/cron add 每天早上8点,通过RSSHub抓取知乎热榜TOP10
(._.) Please provide a prompt or at least one skill

/cron add "every day at 8am" "抓取知乎热榜TOP10"
(._.) Usage: /cron add <schedule> <prompt>

最后,我干脆直接用自然语言问它:

“如何把刚才抓取知乎热榜TOP10的任务放在定时任务里,我想每天8点都看到。”

没想到,这样直接就完成了!

通过 /cron list 查看,确实已经存在这个定时任务。

这给我的启发是:对于 Agent 来说,自然语言交互比命令语法更重要。用户不应该去记忆复杂的命令格式,直接用自然语言描述需求就好。

5. Gateway 网关(跳过)

Hermes 支持通过 Telegram、Discord、Slack 等多个平台进行交互。但这个功能在很多同类产品中都有,差异化不明显,这里就不展开了。

6. 其他值得了解的功能

除了上面详细体验的功能外,Hermes 还有一些值得关注的能力:

Goal(目标系统)

你可以给 Hermes 设置一个长期目标,比如"帮我整理一份 Python 数据处理最佳实践文档"。它会跨多轮对话持续追踪这个目标,直到完成。适合需要多步骤协作的复杂任务。

子 Agent 并行

Hermes 可以 spawn 隔离的子 Agent 来处理并行工作流。比如你让它同时做三件事,它会分配给不同的子 Agent 并行执行,而不是串行等待。这在处理批量任务时能显著提升效率。

模型无关

Hermes 不绑定任何 LLM 厂商。通过 hermes model 命令可以一键切换模型,支持 OpenRouter(200+ 模型)、OpenAI、Anthropic、小米 MiMo、月之暗面 Kimi 等多家提供商。这意味着你可以根据任务类型选择最合适的模型,而不是被锁定在某个平台上。

MCP 集成

Hermes 支持 MCP(Model Context Protocol)协议,可以连接任何 MCP 服务器来扩展能力。这意味着你可以接入各种第三方工具和服务,而不需要 Hermes 本身支持它们。

灵活部署

Hermes 支持六种终端后端:本地、Docker、SSH、Singularity、Modal、Daytona。其中 Modal 和 Daytona 支持 serverless 持久化——空闲时休眠,按需唤醒,几乎零成本。你可以跑在 $5 VPS 上,也可以跑在 GPU 集群上。

整体体验总结

经过实际体验,Hermes Agent 有几个让我印象深刻的地方:

1. 记忆系统真的好用

跨会话记忆是刚需。很多 Agent 产品都有这个功能,但 Hermes 的实现方式很优雅——自动注入系统提示词,用户完全无感。

2. 技能系统有潜力

77 个内置技能覆盖了很多场景,而且 Agent 还能自动创建新技能。虽然这次体验中没有触发自动创建技能的功能,但这个方向很有想象空间。

3. 自主决策能力突出

网页抓取那个案例最能说明问题:遇到 4 次失败后,它自己找到了 RSSHub 这个方案。这种"不依赖用户提示,自己解决问题"的能力,比简单的工具调用更有价值。

4. 自然语言交互是王道

定时任务的创建过程说明,对于 Agent 来说,精确的命令语法不如自然语言交互来得直接。这也是 Agent 产品应该追求的方向。

也有需要改进的地方:

  • 安装过程对新手不太友好,需要处理很多环境问题
  • 命令语法有时不够直观,容易出错
  • 部分功能依赖外部服务(如 RSSHub),稳定性有风险

适合什么场景?

根据我的体验,Hermes Agent 适合以下场景:

  • 需要长期协作的开发者:记忆系统让 Agent 能记住你的项目背景和偏好
  • 需要自动化工作流的用户:定时任务 + 网页抓取可以实现很多自动化场景
  • 喜欢折腾的技术爱好者:丰富的技能系统和插件机制有很多可玩性

与同类产品对比

市面上有不少 AI Agent 产品,这里拿几个有代表性的来对比一下。

Hermes Agent vs OpenClaw

OpenClaw 是另一个开源 AI Agent 项目,Hermes 官方甚至提供了从 OpenClaw 迁移的工具(hermes claw migrate),说明两者定位相似。主要区别:

维度 Hermes Agent OpenClaw
核心理念 自我进化(记忆 + 技能自改进) 工具调用 + 对话
记忆系统 自动注入系统提示词,跨会话持久化 有记忆功能,但实现方式不同
技能系统 77 个内置技能 + 自动创建 技能体系较轻量
模型支持 200+ 模型,一键切换 支持主流模型
部署方式 6 种终端后端(本地/Docker/SSH/云) 主要本地部署
社区生态 Nous Research 维护,活跃度高 社区驱动

从 OpenClaw 迁移到 Hermes 很方便,官方支持导入设置、记忆、技能和 API Key。

Hermes Agent vs Claude Code / Cursor

这类产品更偏向"编程助手",而 Hermes 是一个通用 Agent:

维度 Hermes Agent Claude Code / Cursor
定位 通用 AI Agent 编程专用助手
记忆 跨会话持久化记忆 项目级上下文
技能 77 个跨领域技能 专注代码相关
定时任务 内置 cron 调度器
多平台 CLI + Telegram + Discord 等 IDE 集成
适用场景 编程 + 研究 + 自动化 + 日常 编程为主

如何选择?

  • 如果你主要写代码:Claude Code / Cursor 更专业,IDE 集成更好
  • 如果你需要一个"会记住你的全能助手":Hermes Agent 更合适
  • 如果你两者都要:Hermes 支持委托 Claude Code 执行编码任务(内置 claude-code 技能)

写在最后

Hermes Agent 的核心理念是"自我进化"——通过记忆系统、技能系统和自主决策能力,让 Agent 能够在使用过程中不断学习和改进。虽然目前还有一些体验上的小问题,但这个方向很有前景。

如果你也对 AI Agent 感兴趣,不妨试试 Hermes Agent,体验一下"会记住你的 AI 助手"是什么感觉。


Logo

欢迎加入 MCP 技术社区!与志同道合者携手前行,一同解锁 MCP 技术的无限可能!

更多推荐