发生了什么

开源 AI 组织 Nous Research——Hermes 系列模 型的幕后推手——正式发布了 Hermes Agent,这是一个以 持久化跨会话记忆和闭环技能学习为核心的自我进化 AI 智能体框架。据来源 文章引用的代码仓库数据,该 项目已累计超过 90,300 个 GitHub Stars 和 12,400 次 Fork,是目前 GitHub 上 Stars 数最高的 Agent 框架之一。最 新版本为 v0.9.0,发布于 2026 年 4 月,采 用 MIT 许可证。

该框架支持超过 200 个语言 模型,内置 40 余种工具,涵盖文件 操作、Shell 执行、HTTP 网络请求、Python REPL、SQL ite 访问以及系统进程管理。单一 Gateway 进程可同时桥接七个消息平 台——Telegram、Discord、Slack、WhatsApp、Signal、CLI 和电子邮件——并 在所有平台上保持会话连续性。

为 什么重要

当前 Agent 框架——从 LangChain 到 Auto GPT——所受到的主要批评集中在无 状态性上:每次会话都从 零开始。Hermes Agent 的核心架构赌注在 于:持续累积的技能记忆将从根 本上改变 Agent 部署的经济逻辑。如果一个 Agent 能够回 忆并复用成功的任务策略,那么重复或相 似任务的边际成本将随时间递减, 这将直接影响大规模运行 Agent 的工程团 队的总算力支出和人工监督需求。

对于正在评估 Agent 基础设施的 CTO 而 言,MIT 许可证以及 Nous Research 在 GitHub 上维护的 71 个代码仓库, 意味着这是一个可持续维护的开源基础,而非 风险投资支持的黑盒产品。Nous Research 是 开源 LLM 生态中的成 熟参与者,其与 NVIDIA NeMo 和 PyTorch 流 水线均有文档记录的集成, 为该框架的长期生命力提供了机构背 书。

六种后端部署方式——覆盖本地笔记本、Docker、SSH、 Daytona Serverless、Singularity HPC 以及 Modal GPU 集群——意味着同一套 工作流定义无需修改代码即可 跨环境运行。这种可移植性降低了供应商锁定风险, 对于在 Agent 工具链上押 注多年的基础设施团队而言,这是一个实质性的考 量因素。

然而,代码仓库中 1 ,700 余个未关闭 Issue 是工程 负责人需要认真权衡的数据点。在 v 0.9.0 阶段,Hermes Agent 尚未达到 1.0,如此 规模的 Issue 增速既说明社区参 与活跃,也折射出活跃的开发摩擦并存。

技术细节

三层记忆架构

Hermes Agent 将记忆明确划 分为三个层次:

  • 会话上下文(Session context)—— 短期、非持久化的记忆,作用域限定于当前对话窗口
  • 持久化 事实记忆(Persistent fact memory)——跨会话存储,用于保存用户偏好、 环境信息及长期事实
  • 程序化 技能记忆(Procedural skill memory)——序列化、可执行的任务解决策略,持久化写入 磁盘(路径:~/.hermes/skills/task-type-xxx.skill

当接 收到新任务时,Agent 优先从程序化层检索,再叠加持 久化事实,最后在当前会话上下文中执行。这一检索顺序的设计目 标是在从头推理之前,最大化复 用历史成功策略。

闭环技能提取

每次 任务完成后,Agent 会执行一个任务后反思步骤:评 估当前解决方案是否具有可泛化性,将其提炼为可复用技 能并写入持久化存储。在后续相似任务中,该技能将 被直接调用执行,若发现更优方案则 随之更新。来源文章将此描述为随使 用时长产生指数级效率提升——这一 说法更多基于架构设计逻辑,现 有材料中尚无基准测试数据支撑。

跨会话搜索

历史对话通过 SQLite FTS5 全文搜索进 行索引。LLM 层对搜索结果进行语义摘要,以提 取最具上下文相关性的片段。Agent 还会 定期发起自主提示,将上 下文中的重要信息主动推送至长期持久化记忆。

基 于 Honcho 的辩证式用户建 模

用户建模通过 Honcho 框架处理,该框架跟 踪 12 个身份维度——涵盖静态属性(姓名、角色、明确 偏好)和动态关系状态(用户与 Agent 关系随 交互演进的方式)。随着该 模型不断积累数据,Agent 的响应风格和任务执行策 略将随之自适应调整。

部署后端

以 下六种后端均无需修改工作流代码即可支 持:Local(本地笔记本)、Docker(容器化隔离)、SSH(远程服务器)、Daytona(Serverless 弹性扩展)、Singularity(HPC / 高安全隔离)以及 Modal(GPU 集群 / Serverless)。MCP Server 集成和 Python RPC 可用于自定义工具扩展。

值 得持续关注的动向

  • v1.0 发布时 间线:在 v0.9.0 阶段存在 1,700 余个未关闭 Issue 的情况下,稳定版本的发布将是 生产环境采用的关键信号。建议在未来 30 天内持续关 注 Nous Research GitHub 的里程碑标记动态。
  • Honcho 框架更新: Hermes Agent 的用户建模直接依赖 Honcho。Honcho 的任何破 坏性变更或能力扩展,都将连锁影响 Hermes Agent 的核心差异化能力。
  • LangChain 与 CrewAI 的竞争回应:两个框架均拥有活 跃的产品路线图和庞大的安装基础。Hermes Agent 所提供的持 久化技能记忆模式是一次直接的架构挑战; 请关注这两个项目是否会宣布推 出类似的记忆持久化功能。
  • Modal 与 Daytona 集成深度: GPU Serverless 后端支持使 Hermes Agent 具备承载计算密 集型 Agentic 工作负载的能力。建议持续监测在 Modal 后端大规模运行的团队所发布的性 能基准或案例研究,这将为效率复利 主张提供首批量化证据。
  • MCP 生态系统采用率:随着 Model Context Protocol 逐步获 得市场认可,Hermes Agent 的原生 MCP Server 支持有望成为重 要的分发渠道。建议在未来一个月内,追踪专 门针对 Hermes Agent 的 MCP 兼容工具注册情况。