Nous Research Open-Sources Her mes Agent, a Self-Improving AI Agent Framework

发生了什么

开源 AI 组织 Nous Research——Hermes 系列模型的幕后推手——正式发布了 Hermes Agent，这是一个以持久化跨会话记忆和闭环技能学习为核心的自我进化 AI 智能体框架。据来源文章引用的代码仓库数据，该项目已累计超过 90,300 个 GitHub Stars 和 12,400 次 Fork，是目前 GitHub 上 Stars 数最高的 Agent 框架之一。最新版本为 v0.9.0，发布于 2026 年 4 月，采用 MIT 许可证。

该框架支持超过 200 个语言模型，内置 40 余种工具，涵盖文件操作、Shell 执行、HTTP 网络请求、Python REPL、SQL ite 访问以及系统进程管理。单一 Gateway 进程可同时桥接七个消息平台——Telegram、Discord、Slack、WhatsApp、Signal、CLI 和电子邮件——并在所有平台上保持会话连续性。

为什么重要

当前 Agent 框架——从 LangChain 到 Auto GPT——所受到的主要批评集中在无状态性上：每次会话都从零开始。Hermes Agent 的核心架构赌注在于：持续累积的技能记忆将从根本上改变 Agent 部署的经济逻辑。如果一个 Agent 能够回忆并复用成功的任务策略，那么重复或相似任务的边际成本将随时间递减，这将直接影响大规模运行 Agent 的工程团队的总算力支出和人工监督需求。

对于正在评估 Agent 基础设施的 CTO 而言，MIT 许可证以及 Nous Research 在 GitHub 上维护的 71 个代码仓库，意味着这是一个可持续维护的开源基础，而非风险投资支持的黑盒产品。Nous Research 是开源 LLM 生态中的成熟参与者，其与 NVIDIA NeMo 和 PyTorch 流水线均有文档记录的集成，为该框架的长期生命力提供了机构背书。

六种后端部署方式——覆盖本地笔记本、Docker、SSH、 Daytona Serverless、Singularity HPC 以及 Modal GPU 集群——意味着同一套工作流定义无需修改代码即可跨环境运行。这种可移植性降低了供应商锁定风险，对于在 Agent 工具链上押注多年的基础设施团队而言，这是一个实质性的考量因素。

然而，代码仓库中 1 ,700 余个未关闭 Issue 是工程负责人需要认真权衡的数据点。在 v 0.9.0 阶段，Hermes Agent 尚未达到 1.0，如此规模的 Issue 增速既说明社区参与活跃，也折射出活跃的开发摩擦并存。

技术细节

三层记忆架构

Hermes Agent 将记忆明确划分为三个层次：

会话上下文（Session context）—— 短期、非持久化的记忆，作用域限定于当前对话窗口
持久化事实记忆（Persistent fact memory）——跨会话存储，用于保存用户偏好、环境信息及长期事实
程序化技能记忆（Procedural skill memory）——序列化、可执行的任务解决策略，持久化写入磁盘（路径：~/.hermes/skills/task-type-xxx.skill）

当接收到新任务时，Agent 优先从程序化层检索，再叠加持久化事实，最后在当前会话上下文中执行。这一检索顺序的设计目标是在从头推理之前，最大化复用历史成功策略。

闭环技能提取

每次任务完成后，Agent 会执行一个任务后反思步骤：评估当前解决方案是否具有可泛化性，将其提炼为可复用技能并写入持久化存储。在后续相似任务中，该技能将被直接调用执行，若发现更优方案则随之更新。来源文章将此描述为随使用时长产生指数级效率提升——这一说法更多基于架构设计逻辑，现有材料中尚无基准测试数据支撑。

跨会话搜索

历史对话通过 SQLite FTS5 全文搜索进行索引。LLM 层对搜索结果进行语义摘要，以提取最具上下文相关性的片段。Agent 还会定期发起自主提示，将上下文中的重要信息主动推送至长期持久化记忆。

基于 Honcho 的辩证式用户建模

用户建模通过 Honcho 框架处理，该框架跟踪 12 个身份维度——涵盖静态属性（姓名、角色、明确偏好）和动态关系状态（用户与 Agent 关系随交互演进的方式）。随着该模型不断积累数据，Agent 的响应风格和任务执行策略将随之自适应调整。

部署后端

以下六种后端均无需修改工作流代码即可支持：Local（本地笔记本）、Docker（容器化隔离）、SSH（远程服务器）、Daytona（Serverless 弹性扩展）、Singularity（HPC / 高安全隔离）以及 Modal（GPU 集群 / Serverless）。MCP Server 集成和 Python RPC 可用于自定义工具扩展。

值得持续关注的动向

v1.0 发布时间线：在 v0.9.0 阶段存在 1,700 余个未关闭 Issue 的情况下，稳定版本的发布将是生产环境采用的关键信号。建议在未来 30 天内持续关注 Nous Research GitHub 的里程碑标记动态。
Honcho 框架更新： Hermes Agent 的用户建模直接依赖 Honcho。Honcho 的任何破坏性变更或能力扩展，都将连锁影响 Hermes Agent 的核心差异化能力。
LangChain 与 CrewAI 的竞争回应：两个框架均拥有活跃的产品路线图和庞大的安装基础。Hermes Agent 所提供的持久化技能记忆模式是一次直接的架构挑战；请关注这两个项目是否会宣布推出类似的记忆持久化功能。
Modal 与 Daytona 集成深度： GPU Serverless 后端支持使 Hermes Agent 具备承载计算密集型 Agentic 工作负载的能力。建议持续监测在 Modal 后端大规模运行的团队所发布的性能基准或案例研究，这将为效率复利主张提供首批量化证据。
MCP 生态系统采用率：随着 Model Context Protocol 逐步获得市场认可，Hermes Agent 的原生 MCP Server 支持有望成为重要的分发渠道。建议在未来一个月内，追踪专门针对 Hermes Agent 的 MCP 兼容工具注册情况。

Nous Research Open-Sources Her mes Agent, a Self-Improving AI Agent Framework

发生了什么

为什么重要

技术细节

三层记忆架构

闭环技能提取

基于 Honcho 的辩证式用户建模

部署后端

值得持续关注的动向

相关推荐

Playwright MCP 把网页测试改成“说一句话就能跑”，但离省钱省心还很远

Claude Code 一口气放出 35 个插件，AI 编程开始从问答走向流程化

硅基流动拿到的不是钱

Cloudflare 一个小规则就少拦很多人，AI 时代网站防爬开始从“一刀切”转向精细化

一则 Reddit 讨论点破本地 Agent 价值：省钱之外，更关键是可控与可持续

Anthropic 被停服的真问题

Nous Research Open-Sources Her mes Agent, a Self-Improving AI Agent Framework

发生了什么

为 什么重要

技术细节

三层记忆架构

闭环技能提取

基 于 Honcho 的辩证式用户建 模

部署后端

值 得持续关注的动向

相关推荐

Playwright MCP 把网页测试改成“说一句话就能跑”，但离省钱省心还很远

Claude Code 一口气放出 35 个插件，AI 编程开始从问答走向流程化

硅基流动拿到的不是钱

Cloudflare 一个小规则就少拦很多人，AI 时代网站防爬开始从“一刀切”转向精细化

一则 Reddit 讨论点破本地 Agent 价值：省钱之外，更关键是可控与可持续

Anthropic 被停服的真问题

为什么重要

基于 Honcho 的辩证式用户建模

值得持续关注的动向