功能概览

Hermes Agent 包含丰富的功能集，远远超出基本聊天功能。从持久化内存和文件感知上下文到浏览器自动化和语音对话，这些功能共同使 Hermes 成为强大的自主助手。

核心功能

工具和工具集 — 工具是扩展 agent 能力的函数。它们被组织成逻辑工具集，可以按平台启用或禁用，涵盖 Web 搜索、终端执行、文件编辑、内存、委托等。
Skills 系统 — 按需知识文档，agent 可以在需要时加载。Skills 遵循渐进式披露模式以最小化 token 使用量，并与 agentskills.io 开放标准兼容。
持久化内存 — 有界的、策划的跨会话持久化内存。Hermes 记住您的偏好、项目、环境以及通过 MEMORY.md 和 USER.md 学习到的内容。
上下文文件 — Hermes 自动发现并加载项目上下文文件（.hermes.md、AGENTS.md、CLAUDE.md、SOUL.md、.cursorrules），这些文件塑造了它在您的项目中的行为方式。
上下文引用 — 键入 @ 后跟引用，将文件、文件夹、git diff 和 URL 直接注入到您的消息中。Hermes 内联展开引用并自动附加内容。
检查点 — Hermes 在进行文件更改前自动快照您的工作目录，为您提供安全网，以便在使用 /rollback 时出现问题时回滚。

计划任务（Cron） — 使用自然语言或 cron 表达式安排自动运行的任务。作业可以附加 skills，将结果传递到任何平台，并支持暂停/恢复/编辑操作。
Subagent 委托 — delegate_task 工具生成具有隔离上下文、受限工具集和各自终端会话的子 agent 实例。最多运行 3 个并发 subagent 以进行并行工作流。
代码执行 — execute_code 工具让 agent 编写以编程方式调用 Hermes 工具的 Python 脚本，通过沙箱 RPC 执行将多步骤工作流压缩为单个 LLM 轮次。
事件钩子 — 在关键生命周期点运行自定义代码。Gateway 钩子处理日志、警报和 webhooks；插件钩子处理工具拦截、指标和 guardrails。
批处理 — 跨数百或数千个提示并行运行 Hermes agent，生成结构化的 ShareGPT 格式轨迹数据，用于训练数据生成或评估。

语音模式 — 跨 CLI 和消息平台的完整语音交互。使用麦克风与 agent 交谈，听取语音回复，并在 Discord 语音频道中进行实时语音对话。
浏览器自动化 — 多种后端的完整浏览器自动化：Browserbase 云、Browser Use 云、通过 CDP 的本地 Chrome 或本地 Chromium。浏览网站、填写表单和提取信息。
视觉和图像粘贴 — 多模态视觉支持。将图像从剪贴板粘贴到 CLI 中，并使用任何支持视觉的模型让 agent 分析、描述或处理它们。
图像生成 — 使用 FAL.ai 的 FLUX 2 Pro 模型从文本提示生成图像，并通过 Clarity Upscaler 进行自动 2 倍放大。
语音和 TTS — 跨所有消息平台的文本转语音输出和语音消息转录，有五个 provider 选项：Edge TTS（免费）、ElevenLabs、OpenAI TTS、MiniMax 和 NeuTTS。

MCP 集成 — 通过 stdio 或 HTTP 传输连接到任何 MCP 服务器。访问外部工具（如 GitHub、数据库、文件系统、内部 API），而无需编写原生 Hermes 工具。包括每个服务器的工具有过滤和采样支持。
Provider 路由 — 精细控制哪些 AI provider 处理您的请求。通过排序、白名单、黑名单和优先级排序优化成本、速度或质量。
回退 Provider — 当您的主要模型遇到错误时，自动故障转移到备用 LLM provider，包括辅助任务（如视觉和压缩）的独立回退。
凭证池 — 在相同 provider 的多个密钥之间分配 API 调用。在速率限制或失败时自动轮换。
内存 Provider — 插入外部内存后端（Honcho、OpenViking、Mem0、Hindsight、Holographic、RetainDB、ByteRover），用于内置内存系统之外的跨会话用户建模和个性化。
API 服务器 — 将 Hermes 公开为 OpenAI 兼容的 HTTP 端点。连接任何支持 OpenAI 格式的前端 — Open WebUI、LobeChat、LibreChat 等。
IDE 集成（ACP） — 在支持 ACP 的编辑器（如 VS Code、Zed 和 JetBrains）中使用 Hermes。聊天、工具活动、文件 diff 和终端命令在您的编辑器中呈现。
RL 训练 — 从 agent 会话生成轨迹数据，用于强化学习和模型微调。

人格和 SOUL.md — 完全可定制的 agent 人格。SOUL.md 是主要身份文件 — 系统提示中的第一个内容 — 您可以为每个会话交换内置或自定义的 /personality 预设。
皮肤和主题 — 自定义 CLI 的视觉呈现：横幅颜色、旋转器面部和动词、响应框标签、品牌文本和工具活动前缀。
插件 — 无需修改核心代码即可添加自定义工具、钩子和集成。三种插件类型：通用插件（工具/钩子）、内存 provider（跨会话知识）和上下文引擎（替代上下文管理）。通过统一的 hermes plugins 交互式 UI 管理。