跳到主要内容

集成

Hermes Agent 连接到外部系统,用于 AI 推理、工具服务器、IDE 工作流程、编程访问等。这些集成扩展了 Hermes 能做什么和能在哪里运行。

AI 提供商和路由

Hermes 开箱即用地支持多个 AI 推理提供商。使用 hermes model 交互式配置,或在 config.yaml 中设置。

  • AI 提供商 — OpenRouter、Anthropic、OpenAI、Google 和任何 OpenAI 兼容端点。Hermes 按提供商自动检测视觉、流式传输和工具使用等能力。
  • 提供商路由 — 精细控制哪个底层提供商处理你的 OpenRouter 请求。通过排序、白名单、黑名单和显式优先级排序优化成本、速度或质量。
  • 回退提供商 — 当主模型遇到错误时自动故障转移到备用 LLM 提供商。包括主模型回退和独立的辅助任务回退(视觉、压缩和 Web 提取)。

工具服务器 (MCP)

  • MCP 服务器 — 通过 Model Context Protocol 将 Hermes 连接到外部工具服务器。从 GitHub、数据库、文件系统、浏览器栈、内部 API 等访问工具,无需编写原生 Hermes 工具。支持 stdio 和 SSE 传输、每服务器工具过滤以及能力感知资源/提示词注册。

Web 搜索后端

web_searchweb_extract 工具支持四个后端提供商,通过 config.yamlhermes tools 配置:

| 后端 | 环境变量 | 搜索 | 提取 | 爬取 | | |---------|---------|--------|---------|-------| | | Firecrawl(默认) | FIRECRAWL_API_KEY | ✔ | ✔ | ✔ | | | Parallel | PARALLEL_API_KEY | ✔ | ✔ | — | | | Tavily | TAVILY_API_KEY | ✔ | ✔ | ✔ | | | Exa | EXA_API_KEY | ✔ | ✔ | — | |

快速设置示例:

web:
backend: firecrawl # firecrawl | parallel | tavily | exa

如果未设置 web.backend,后端从可用的 API 密钥自动检测。也支持通过 FIRECRAWL_API_URL 自托管 Firecrawl。

浏览器自动化

Hermes 包含完整的浏览器自动化,具有多个后端选项,用于导航网站、填写表单和提取信息:

  • Browserbase — 具有反机器人工具、CAPTCHA 解决和住宅代理的托管云浏览器
  • Browser Use — 替代云浏览器提供商
  • 通过 CDP 的本地 Chrome — 使用 /browser connect 连接到你正在运行的 Chrome 实例
  • 本地 Chromium — 通过 agent-browser CLI 的无头本地浏览器

请参阅浏览器自动化了解设置和使用。

语音和 TTS 提供商

跨所有消息平台的文本转语音和语音转文本:

| 提供商 | 质量 | 成本 | API 密钥 | | :|----------|---------|------|---------| | | Edge TTS(默认) | 良好 | 免费 | 无需 | | | ElevenLabs | 优秀 | 付费 | ELEVENLABS_API_KEY | | | OpenAI TTS | 良好 | 付费 | VOICE_TOOLS_OPENAI_KEY | | | MiniMax | 良好 | 付费 | MINIMAX_API_KEY | | | NeuTTS | 良好 | 免费 | 无需 | |

语音转文本支持三个提供商:本地 Whisper(免费、设备上运行)、Groq(快速云)和 OpenAI Whisper API。语音消息转录跨 Telegram、Discord、WhatsApp 和其他消息平台工作。请参阅语音和 TTS语音模式了解更多详情。

IDE 和编辑器集成

  • IDE 集成 (ACP) — 在 ACP 兼容编辑器(如 VS Code、Zed 和 JetBrains)中使用 Hermes Agent。Hermes 作为 ACP 服务器运行,在你的编辑器内渲染聊天消息、工具活动、文件 diff 和终端命令。

编程访问

  • API 服务器 — 将 Hermes 暴露为 OpenAI 兼容的 HTTP 端点。任何使用 OpenAI 格式的前端 — Open WebUI、LobeChat、LibreChat、NextChat、ChatBox — 可以连接并使用带有完整工具集的 Hermes 作为后端。

记忆和个性化

  • 内置记忆 — 通过 MEMORY.mdUSER.md 文件进行持久化、有策划的记忆。Agent 维护跨会话存活的个人笔记和用户档案数据的有限存储。
  • 记忆提供商 — 插入外部记忆后端以获得更深入的个性化。支持七个提供商:Honcho(辩证推理)、OpenViking(分层检索)、Mem0(云提取)、Hindsight(知识图谱)、Holographic(本地 SQLite)、RetainDB(混合搜索)和 ByteRover(基于 CLI)。

消息平台

Hermes 作为网关机器人运行在 15+ 消息平台上,全部通过相同的 gateway 子系统配置:

请参阅消息网关概述了解平台比较表和设置指南。

家庭自动化

  • Home Assistant — 通过四个专用工具(ha_list_entitiesha_get_stateha_list_servicesha_call_service)控制智能家居设备。当配置 HASS_TOKEN 时,Home Assistant 工具集自动激活。

插件

  • 插件系统 — 无需修改核心代码即可使用自定义工具、生命周期钩子和 CLI 命令扩展 Hermes。插件从 ~/.hermes/plugins/、项目本地 .hermes/plugins/ 和 pip 安装的入口点发现。
  • 构建插件 — 创建带有工具、钩子和 CLI 命令的 Hermes 插件的分步指南。

训练和评估

  • RL 训练 — 从 agent 会话生成轨迹数据,用于强化学习和模型微调。支持具有可自定义奖励函数的 Atropos 环境。
  • 批处理 — 跨数百个提示词并行运行 agent,生成结构化的 ShareGPT 格式轨迹数据,用于训练数据生成或评估。