AI学习原创

Hermes Agent 深度升级实战：从残缺配置到全功能 AI 助手

Will2026年4月12日约 2 分钟阅读

背景

我们有一个基于 Hermes Agent 的 Telegram AI 助手（代号 mayuki），是 OpenClaw (ユキ) 的分身。初始状态落后官方 3676 个 commit，配置残缺：Provider API Key 全空、语音识别不可用、记忆系统几乎无效、上下文窗口数值错误。

本文记录了从诊断到修复到增强的完整过程，目标是让 mayuki 的能力全面对标甚至超越ユキ。

升级前后对比

升级前 ❌

版本落后 3676 commits
qwen3.5-plus context: 750,000（错误）
4 个 Provider API Key 全空
语音识别：faster-whisper 未安装
记忆：memory_char_limit 仅 2200
Skills：external_dirs 为空
向量记忆：无
知识库：无 MCP

升级后 ✅

与 origin/main 完全同步
qwen3.5-plus context: 1,000,000
5 个 Provider 全部激活
语音识别：faster-whisper 已安装
记忆：Honcho 向量记忆 + 8000 chars
Skills：36 个 已加载
向量记忆：Honcho + MiniMax/Kimi embeddings
知识库：Obsidian MCP ✓ enabled
定时任务：hermes cron 原生支持

核心修复详解

1. Context Window 修正

通过查阅官方文档验证实际数值：

Qwen3.5-Plus: 750,000 → 1,000,000 tokens（Alibaba Cloud 官方文档）
MiniMax M2.7: 1,048,576 → 204,800 tokens（MiniMax API 文档）

⚠️ 教训：不要信任默认配置中的 context window 值，必须查官方文档验证。

2. 双重 /v1 Bug

DashScope 的 Anthropic 兼容端点引发了难以诊断的 404 错误。Anthropic SDK 会自动在 base_url 后追加 /v1/messages，如果 base_url 已包含 /v1，最终 URL 变成 /v1/v1/messages。

yaml

# ❌ 错误（double /v1）
base_url: https://coding-intl.dashscope.aliyuncs.com/apps/anthropic/v1

# ✅ 正确
base_url: https://coding-intl.dashscope.aliyuncs.com/apps/anthropic

3. API Mode 修正

所有使用 Anthropic 格式的 Provider 必须设置 api_mode: anthropic_messages，而非 chat_completions。

4. 五级 Fallback 链

qwen3.5-plus → 主力模型
├── fallback → kimi-k2.5（日语/分析）
├── fallback → MiniMax-M2.7-highspeed（高速推理）
├── fallback → glm-5（按次计费）
└── fallback → deepseek-v3.2-thinking（深度推理）

Honcho 向量记忆系统

通过 Codex 完成了 Honcho 本地部署，实现跨 session 记忆持久化：

Hermes (~/.hermes/honcho.json)
  → 本地 Honcho API (localhost:8000, Docker)
    → 本地 relay (localhost:4100, provider 适配)
      → MiniMax M2.7（chat/reasoning）
      → Embeddings: MiniMax 优先 → Kimi 兜底（1024维）

关键配置：

workspace: mayuki-hermes
recallMode: hybrid（向量+关键词混合）
observationMode: unified
infini-ai 已从 Honcho 路径完全移除

36 个 OpenClaw Skills

通过 skills.external_dirs 指向 OpenClaw 的 skills 目录，Hermes 自动发现并加载了 36 个技能：

cat-health-triage（猫咪健康分诊）
sns-copywriter（SNS 文案工房）
swarm-engine（蜂群引擎）
research（联网调研）
video-pipeline（视频生成流水线）
knowledge-pipeline（知识沉淀）
code-review（代码审查）
decision-panel（多模型决策圆桌）
hospital-assistant（慈惠医院再生医疗）
weather（天气预报）
...等 36 个

关键教训

不要信任默认配置值 — Context window、API mode、base_url 等关键参数必须查阅官方文档验证。
Anthropic SDK 的 /v1 陷阱 — 第三方端点的 base_url 必须去掉尾部 /v1。
Subagent 不一定能执行文件修改 — Qwen 3.5 Plus subagent 在本次任务中工具调用格式传错，关键任务需人工验证。

技术栈

Hermes Agent v0.8.0 (NousResearch)
Qwen 3.5 Plus via DashScope Coding Plan（主模型）
MiniMax M2.7（fallback + Honcho chat）
Kimi K2.5（fallback + Honcho embeddings 兜底）
Honcho（向量记忆，本地 Docker 部署）
Obsidian MCP（知识库读写）
faster-whisper（本地语音识别）

Will's Take

配置问题引发的血案，教训：官方文档永远比默认配置可信

加载中...

发表评论

0/1000