AI学习原创
Hermes Agent 深度升级实战:从残缺配置到全功能 AI 助手
Will约 2 分钟阅读
背景
我们有一个基于 Hermes Agent 的 Telegram AI 助手(代号 mayuki),是 OpenClaw (ユキ) 的分身。初始状态落后官方 3676 个 commit,配置残缺:Provider API Key 全空、语音识别不可用、记忆系统几乎无效、上下文窗口数值错误。
本文记录了从诊断到修复到增强的完整过程,目标是让 mayuki 的能力全面对标甚至超越ユキ。
升级前后对比
升级前 ❌
- 版本落后 3676 commits
- qwen3.5-plus context: 750,000(错误)
- 4 个 Provider API Key 全空
- 语音识别:faster-whisper 未安装
- 记忆:memory_char_limit 仅 2200
- Skills:external_dirs 为空
- 向量记忆:无
- 知识库:无 MCP
升级后 ✅
- 与 origin/main 完全同步
- qwen3.5-plus context: 1,000,000
- 5 个 Provider 全部激活
- 语音识别:faster-whisper 已安装
- 记忆:Honcho 向量记忆 + 8000 chars
- Skills:36 个 已加载
- 向量记忆:Honcho + MiniMax/Kimi embeddings
- 知识库:Obsidian MCP ✓ enabled
- 定时任务:hermes cron 原生支持
核心修复详解
1. Context Window 修正
通过查阅官方文档验证实际数值:
- Qwen3.5-Plus: 750,000 → 1,000,000 tokens(Alibaba Cloud 官方文档)
- MiniMax M2.7: 1,048,576 → 204,800 tokens(MiniMax API 文档)
⚠️ 教训:不要信任默认配置中的 context window 值,必须查官方文档验证。
2. 双重 /v1 Bug
DashScope 的 Anthropic 兼容端点引发了难以诊断的 404 错误。Anthropic SDK 会自动在 base_url 后追加 /v1/messages,如果 base_url 已包含 /v1,最终 URL 变成 /v1/v1/messages。
yaml
# ❌ 错误(double /v1)
base_url: https://coding-intl.dashscope.aliyuncs.com/apps/anthropic/v1
# ✅ 正确
base_url: https://coding-intl.dashscope.aliyuncs.com/apps/anthropic3. API Mode 修正
所有使用 Anthropic 格式的 Provider 必须设置 api_mode: anthropic_messages,而非 chat_completions。
4. 五级 Fallback 链
qwen3.5-plus → 主力模型
├── fallback → kimi-k2.5(日语/分析)
├── fallback → MiniMax-M2.7-highspeed(高速推理)
├── fallback → glm-5(按次计费)
└── fallback → deepseek-v3.2-thinking(深度推理)Honcho 向量记忆系统
通过 Codex 完成了 Honcho 本地部署,实现跨 session 记忆持久化:
Hermes (~/.hermes/honcho.json)
→ 本地 Honcho API (localhost:8000, Docker)
→ 本地 relay (localhost:4100, provider 适配)
→ MiniMax M2.7(chat/reasoning)
→ Embeddings: MiniMax 优先 → Kimi 兜底(1024维)关键配置:
- workspace: mayuki-hermes
- recallMode: hybrid(向量+关键词混合)
- observationMode: unified
- infini-ai 已从 Honcho 路径完全移除
36 个 OpenClaw Skills
通过 skills.external_dirs 指向 OpenClaw 的 skills 目录,Hermes 自动发现并加载了 36 个技能:
- cat-health-triage(猫咪健康分诊)
- sns-copywriter(SNS 文案工房)
- swarm-engine(蜂群引擎)
- research(联网调研)
- video-pipeline(视频生成流水线)
- knowledge-pipeline(知识沉淀)
- code-review(代码审查)
- decision-panel(多模型决策圆桌)
- hospital-assistant(慈惠医院再生医疗)
- weather(天气预报)
- ...等 36 个
关键教训
- 不要信任默认配置值 — Context window、API mode、base_url 等关键参数必须查阅官方文档验证。
- Anthropic SDK 的 /v1 陷阱 — 第三方端点的 base_url 必须去掉尾部
/v1。 - Subagent 不一定能执行文件修改 — Qwen 3.5 Plus subagent 在本次任务中工具调用格式传错,关键任务需人工验证。
技术栈
- Hermes Agent v0.8.0 (NousResearch)
- Qwen 3.5 Plus via DashScope Coding Plan(主模型)
- MiniMax M2.7(fallback + Honcho chat)
- Kimi K2.5(fallback + Honcho embeddings 兜底)
- Honcho(向量记忆,本地 Docker 部署)
- Obsidian MCP(知识库读写)
- faster-whisper(本地语音识别)
Will's Take
配置问题引发的血案,教训:官方文档永远比默认配置可信
评论
加载中...
发表评论
0/1000