Hermes Agent模型配置小白指南

admin 2026-4-15 04:34 4人围观人工智能

以Windows系统为例，Hermes的配置文件路径一般位于：C:\Users\你的用户名\AppData\Local\hermes，主要是config.yaml和.env两个文件。 yaml文件是一种以数据为中心的配置文件，yaml是json的超集，这意味着json能表达 ...

以Windows系统为例，Hermes的配置文件路径一般位于：C:\Users\你的用户名\AppData\Local\hermes，主要是config.yaml和.env两个文件。

yaml文件是一种以数据为中心的配置文件，yaml是json的超集，这意味着json能表达的数据，yaml都能表达，而且通常更简洁。

.env文件是一个专门用于存储项目环境变量和配置信息的纯文本文件。像OpenClaw的主配置文件是OpenClaw.json，Hermes就是config.yaml。

介绍完基本的文件，下面开始正式了解Hermes模型配置的五层机制。

第一层：主模型

使用vs code、记事本等工具打开config.yaml文件后，顶部的一段配置，就是主模型的，你平时跟Hermes聊天，主要就是调这里的模型：

183ad5aff8dd413ab95de63597f95a84~tplv-tt-large.jpg

主模型的配置内容示例如下：

model:

default:z-ai/glm-5.1

provider:majiabin

base_url:https://api.majiabin.com/v1

api_key:你的api key

api_mode:chat_completions

以上配置内容翻译成大白话如下：

我要用majiabin这个服务商；

模型叫z-ai/glm-5.1；

接口地址是https://api.majiabin.com/v1；

它是OpenAI兼容接口，所以api_mode用chat_completions。

这算是整个模型配置中最重要的一段，因此如果你出现模型unknow未知的情况，或者模型不可用的情况，就得来看看这里的配置有没有问题。

在Hermes的安装流程中，哪怕你的模型配置是有问题的，默认是会帮你跳过的，并不会卡在那里，这就会让你产生误判。

最终你得在安装完成之后，跟Hermes进行对话，来判断模型配置是否正确，而yaml文件的修改要比json的简单，没那么多括号和引号的格式要求。

第二层：providers模型服务商通讯录

providers位于主模型配置内容的下方，一般是为空的。这个只有在Hermes新版里面才有的，老版的老式配置文件里面没有：

11c149c7dabe4b73a901ead9a09fd311~tplv-tt-large.jpg

11c149c7dabe4b73a901ead9a09fd311~tplv-tt-large.jpg

如上图所示，老马在providers这里是填写了模型服务商的配置内容，并不是为空。其实无所谓，为空也是可以的。

因为providers的作用就是跟电话本、通讯录一样，它只负责登记的作用，并不会起到模型轮询的作用。模型轮询的另外一层，下面会讲到。

providers的配置内容示例如下：

providers:

majiabin:

name:MAJIABIN

api:https://api.majiabin.com/v1

transport

penai_chat

default_model:z-ai/glm-5.1

以上配置内容翻译成大白话如下：

majiabin这个名字，对应哪个API地址、用什么协议、默认模型是什么。

这里majiabin就是一个服务商的名字，对应的API地址，协议，默认模型，按以上格式进行登记，所以它可登可不登。

第三层：fallback机制

fallback机制非常好理解，就是当主模型不能用的时候，自动切换到备用模型去使用，也叫模型的轮询机制：

68ba8f79a15f4cbab288feb2c3631efd~tplv-tt-large.jpg

68ba8f79a15f4cbab288feb2c3631efd~tplv-tt-large.jpg

从上图可以看出，fallback的默认配置是为空的。假设你需要配置多个备用模型的时候，就可以删除掉括号，往下面添加其它模型的配置内容了。

比如你现在的主模型配置内容是：

model:

default:z-ai/glm-5.1

provider:majiabin

如果majiabin这个服务商的API临时挂了、限流、余额不足、接口503、网络连不上时，Hermes就可以尝试备用provider/model，而不是直接中断使用，那么配置内容示例如下：

fallback_providers:

-provider

penrouter

model:anthropic/claude-sonnet-4.5

-provider:laoma

model:moonshotai/kimi-k2.5

以上配置内容翻译成大白话如下：

主模型调用失败后，先尝试调用OpenRouter的Claude模型。如果还不行，再去尝试laoma的kimi k2.5模型。

在上述的fallback_providers中，是可以写一串多个的备用模型的。这时有小伙伴就会问了，如果fallback_providers设置了多个备用模型，那备用模型的API Base URL跟API Key要怎么填写呢？

这个问题问得好，还记得前面第二层提到的providers模型提供商通讯录么，我们的备用模型就可以在它下面补充对应的API Key：

providers:

majiabin:

name:MAJIBIN

api:https://api.majiabin.com/v1

transport

penai_chat

default_model:z-ai/glm-5.1

key_env:MAJIBIN_API_KEY

backup_openrouter:

name:OpenRouter Backup

api:https://openrouter.ai/api/v1

transport

penai_chat

default_model:anthropic/claude-sonnet-4

key_env:OPENROUTER_API_KEY

backup_other:

name:Other Backup

api:https://your-other-api.example.com/v1

transport

penai_chat

default_model:some/model-name

key_env:OTHER_API_KEY

以上配置内容翻译成大白话如下：

providers.majiabin.api写MAJIBIN的URL，providers.backup_openrouter.api写OpenRouter的URL，providers.backup_other.api写另一个备用服务商的URL。每个provider自己通过key_env去.env里找对应API key。

后面更多的备用模型老马就不再添加了，以此类推，需要用到几个备用模型，你就根据这样的格式去添加几个。

细心的小伙伴也发现了，这里的API Key不是直接写出来的，而是要通过key_env去.env文件里面找对应的API key，这就引出了下一层机制。

第四层：.env文件

.env不是主模型配置的首选位置，它是各大模型API Key存储的地方，可以称之为钥匙柜：

5bf3ddba74964f00929b8519919e9a3c~tplv-tt-large.jpg

5bf3ddba74964f00929b8519919e9a3c~tplv-tt-large.jpg

比如下面的示例配置内容：

OPENROUTER_API_KEY=...

OPENAI_API_KEY=...

ANTHROPIC_API_KEY=...

翻译成大白话，这些变量的意思是：

如果Hermes要用OpenRouter的模型，这里有OpenRouter的API key。

如果Hermes要用OpenAI的模型，这里有OpenAI的API key。

如果Hermes要用Anthropic的模型，这里有Anthropic的API key。

所以在第三层的备用模型配置内容中，我们才会设置key_env去.env文件里面找对应的API key，毕竟把API Key保存在环境变量文件中，就好像把钥匙存在钥匙柜里面，比直接写在配置文件里，要安全得多。

第五层：辅助任务模型

Hermes作为一个AI Agent框架，它的作用当然不止是像Chat Bot那样只能陪你聊天，它还会偷偷做一些后台任务，比如压缩上下文、总结记忆、搜索历史会话、网页内容提取、技能搜索、危险命令审批等。

拿压缩任务举例，在config.yaml文件中，也能找到这段配置内容：

2075389e905e460cba13b9f125b35112~tplv-tt-large.jpg

2075389e905e460cba13b9f125b35112~tplv-tt-large.jpg

我们只看模型配置那一部分，示例配置内容如下：

compression:

summary_model:google/gemini-3-flash-preview

summary_provider:auto

summary_base_url:null

以上配置内容翻译成大白话如下：

当聊天内容太长、上下文快塞不下的时候，Hermes会找一个模型来帮你把前面的聊天记录压缩成摘要。

summary_model:google/gemini-3-flash-preview的意思是：压缩摘要时，优先用google/gemini-3-flash-preview这个模型来做总结。

summary_provider:auto的意思是：让Hermes自己判断这个模型应该走哪个提供商，不手动指定provider。

summary_base_url:null的意思是：这里不单独指定API地址，继续使用Hermes自动推断出来的默认地址。

简单说就是，这不是你的主聊天模型配置，而是聊天太长时，用哪个模型来帮忙做摘要压缩的配置。假设老马现在的主模型是z-ai/glm-5.1，但压缩摘要时可能会尝试用gemini-3-flash-preview。

还有一点是summary_provider:auto，Hermes会自己去判断，自己去猜测用哪个模型提供商。这时就会去翻.env的钥匙柜，看看有哪家提供商在这里存了API Key，有哪家的钥匙，就用哪家。

说到这里，又有聪明的小伙伴会提问了。如果compression这里本身就没有配置gemini-3-flash-preview模型，况且这只是优先的配置模型。

那Hermes就会auto自动去找，上面也说过，会去.env文件钥匙柜里面找钥匙。但是钥匙柜里面也没有钥匙的话，就会使用主模型来压缩摘要了。

你可能会觉得有点绕，但没关系，从第一层机制看到第五层，串起来理解，基本就能了解个大概了。