找回密码
 立即注册
搜索

Hermes Agent模型配置小白指南

admin 2026-4-15 04:34 4人围观 人工智能

# 人工智能
以Windows系统为例,Hermes的配置文件路径一般位于:C:\Users\你的用户名\AppData\Local\hermes,主要是config.yaml和.env两个文件。 yaml文件是一种以数据为中心的配置文件,yaml是json的超集,这意味着json能表达 ...
以Windows系统为例,Hermes的配置文件路径一般位于:C:\Users\你的用户名\AppData\Local\hermes,主要是config.yaml和.env两个文件。

yaml文件是一种以数据为中心的配置文件,yaml是json的超集,这意味着json能表达的数据,yaml都能表达,而且通常更简洁。

.env文件是一个专门用于存储项目环境变量和配置信息的纯文本文件。像OpenClaw的主配置文件是OpenClaw.json,Hermes就是config.yaml。

介绍完基本的文件,下面开始正式了解Hermes模型配置的五层机制。
第一层:主模型

使用vs code、记事本等工具打开config.yaml文件后,顶部的一段配置,就是主模型的,你平时跟Hermes聊天,主要就是调这里的模型:

183ad5aff8dd413ab95de63597f95a84~tplv-tt-large.jpg

主模型的配置内容示例如下:

model:

default:z-ai/glm-5.1

provider:majiabin

base_url:https://api.majiabin.com/v1

api_key:你的api key

api_mode:chat_completions

以上配置内容翻译成大白话如下:

我要用majiabin这个服务商;

模型叫z-ai/glm-5.1;

接口地址是https://api.majiabin.com/v1;

它是OpenAI兼容接口,所以api_mode用chat_completions。

这算是整个模型配置中最重要的一段,因此如果你出现模型unknow未知的情况,或者模型不可用的情况,就得来看看这里的配置有没有问题。

在Hermes的安装流程中,哪怕你的模型配置是有问题的,默认是会帮你跳过的,并不会卡在那里,这就会让你产生误判。

最终你得在安装完成之后,跟Hermes进行对话,来判断模型配置是否正确,而yaml文件的修改要比json的简单,没那么多括号和引号的格式要求。

第二层:providers模型服务商通讯录

providers位于主模型配置内容的下方,一般是为空的。这个只有在Hermes新版里面才有的,老版的老式配置文件里面没有:

11c149c7dabe4b73a901ead9a09fd311~tplv-tt-large.jpg

如上图所示,老马在providers这里是填写了模型服务商的配置内容,并不是为空。其实无所谓,为空也是可以的。

因为providers的作用就是跟电话本、通讯录一样,它只负责登记的作用,并不会起到模型轮询的作用。模型轮询的另外一层,下面会讲到。

providers的配置内容示例如下:

providers:

majiabin:

name:MAJIABIN

api:https://api.majiabin.com/v1

transportpenai_chat

default_model:z-ai/glm-5.1

以上配置内容翻译成大白话如下:

majiabin这个名字,对应哪个API地址、用什么协议、默认模型是什么。

这里majiabin就是一个服务商的名字,对应的API地址,协议,默认模型,按以上格式进行登记,所以它可登可不登。

第三层:fallback机制

fallback机制非常好理解,就是当主模型不能用的时候,自动切换到备用模型去使用,也叫模型的轮询机制:

68ba8f79a15f4cbab288feb2c3631efd~tplv-tt-large.jpg

从上图可以看出,fallback的默认配置是为空的。假设你需要配置多个备用模型的时候,就可以删除掉括号,往下面添加其它模型的配置内容了。

比如你现在的主模型配置内容是:

model:

default:z-ai/glm-5.1

provider:majiabin

如果majiabin这个服务商的API临时挂了、限流、余额不足、接口503、网络连不上时,Hermes就可以尝试备用provider/model,而不是直接中断使用,那么配置内容示例如下:

fallback_providers:

-providerpenrouter

model:anthropic/claude-sonnet-4.5

-provider:laoma

model:moonshotai/kimi-k2.5

以上配置内容翻译成大白话如下:

主模型调用失败后,先尝试调用OpenRouter的Claude模型。如果还不行,再去尝试laoma的kimi k2.5模型。

在上述的fallback_providers中,是可以写一串多个的备用模型的。这时有小伙伴就会问了,如果fallback_providers设置了多个备用模型,那备用模型的API Base URL跟API Key要怎么填写呢?

这个问题问得好,还记得前面第二层提到的providers模型提供商通讯录么,我们的备用模型就可以在它下面补充对应的API Key:

providers:

majiabin:

name:MAJIBIN

api:https://api.majiabin.com/v1

transportpenai_chat

default_model:z-ai/glm-5.1

key_env:MAJIBIN_API_KEY

backup_openrouter:

name:OpenRouter Backup

api:https://openrouter.ai/api/v1

transportpenai_chat

default_model:anthropic/claude-sonnet-4

key_env:OPENROUTER_API_KEY

backup_other:

name:Other Backup

api:https://your-other-api.example.com/v1

transportpenai_chat

default_model:some/model-name

key_env:OTHER_API_KEY

以上配置内容翻译成大白话如下:

providers.majiabin.api写MAJIBIN的URL,providers.backup_openrouter.api写OpenRouter的URL,providers.backup_other.api写另一个备用服务商的URL。每个provider自己通过key_env去.env里找对应API key。

后面更多的备用模型老马就不再添加了,以此类推,需要用到几个备用模型,你就根据这样的格式去添加几个。

细心的小伙伴也发现了,这里的API Key不是直接写出来的,而是要通过key_env去.env文件里面找对应的API key,这就引出了下一层机制。

第四层:.env文件

.env不是主模型配置的首选位置,它是各大模型API Key存储的地方,可以称之为钥匙柜:

5bf3ddba74964f00929b8519919e9a3c~tplv-tt-large.jpg

比如下面的示例配置内容:

OPENROUTER_API_KEY=...

OPENAI_API_KEY=...

ANTHROPIC_API_KEY=...

翻译成大白话,这些变量的意思是:

如果Hermes要用OpenRouter的模型,这里有OpenRouter的API key。

如果Hermes要用OpenAI的模型,这里有OpenAI的API key。

如果Hermes要用Anthropic的模型,这里有Anthropic的API key。

所以在第三层的备用模型配置内容中,我们才会设置key_env去.env文件里面找对应的API key,毕竟把API Key保存在环境变量文件中,就好像把钥匙存在钥匙柜里面,比直接写在配置文件里,要安全得多。

第五层:辅助任务模型

Hermes作为一个AI Agent框架,它的作用当然不止是像Chat Bot那样只能陪你聊天,它还会偷偷做一些后台任务,比如压缩上下文、总结记忆、搜索历史会话、网页内容提取、技能搜索、危险命令审批等。

拿压缩任务举例,在config.yaml文件中,也能找到这段配置内容:

2075389e905e460cba13b9f125b35112~tplv-tt-large.jpg


我们只看模型配置那一部分,示例配置内容如下:

compression:

summary_model:google/gemini-3-flash-preview

summary_provider:auto

summary_base_url:null

以上配置内容翻译成大白话如下:

当聊天内容太长、上下文快塞不下的时候,Hermes会找一个模型来帮你把前面的聊天记录压缩成摘要。

summary_model:google/gemini-3-flash-preview的意思是:压缩摘要时,优先用google/gemini-3-flash-preview这个模型来做总结。

summary_provider:auto的意思是:让Hermes自己判断这个模型应该走哪个提供商,不手动指定provider。

summary_base_url:null的意思是:这里不单独指定API地址,继续使用Hermes自动推断出来的默认地址。

简单说就是,这不是你的主聊天模型配置,而是聊天太长时,用哪个模型来帮忙做摘要压缩的配置。假设老马现在的主模型是z-ai/glm-5.1,但压缩摘要时可能会尝试用gemini-3-flash-preview。

还有一点是summary_provider:auto,Hermes会自己去判断,自己去猜测用哪个模型提供商。这时就会去翻.env的钥匙柜,看看有哪家提供商在这里存了API Key,有哪家的钥匙,就用哪家。

说到这里,又有聪明的小伙伴会提问了。如果compression这里本身就没有配置gemini-3-flash-preview模型,况且这只是优先的配置模型。

那Hermes就会auto自动去找,上面也说过,会去.env文件钥匙柜里面找钥匙。但是钥匙柜里面也没有钥匙的话,就会使用主模型来压缩摘要了。

你可能会觉得有点绕,但没关系,从第一层机制看到第五层,串起来理解,基本就能了解个大概了。
原作者: admin
精彩评论0
我有话说......
相关推荐