孓访懔 发表于 2025-8-7 02:00:21

HRM(Hierarchical Reasoning Model)部署训练记录

前两天朋友刷到HRM这个27M模型的文章,想让我试着部署训练一下。此文用于记录部署过程
前期准备
克隆仓库
sapientinc/HRM
安装CUDA
我的CUDA是已经安装好的12.8版本,安装过程不再赘述
安装torch
torch版本如下 Version: 2.7.1+cu128
pip install torch torchvision torchaudio -f https://mirrors.aliyun.com/pytorch-wheels/cu128/
这里贴出的链接为CUDA12.8版本的阿里云镜像torch安装
安装Flash Attention
这里由于我的系统是windows所以我使用flash-attention-for-windows
github地址
Pip install flash_attn-2.8.2+cu128torch2.7.1cxx11abiFALSEfullbackward-cp311-cp311-win_amd64.whl
这里cu128指CUDA12.8
torch版本为2.7.1
python版本3.11
安装依赖
pip install -r requirements.txt
注册并创建wandb key
由于项目使用wandb记录数据,所以此处需要注册wandb并且在训练时要保持网络畅通
pip install wandb
安装好后使用key登录
wandb login
安装triton
虽然原文没有提到,但是我在部署过程中发现需要,故此添加安装
需要注意triton版本、torch版本以及CUDA版本需要对应


同样我这里使用的windows版
github链接
此处我使用的为3.3版本 Version: 3.3.1.post19
pip install -U "triton-windows

瞧蛀 发表于 2025-10-30 01:43:30

不错,里面软件多更新就更好了

郗新语 发表于 2025-11-27 12:41:41

鼓励转贴优秀软件安全工具和文档!

左丘纨 发表于 2025-12-9 22:04:21

感谢,下载保存了

钦遭聘 发表于 2026-1-4 05:04:29

这个有用。

厨浴 发表于 2026-1-13 21:22:24

感谢分享,下载保存了,貌似很强大

豹筒生 发表于 2026-1-14 22:16:37

谢谢分享,辛苦了

叟澡帅 发表于 2026-1-16 12:44:14

热心回复!

诞楮 发表于 2026-1-18 13:14:08

感谢分享,学习下。

嫁蝇 发表于 2026-1-20 19:55:47

这个好,看起来很实用

昝沛珊 发表于 2026-1-22 00:24:51

前排留名,哈哈哈

麓吆 发表于 2026-1-22 07:55:42

懂技术并乐意极积无私分享的人越来越少。珍惜

郏琼芳 发表于 2026-1-23 11:22:19

感谢分享

昝琳怡 发表于 2026-1-24 11:24:45

前排留名,哈哈哈

韶侪 发表于 2026-1-26 09:04:28

分享、互助 让互联网精神温暖你我

阎怀慕 发表于 2026-1-26 11:13:15

这个有用。

渭茱瀑 发表于 2026-1-27 13:24:56

感谢,下载保存了

阮蓄 发表于 2026-1-30 03:28:53

这个好,看起来很实用

赖秀竹 发表于 2026-1-30 05:43:09

热心回复!

迁岂罚 发表于 2026-1-30 07:12:24

收藏一下   不知道什么时候能用到
页: [1] 2
查看完整版本: HRM(Hierarchical Reasoning Model)部署训练记录