登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
导读
排行榜
资讯
发帖说明
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
写记录
写博客
小组
VIP申请
VIP网盘
网盘
联系我们
发帖说明
道具
勋章
任务
淘帖
动态
分享
留言板
导读
设置
我的收藏
退出
腾讯QQ
微信登录
返回列表
首页
›
业界区
›
科技
›
HRM(Hierarchical Reasoning Model)部署训练记录
HRM(Hierarchical Reasoning Model)部署训练记录
[ 复制链接 ]
孓访懔
2025-8-7 02:00:21
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
前两天朋友刷到HRM这个27M模型的文章,想让我试着部署训练一下。此文用于记录部署过程
前期准备
克隆仓库
sapientinc/HRM
安装CUDA
我的CUDA是已经安装好的12.8版本,安装过程不再赘述
安装torch
torch版本如下 Version: 2.7.1+cu128
pip install torch torchvision torchaudio -f https://mirrors.aliyun.com/pytorch-wheels/cu128/
这里贴出的链接为CUDA12.8版本的阿里云镜像torch安装
安装Flash Attention
这里由于我的系统是windows所以我使用flash-attention-for-windows
github地址
Pip install flash_attn-2.8.2+cu128torch2.7.1cxx11abiFALSEfullbackward-cp311-cp311-win_amd64.whl
这里cu128指CUDA12.8
torch版本为2.7.1
python版本3.11
安装依赖
pip install -r requirements.txt
注册并创建wandb key
由于项目使用wandb记录数据,所以此处需要注册wandb并且在训练时要保持网络畅通
pip install wandb
安装好后使用key登录
wandb login
安装triton
虽然原文没有提到,但是我在部署过程中发现需要,故此添加安装
需要注意triton版本、torch版本以及CUDA版本需要对应
同样我这里使用的windows版
github链接
此处我使用的为3.3版本 Version: 3.3.1.post19
pip install -U "triton-windows
HRM
Hierarchical
Reasoning
Model
部署
相关帖子
使用 Docker 快速部署 MinIO 文件存储服务
K3s 高可用集群实操笔记:3 Master + 外部 PostgreSQL-15 部署全流程
Spring AI 代码分析(二)--Model 领域
Redis有哪些部署方案?了解哨兵机制吗?
MySQL主从复制:原理、部署、运维与选型全指南
实物部署【Switching Sampling Space of Model Predictive Path-Integral Controller
docker-compse部署docker容器示例
Flask 应用部署实战:Nginx 反向代理配置指南
SeaTunnel(2.3.12)部署及其Demo(含CDC实时采集demo)
一键部署!一款开源自托管的照片画廊神器!
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
业界
使用 Docker 快速部署 MinIO 文件存储服务
3
815
睿哝
2025-11-11
安全
K3s 高可用集群实操笔记:3 Master + 外部 PostgreSQL-15 部署全流程
0
520
粹脍誊
2025-11-12
安全
Spring AI 代码分析(二)--Model 领域
2
692
馏栩梓
2025-11-19
业界
Redis有哪些部署方案?了解哨兵机制吗?
0
681
单于易槐
2025-11-20
业界
MySQL主从复制:原理、部署、运维与选型全指南
1
330
尚腱埂
2025-11-28
业界
实物部署【Switching Sampling Space of Model Predictive Path-Integral Controller
1
1021
唯棉坜
2025-11-29
安全
docker-compse部署docker容器示例
1
403
乐敬
2025-12-01
业界
Flask 应用部署实战:Nginx 反向代理配置指南
1
912
盒礁泅
2025-12-11
业界
SeaTunnel(2.3.12)部署及其Demo(含CDC实时采集demo)
0
610
溧久苟
2025-12-11
安全
一键部署!一款开源自托管的照片画廊神器!
0
257
莅耸
2025-12-12
回复
(3)
瞧蛀
2025-10-30 01:43:30
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
不错,里面软件多更新就更好了
郗新语
2025-11-27 12:41:41
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
鼓励转贴优秀软件安全工具和文档!
左丘纨
4 天前
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
感谢,下载保存了
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
浏览过的版块
业界
签约作者
程序园优秀签约作者
发帖
孓访懔
4 天前
关注
0
粉丝关注
17
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
anyue1937
9994893
kk14977
6845356
3934307807
991123
4
xiangqian
638210
5
宋子
9984
6
韶又彤
9998
7
闰咄阅
9993
8
刎唇
9993
9
俞瑛瑶
9998
10
蓬森莉
9951
查看更多
今日好文热榜
957
永别了,控制台!
832
开源项目分享 : Gitee热榜项目 2025-12-13
805
postgreSQL 中的自定义操作符
684
ROS2核心概念之通信接口
477
拿着顶级服务器跑慢查询,就像开着法拉利送
17
一文打通软件测试中pytest框架
948
vscode远程调试python程序,基于debugpy库
318
正点原子HP20智能加热台,重新定义精密加热
716
K8S 中使用 YAML 安装 ECK
1003
一种可落地的任务令牌锁机制:设计原理、实
150
Flink学习笔记:状态类型和应用
582
Oracle19c impdp失败报ORA-20000案例
206
Markdown写作常用组件
714
fs1.6-fs1.10代码移植方案
49
大疆不同任务类型执行逻辑,上云API源码分
547
对标MinIO!全新一代分布式文件系统诞生!
247
上海房屋漏水反复修不好?芮生建设提供免费
927
2025 年度西安网站制作公司推荐:定制开发
414
15.结构型 - 组合模式 (Composite Pattern)
173
C++ 语言特性的变更可能让你的防御成为马奇