登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
导读
排行榜
资讯
发帖说明
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
帖子
用户
软件
问答
教程
代码
写记录
写博客
小组
VIP申请
VIP网盘
网盘
联系我们
发帖说明
道具
勋章
任务
淘帖
动态
分享
留言板
导读
设置
我的收藏
退出
腾讯QQ
微信登录
办理程序园永久VIP会员500$ USDT,请勿使用程序园{ 程序/软件/技术}用于违法用途,商务合作请联系TG:lplp519 邮箱:102@cxy5.com
奎根百度2级代绑
DDOS测试,水墨先生
████李木子只卖好域名████
✅✅海外SEM投放✅✅
✅程序园头条✅
猛犸象科技工作室
✅✅百度蜘蛛池收录✅✅
代绑百度站长二级-奎根
高价收量,SEO,跳转
招租(A3-10)
招租(A3-11)
钱多多精品好域名出售
✅✅百度强引蜘蛛工具✅✅
泛目录代做代引蜘蛛
✅域名回收✅不限制
权8下载,体育站寻实力合作
出运营商JC量、可指定域名
招租(A3-18)
个人云电脑搭建工具
网站标题查询
★谷歌代发【可测试】★
推荐
科技
业界
安全
程序
软件
教程
代码
问答
公告
数据
办公室
高效实现 LRU 缓存机制:双向链表与哈希表的结合
世事洞明皆学问 — 如何理解 OB 4.x 版本中的日志流?
Linux工作原理7系统配置:日志、系统时间、批处理作业
[LKD/Linux 内核] 关于对 current_thread_info 的一点研究
9、PipedInputStream和PipedOutputStream的源码分析和使用方法详
微调显存总爆炸?问题往往不在你以为的地方
显存不够,几乎是每个微调项目的“入场仪式” 如果你做过大模型微调,那“显存不够”这四个字,你几乎不可能陌生。 第一次跑,直接 OOM。 换个 batch size,再 O ...
0
368
28
坐褐
评估,才是微调里最反直觉的部分
训练跑通了,并不意味着你“完成了微调” 如果你已经做过几次大模型微调,很可能会有一种奇怪的感觉。 训练这件事,其实没那么难。 数据准备好,参数配一配,模 ...
0
265
11
撇瞥
钉钉A1与飞书AI录音豆
钉钉A1与飞书AI录音豆的全面对比分析表。从整体定位来看,两款产品分别深度绑定各自办公生态,面向职场会议场景,但在设计理念和功能侧重上有明显差异:核心差异 ...
0
668
17
寇秀娟
为什么 loss 几乎没用:微调里最容易让人“自嗨”的指标
loss 是怎么一步步“骗”过工程师的 如果你做过大模型微调,几乎一定经历过这样一个时刻。 训练刚跑起来,你盯着屏幕上的 loss 曲线,看着它从一个比较高的值, ...
0
1086
12
羊舌正清
Vibe Coding 小记 —— Google AI Studio
小编最近用 Cursor、Claude Code 等工具,Vibe Coding 了一些乱七八糟的小玩意儿,但需要消耗公司给大家发放的 token。 本着给公司省钱的原则,今天这篇小短文, ...
0
33
10
卿搞笔
读人本智能产品设计6原则10链接(下)
0
37
15
任俊慧
从零开始:PPO 微调大模型实战(基于 PyTorch)
从零开始:PPO 微调大模型实战(基于 PyTorch) PPO 真正难的,不是算法本身 如果你已经看过一些 PPO 的原理文章,大概率会有过这种感觉: 好像每个字都认识,但 ...
0
35
6
凳舒
客服大模型 ≠ 问答机器人
为什么很多客服大模型,看起来很聪明,却一点也不好用 如果你做过客服相关的项目,大概率会经历一个非常相似的过程。 一开始,大家都很兴奋。 把历史客服文档、F ...
0
25
11
硫辨姥
客服大模型 ≠ 问答机器人
为什么很多客服大模型,看起来很聪明,却一点也不好用 如果你做过客服相关的项目,大概率会经历一个非常相似的过程。 一开始,大家都很兴奋。 把历史客服文档、F ...
0
27
11
邹语彤
你以为 PPO 很高级,其实它更像个“微调旋钮”
为什么 PPO 在真实业务里越来越重要 如果你是从论文或者课程里接触 PPO 的,那大概率会有一种“这东西看起来很厉害”的感觉。策略梯度、clip、KL 约束、reward m ...
0
880
13
幽淆
向量数据库技术内核:从存储到检索,拆解其高效运作的秘密
向量数据库技术内核:从存储到检索,拆解其高效运作的秘密 写在前面:我也是“被向量数据库名词轰炸”过的人 说实话,我第一次接触向量数据库的时候,是有点抗 ...
0
265
21
蛟当罟
读人本智能产品设计6原则08情境
0
21
8
辗振
Agent设计模式学习(基于langchain4j实现)(7) - 监督者模式
0
33
8
致掣
读人本智能产品设计6原则05表达(下)
0
33
7
杼氖
10 万文档 RAG 落地实战:从 Demo 到生产,我踩过的所有坑
10 万文档 RAG 落地实战:从 Demo 到生产,我踩过的所有坑 引言:RAG 为什么在企业级场景“必选但难用” 在过去一年里,RAG(Retrieval-Augmented Generation) ...
0
514
10
恶凝毛
10 万文档 RAG 落地实战:从 Demo 到生产,我踩过的所有坑
0
33
15
嗅叽
大模型微调评测入门:看懂这些指标,才知道模型好不好
大模型微调评测入门:看懂这些指标,才知道模型好不好 从“瞎评”到“精准评”:大模型微调核心评测指标全拆解 大家好,我是七七!最近后台收到很多粉丝的共性 ...
0
675
18
红弘丽
民用卡 vs 专业卡 vs 云 GPU:大模型微调该选哪种?
民用卡 vs 专业卡 vs 云 GPU:大模型微调该选哪种? 大模型微调 GPU 选型无优劣,核心是场景与成本的精准适配 大家好,我是七七!最近后台收到的GPU选型问题快 ...
0
26
5
颖顿庐
大模型微调评测入门:看懂这些指标,才知道模型好不好
0
27
16
靳谷雪
大模型成本刺客退散!1/3算力跑出同等效果的秘诀
大模型成本刺客退散!1/3算力跑出同等效果的秘诀 破解算力成本难题,1/3 算力实现同等效果 大家好,我是七七!前阵子帮一个创业团队做大模型落地咨询,他们吐槽 ...
0
150
18
利怡悦
1 ...
7
8
9
10
11
12
13
14
15
... 1362
/ 1362 页
下一页