登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
导读
排行榜
资讯
发帖说明
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
写记录
写博客
小组
VIP申请
VIP网盘
网盘
联系我们
发帖说明
道具
勋章
任务
淘帖
动态
分享
留言板
导读
设置
我的收藏
退出
腾讯QQ
微信登录
返回列表
首页
›
业界区
›
安全
›
Open R1 项目进展第三期
Open R1 项目进展第三期
[ 复制链接 ]
钿稳铆
2025-6-1 18:38:14
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
Open R1 项目进展第三期
本次更新带来三大突破性进展:
CodeForces-CoTs 数据集
: 通过 R1 模型蒸馏生成近 10 万条高质量编程思维链样本,同时包含 C++ 和 Python 双语言解题方案
IOI 基准测试
: 基于 2024 国际信息学奥林匹克竞赛 (IOI) 构建的全新挑战性基准
OlympicCoder 模型
: 7B/32B 双版本代码模型,在 IOI 问题上超越 Claude 3.7 Sonnet 等闭源前沿模型
下图展示了 OlympicCoder 与各类指令微调模型、推理模型的性能对比。通过 CodeForces-CoTs 训练出的模型展现顶尖性能,其中 32B 版本甚至超越了我们测试过的所有开源模型 (包括某些参数量百倍于它的模型)
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
Open
R1
项目进展
三期
相关帖子
百度正式上线 DeepSeek-R1 满血版,免费使用、免下载、免登录,百度这次良心了!
DeepSeek-R1源码解读
DeepSeek-R1详解
每天一个安卓测试开发小知识之 (五)---常用的adb shell命令第三期 pm命令第二期
[JOI Open 2023] 古代机器 2 / Ancient Machine 2 题解
P6071 『MdOI R1』Treequery
高通QCS8550开发板 + DeepSeek-R1:打造智能化商场导购实践
Open JDK 和 Oracle JDK傻傻分不清楚
DolphinScheduler依赖机制、Open-Falcon告警推送与监控的优化实践
基于DeepSeek-R1 15b微调训练自主的领域大模型,附带工程代码
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
业界
百度正式上线 DeepSeek-R1 满血版,免费使用、免下载、免登录,百度这次良心了!
2
826
翁谌缜
2025-06-09
科技
DeepSeek-R1源码解读
2
444
濮阳雅爱
2025-06-20
业界
DeepSeek-R1详解
4
212
刘凤
2025-08-01
业界
每天一个安卓测试开发小知识之 (五)---常用的adb shell命令第三期 pm命令第二期
4
577
蒙飘
2025-09-04
安全
[JOI Open 2023] 古代机器 2 / Ancient Machine 2 题解
3
157
郗新语
2025-09-19
安全
P6071 『MdOI R1』Treequery
4
283
鲫疹
2025-09-24
安全
高通QCS8550开发板 + DeepSeek-R1:打造智能化商场导购实践
3
355
仇华乐
2025-09-26
业界
Open JDK 和 Oracle JDK傻傻分不清楚
3
652
秦欣艷
2025-09-28
安全
DolphinScheduler依赖机制、Open-Falcon告警推送与监控的优化实践
2
865
司寇涵涵
2025-10-23
业界
基于DeepSeek-R1 15b微调训练自主的领域大模型,附带工程代码
5
1015
稿辏付
2025-11-18
回复
(2)
焦和玉
2025-10-16 15:42:07
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
很好很强大 我过来先占个楼 待编辑
嗣伐
3 天前
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
感谢分享
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
签约作者
程序园优秀签约作者
发帖
钿稳铆
3 天前
关注
0
粉丝关注
34
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
anyue1937
9994893
kk14977
6845357
3934307807
991123
4
xiangqian
638210
5
韶又彤
9998
6
宋子
9983
7
闰咄阅
9993
8
刎唇
9993
9
俞瑛瑶
9998
10
蓬森莉
9951
查看更多
今日好文热榜
311
《ESP32-S3使用指南—IDF版 V1.6》第五十五
941
纯前端调用大模型真的安全吗?我踩过的坑比
895
【分析式AI】-带你秒弄懂决策树与随机森林
97
DBLens 的数据安全、登录方式与离线使用说
71
国内开发者合规订阅 Claude Code 的 3 条最
153
Perforce QAC 2025.3 新版上线 | 速度与深
475
防止跨站脚本攻击(XSS)(完整版HTTP安全
352
Wayland下RDP服务器的搭建
887
Flink学习笔记:状态后端
532
csq-蓝桥杯python-基础语法2-列表与循环语
512
C#+VisionMaster 学习笔记(目录)-目录
586
ROS2核心概念之参数
88
【Agent】MemOS 源码笔记---(5)---记忆分类
129
.NET周刊【11月第4期 2025-11-23】
191
Oracle回滚与撤销(Undo)技术:从理论到实
223
吴恩达深度学习课程四:计算机视觉 第二周
854
jetson nano的ssh远程登录连接
638
Categraf 监控采集器常见问题汇总
825
11月和12月求职总结
950
2026年成都品牌主,如何选择AI优化搜索(AI