登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
每日签到
每天签到奖励2圆-6圆
发帖说明
VIP申请
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
写记录
写博客
VIP申请
VIP网盘
网盘
联系我们
每日签到
道具
勋章
任务
设置
我的收藏
退出
腾讯QQ
微信登录
返回列表
首页
›
业界区
›
安全
›
Open R1 项目进展第三期
Open R1 项目进展第三期
[ 复制链接 ]
钿稳铆
2025-6-1 18:38:14
Open R1 项目进展第三期
本次更新带来三大突破性进展:
CodeForces-CoTs 数据集
: 通过 R1 模型蒸馏生成近 10 万条高质量编程思维链样本,同时包含 C++ 和 Python 双语言解题方案
IOI 基准测试
: 基于 2024 国际信息学奥林匹克竞赛 (IOI) 构建的全新挑战性基准
OlympicCoder 模型
: 7B/32B 双版本代码模型,在 IOI 问题上超越 Claude 3.7 Sonnet 等闭源前沿模型
下图展示了 OlympicCoder 与各类指令微调模型、推理模型的性能对比。通过 CodeForces-CoTs 训练出的模型展现顶尖性能,其中 32B 版本甚至超越了我们测试过的所有开源模型 (包括某些参数量百倍于它的模型)
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
Open
R1
项目进展
三期
相关帖子
deepseek-r1的1.5b、7b、8b、14b、32b、70b和671b有啥区别?
腾讯ima接入deepseek-r1,借用别人脑子用用成真了~
移动端window.open跳转链接时,iOS没有反应的问题
记录---当window.open被ios安全机制拦截,我掏出3种方案,终于跳转成功!
open webui 可扩展、功能丰富且用户友好的本地部署 AI 平台
DeepSeek-R1满血版性能飙升四倍,成本大降,竟是因为……
百度正式上线 DeepSeek-R1 满血版,免费使用、免下载、免登录,百度这次良心了!
DeepSeek-R1源码解读
DeepSeek-R1详解
每天一个安卓测试开发小知识之 (五)---常用的adb shell命令第三期 pm命令第二期
vip免费申请,1年只需15美金$
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
业界
deepseek-r1的1.5b、7b、8b、14b、32b、70b和671b有啥区别?
0
228
热琢
2025-06-05
业界
腾讯ima接入deepseek-r1,借用别人脑子用用成真了~
0
152
段一璇
2025-06-06
业界
移动端window.open跳转链接时,iOS没有反应的问题
0
610
焦听云
2025-06-06
业界
记录---当window.open被ios安全机制拦截,我掏出3种方案,终于跳转成功!
0
710
方方仪
2025-06-06
业界
open webui 可扩展、功能丰富且用户友好的本地部署 AI 平台
0
216
喙审
2025-06-07
科技
DeepSeek-R1满血版性能飙升四倍,成本大降,竟是因为……
0
768
毡轩
2025-06-07
业界
百度正式上线 DeepSeek-R1 满血版,免费使用、免下载、免登录,百度这次良心了!
0
782
翁谌缜
2025-06-09
科技
DeepSeek-R1源码解读
0
396
濮阳雅爱
2025-06-20
业界
DeepSeek-R1详解
0
89
刘凤
2025-08-01
业界
每天一个安卓测试开发小知识之 (五)---常用的adb shell命令第三期 pm命令第二期
0
447
蒙飘
2025-09-04
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
签约作者
程序园优秀签约作者
发帖
钿稳铆
2025-6-1 18:38:14
关注
0
粉丝关注
31
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
敖可
9984
杭环
9988
凶契帽
9988
4
氛疵
9988
5
黎瑞芝
9988
6
猷咎
9986
7
里豳朝
9986
8
肿圬后
9986
9
蝓俟佐
9984
10
虽裘侪
9984
查看更多