您好，欢迎来到报告网！[登录] [注册]

cart

购物车| 设为首页| 收藏夹| 帮助中心|联系我们|快捷导航

李飞飞团队最新s1模型基于阿里云Qwen基模监督微调而成

2025-02-07 10:13:10上传人：fo**ve
Aa 小中大

分享到：

　　近日，李飞飞团队提出了一种模型训练新方法引发热议，他们以阿里通义千问Qwen2.5-32B-Instruct开源模型为底座，在16块H100 GPU上监督微调26分钟，训练出新模型s1-32B，取得了与OpenAI的o1和DeepSeek的R1等尖端推理模型数学及编码能力相当的效果，甚至在竞赛数学问题上的表现比 o1-preview 高出27%。

　　更早之前，DeepSeek官方曾透露，将DeepSeek-R1的推理能力蒸馏6个模型开源给社区，其中4个模型来自Qwen：基于Qwen-32B蒸馏的模型，在多项能力上实现了对标OpenAI o1-mini的效果。

（文章来源：界面新闻）

标签团队
机构、内容合作请点这里：寻求合作>>

团队行业标签

上一篇“妖股”特朗普媒体进军金融业！今年拟推出比特币ETF等多支基金
下一篇重庆迎3000万游客大考：亟待春晚效应提升城市温度

报告网所有产经新闻是由用户上传分享，未经用户书面授权，请勿作商用！

fo**ve

该用户很懒，什么也没介绍！: 关注私信

相关推荐

个性定制报告需求

报告咨询

400-817-8000全国24小时服务
010-5824-7071010-5824-7072北京热线 24小时服务
059-2533-7135059-2533-7136福建热线 24小时服务
邮箱：sales@yuboinfo.com

如您想投稿，请将稿件发送至邮箱

seles@yuboinfo.com，审核录用后客服人员会联系您

机构入驻请扫二维码，可申请开通机构号

平台介绍|服务与保障|支付方式|联系我们|版权声明|版权申诉|网站地图

Copyright © 2025 baogao.com 报告网 All Rights Reserved. 版权所有

闽ICP备09008123号-13