北大杨仝团队发布FairyR1模型:5%参数量数学和代码能力超越满血DeepSeek
北京大学杨仝教授团队近期发布了其在高效大型语言模型研究方向的一项新成果——FairyR1-32B模型。该模型基于DeepSeek-R1-Distill-Qwen-32B基座,通过结合微调与模型合并技术构建。研究探索了在参数量大幅减少的情况下,模型在特定任务上实现与更大模型相当甚至更优性能的可能性。该研究得到了国家自然科学基金委项目(624B2005, 62372009)的资助。FairyR1-32B模型已在huggingface开源:https://huggingface.co/PKU-DS-LAB/FairyR1-32B。
FairyR1-32B模型是在团队前期TinyR1工作基础上进行的进一步探索,沿用了“分合蒸馏”的研究思路,提出了多种改进方法,包括自我合并、多教师交叉蒸馏、轻蒸馏等方法,并在数据处理进行了优化,模型精度有了显著提升。
本次工作重点改进了蒸馏数据的构建流程,对来源于AI-MO/NuminaMath-1.5(数学)和open-thoughts/OpenThoughts-114k(代码)等数据集的原始数据,通过多个“教师模型”生成答案,随后对问答数据进行精心筛选、结构调整与思维链优化,并进行多阶段筛选。筛选过程包括基于答案的正确性验证(针对数学数据),以及基于长度的筛选(数学数据保留2k-8k tokens范围,代码数据保留4k-8k tokens范围),最终构建了更具针对性的约6.6k条数学数据和约3.8k条代码数据用于训练。
在模型结构方面,研究团队尝试训练两个领域(数学和代码)的专业模型进行合并,旨在进一步优化流程和资源消耗。这两个专业模型在一致的训练参数下(例如相同的学习率和批次大小)独立训练约5个周期后,利用AcreeFusion工具进行了合并。在多个公开基准测试中,FairyR1展现出了在低参数量下的竞争力表现。以下为FairyR1与DeepSeek-R1-671B及DeepSeek-R1-Distill-Qwen-32B在部分基准上的得分对比:

从测试结果可以看出,FairyR1-32B在AIME 2025和LiveCodeBench基准上得分略高于DeepSeek-R1-671B,在AIME 2024上表现接近。在GPQA-Diamond科学基准上,FairyR1的得分低于DeepSeek-R1-671B。这些结果表明,FairyR1在采用DeepSeek-R1-Distill-Qwen-32B基座并经过特定技术处理后,能够在约5%参数量的情况下,在数理和编程等领域实现与大型模型相当或略优的性能水平,但在科学等其他领域可能存在差距。这项工作探索了通过优化的数据处理和模型融合技术,在保证特定任务性能的前提下,大幅降低模型规模和潜在推理成本的可能性。
北京大学杨仝教授团队表示:“FairyR1-32B模型是我们探索高效大型语言模型技术路线的阶段性成果。通过对蒸馏和合并方法的改进,我们初步验证了在有限资源下实现高性能模型的可行性。”
团队成员:李旺、周俊廷、刘文睿、姚一伦、王融乐、杨仝

关键词:
相关阅读
- 
      北大杨仝团队发布FairyR1模型:5%参数量...北京大学杨仝教授团队近期发布了其在高效大型语言模型研究方向的一
- 
      AI如何重构PC?高通在COMPUTEX 2025给出答案过去一年,AI PC 俨然已从一种「未来趋势」变成了「正在发生」的
- 
      易联众助力打造全信创架构影像云平台,...长期以来,医疗影像检查存在“数据孤岛”问题,预约排队耗时、跨院...
- 
      萨科微宋仕强,在人工智能Ai大模型文本...现在基本是全民熟悉人工智能(Ai)大模型了,除了跳广场舞的大妈外
- 
      语言桥:25年专注翻译事业,凭实力打造...2000年5月23日,当我去西南交大旁边的工商所注册“成都语言桥翻译社
- 
      来学网揭秘初级会计考前临门一脚2025年初级会计考试时间为5月17日-20日,考试每半天为一个批次,分
精彩推送
- 
      北大杨仝团队发布FairyR1模型:5%参数量...北京大学杨仝教授团队近期发布了其在高效大型语言模型研究方向的一
- 
      AI如何重构PC?高通在COMPUTEX 2025给出答案过去一年,AI PC 俨然已从一种「未来趋势」变成了「正在发生」的
- 
      易联众助力打造全信创架构影像云平台,...长期以来,医疗影像检查存在“数据孤岛”问题,预约排队耗时、跨院...
- 
      萨科微宋仕强,在人工智能Ai大模型文本...现在基本是全民熟悉人工智能(Ai)大模型了,除了跳广场舞的大妈外
- 
      语言桥:25年专注翻译事业,凭实力打造...2000年5月23日,当我去西南交大旁边的工商所注册“成都语言桥翻译社
- 
      来学网揭秘初级会计考前临门一脚2025年初级会计考试时间为5月17日-20日,考试每半天为一个批次,分
- 
      悠易科技战略升级:推出AI智能体矩阵,...2025年5月15日,悠易科技在北京举办“智启全域·策动未来”AI全域营...
- 
      易联众医信助力泉州市中医院DeepSeek项...近日,由易联众集团旗下智慧医疗产品子公司福建易联众医疗信息系统
- 
      数智引领高质量发展,易联众亮相第八届...4月28日—5月4日,第八届数字中国建设峰会现场体验区在福州举办,易
- 
      易联众集团召开“AI+”战略宣贯会,以人...近日,易联众集团“AI+”战略宣贯会于厦门总部召开,奏响易联众以人...
- 
      在技术浪潮中求生:语言桥的实践和探索本文记录了语言桥从2000年成立至今的技术发展历程,从CAT工具的应用
- 
      大成之门·星光璀璨——精英AI集团合伙...【盛典启幕】4月12日,深圳湾莱佛士酒店群贤毕至,【大成之门•星光璀
- 
      来学网是骗局吗?揭秘消费者权益是否受损?越来越多的人开始重视职业资格考试,想要通过考证“逆风翻盘”,增...
- 
      来学网的课程怎么样?来学网,一家专业的职业资格考试在线教育平台,通过视频课程、在线
- 
      数译AI同传1.2.2版本发布前瞻:智能词库...在全球化交流日益频繁的今天,一场会议的成功往往取决于语言沟通的
- 
      AI赋能政务审核提速,易联众智能材料预审...在数字中国建设纵深推进的当下,政务服务智能化升级成为提升国家治理
- 
      "比人类还会骗人":Z世代大学生用AI重构...近日,由淘天集团发起、天猫校园承办的「谁是卧底·AI Agent校园挑
- 
      政务提效「数智引擎」!鲲之益助力丹东...2025年鲲之益× 丹东市委组织部--AI实战圆满收官创新 有效 高效
- 
      佰维企业级SSD通过OpenCloudOS、龙蜥、o...近日,佰维存储的企业级存储产品SP406 416、SP506 516系列PCIe SSD
- 
      AI潮涌·文化共生:全球数字文明生态峰...AI驱动文化新航海时代到来在全球数字化浪潮与人工智能技术革命的双...
- 
      紫东太初多模态RAG全新发布:端到端问答...在产业智能化进程中,如何高效融合企业专有知识资产,构建领域专属
- 
      成功引领旗舰革命后,高通的底气明显更足了众所周知,在整个智能手机市场中,旗舰机一贯被认为是最新技术和创
- 
      联发科强势出击,凭硬核实力改写移动游...4月11日,MediaTek天玑开发者大会2025(MDDC 2025)在深圳举办。本
- 
      AI 深度赋能文旅,鲲之益携手辽宁文体...4月2日,上海鲲之益科技有限公司创始人曹颉女士受邀为辽宁省文体旅
- 
      联发科启动天玑智能体化体验领航计划,...AI终端的智能化,正在走出依赖算力单点突破的老路,迈入工具与生态
- 
      从模型接入到训练优化全流程,联发科打...在全球AI技术迅猛发展的背景下,联发科于近期举办了以“AI随芯,应
- 
      钦家算法+AI大模型 引爆校服产业智能革命免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
- 
      Spectrum数字化仪卡将海豚声呐点击转为...海豚将通过移动水下屏幕光标进行交流中国北京,2025年4月9日——
- 
      第四代骁龙8s正式发布,“新生代”旗舰...摘要:骁龙,让旗舰体验不再“稀有”。近年来,中国的高端手机市场...
- 
      唢呐一响,故事开讲!看仰韶用“吹”功...
- 
      RK首款AI四模机械键盘来袭!一机多用超...2025年4月6日,RK正式发布首款AI四模机械键盘。作为行业革新产品,R
- 
      雅特力科技助力宇树科技推动智慧机器人...随着人工智能与机器人技术的快速发展,机器人正加速落地于智能制造
- 
      第八届数字中国建设峰会现场体验区参展...第八届数字中国建设峰会将于2025年4月29日至30日在福州举办,峰会现
- 
      跨境收款平台怎么选?Pingpong、连连、...在【跨境电商】年增速超 30% 的万亿市场中,连连国际、Pingpong、...
- 
      2025跨境支付收款,WF、连连、P卡、Ping...在跨境电商蓬勃发展的今天,资金周转效率与利润空间直接受制于收款...
- 
      上海交通大学发布“明岐”多模态大模型...在“健康中国2030”国家战略和新一轮科技革命的背景下,由上海交通...
- 
      Moka AI 探索实践:七年技术深耕,从...作为人力资源领域的长期革新者,Moka 自2015年成立以来,持续以技
- 
      工作效率杀手?AIPC帮助新职人找到真相在AI风云突起的当下,广大新职人要面对这样一个关键问题——到底是...
- 
      游戏玩家必备——实测AI+ PC哪吒脚踏风火轮劈开巨浪的瞬间,电影《哪吒2》每秒120帧的视效冲击
- 
      当土拨鼠遇上AIPC,「修仙版」购买指南...热映的《哪吒 2》电影中,那些灵动可爱的土拨鼠给观众们留下了深刻
- 
      PC还停留在过去?测测性能指数,发现答案!2025年以来,以DeepSeek、Manus等为代表的新一代AI风潮正在迅猛发展
- 
      4月“愈”您相约“2025深圳首届国际疗愈...随着现代社会压力的增加,人们对身心健康的关注日益提升,疗愈经济
- 
      百度副总裁平晓黎:智能电商正在进一步演化导语:百度优选提出,AI的应用深度决定了生意的增长速度。如今随着
- 
      接入DeepSeek,睿帆科技助力某银行托管...近日,由睿帆科技助力打造的某银行托管客户生命周期管理平台正式接入
- 
      告别有Ai无爱?免交智商税? Ai抱抱喵...近年来,Ai技术与玩具行业的深度融合,推动了智能玩具市场的快速增长
- 
      第八届数字中国建设峰会招展招商推介会...数字搭台 纵论未来潮起东南,数联鹏城。昨日,继杭州之后,有福之
- 
      想看看你的AI创意值多少?来联想×联通...免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
- 
      佰维存储邀您相聚德国嵌入式展Embedded...免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
- 
      佰维存储邀您相聚德国嵌入式展Embedded...免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
- 
      联通云盘亮相MWC 2025:融云融智,让存...DeepSeek爆火,再度掀起人工智能(AI)热浪。云存储领域,也面临AI
- 
      长安+联通+华为,入围世界移动通讯产业...3月5日,在巴塞罗那举行的2025年世界移动通信大会(MWC)上,长安汽车AI...
- 
      易联众医信深度融合DeepSeek大模型,以AI...2025年,医疗AI技术加速迈向场景为王时代。作为易联众集团旗下数字医...
- 
      360联合北大震撼发布!5%参数量逼近Deep...2025年2月24日——由360与北京大学联合研发的中等量级推理模型Tiny-
- 
      未来智链亮相纳斯达克大屏,共祝全球华...在这个充满希望与梦想的初春时节,我们迎来了激动人心的时刻。2月12
- 
      易联众睿图全面接入DeepSeek,开启医疗影...当前,人工智能正以前所未有的速度重塑现代医疗行业格局。在AI领域取
- 
      DeepSeek赋能Vixtel飞思达CloudFox可观...随着云原生、微服务架构的普及,可观测性工程(Observability)变得越
- 
      哪吒2成史上最高热电影词条,百度百科浏...2月13日19时,《哪吒2》票房已破百亿,成为中国影史首部票房破100亿
- 
      产品力获认可,佰维存储企业级SSD通过联...近日,佰维存储SP406 416系列企业级PCIe 4 0 SSD、SS621系列企业...
- 
      易联众“智鼎云帆大模型平台”全面接入D...新年伊始,国产DeepSeek大模型凭借卓越的自然语言处理能力和强大的深
- 
      亚冬冰雪狂欢:AI加持联通看家,守护生...2月7日,哈尔滨以其独特的北国冰雪风光,迎来“2025年第九届亚洲冬
- 
      从《满江红》到频繁爆火的豫剧微电影,...
- 
      光谷AI创新应用大赛启动,2月7日报名截止近日,首届光谷AI创新应用大赛正式启动报名,该赛事面向全球范围内...
- 
      未来智链:Web3+AI=Web4,开启智能互联网新时代未来智链(Future Smart Chain)通过创新性地结合Web3和人工智能...
- 
      AI多样屋首店盛大开业,开启智慧零售新纪元2025年1月18日,备受瞩目的AI多样屋金虹桥店在娄山关路地铁站旁的金...
- 
      喜报!万恒科技荣获“2024数字化发展最...近日,粤港澳大湾区AI领袖峰会在深圳成功举办。本次峰会以“智擎时
- 
      NVIDIA AI零售助手蓝图:开启个性化购物新时代新工作流为开发人员提供了生成式 AI 和 3D 可视化技术,以提升
- 
      天玑9400称霸苏黎世榜单,AI 性能领先一大步过去两年,手机端AI应用的爆发式增长和体验升级引领了“超级加速”...
- 
      端侧生成式AI赋能游戏开发:联发科技携...全球领先的半导体公司联发科技与知名游戏引擎开发商Cocos正式宣布达...
- 
      端侧生成式AI赋能游戏开发:联发科技携...全球领先的半导体公司联发科技与知名游戏引擎开发商Cocos正式宣布达
- 
      联发科与NVIDIA合作 为NVIDIA 个人AI...联发科近日宣布与NVIDIA合作设计NVIDIA GB10 Grace Blackwell超...
- 
      联发科携手意腾科技,于CES 2025展出多...近日,联发科与意腾科技宣布,将协同合作为车用、智慧家庭,以及智
- 
      河南黄河酒业:大黄河美酒
- 
      人保车险-如何选择汽车保险附加险?选择汽车保险附加险时,需要根据您的具体需求和预算来考虑。以下是
- 
      天玑8400性能、能效、AI全方位进化!同...联发科再度展现技术实力,最新发布的天玑 8400 移动芯片以超越期...
- 
      天玑搭载8400旗舰同级NPU 880,AI 性能猛增54%!联发科再一次用实力证明了“神U”系列的真正含义,最新发布的天玑 ...
- 
      时尚科技尖锋之作,爱玛A7 Plus一路超神文 柳华芳 科技先生 出品当穿越于大街小巷、社区绿荫,短距离上...
- 
      时尚科技尖锋之作,爱玛A7 Plus一路超神文 柳华芳 科技先生 出品当穿越于大街小巷、社区绿荫,短距离上下
- 
      紫光展锐5G加速云电脑普及,推动云终端...1946年,世界上第一台通用电子数字计算机ENIAC问世,标志着计算机时
- 
      皇家剑南春推动千元价格带风云再起2024四川国际美酒博览会的剑南春之夜上,剑南春高端核心战略产品皇
- 
      BenQ DesignVue携新品重磅亮相「创意界...2024年的Adobe MAX 2024发布会上,Adobe推出了最新版本的Adobe Cr...
- 
      大模型让“润物无声”营销成为可能,商...摘要:“大模型让“润物无声”营销成为可能,商家智能体成为优质经...
- 
      搭建企业与资本对接桥梁,这场人工智能...在全球人工智能从“百模大战”迈向“应用为王”的关键节点,成都人...
- 
      京蓉联动·智启未来 | 2024人工智能高...2024年11月27日-29日,由成都市经济和信息化局市新经济发展委员会主
- 
      剑南春:坚守品质拓展品牌 诠释高品质...质量是企业赖以生存的基石、永恒探索的主题、基业长青的根本。在入
- 
      青岛西海岸“未来文化中心”正式启用,...青岛西海岸“未来文化中心-海洋图书馆、海洋大剧院”正式启用迎来了...
- 
      取经路上!雨前顾问组织成都人工智能企...11月27日,2024人工智能高端技术人才交流活动(北京站)正式起航!
- 
      存量为王 场景制胜 万恒科技助力数字...数字金融是助推高质量发展的重要抓手2023年中央金融工作会议强调,
- 
      定了!2024成都智能网联汽车“车路云一...2024年7月,成都入选智能网联汽车“车路云一体化”应用试点城市名单...
- 
      促合作,话未来,成都这场大会共谋算力...11月22日,为坚定把科技成果转化作为科技创新“一号工程”,加速科...
- 
      成都→北京,2024人工智能高端技术人才...2024人工智能高端技术人才交流活动(北京站)即将开启!在奔向未来
- 
      发力“人工智能+生物医药”赛道,成都企...11月12日,由成都市经信局市新经济委主办,雨前顾问承办的2024人工
- 
      机械装备以“智”求进,成都企业推动“...11月12日,由成都市经信局市新经济委主办,雨前顾问承办的2024人工
- 
      人工智能革新智能家居,成都企业探索智...11月12日,由成都市经信局市新经济委主办,雨前顾问承办的2024人工
- 
      百模论剑汇聚AI创新力量,首届全国AI+行...2024年11月20日,由中国电子信息行业联合会指导,中国电子信息行业联
- 
      百模论剑决赛收官日 | “人工智能+”...11月19日,百模论剑·首届全国“人工智能+”行业应用创新大赛决赛进...
- 
      百模论剑决赛第3日 | 各地团队赴蓉参...11月18日,百模论剑·首届全国人工智能+行业应用创新大赛决赛第三日...
- 
      百模论剑决赛第2日 | 多赛道展演答辩...11月17日,百模论剑·首届全国“人工智能+”行业应用创新大赛决赛次...
- 
      百模论剑决赛第1日 | 15支队伍首发亮...11月16日,百模论剑·首届全国“人工智能+”行业应用创新大赛决赛开...
- 
      百模论剑·首届全国“人工智能+”行业应...为了响应人工智能+行动,加快人工智能领域的科学技术创新,推动人工智...
- 
      佰维企业级存储矩阵,赋能AI+时代的数智...在数字经济的框架下,存力、算力、运力三者构成了核心支撑体系,存储








