北大团队提出2比特复数模型iFairy{±1, ±i},精度反超量化前,可手机部署
version 8.14
摘要:为破解大模型部署与推理成本高昂的困境,北京大学杨仝老师团队首次提出名为iFairy的超低比特量化方案。该方案创新性地利用复数{±1, ±i}对模型权重进行2-bit量化,在实现1/8极致压缩与“无乘法”推理加速的同时,语言建模能力和下游任务表现甚至反超了其全精度的LLaMA基座模型。
当下,大语言模型(LLM)的研究热潮席卷全球,技术迭代日新月异。然而,在这片繁荣之下,一个严峻的现实不容忽视:LLM在真实世界中产生的商业价值,很大程度上仍无法覆盖其高昂的训练与推理成本。
究其根源,大模型走向产业落地的道路上,横亘着两大“拦路虎”:空间瓶颈和时间瓶颈。
为了追求更高的模型性能,业界普遍的策略是不断堆叠参数量,这使得模型部署成本高昂。
同时,庞大的参数量带来了计算量的激增,尽管学界和业界已涌现出如gpt-oss的MXFP4训练等优秀的量化方案,但其核心计算逻辑依然没有消除对硬件资源消耗巨大的“乘法”运算的依赖,推理延迟没有实现根本性的降低。
能否同时攻克这两大瓶颈,实现模型的轻量化和推理加速,已成为推动大模型发展从“技术奇观”迈向“生产力工具”新阶段的关键。
为解决这一难题,北京大学杨仝老师团队在一篇名为“iFairy: the First 2-bit Complex LLM with All Parameters in {±1,±i}”的论文中,提出了一个脑洞大开的方案:跳出实数轴的束缚,进入复数平面!
这看似简单的维度提升,却蕴含着破解瓶颈的深刻智慧。
一、空间魔法:极致压缩,体积仅为1/8
在“空间”上,iFairy实现了极致的压缩。
传统的全精度(FP16)权重需要16比特,而iFairy方案仅用2比特,就完成了对一个权重信息的编码。
这意味着,相较于流行的FP16模型,其模型体积可以直接压缩至原来的1/8。这种“史诗级”的压缩率,为大模型在手机、汽车等边缘设备上的部署扫清了最大的存储障碍。
二、时间魔法:“无乘法”计算的革命
在“时间”上,iFairy实现了“无乘法”计算的革命。这个魔法是如何实现的呢?
1. PhaseQuant算法的神来之笔
这一切,都源于团队提出的全新量化算法PhaseQuant。它不再将权重映射到实数轴上的点,而是基于参数的相位将其映射到复平面上的四个单位根{±1, ±i}。
这一操作堪称神来之笔,一举多得:
信息密度拉满:用{±1, ±i} 四个值,彻底利用了2-bit的全部信息容量,信息熵从传统三元量化(如BitNet b1.58)的log₂(3)≈1.58-bit,提升到满格的log₂(4)=2-bit。
优雅的对称性:这四个点在复平面上关于原点中心对称,保持了模型训练所需的良好性质。
隐含的稀疏性:每个量化后的复数权重,其实部或虚部必有一个为零,这在高维度上保留了稀疏性的优势。
2. 惊艳的“无乘法”运算
最令人拍案叫绝的是,引入复数,计算仍然高效!一个标准的复数乘法 (a+ib)(c+id) 需要4次实数乘法和2次加法,计算量不小。
但在iFairy模型中,当一个复数激活值与量化后的权重 {±1, ±i} 相乘时,运算发生了奇妙的“退化”:所有乘法都消失了。
看!整个模型中最核心、最庞大的矩阵乘法(GEMM),被彻底重构了!原本昂贵的浮点乘法运算,被完全替换为硬件成本几乎为零的加法、减法和数据交换(shuffle)操作。这从根本上消除了计算瓶颈,为实现数量级的推理加速提供了可能。
三、架构革新:一个全面“复数化”的Transformer
为了让这个魔法完美落地,研究团队还将整个Transformer架构都进行了“复数化”改造。
复数注意力机制:传统注意力计算Q和K的点积,这里则巧妙地使用了Hermitian内积的实部作为相似度分数,既利用了所有复数信息,又自然地得到了实数分数用于Softmax。
复数旋转位置编码(RoPE):在复数域,位置编码的旋转操作变得异常简洁和统一,一个简单的复数乘法即可实现。
四、惊艳成果:PPL降低10%,性能反超全精度!
理论如此优雅,实践效果如何呢?结果同样令人瞩目。
iFairy 不仅没有出现超低比特量化常见的性能悬崖,反而实现了惊人的性能反超。
在LLM的语言建模能力方面,模型的困惑度(PPL)越低,代表模型对文本的理解和预测能力越强。在对PPL的测试中,基于相同数据集训练(注:为保证对比的严谨性,所有对比模型的训练数据均保持一致,具体信息可参见论文)的2-bit的iFairy 模型取得了比全精度(FP16)模型更低的困惑度(PPL),降幅高达 10%。
而在下游任务评测方面,iFairy 模型更是在多个任务的评分反超了全精度的Llama基座模型。
这意味着,一个体积只有原来1/8、计算几乎“零”乘法的模型,其能力反而更强了。这彻底颠覆了我们的传统认知。
对量化后权重的分析还发现,模型在训练后,这四个复数值 {±1, ±i} 的分布非常均匀,证明模型确实学会了充分利用这套全新的“编码系统”。
总而言之,这项工作开创性地将复数神经网络的思想与超低比特量化相结合,通过利用“相位”这一被忽略的信息维度,在不增加任何存储成本的前提下,显著提升了模型的表达能力和最终性能,真正实现了“鱼与熊掌兼得”。
它为设计下一代超高效、高性能的大语言模型,打开了一扇全新的大门。或许,我们离在普通手机上流畅运行GPT-5级别的模型,又近了一步。 相关论文、训练代码、模型权重与实验脚本已全部开源,配套提供从训练、评测到可复现实验的完整流程,人人皆可复现训练。
关键词:
相关阅读
-
北大团队提出2比特复数模型iFairy{±1,...
version 8 14摘要:为破解大模型部署与推理成本高昂的困境,北京大 -
移动游戏边界再拓展!高通携手生态伙伴...
又到暑期“七月份的尾巴”和“八月份的前头”这个时间段,我们迎来... -
从芯出发、共创生态,骁龙释放移动游戏...
7月31日,2025骁龙游戏技术赏在上海举办。高通(中国)携手iQOO、一加 -
TRAE推出SOLO模式,新增PRD写作、UI 设计等功能
7 月 21 日,TRAE 宣布全新推出SOLO模式。该功能是业内首个基于 -
AI专家谌鹏飞:企业AI智能体应用要有场...
脑力激荡、实力交锋、创新碰撞!2025年6月27日,以「破界·AI」为主 -
易联众智鼎云帆大模型成功完成生成式人...
据“网信福建”微信公众号消息,6月30日,易联众智鼎云帆大模型在福...
精彩推送
-
北大团队提出2比特复数模型iFairy{±1,...
version 8 14摘要:为破解大模型部署与推理成本高昂的困境,北京大 -
移动游戏边界再拓展!高通携手生态伙伴...
又到暑期“七月份的尾巴”和“八月份的前头”这个时间段,我们迎来... -
从芯出发、共创生态,骁龙释放移动游戏...
7月31日,2025骁龙游戏技术赏在上海举办。高通(中国)携手iQOO、一加 -
TRAE推出SOLO模式,新增PRD写作、UI 设计等功能
7 月 21 日,TRAE 宣布全新推出SOLO模式。该功能是业内首个基于 -
AI专家谌鹏飞:企业AI智能体应用要有场...
脑力激荡、实力交锋、创新碰撞!2025年6月27日,以「破界·AI」为主 -
易联众智鼎云帆大模型成功完成生成式人...
据“网信福建”微信公众号消息,6月30日,易联众智鼎云帆大模型在福... -
赴港IPO的华曦达携手立讯精密,共筑 AI...
在科技飞速发展的当下,智能家居领域正经历着前所未有的变革。2025 -
恺英网络举办“BEYOND GAMING”发布会,...
2025年6月30日,恺英网络成功举办了线上“BEYOND GAMING”AI科技与 -
达沃斯聚焦AI时代“她力量” 东软王楠...
6月24日,2025天津夏季达沃斯论坛在国家会展中心(天津)盛大启幕,其中 -
小散工程防灾减灾的背后:AI重塑风险减量...
两架无人机盘旋在东莞市厚街镇一座正在施工的民房上空,它们或交替作 -
用友YonSuite AI+赋能:引领制造业迈向...
当前,中国制造业正处于转型升级的关键阶段,既面临劳动力成本攀升 -
云南医保公共服务平台牵手AI 为群众幸...
动动手指,医保公共服务“云端直达”,提提需求,医保政策“秒懂回... -
易联众基于私域大模型的医保解决方案入...
近日,福建省工业和信息化厅正式公布省级人工智能典型应用场景名单 -
易联众区块链应用技术获批国家发明专利
近期,易联众自主研发的“一种基于区块链的捐赠数据处理方法、设备 -
科技照亮银发生活 创新编织幸福晚年
在老龄化浪潮日益汹涌的今天,如何为银发一族构筑一个安心、惬意、 -
金蝶云·星空旗舰版焕新升级,助力成长...
在AI普惠时代,技术角色从工具转变为管理引擎,AI Agent通过闭环场 -
9.9元享1年腾讯云服务器!0.15折超值优...
在当前经济形势复杂多变的背景下,企业面临着前所未有的挑战,成本 -
九章云极发布九章智算云Alaya NeW Clo...
2025年6月16日——AI独角兽企业九章云极DataCanvas在“九章云极智能 -
九章云极推出全球首个强化学习云平台Age...
6月16日,AI独角兽企业九章云极DataCanvas公司宣布,正式上线全球首 -
2025年卫生资格成绩已出、来学网提醒考...
来学网提醒:2025年卫生资格考试成绩已经公布,考生在查询成绩的同 -
2025年AI未来校长论坛(香港站)圆满收...
2025年6月10日,由蝴蝶发展教育基金发起、联合广州南沙新区香港服务 -
语言桥“数译AI同传”护航共建“一带一...
6月12日上午,在第二届“一带一路”科技交流大会的重磅活动——“民... -
2025低空技术与工程大会圆满闭幕 ——...
6月9日,为期三天的2025低空技术与工程大会在北京落下帷幕。本次大会 -
智惠民生 深耕固本,易联众重磅发布“A...
6月6日,易联众集团在厦门总部召开“AI+”民生业务领域整体解决方案... -
2025低空技术与工程大会在京开幕
6月7日,备受瞩目的2025低空技术与工程大会在北京市延庆区隆重开幕! -
2025车用动力系统国际论坛焦点:混动加...
全球汽车产业正经历百年未遇之大变革,在这场深刻的产业变革中,车 -
极光湾科技CEO王瑞平:混动进化聚焦智能...
中国汽车报:记者 吴戈编者按:5月28日,第五届车用动力系统国际论 -
浩思动力构建创新生态体系,助力第五届...
助力全球实现碳中和愿景,汽车产业责无旁贷。当下,积极奔赴在零碳... -
浩思动力构建创新生态体系,助力第五届...
助力全球实现碳中和愿景,汽车产业责无旁贷。当下,积极奔赴在“零 -
开源鸿蒙开发者大会2025 | AI分论坛:...
5月24日,开源鸿蒙开发者大会2025(OHDC 2025)在深圳成功举办。会 -
共赴国潮花车之约!恺英网络多元IP点亮第...
5月29日,第二十一届中国国际动漫节盛大开幕。恺英网络携《百工灵》 -
2025深圳手信名单揭晓|冠旭电子携Cleer...
5月26日,2025年度“深圳手信”评选结果正式揭晓。在这场代表深圳智... -
高通CEO公布骁龙AI PC最新进展,颠覆性...
临近2025年年中,回看过去一年,生成式AI一直处于焦点中的焦点,其 -
未来智链汇聚科技力量 中链资本微信小...
创新生态,连接未来在数字经济飞速发展的今天,数字资产与区块链技术 -
北大杨仝团队发布FairyR1模型:5%参数量...
北京大学杨仝教授团队近期发布了其在高效大型语言模型研究方向的一 -
AI如何重构PC?高通在COMPUTEX 2025给出答案
过去一年,AI PC 俨然已从一种「未来趋势」变成了「正在发生」的 -
易联众助力打造全信创架构影像云平台,...
长期以来,医疗影像检查存在“数据孤岛”问题,预约排队耗时、跨院... -
萨科微宋仕强,在人工智能Ai大模型文本...
现在基本是全民熟悉人工智能(Ai)大模型了,除了跳广场舞的大妈外 -
语言桥:25年专注翻译事业,凭实力打造...
2000年5月23日,当我去西南交大旁边的工商所注册“成都语言桥翻译社 -
来学网揭秘初级会计考前临门一脚
2025年初级会计考试时间为5月17日-20日,考试每半天为一个批次,分 -
悠易科技战略升级:推出AI智能体矩阵,...
2025年5月15日,悠易科技在北京举办“智启全域·策动未来”AI全域营... -
易联众医信助力泉州市中医院DeepSeek项...
近日,由易联众集团旗下智慧医疗产品子公司福建易联众医疗信息系统 -
数智引领高质量发展,易联众亮相第八届...
4月28日—5月4日,第八届数字中国建设峰会现场体验区在福州举办,易 -
易联众集团召开“AI+”战略宣贯会,以人...
近日,易联众集团“AI+”战略宣贯会于厦门总部召开,奏响易联众以人... -
在技术浪潮中求生:语言桥的实践和探索
本文记录了语言桥从2000年成立至今的技术发展历程,从CAT工具的应用 -
大成之门·星光璀璨——精英AI集团合伙...
【盛典启幕】4月12日,深圳湾莱佛士酒店群贤毕至,【大成之门•星光璀 -
来学网是骗局吗?揭秘消费者权益是否受损?
越来越多的人开始重视职业资格考试,想要通过考证“逆风翻盘”,增... -
来学网的课程怎么样?
来学网,一家专业的职业资格考试在线教育平台,通过视频课程、在线 -
数译AI同传1.2.2版本发布前瞻:智能词库...
在全球化交流日益频繁的今天,一场会议的成功往往取决于语言沟通的 -
AI赋能政务审核提速,易联众智能材料预审...
在数字中国建设纵深推进的当下,政务服务智能化升级成为提升国家治理 -
"比人类还会骗人":Z世代大学生用AI重构...
近日,由淘天集团发起、天猫校园承办的「谁是卧底·AI Agent校园挑 -
政务提效「数智引擎」!鲲之益助力丹东...
2025年鲲之益× 丹东市委组织部--AI实战圆满收官创新 有效 高效 -
佰维企业级SSD通过OpenCloudOS、龙蜥、o...
近日,佰维存储的企业级存储产品SP406 416、SP506 516系列PCIe SSD -
AI潮涌·文化共生:全球数字文明生态峰...
AI驱动文化新航海时代到来在全球数字化浪潮与人工智能技术革命的双... -
紫东太初多模态RAG全新发布:端到端问答...
在产业智能化进程中,如何高效融合企业专有知识资产,构建领域专属 -
成功引领旗舰革命后,高通的底气明显更足了
众所周知,在整个智能手机市场中,旗舰机一贯被认为是最新技术和创 -
联发科强势出击,凭硬核实力改写移动游...
4月11日,MediaTek天玑开发者大会2025(MDDC 2025)在深圳举办。本 -
AI 深度赋能文旅,鲲之益携手辽宁文体...
4月2日,上海鲲之益科技有限公司创始人曹颉女士受邀为辽宁省文体旅 -
联发科启动天玑智能体化体验领航计划,...
AI终端的智能化,正在走出依赖算力单点突破的老路,迈入工具与生态 -
从模型接入到训练优化全流程,联发科打...
在全球AI技术迅猛发展的背景下,联发科于近期举办了以“AI随芯,应 -
钦家算法+AI大模型 引爆校服产业智能革命
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。 -
Spectrum数字化仪卡将海豚声呐点击转为...
海豚将通过移动水下屏幕光标进行交流中国北京,2025年4月9日—— -
第四代骁龙8s正式发布,“新生代”旗舰...
摘要:骁龙,让旗舰体验不再“稀有”。近年来,中国的高端手机市场... -
唢呐一响,故事开讲!看仰韶用“吹”功...
-
RK首款AI四模机械键盘来袭!一机多用超...
2025年4月6日,RK正式发布首款AI四模机械键盘。作为行业革新产品,R -
雅特力科技助力宇树科技推动智慧机器人...
随着人工智能与机器人技术的快速发展,机器人正加速落地于智能制造 -
第八届数字中国建设峰会现场体验区参展...
第八届数字中国建设峰会将于2025年4月29日至30日在福州举办,峰会现 -
跨境收款平台怎么选?Pingpong、连连、...
在【跨境电商】年增速超 30% 的万亿市场中,连连国际、Pingpong、... -
2025跨境支付收款,WF、连连、P卡、Ping...
在跨境电商蓬勃发展的今天,资金周转效率与利润空间直接受制于收款... -
上海交通大学发布“明岐”多模态大模型...
在“健康中国2030”国家战略和新一轮科技革命的背景下,由上海交通... -
Moka AI 探索实践:七年技术深耕,从...
作为人力资源领域的长期革新者,Moka 自2015年成立以来,持续以技 -
工作效率杀手?AIPC帮助新职人找到真相
在AI风云突起的当下,广大新职人要面对这样一个关键问题——到底是... -
游戏玩家必备——实测AI+ PC
哪吒脚踏风火轮劈开巨浪的瞬间,电影《哪吒2》每秒120帧的视效冲击 -
当土拨鼠遇上AIPC,「修仙版」购买指南...
热映的《哪吒 2》电影中,那些灵动可爱的土拨鼠给观众们留下了深刻 -
PC还停留在过去?测测性能指数,发现答案!
2025年以来,以DeepSeek、Manus等为代表的新一代AI风潮正在迅猛发展 -
4月“愈”您相约“2025深圳首届国际疗愈...
随着现代社会压力的增加,人们对身心健康的关注日益提升,疗愈经济 -
百度副总裁平晓黎:智能电商正在进一步演化
导语:百度优选提出,AI的应用深度决定了生意的增长速度。如今随着 -
接入DeepSeek,睿帆科技助力某银行托管...
近日,由睿帆科技助力打造的某银行托管客户生命周期管理平台正式接入 -
告别有Ai无爱?免交智商税? Ai抱抱喵...
近年来,Ai技术与玩具行业的深度融合,推动了智能玩具市场的快速增长 -
第八届数字中国建设峰会招展招商推介会...
数字搭台 纵论未来潮起东南,数联鹏城。昨日,继杭州之后,有福之 -
想看看你的AI创意值多少?来联想×联通...
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。 -
佰维存储邀您相聚德国嵌入式展Embedded...
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。 -
佰维存储邀您相聚德国嵌入式展Embedded...
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。 -
联通云盘亮相MWC 2025:融云融智,让存...
DeepSeek爆火,再度掀起人工智能(AI)热浪。云存储领域,也面临AI -
长安+联通+华为,入围世界移动通讯产业...
3月5日,在巴塞罗那举行的2025年世界移动通信大会(MWC)上,长安汽车AI... -
易联众医信深度融合DeepSeek大模型,以AI...
2025年,医疗AI技术加速迈向场景为王时代。作为易联众集团旗下数字医... -
360联合北大震撼发布!5%参数量逼近Deep...
2025年2月24日——由360与北京大学联合研发的中等量级推理模型Tiny- -
未来智链亮相纳斯达克大屏,共祝全球华...
在这个充满希望与梦想的初春时节,我们迎来了激动人心的时刻。2月12 -
易联众睿图全面接入DeepSeek,开启医疗影...
当前,人工智能正以前所未有的速度重塑现代医疗行业格局。在AI领域取 -
DeepSeek赋能Vixtel飞思达CloudFox可观...
随着云原生、微服务架构的普及,可观测性工程(Observability)变得越 -
哪吒2成史上最高热电影词条,百度百科浏...
2月13日19时,《哪吒2》票房已破百亿,成为中国影史首部票房破100亿 -
产品力获认可,佰维存储企业级SSD通过联...
近日,佰维存储SP406 416系列企业级PCIe 4 0 SSD、SS621系列企业... -
易联众“智鼎云帆大模型平台”全面接入D...
新年伊始,国产DeepSeek大模型凭借卓越的自然语言处理能力和强大的深 -
亚冬冰雪狂欢:AI加持联通看家,守护生...
2月7日,哈尔滨以其独特的北国冰雪风光,迎来“2025年第九届亚洲冬 -
从《满江红》到频繁爆火的豫剧微电影,...
-
光谷AI创新应用大赛启动,2月7日报名截止
近日,首届光谷AI创新应用大赛正式启动报名,该赛事面向全球范围内... -
未来智链:Web3+AI=Web4,开启智能互联网新时代
未来智链(Future Smart Chain)通过创新性地结合Web3和人工智能... -
AI多样屋首店盛大开业,开启智慧零售新纪元
2025年1月18日,备受瞩目的AI多样屋金虹桥店在娄山关路地铁站旁的金... -
喜报!万恒科技荣获“2024数字化发展最...
近日,粤港澳大湾区AI领袖峰会在深圳成功举办。本次峰会以“智擎时 -
NVIDIA AI零售助手蓝图:开启个性化购物新时代
新工作流为开发人员提供了生成式 AI 和 3D 可视化技术,以提升