DeepSeekV3.1一上线,官方的一条留言就把整个AI圈炸了。
新的架构、下一代国产芯片,短短不到20个字,却信息量满满,引发热议。
这两天老狐看了不少科普文后,简单理解就是:国产AI正在走向软硬协同阶段,未来模型有望实质性减少对英伟达、AMD等国外算力的依赖。
同时,这次更新还打破了“性能越高成本越贵”的行业魔咒,让金融、医疗等高算力场景的应用想象空间一下子被打开。
资本市场的反应也很直接:DeepSeek一官宣,国产芯片概念股应声大涨,每日互动尾盘直线拉升,收盘大涨13.62%。
有网友调侃说:国产芯片迎来史诗级暴涨,DeepSeek一句话,周五大盘直接冲上3800点。
这两天,DeepSeek官方上线V3.1版本,没铺天盖地宣传,就像平常一样低调发个公告。
老狐整理了一下这次V3.1的更新,最核心、最有革命性的创新,就是它的混合推理架构——HybridReasoningArchitecture。
这个架构能同时支持思考模式和非思考模式,用户可以随时切换,想慢慢分析就慢慢分析,想快速出结果也没问题。
以前DeepSeek的产品线里,分工很清楚:V3模型擅长通用对话,R1模型更偏深度思考。这种分离式架构好处是,各个模型都能在自己擅长的领域表现不错,但用户来回切换很麻烦。
现在,V3.1打破了这种壁垒,把通用对话、复杂推理、专业编程等多种核心功能集成在同一个模型里,让使用体验更灵活,效率更高。
不仅如此,V3.1的推理效率也大幅提升。官方数据显示,思考模式下,它在各项任务的平均表现和前代顶级R1-0528持平,但输出的token数量减少了20%到50%。非思考模式下,输出长度也更短,但性能不打折。
这背后其实是“思维链压缩”在起作用:模型在训练阶段学会生成更简洁、高效的推理路径,同时保证答案准确。简单理解,就是算法更聪明了。
为什么要这样做?很简单:省钱!
过去,思维链虽然能让模型推理更强,但冗长的中间步骤会带来高昂计算成本和API调用费用,想大规模应用就很难
V3.1的思维链压缩,正好解决了这个问题,把高级AI推理能力从学术工具变成了可大规模商业化使用的经济方案。
社区测试中,DeepSeekV3.1在Aider多语言编程测试里,分数已经超过了Claude4Opus,而且成本还更低。
这下开发者都在刷屏了,HuggingFace上的热度也蹭蹭往上。
值得一提的是,DeepSeek官宣V3.1的时候提到,这次模型用了UE8M0FP8Scale的参数精度,同时对分词器和chattemplate也做了不小的调整,所以和之前的V3有明显区别。
说到DeepSeekV3.1用的“UE8M0FP8”,老狐简单学习后科普一下:
FP8就是把普通浮点数压缩成8位来存,既省空间又省算力。
再加上MXFP8的“块缩放”思路:把数据分块,每块用自己的缩放系数,这样既不会丢太多信息,又能节省更多资源。
名字里的U、E、M可以理解为“无符号+指数+尾数”。UE8M0里所有8位都用来表示指数,没有尾数和符号位,这让处理器复原数据时非常轻松:只要移动指数位就行,不用做复杂乘法,速度快、路径短。
这个格式的另一个优势是动态范围大,可以同时表示很大和很小的数,不容易溢出或被压成0,也就是在保证8位张量精度的同时,把信息损失降到最低。
这对国产新芯片特别合适,以前大部分国产AI芯片用的还是FP16/INT8,没法原生用FP8。
为什么说它更适合下一代国产芯片?目前大部分国产AI加速器还是FP16/INT8方案,没有完整的FP8单元。
新一代芯片,比如摩尔线程MUSA3.1GPU、芯原VIP9000NPU,都开始支持原生FP8,DeepSeekV3.1的UE8M0格式正好匹配这些硬件。
总结一句话:UE8M0FP8让模型在新一代国产芯片上跑得更省空间、更快、更稳,同时保持精度。
这也是为什么DeepSeek官微特别提到它,为国产AI带来了更低成本、高性能的新可能。
再来看看更新后一些体验,大家关心的官网能不能直接访问,官方也给出了答案。
打开官网一看,DeepSeek把App和网页端的“深度思考(R1)”改成了“深度思考”,官方确认了网友之前的猜测——模型已经更新了。
看看万能的网友们,都玩出了什么新花样。
推特X上有AI博主分析新模型生成的小球跳动效果更符合物理定律了,还能调重力、摩擦、旋转速度、弹跳这些参数。
还有人直接用DeepSeekV3.1做了个振动编码,当场变身VJ。
更有网友让V3.1给自己画了个自画像,画风意外特别。
不过,社区中还是有部分用户吐槽翻译和写作,SYSTEMPROMPT需要现场写指令,中英夹杂和错词偶尔出现,有点乱。
感兴趣的狐友们,现在可以上官网自行体验一番了~
老狐觉得每次DeepSeek更新都让人期待下一次,几乎快成了国产AI的精神图腾了,一起期待DeepSeekR2吧。
本文来自微信公众号“科技狐”(ID:kejihutv),作者:老狐,经授权发布。