文章来源:智汇AI 发布时间:2025-09-09
中科院自动化所联合沐曦MetaX推出全球首款类脑脉冲大模型“瞬悉1.0”,实现全流程国产化,在超长序列推理上效率提升显著。开源7B模型并开放76B测试,为法律、医疗等领域提供高效工具。
暂无访问智汇AI9月8日消息,据中国科学院自动化研究所官方微信公众号消息,近日,中国科学院自动化研究所李国齐、徐波团队在发表原创内生复杂性理论系列论文的工作基础上,与沐曦MetaX合作,打造了类脑脉冲大模型“瞬悉1.0”(SpikingBrain-1.0),在国产千卡GPU算力平台上完成全流程训练和推理,实现了大模型在超长序列推理上数量级的效率和速度提升,展示了构建国产自主可控的新型非Transformer大模型架构生态的可行性。研究团队开源了SpikingBrain-1.0-7B模型并开放SpikingBrain-1.0-76B测试网址,同步公开了经工业界大规模验证的类脑脉冲大模型SpikingBrain-1.0中英文技术报告。这是全球首款类脑脉冲大模型,实现了全流程国产化,标志着我国在类脑计算与大模型融合创新方面取得重要突破。
智汇AI从官方介绍获悉,研发团队借鉴大脑神经元内部复杂工作机制提出“基于内生复杂性”的大模型构架方式,打造类脑脉冲大模型“瞬悉1.0”(SpikingBrain-1.0),在理论上建立了脉冲神经元内生动力学与线性注意力模型之间的联系,揭示了现有线性注意力机制是树突计算的特殊简化形式,从而清晰地展示了一条不断提升模型复杂度和性能的新型可行路径。研发团队进而构建并开源了基于脉冲神经元、具有线性(SpikingBrain-1.0-7B)及混合线性复杂度(SpikingBrain-1.0-76B,激活参数量12B)的新型类脑基础模型,开发了面向国产GPU(沐曦MetaX曦云C550)集群高效训练和推理框架、Triton算子库、模型并行策略以及集群通信原语。
李国齐表示,这项成果不仅是我国在类脑脉冲大模型架构和国产算力全流程建设上的重大突破,更为法律、医疗、科学模拟等超长序列应用场景提供了更高效的建模工具,也将启迪下一代神经形态计算理论和芯片设计。