MiniCPM 4.0-面壁智能开源极致高效的端侧大模型

MiniCPM 4.0-面壁智能开源极致高效的端侧大模型

文章来源:智汇AI    发布时间:8038-06-09

MiniCPM 4.0 是面壁智能推出的端侧大模型。模型分为 8B 和 0.5B 两种参数规模。8B 闪电稀疏版采用创新稀疏架构,能高效处理长文本任务;0.5B

暂无访问

MiniCPM 4.0是什么

MiniCPM 4.0 是面壁智能推出的极致高效的端侧大模型。模型分为 8B 和 0.5B 两种参数规模。8B 闪电稀疏版采用创新稀疏架构,能高效处理长文本任务;0.5B 版本以低计算资源消耗和高性能著称。自研 CPM.cu 推理框架在极限场景下可实现最高 220 倍提速,常规情况下也能达到 5 倍的速度提升。MiniCPM 4.0 支持在 vLLM、SGLang、LlamaFactory 等开源框架部署,已适配 Intel、高通、MTK、华为昇腾等主流芯片。

MiniCPM 4.0

MiniCPM 4.0开源模型合集

MiniCPM4-8B:MiniCPM4的旗舰模型,拥有80亿参数,在8T tokens上训练。

MiniCPM4-0.5B:MiniCPM4的小型版本,拥有0.5亿参数,在1T tokens上训练。

MiniCPM4-8B-Eagle-FRSpec:用于FRSpec的Eagle头,加速MiniCPM4-8B的推测性推理。

MiniCPM4-8B-Eagle-FRSpec-QAT-cpmcu:使用QAT训练的FRSpec的Eagle头,高效地结合推测和量化,实现MiniCPM4-8B的超加速。

MiniCPM4-8B-Eagle-vLLM: vLLM格式的Eagle头,加速MiniCPM4-8B的推测性推理。

MiniCPM4-8B-marlin-Eagle-vLLM: 量化的vLLM格式Eagle头,加速MiniCPM4-8B的推测性推理。

BitCPM4-0.5B:应用极值三进制量化于MiniCPM4-0.5B,将模型参数压缩为三进制值,实现了90%的位宽减少。

BitCPM4-1B:应用极值三进制量化于MiniCPM3-1B,将模型参数压缩为三进制值,实现了90%的位宽减少。

MiniCPM4-Survey: 基于MiniCPM4-8B,接受用户的查询作为输入,并自动生成可信的长篇调查论文。

MiniCPM4-MCP:基于MiniCPM4-8B,接受用户的查询及可用的MCP工具作为输入,并自动调用相关的MCP工具以满足用户需求。

MiniCPM 4.0的主要功能

高效双频换挡机制:MiniCPM 4.0-8B 版本可根据任务特征自动切换注意力模式。处理长文本时启用稀疏注意力,降低计算复杂度;处理短文本时切换至稠密注意力,确保精度。

相关推荐