文章来源:智汇AI 发布时间:8038-06-09
MiniCPM 4.0 是面壁智能推出的端侧大模型。模型分为 8B 和 0.5B 两种参数规模。8B 闪电稀疏版采用创新稀疏架构,能高效处理长文本任务;0.5B
暂无访问MiniCPM 4.0 是面壁智能推出的极致高效的端侧大模型。模型分为 8B 和 0.5B 两种参数规模。8B 闪电稀疏版采用创新稀疏架构,能高效处理长文本任务;0.5B 版本以低计算资源消耗和高性能著称。自研 CPM.cu 推理框架在极限场景下可实现最高 220 倍提速,常规情况下也能达到 5 倍的速度提升。MiniCPM 4.0 支持在 vLLM、SGLang、LlamaFactory 等开源框架部署,已适配 Intel、高通、MTK、华为昇腾等主流芯片。
MiniCPM4-8B:MiniCPM4的旗舰模型,拥有80亿参数,在8T tokens上训练。
MiniCPM4-0.5B:MiniCPM4的小型版本,拥有0.5亿参数,在1T tokens上训练。
MiniCPM4-8B-Eagle-FRSpec:用于FRSpec的Eagle头,加速MiniCPM4-8B的推测性推理。
MiniCPM4-8B-Eagle-FRSpec-QAT-cpmcu:使用QAT训练的FRSpec的Eagle头,高效地结合推测和量化,实现MiniCPM4-8B的超加速。
MiniCPM4-8B-Eagle-vLLM: vLLM格式的Eagle头,加速MiniCPM4-8B的推测性推理。
MiniCPM4-8B-marlin-Eagle-vLLM: 量化的vLLM格式Eagle头,加速MiniCPM4-8B的推测性推理。
BitCPM4-0.5B:应用极值三进制量化于MiniCPM4-0.5B,将模型参数压缩为三进制值,实现了90%的位宽减少。
BitCPM4-1B:应用极值三进制量化于MiniCPM3-1B,将模型参数压缩为三进制值,实现了90%的位宽减少。
MiniCPM4-Survey: 基于MiniCPM4-8B,接受用户的查询作为输入,并自动生成可信的长篇调查论文。
MiniCPM4-MCP:基于MiniCPM4-8B,接受用户的查询及可用的MCP工具作为输入,并自动调用相关的MCP工具以满足用户需求。