面壁智能MiniCPM4与Intel全面适配，实现AIPC2.2倍长文本推理优化

文章来源：智汇AI 发布时间：2025-06-19

面壁智能于本月 6 日晚发布端侧大模型 MiniCPM 4.0。面壁智能官方今日发文称，面壁 MiniCPM 4 与 Intel 全面适配，结合英特尔加速套件与 KV Cache 内存增强技术，实现 AI PC 2.2 倍长文本推理优化。

暂无访问

感谢智汇AI网友SNOS雪诺的线索投递！

智汇AI6月12日消息，面壁智能于本月6日晚发布端侧大模型MiniCPM4.0。面壁智能官方今日发文称，面壁MiniCPM4与Intel全面适配，结合英特尔加速套件与KVCache内存增强技术，实现AIPC2.2倍长文本推理优化，端侧AIPC在Day0全面适配，128K长上下文窗口等多方面突破。

据介绍，此次面壁推出的MiniCPM4.0系列LLM模型拥有8B、0.5B两种参数规模，针对单一架构难以兼顾长、短文本不同场景的技术难题，MiniCPM4.0-8B采用「高效双频换挡」机制，能够根据任务特征自动切换注意力模式：在处理高难度的长文本、深度思考任务时，启用稀疏注意力以降低计算复杂度，在短文本场景下切换至稠密注意力以确保精度，实现了长、短文本切换的高效响应。

目前，具有CPU、GPU、NPU三个AI运算引擎的英特尔酷睿Ultra处理器已对此适配，并借助OpenVINO工具套件为MiniCPM4.0系列模型提供优化的卓越性能表现。英特尔再次在NPU上对模型发布提供第零日（Day0）支持，为不同参数量模型和应用场景提供更多样化的、更有针对性的平台支持。

据智汇AI了解，MiniCPM4.0可在vLLM、SGLang、LlamaFactory、XTuner等开源框架部署。其内置自研CPM.cu极速端侧推理框架，从投机采样创新、模型压缩量化创新、端侧部署框架创新几方面，带来90%的模型瘦身和速度提升，官方宣称将实现端侧推理“从天生到终生”的丝滑。