Model1-DeepSeek代码库更新的新模型版本

Model1-DeepSeek代码库更新的新模型版本

文章来源:智汇AI    发布时间:2026-01-23

Model1 是 DeepSeek 在 FlashMLA 代码库中更新曝光的神秘模型,可能为下一代旗舰模型 DeepSeek-V4 的内部代号或首个工程版本。

暂无访问

Model1是什么

Model1 是 DeepSeek 在 FlashMLA 代码库中更新曝光的神秘模型,可能为下一代旗舰模型 DeepSeek-V4 的内部代号或首个工程版本。模型在技术上进行了多项创新,包括回归 512 维标准架构、全面适配 NVIDIA 的 Blackwell 架构(SM100),引入 Token 级稀疏 MLA 和 VVPA 等新机制,优化性能、提升长文本处理能力和硬件适配性。目前,Model1 仍处于开发阶段,具体细节和能力有待 DeepSeek 官方正式发布确认。

Model1

Model1的主要功能

高性能计算:全面适配 NVIDIA 的 Blackwell 架构(SM100),在 B200 GPU 上稀疏算子已达到 350 TFlops,显著提升计算效率。

相关推荐