文章来源:智汇AI 发布时间:2026-01-23
Model1 是 DeepSeek 在 FlashMLA 代码库中更新曝光的神秘模型,可能为下一代旗舰模型 DeepSeek-V4 的内部代号或首个工程版本。
暂无访问Model1 是 DeepSeek 在 FlashMLA 代码库中更新曝光的神秘模型,可能为下一代旗舰模型 DeepSeek-V4 的内部代号或首个工程版本。模型在技术上进行了多项创新,包括回归 512 维标准架构、全面适配 NVIDIA 的 Blackwell 架构(SM100),引入 Token 级稀疏 MLA 和 VVPA 等新机制,优化性能、提升长文本处理能力和硬件适配性。目前,Model1 仍处于开发阶段,具体细节和能力有待 DeepSeek 官方正式发布确认。
