文章来源:智汇AI 发布时间:2025-12-04
NEO是商汤科技与南洋理工大学合作研发的全新多模态模型架构,作为首个原生多模态架构(Native VLM),NEO通过底层架构的深度创新,打破了传统多模态模型的
暂无访问NEO是商汤科技与南洋理工大学合作研发的全新多模态模型架构,作为首个原生多模态架构(Native VLM),NEO通过底层架构的深度创新,打破了传统多模态模型的局限。核心创新包括原生图块嵌入(Native Patch Embedding),能更精细地捕捉图像细节;原生三维旋转位置编码(Native-RoPE),完美适配图像和文本的自然结构;以及原生多头注意力(Native Multi-Head Attention),提升模型对复杂图文关系的理解能力。NEO在数据效率、性能和推理性价比方面表现出色,仅需较少数据即可达到顶尖视觉感知能力,在多项权威评测中取得优异成绩。商汤已开源2B和9B两种规格的NEO模型,推动原生多模态技术的产业化应用,构建下一代多模态技术标准。
