NEO-商汤联合南洋理工开源的全新多模态模型架构

NEO-商汤联合南洋理工开源的全新多模态模型架构

文章来源:智汇AI    发布时间:2025-12-04

NEO是商汤科技与南洋理工大学合作研发的全新多模态模型架构,作为首个原生多模态架构(Native VLM),NEO通过底层架构的深度创新,打破了传统多模态模型的

暂无访问

NEO是什么

NEO是商汤科技与南洋理工大学合作研发的全新多模态模型架构,作为首个原生多模态架构(Native VLM),NEO通过底层架构的深度创新,打破了传统多模态模型的局限。核心创新包括原生图块嵌入(Native Patch Embedding),能更精细地捕捉图像细节;原生三维旋转位置编码(Native-RoPE),完美适配图像和文本的自然结构;以及原生多头注意力(Native Multi-Head Attention),提升模型对复杂图文关系的理解能力。NEO在数据效率、性能和推理性价比方面表现出色,仅需较少数据即可达到顶尖视觉感知能力,在多项权威评测中取得优异成绩。商汤已开源2B和9B两种规格的NEO模型,推动原生多模态技术的产业化应用,构建下一代多模态技术标准。

NEO

NEO的主要功能

原生多模态融合:NEO通过底层架构设计,实现了图像和文本的深度融合,突破了传统多模态模型的模块化限制,能更自然地处理图文混合内容。

相关推荐