SAIL-Embedding-抖音联合港中文推出的全模态嵌入模型

SAIL-Embedding-抖音联合港中文推出的全模态嵌入模型

文章来源:智汇AI    发布时间:2025-11-05

SAIL-Embedding是字节跳动抖音SAIL团队和香港中文大学MMLab联合开发的全模态(omni-modal)嵌入基础模型。解决多模态信息检索和推荐系统

暂无访问

SAIL-Embedding是什么

SAIL-Embedding是字节跳动抖音SAIL团队和香港中文大学MMLab联合开发的全模态(omni-modal)嵌入基础模型。解决多模态信息检索和推荐系统中的实际应用问题,通过支持任意模态输入(包括文本、视觉和音频),生成统一且信息丰富的表示,支持多模态检索和分类任务。SAIL-Embedding通过动态难负样本挖掘和自适应多源数据平衡等训练策略,增强了训练的鲁棒性和可扩展性。采用大型语言模型(LLM)作为核心推理和融合骨干网络,支持灵活的模态集成。在多个基准测试中,SAIL-Embedding显著优于其他方法,特别是在搜索和协作感知场景中。

SAIL-Embedding

SAIL-Embedding的主要功能

全模态支持:能处理视觉、文本和音频等多种模态的输入,生成统一的多维表示向量,满足不同业务场景的需求。

相关推荐