文章来源:智汇AI 发布时间:2025-11-05
SAIL-Embedding是字节跳动抖音SAIL团队和香港中文大学MMLab联合开发的全模态(omni-modal)嵌入基础模型。解决多模态信息检索和推荐系统
暂无访问SAIL-Embedding是字节跳动抖音SAIL团队和香港中文大学MMLab联合开发的全模态(omni-modal)嵌入基础模型。解决多模态信息检索和推荐系统中的实际应用问题,通过支持任意模态输入(包括文本、视觉和音频),生成统一且信息丰富的表示,支持多模态检索和分类任务。SAIL-Embedding通过动态难负样本挖掘和自适应多源数据平衡等训练策略,增强了训练的鲁棒性和可扩展性。采用大型语言模型(LLM)作为核心推理和融合骨干网络,支持灵活的模态集成。在多个基准测试中,SAIL-Embedding显著优于其他方法,特别是在搜索和协作感知场景中。
