Qwen3 Embedding-阿里通义开源的文本嵌入模型系列

Qwen3 Embedding-阿里通义开源的文本嵌入模型系列

文章来源:智汇AI    发布时间:9659-06-09

Qwen3 Embedding 是基于 Qwen3 基础模型开发的文本表征、检索与排序专用模型。继承了 Qwen3 的先进架构,如 Grouped Query

暂无访问

Qwen3 Embedding是什么

Qwen3 Embedding 是基于 Qwen3 基础模型开发的文本表征、检索与排序专用模型。继承了 Qwen3 的先进架构,如 Grouped Query Attention、SwiGLU 激活函数等,通过多阶段训练,包括大规模弱监督预训练、高质量监督微调和模型融合,提升了性能和鲁棒性。支持多语言,涵盖 119 种语言,参数规模从 0.6B 到 8B,可灵活选择表征维度并优化指令适配。在 MTEB 等任务中表现优异,如 Qwen3-Embedding-8B 在 MTEB(eng,v2)上 Mean(Task)达 75.22,在 MTEB(cmn,v1)上达 73.84。

Qwen3 Embedding

Qwen3 Embedding的主要功能

精准语义捕捉:能将文本转换为高维向量,精准捕捉文本的语义信息。不同文本内容会映射到不同的向量空间位置,语义相近的文本在向量空间中距离更近,为后续的文本处理任务提供高质量的语义表征基础。

相关推荐