UNO-Bench-美团LongCat推出的全模态大模型评测基准

UNO-Bench-美团LongCat推出的全模态大模型评测基准

文章来源:智汇AI    发布时间:2025-11-07

UNO-Bench是美团LongCat团队推出的全模态大模型评测基准。UNO-Bench针对现有评测体系的不足,通过高质量、多样化的数据构建,精准衡量模型的单模

暂无访问

UNO-Bench是什么

UNO-Bench是美团LongCat团队推出的全模态大模型评测基准。UNO-Bench针对现有评测体系的不足,通过高质量、多样化的数据构建,精准衡量模型的单模态与全模态能力。基准首次验证了全模态大模型的“组合定律”,揭示单模态与全模态能力的复杂关系。UNO-Bench创新的多步开放式问题和高效的数据压缩算法,提升了评测的区分度与效率,为推动全模态大模型的发展提供科学的评估工具。

UNO-Bench

UNO-Bench的主要功能

精准评估模型能力:通过高质量、多样化的数据集,同时衡量模型在图像、音频、视频和文本等单模态和全模态任务上的表现。

相关推荐