OmniGen2-智源研究院开源的多模态生成模型

OmniGen2-智源研究院开源的多模态生成模型

文章来源:智汇AI    发布时间:2025-08-12

OmniGen2 是北京智源人工智能研究院推出的开源多模态生成模型。能根据文本提示生成高质量图像,支持指令引导的图像编辑,比如修改背景或人物特征等。OmniGe

暂无访问

OmniGen2是什么

OmniGen2 是北京智源人工智能研究院推出的开源多模态生成模型。能根据文本提示生成高质量图像,支持指令引导的图像编辑,比如修改背景或人物特征等。OmniGen2 采用双组件架构,结合视觉语言模型(VLM)和扩散模型,实现对多种生成任务的统一处理。优势在于开源免费、高性能以及强大的上下文生成能力,适用于商业、创意设计和研究开发等场景。

OmniGen2

OmniGen2的主要功能

文本到图像生成:能根据文本提示生成高保真度和美观的图像。在多个基准测试中表现出色,例如在 GenEval 和 DPG-Bench 上的得分分别为 0.86 和 83.57。

相关推荐