OpenAI推出的GPT-4o图像生成有哪些功能特点?

AI快讯 2025-04-02 09:48更新网络

2025年3月25日,Openai通过一场直播活动正式发布了GPT-4o的原生图像生成功能,并将其集成到ChatGPT和Sora平台,用户可以通过文字提示生成高质量图像,甚至对现有图像进行风格化编辑。

OpenAI推出的GPT-4o图像生成有哪些功能特点?.webp

GPT-4o图像生成功能的主要功能特点

多模态能力:GPT-4o能够理解和编辑现有图像,而不仅仅是生成新的图像。它可以通过图像识别技术理解照片中的人物、物体和场景,并进行风格化编辑。

风格迁移:可以将现实照片转化为动漫风格,同时保留人物的姿势和表情。

文本渲染与图像融合:能够在图像中添加文字,并根据图像的整体风格自动调整文字的字体、颜色和位置,确保最终效果自然且美观。

语义理解与场景生成:能够根据一句话描述生成全新的漫画内容,包括分格布局、人物表情和对话内容。

图像合成与格式化:可以将上传的图像与指定的风格和布局无缝融合,生成符合要求的图像,如交易卡。

图像识别与上色排版:能够将手绘漫画草稿转化为全彩色电子版,自动上色并优化排版。

GPT-4o图像生成功能的主要应用场景.jpg

GPT-4o图像生成功能的主要应用场景

艺术创作:将现实照片转化为动漫风格,生成艺术作品。

内容创作:制作社交媒体内容、宣传海报或个性化卡片。

教育与学习:生成与教学相关的图像,如科学图表或历史场景。

游戏开发:设计游戏角色和场景。

漫画创作:从零开始生成漫画内容,或将手绘草稿转化为电子版并进行上色和排版。

在安全性与溯源方面,这个功能更新会阻止违反内容政策的图像生成请求,比如儿童性虐待和换脸等方面,而且生成的图像包含C2PA元数据,从而标识为GPT-4o生成。

ChatGPT的Plus、Pro、Team和Free用户可以试用这个功能了,很快也会向企业和教育用户开放,开发者将很快通过API使用GPT-4o生成图像。

相关文章