GPT-4V生成网页超一半情况比人类效果更好

AI快讯 2024-10-25 15:05更新网络

斯坦福大学、微软以及谷歌DeepMind的研究人员联手发布了一篇论文,深入探讨了Design2Code任务,即实现从视觉设计到代码实现的高效转化。在这项研究中,研究团队选取了484个真实的网页作为测试样本,并设计了一组自动化的评估指标,旨在精准地衡量多模态大型模型在面对屏幕截图输入时,其生成代码实现效果与给定参考网页的契合程度。

为了提升模型的性能,研究人员创新性地提出了多模式提示方法,并在GPT-4V和Gemini Vision Pro上进行了实证验证,效果显著。在评估环节,GPT-4V凭借其卓越的性能脱颖而出,生成的网页在高达64%的情况下,被评价为比原始参考网页更加出色。

相关文章