GPT-4V生成网页超一半情况比人类效果更好

AI快讯 2024-10-25 15:05更新

斯坦福大学、微软以及谷歌DeepMind的研究人员联手发布了一篇论文，深入探讨了Design2Code任务，即实现从视觉设计到代码实现的高效转化。在这项研究中，研究团队选取了484个真实的网页作为测试样本，并设计了一组自动化的评估指标，旨在精准地衡量多模态大型模型在面对屏幕截图输入时，其生成代码实现效果与给定参考网页的契合程度。

为了提升模型的性能，研究人员创新性地提出了多模式提示方法，并在GPT-4V和Gemini Vision Pro上进行了实证验证，效果显著。在评估环节，GPT-4V凭借其卓越的性能脱颖而出，生成的网页在高达64%的情况下，被评价为比原始参考网页更加出色。

相关文章

CADCrafter-单张图片到参数化CAD模型生成框架

网络

2025-04-26

Codemcp-一款将Claude-Pro转变为结对编程助手的工具

网络

2025-04-26

Hi3DGen-从2D图像生成高保真3D几何模型的框架

网络

2025-04-25

Magnitude-一个基于AI的端到端Web测试平台

网络

2025-04-25

Neural4D-2o-DreamTech推出的全球首个多模态3D-AIGC大模型

网络

2025-04-25

FIRE-1-Firecrawl推出的一款智能交互AI数据抓取工具

网络

2025-04-25

如何利用支付宝百宝箱创建一个旅游助手智能体教程

网络

2025-04-25

Seedream-3.0-字节跳动推出的高性能中英双语图像生成模型

网络

2025-04-25

让AI帮助您提高工作或学习效率整理最优秀的AI绘画,AI聊天,AI提示词,AI办公,AIGC,文生图等网站

Copyright @ 智汇AI

联系方式QQ：3756153558 | 手机：17359272608 | 闽ICP备2024047188号-2 | 厦门点击创客网络科技有限公司
友情链接: 微米小说站 | 笔魂AI绘图 | 库宝ai工作助手 | 智搜AI导航站 | 快标书 AI | AI吧 | 邢台医院 | 声动视界 | 文多多AIPPT | HelpLook AI知识库 |
gitee AI | 笔格设计 | AIBOX创作平台 | 08AI导航网 | 零导航 | 下载之家 | 教程之家 | 系统之家 | 天极网 | 曲多多版权音乐