大模型首次直接理解代码图：不用Agent自动修bug，登顶SWE-Bench开源模型榜单

大模型首次直接理解代码图：不用Agent自动修bug，登顶SWE-Bench开源模型榜单

文章来源：智汇AI 发布时间：2025-06-27

AI 自动修 bug，解决率达 44%！这是全球开源模型的最新最强水平。来自蚂蚁的开源新模型，在 SWE-bench Lite 上超越所有开源方案，性能媲美闭源模型。

暂无访问

AI自动修bug，解决率达44%！这是全球开源模型的最新最强水平。

来自蚂蚁的开源新模型，在SWE-benchLite上超越所有开源方案，性能媲美闭源模型。

具体表现如下，在SWE-benchLite上：

所有开源模型方法（OpenWeightModel）中排名第一；

所有开源系统方法（OpenSourceSyestem）中排名第六；

总体排名第14；

优于目前榜单最好开源模型“KGCompass”7.33%。

他们首创将仓库代码图模态融入大模型（CodeGraphModel,CGM），让大语言模型能直接理解代码图，更高效修复bug、补全代码。

这彻底摆脱对黑盒模型（如GPT-4或Claude3.7等）和复杂Agent工作流程的依赖，实现更加可控、透明、安全的SE自动化。

而且，CGM完全基于开源模型。要知道，开源模型在SWE-bench上的表现通常不够好，此前几乎所有SOTA级方案都是基于闭源模型实现。而CGM基于Qwen模型，做到了比肩闭源模型的水平。

CGM仅需4步就能快速定位、生成补丁，省去了Agent方案中复杂的编排过程，效率直线up。

让AI真正理解大模型代码库

大模型趋势以来，AI编程迅速崛起，尤其是在写函数这类小任务上的表现出色，比如在HumanEval等基准测试上，许多模型的准确率已经超过90%。

然而真实的软件工程远比”写一个函数“复杂得多。像Bug修复、功能增强这样的任务，通常需要跨文件、跨模块操作，并要求模型理解项目中复杂的结构、依赖关系和类的继承体系。

现在的主流方法通常是使用基于闭源模型的Agent。它们可以模拟人类程序员行为，如观察代码、调用工具、多轮交互等完成任务。

但这类方法也存在几个问题：

行为路径不可控，容易积累推理误差；

依赖GPT-4、Claude等闭源模型，难以私有部署或定制；

工程成本高，效率不高。

与此同时，当前使用开源模型的方案，很难实现SOTA级效果。

为此研究团队提出：能否只用开源模型、不依赖Agent，解决仓库级任务？CGM由此而来。

相关推荐

最新收录

腾讯混元大模型与DeepSeek深度学习引擎融合，赋能全新图像理解技能

腾讯混元大模

AI神器集安卓pad版

AI神器集安

Mesherapp官网

Mesher

Z2H字帖ai工具免费版下载

Z2H字帖a

妙办画板pad版

妙办画板pa

DubbingAI安卓福利版

Dubbin

Cleanpng|KissPNG极速版

Cleanp

爱美刻旧版本

爱美刻旧版本

Jasper.ai经典版2025升级版本

Jasper

Ezindie车载版下载

Ezindi

MESH·Y极速版手机版

MESH·Y

VideoTutorai工具大全下载

VideoT

Excalidraw个人版网页版登录入口

Excali

AdobePodcast2025版本下载

AdobeP

SooGif播放器app下载

SooGif

Apowersoft在线视频压缩pc端官网入口

Apower

造作AI助手苹果版官网入口

造作AI助手

IndieHackers.siteapp苹果iOS下载

IndieH

最新文章

大模型首次直接理解代码图：不用Agent自动修bug，登顶SWE-Bench开源模型榜单

大模型首次直

总时长180分钟！快手推出全球首部AI单元故事集《新世界加载中》

总时长180

Airweave-将任何应用程序转为 Agent 知识库的开源工具

Airwea

追剧指南：康熙王朝50集在线观看免费资源哪里找？这些细节值得留意

追剧指南：康

MotionCanvas-港中文和 Adobe 等机构推出的可控图像到视频生成方法

Motion

岗本视频官网软件：为什么它成了视频创作者的新宠？

岗本视频官网

情侣之间角色扮演_情侣之间角色扮演都有哪些角色姐夫叫什么

情侣之间角色

局长边摸边吃奶边做爰：一场权力失控的荒诞剧如何敲响社会警钟

局长边摸边吃

古风双男主的巴掌狠揍红肿臂瓣：一场“体面”下的爱恨博弈

古风双男主的

AnythingLLM-开源的全栈 AI 客户端，支持本地部署和API集成

Anythi

Zonos-ZyphraAI 开源的多语言 TTS 模型

Zonos-

为什么大家都在聊尤蜜app下载免费视频？这些细节你可能没想到

为什么大家都

HUGWBC-上海交大联合上海 AI Lab 推出的人形机器人全身控制器

HUGWBC

尤蜜软件下载最新版：从功能到安全的全方位指南

尤蜜软件下载

PDF to Podcast-英伟达推出的 PDF 转音频内容 AI 工具

PDF to

小蝌蚪app下载大全小蝌蚪：新手必备的实用工具合集

小蝌蚪app

InternVideo2.5-上海 AI Lab 联合南大、中科院开源的视频多模态大模型

Intern

小花螺直播最新版来了！这些功能让你玩到停不下来

小花螺直播最