CADCrafter-单张图片到参数化CAD模型生成框架

AI快讯 2025-04-26 10:51更新网络

CADCrafter是什么?

CADCrafter 是一种由魔芯科技、新加坡南洋理工大学等机构研究人员提出的图像到参数化 CAD 模型生成框架。它能够直接从单张图片生成高质量、可编辑的 CAD 模型,这些模型可以通过 CAD 编译器编译为可用于生产的 3D 文件,解决了从图像到可编辑CAD模型的转换问题。

CADCrafter核心特点

基于几何特征的生成:CADCrafter 使用几何编码器来准确捕捉图像中的几何特征,例如深度和法线图。这些特征不仅增强了模型的几何表示能力,还使得模型能够更好地从合成数据泛化到真实世界图像。

直接偏好优化(DPO):由于将 CAD 参数序列编译为显式 CAD 模型是非可微分过程,CADCrafter 通过 DPO 方法利用 CAD 编译器的反馈来优化模型,确保生成的 CAD 指令具有更高的可编译性和几何精度。

多视图到单视图的知识蒸馏:CADCrafter 通过将多视图几何编码器的知识蒸馏到单视图编码器中,提高了单视图输入的准确性和鲁棒性。

数据集贡献:研究团队还收集了一个名为 RealCAD 的真实世界数据集,包含多视图图像和对应的 CAD 指令序列,用于验证模型的性能。

CADCrafter研究方法

CADCrafter只要通过下面几个步骤来实现从图像到CAD模型的转换:

CAD命令序列编码:将CAD命令序列编码为离散和连续的参数序列,并通过嵌入空间进行处理。

几何条件编码器:提取输入图像的深度和法线图,利用这些几何特征来增强模型对几何结构的理解,并减少合成数据和真实图像之间的域差距。

去噪CAD潜在向量:使用基于扩散模型的架构来去噪潜在CAD代码,该架构通过迭代学习恢复原始潜在向量。

多视图到单视图的知识蒸馏:通过将多视图几何编码器的知识蒸馏到单视图几何编码器中,提高单视图输入的准确性和鲁棒性。

直接偏好优化(DPO):通过CAD编译器的反馈来优化模型,确保生成的CAD指令具有更高的可编译性和几何精度。

CADCrafter:单张图片到参数化CAD模型生成框架.webp

实验

数据集:使用DeepCAD数据集进行训练,并收集了一个名为RealCAD的真实世界数据集进行测试。

评估指标:采用命令准确性(Acccmd)、参数准确性(Accpara)、中位数Chamfer距离(Med CD)和无效率(IR)来评估模型性能。

结果:

在DeepCAD数据集上,CADCrafter在多视图和单视图任务中均表现出色,显著降低了无效率。

在RealCAD数据集上,尽管模型仅在合成数据上进行训练,但其在真实世界数据上的泛化能力表现良好,保持了高准确性和低无效率。

与现有的图像到3D模型生成方法(如One-2-3-45、Wonder3D和TripoSR)相比,CADCrafter在几何精度上表现更好。

CADCrafter应用场景

工业设计:快速生成可编辑的 CAD 模型,加速原型设计和零件重建。

日常物体建模:通过拍摄日常生活中的物体,直接生成其设计制造时可用的工程文件。

CADCrafter论文:https://arxiv.org/pdf/2504.04753

相关文章