CVPR会议落幕不久,腾讯正式发布了混元3D 2.1版本。这一开源成果迅速吸引了业界的广泛关注。在几何处理领域,该模型实现了显著的技术提升;在纹理分析方面,也实现了新的突破;其性能已达到开源3D模型领域的领先地位;为开发者提供了更加丰富的创作空间。
模型亮点宣布
在CVPR会议期间,鹅厂宣布了混元3D 2.1版本的源代码已对外开放。该版本在业界引起了广泛关注,主要因为其在几何和纹理处理上实现了双重优化,尤其是在纹理贴面技术领域取得了显著成就。此外,整个流程,包括训练所需的代码和模型权重,都已实现开源,并支持一键部署,同时为开发者提供了定制化配置的便利。腾讯公司发布消息,这一事件见证了首个实现全流程开源的工业级3D生成大型模型的问世,其性能标准已与闭源模型相当,并且能够兼容消费级显卡。
双重优化解析
混元3D 2.1版本的核心功能包括对几何和纹理的改进。几何优化确保了模型形状的精确度,而纹理优化则致力于恢复表面的色彩和细节。此功能能够生成多指标贴图,并且能够支持皮革等材质的高质量渲染。此外,它还能在同一模型上展现出多种不同的质感。该模型全面展现了该功能的显著特点,人脸上的皱纹细节清晰可见,号角金属的光泽感同样十分突出。
技术架构升级
在2.0版本的基础上,2.1版本对“几何-纹理解耦”架构进行了强化。这一版本以DiT几何架构为支撑,对细节建模进行了优化,进而提升了网格的精确度,并改善了形状的统一性。这些优化措施有助于纹理映射工作的顺利进行。此外,该方案引入了PBR纹理生成技术;该技术能够精确地再现光线与材料间的物理交互作用;因此,在各种光照条件下,所呈现的视觉效果均保持了极高的统一性。
材质还原对比
混元3D 2.1在材质还原方面表现卓越,超越了TexGen及其2.0版本。在用户进行的盲测中,其PBR纹理的质感表现超越了78%的同类产品。另外,PBR材质的标准化特性使其能够与主流渲染引擎兼容,便于在多个平台上重复使用,为开发者带来了极大的便利。
开源使用便捷
混元3D 2.1版本推行了全面开源的策略,允许开发者进行定制化修改和深化训练。在硬件兼容性方面,该系统兼容消费级显卡,并配备了详尽的安装与操作指南,大幅降低了开发者的技术门槛,从而使得开发者能够更轻松地启动项目,有效提升了3D模型及关联应用的开发效率。
发展成果显著
自2024年11月起,首个3D生成模型开源项目正式推出官渡第五中学,该领域的进步势头迅猛。进入今年1月,混元3D的2.0版本成功突破了主流模型的局限。目前,该系列的2.1版本在质感表现上取得了明显进步。自开源项目启动以来,混元3D模型在Hugging Face平台上的下载次数已累计超过180万次。混元3D系列不断进步,导致AI所创造的3D模型在真实感方面日益提升。
关于混元3D 2.1在三维建模领域可能引发的创新进展,您有何高见?它可能遭遇的困难又包括哪些方面?我们热切期待您的观点。同时,恳请您为这篇文章点赞并予以转发!