当前位置:首页 > 科技资讯 > 正文

腾讯混元3D世界模型Lite版发布:显存需求大降,3D建模步入平民化时代

8月15日,腾讯混元团队正式推出了3D世界模型的Lite版本。相比以往需要26GB以上显存的版本,这次通过引入动态FP8(8位浮点格式)量化技术,将显存需求大幅压缩至17GB以下,使得普通消费级显卡也能流畅运行该模型。

此前,腾讯混元3D世界模型的FP32版本虽然能完整保留所有细节,但显存占用极高——其参数规模可能超过十亿个,通常需要配备大容量显存的GPU来加速推理,因此消费级显卡根本无法支撑。

简单来说,FP32、FP16、FP8代表了不同的“精度等级”。过去采用高精度FP32技术时,虽然能实现极高的细节还原,却会占用大量显存,甚至可能保留一些非必要的细节(例如背景的天空贴图等并不需要如此高的精度)。

此次动态FP8量化技术的核心,在于能够实时监控模型运行时的数据分布,并针对不同模块进行动态调整:大部分关键区域保持FP16精度,而像背景贴图等非关键部分则动态切换为FP8精度。

这一技术显著降低了显存占用,尽管在部分区域精度有所降低,但让个人用户也能轻松体验3D世界模型的魅力。

腾讯混元3D重塑3D建模流程

腾讯混元3D世界模型是行业首个开源可编辑的世界生成模型,能够根据用户提供的图片或文字描述,直接生成完整、可编辑且可交互的3D世界,可广泛应用于游戏开发、特效制作、教育仿真等场景。

腾讯混元3D世界模型Lite版发布:显存需求大降,3D建模步入平民化时代 动态FP8量化技术 3D世界模型 AI 3D生成 消费级显卡适配 第1张

图源:腾讯混元3D官网

与腾讯混元模型之前的3D模型AI生成功能相比,这次推出的3D世界模型生成的内容更加丰富,涵盖了环境风格、室内外场景、光线渲染等多个维度。传统3D场景开发耗时极长,仅一个主要建筑场景就可能花费数周甚至数月,而这种一键生成式场景带来的效率提升,完全超出了用户的预期。

那么,面对如此复杂的场景开发,混元3D世界模型是如何快速生成360°沉浸式视觉空间的呢?

从混元世界模型1.0的架构来看,全景世界图像生成技术作为连接文字、图片与3D世界的统一代理系统,会首先生成初始化世界的全景图,从而实现360°的全覆盖场景。

腾讯混元3D世界模型Lite版发布:显存需求大降,3D建模步入平民化时代 动态FP8量化技术 3D世界模型 AI 3D生成 消费级显卡适配 第2张

图源:腾讯混元3D官网 混元世界模型 1.0 的模型架构

随后,系统会将整个3D世界分解为不同的清晰层级,例如前景与背景、海洋与地面、地面与天空等,再基于这些层级进行3D世界重建,最终形成完整的3D世界模型。

相较于传统3D场景开发中每个细节都需要精雕细琢、消耗大量时间和人力的方式,这种一键生成式场景不仅能极大节省时间,还能输出标准化的可漫游3D Mesh资产,兼容Unity、Unreal Engine等主流开发工具。

而且,生成内容的精度已经达到可直接使用的水平:前景内的注意力区域细节表现到位,背景与前景分离清晰,未出现界限模糊或光影不协调的问题。

但在官网体验混元3D世界模型后会发现,它目前还无法完全还原文字描述中的所有要求,只能实现大致的场景需求、光影色调以及前景区域的细节。

例如,下图对应的文本要求中提到了机械世界、机器人等元素,但这些并未在生成的场景中体现。系统只是提取了与构建大体世界场景相关的词汇,如赛博废土风格、天空中红色的落日等,然后分离前景与背景——将“废弃的游乐场”解构为前景内容,红色落日作为背景天空内容,再基于这些层级重建3D世界场景,也就是说,它仅还原了场景的基本框架。

腾讯混元3D世界模型Lite版发布:显存需求大降,3D建模步入平民化时代 动态FP8量化技术 3D世界模型 AI 3D生成 消费级显卡适配 第3张

图源:腾讯混元3D官网

可以明显看出,混元3D世界模型目前尚无法满足用户的深度个性化需求,但已经能够初步构建出前景、背景以及简单的场景细节,在游戏开发等工作中可以节省大量时间。

此外,这种按需生成的3D世界模型对普通玩家来说也极具可玩性。直接输出3D Mesh资产带来了格式的统一和学习成本的降低,当AI能够完成场景解构和3D构建工作时,用户的主观创意就成为决定生成场景效果的关键因素。

3D模型起风了,25年走向平民化?

腾讯此次将混元3D世界模型适配到消费级显卡,意图非常明确——吸引广大开发者和创作者加入“腾讯混元3D”生态。该模型支持从3D模型到3D世界场景的全流程内容生成,用户能够借此创造属于自己的虚拟世界。

当前市面上,支持3D模型生成的AI大模型并不少见,如Tripo AI、Meshy AI、GENIE等。但众多厂商扎堆涌入3D化赛道,导致产品功能高度同质化,也从侧面反映出“将现实场景搬进虚拟世界”已成为各家的核心竞争点。

在这些AI工具中,硅谷初创企业VAST于2024年发布的AI 3D基础模型Tripo AI,凭借其独特的产品结构脱颖而出。

与面向更广泛用户的腾讯混元3D不同,Tripo AI的定位更偏向专业创作者:用户进入页面后,可直接通过文字或图片生成3D模型,且可调节参数较为丰富——不仅支持当前主流AI 3D模型都具备的纹理生成功能,还能自动拆分模型部件,让每个部件可单独编辑;甚至支持为模型部件绑定基础动画并演示,尽管演示中偶尔会出现部件变形问题。总体而言,Tripo AI是一款功能成熟、可适应多场景的AI 3D工具。

腾讯混元3D世界模型Lite版发布:显存需求大降,3D建模步入平民化时代 动态FP8量化技术 3D世界模型 AI 3D生成 消费级显卡适配 第4张

图源:Tripo AI

同样在2024年推出的Meshy AI(由国内团队开发),虽然也支持通过文字、图像直接生成3D模型,但它的核心优势在于更完善的社区功能:用户可在社区内浏览其他创作者的3D模型作品,平台对模型的分类细致清晰,还标注了互动量、点赞数、是否支持3D打印等关键信息。这一设计让新手用户能直接下载现成的3D模型使用,同时也提升了社区的传播度与活跃度。

腾讯混元3D世界模型Lite版发布:显存需求大降,3D建模步入平民化时代 动态FP8量化技术 3D世界模型 AI 3D生成 消费级显卡适配 第5张

图源:Meshy AI

而由Luma AI推出的GENIE工具,除了支持文本转3D模型、多格式(如OBJ、FBX等)导出以适应不同场景外,最大亮点是提供了API接口——用户可通过该接口直接将视频内容转化为3D模型,形成了差异化的竞争力。

不难看出,上述产品均依靠自身特色在同类竞争中脱颖而出,腾讯混元3D也不例外。尽管其3D模型生成功能与其他工具相比优势不明显,但“高免费额度”是其核心吸引力:在混元AI 3D官网,每位用户每天可免费生成20次模型,次数用完后还能通过分享给好友重新获取。这种“以量换用户”的推广策略相当成功,在3D世界模型Lite版发布前,其社区模型下载量已突破230万次,成为全球最受欢迎的3D开源模型平台之一。

腾讯混元3D世界模型Lite版发布:显存需求大降,3D建模步入平民化时代 动态FP8量化技术 3D世界模型 AI 3D生成 消费级显卡适配 第6张

图源:腾讯混元AI

此次腾讯推出适配消费级显卡的混元3D世界模型Lite版,无疑将吸引更多创作者加入其生态。用户规模的增长,又将进一步推动模型迭代与应用场景拓展:以当下热门的VR眼镜为例,混元3D导出的3D世界模型文件可直接导入使用,用户只需拥有VR设备,就能随时随地沉浸在自己创建的虚拟场景中,实现生态与硬件的联动;同时,AI 3D基础模型能让普通用户轻松制作高度自定义的3D模型,与3D打印机等设备形成协同。

更重要的是,AI 3D化近乎“零学习成本”的特性,正推动其快速渗透到各行各业:在建筑规划、室内设计、电商展示等场景中,3D可视化内容比文字或传统图纸更易理解,工作人员无需复杂学习即可输出场景内容,大幅减少重复建模的时间;这种“虚拟模型+实体行业”的联动,既能提升用户粘性,又能通过高度自定义内容让用户产生归属感——种种趋势表明,3D模型在2025年必将走向大众化。

小雷认为,未来的AI 3D模型将进一步整合专业场景模型与创作风格,通过细分领域和使用场景吸引更多垂直用户,不断拓展生态边界并渗透到各类生活化场景中。

而这,正是本次3D模型平民化浪潮的核心意义——在现实与虚拟交融的今天,让每个人都拥有构建3D虚拟世界的能力。

3D模型普及,3D建模师会因此失业吗?

不过,网络上一直有一种观点,认为随着3D模型的普及,3D建模师可能会面临失业风险。对此,小雷却持不同看法。

不可否认,这类能快速生成3D模型的工具,必然会对行业带来冲击。AI模型“快速高效”的优势,确实是人类难以比拟的;但正如前文所说,当前的AI 3D模型尚无法实现真正的用户个性化——其生成的结果,本质上仍是基于大模型训练数据所产生的“模式化内容”。

而这类缺乏个性的内容,终究难以成为优秀的作品。无论是游戏建模还是建筑设计,真正能让人铭记的,永远是那些独具匠心的设计:是3D建模师反复打磨的细节,是为满足用户需求精心斟酌的巧思。因此小雷认为,以当前AI 3D模型的能力,想要完全取代3D建模师几乎不可能;相反,作为能高效执行重复性指令的工具,它更适合成为建模师提升工作效率的“得力助手”。

其实换个角度思考,这种“AI辅助创作”的模式,早已在各个行业中渗透。但受限于内容同质化的问题,AI往往只能停留在“重复的基础构建”环节。

这也正是雷科技在如今AI写作工具日益普及的今天,依然坚持原创的原因,小雷始终相信,真正有深度、有温度的优秀内容,绝不会因为AI的存在而失去光彩。