
该原型率先向美国Google AI Ultra订阅用户开放。
若将人工智能领域的进步比作交响乐章,那么“生成”无疑是过去几年的主题。然而,2026年初,一曲新旋律奏响:它不仅能生成,更能构建。
北京时间1月30日凌晨,谷歌DeepMind向外界开放了Project Genie。它被誉为当前最先进的世界模型之一,是Genie3的实验性研究原型,也是该世界模型首次以可交互形式面向公众。
“Genie”一词源自阿拉伯语jinni(精灵),后通过法语变形为génie,在英语中常指实现召唤者愿望的“精灵”或“神怪”。谷歌DeepMind将其世界模型项目命名为“Project Genie”,正是借用这一神话:该AI模型能瞬间将用户描述的任何场景生成一个可进入并交互的虚拟世界。
当AI不仅能描绘梦境,还能让人与之互动时,我们讨论的“虚拟”与“现实”的界限或许需要重新审视。
目前,该原型向年满18岁的美国Google AI Ultra(3个月125美元)订阅用户开放。
Project Genie的底层是Genie 3世界模型。与OpenAI的Sora等内容生成大模型不同,它不仅限于多模态内容生成,而是能生成一个完整空间,实现“凭空造世”:
只需文字描述一个场景或上传一张图片,如“一座被巧克力河环绕的棉花糖城堡”,一个实时、可交互的3D虚拟世界便会在几秒内生成。
用户能像玩电子游戏一样,指挥角色自由行走、飞行或驾驶,探索这个想象的世界。
周围环境根据视角和行为动态、连续地生成。这并非依赖传统游戏引擎解码固定数据,而是对潜在物理规律与空间逻辑的一次即时推演与具现,能在用户移动时实时生成前方路径和环境。
从技术本质看,世界模型的核心是模拟环境的动态变化,预测环境演化和行为对环境的影响。
谷歌DeepMind在特定环境如国际象棋、围棋的AI智能体研发上已有深厚积累。但实现通用人工智能(AGI),系统必须能理解和应对现实世界近乎无限的复杂性与多样性。
Genie 3正是这一方向的关键一步。它提供了前所未有的模拟能力,能生成任何现实或虚构场景的交互式环境。这为机器人技术、动画制作乃至历史场景的虚拟探索等领域提供了强大工具。
对AI发展而言,Project Genie的核心价值在于为AI智能体(及未来机器人)提供一个无限、安全且成本可控的“模拟训练场”、“试错沙盒”。智能体能在Genie创造的多样化模拟环境中学习和训练,理解现实世界的物理规则和因果逻辑,这是迈向通用人工智能不可或缺的基石。
从这个角度看,世界模型不仅是内容创作工具,更是连接当前AI与未来“具身智能”的桥梁,是让AI学会“常识”与“因果”的关键基础设施。
人工智能先驱们几乎一致认为,世界模型对打造下一代人工智能至关重要。许多人表示,该技术终将助力创造超越人类的AGI。
斯坦福大学教授、人工智能“教母”李飞飞创立了世界模型初创公司World Labs。知情人士透露,李飞飞正与投资者展开新一轮洽谈,公司最新估值有望达约50亿美元。此外,“AI教父”杨立昆的世界模型初创公司AMI Labs也在吸引潜在支持者。英伟达CEO黄仁勋表示,世界模型能助力实现“物理人工智能”,自主操控机器人等设备。Meta的超级智能AI实验室也致力于构建世界模型……
作为初期成果,Project Genie为代表的世界模型仍非常不成熟。以Project Genie为例,该模型每次生成和探索时间被限定在60秒内,生成的世界在物理效果上可能不够逼真。此外,一些高级功能尚未实现。这些限制部分源于世界模型巨大的计算消耗,这也是当前AI模型技术面临的核心矛盾。
谷歌DeepMind、World Labs等领先AI团队认为,世界模型可能首先重塑游戏、影视行业。
传统的3D资产创建与场景搭建是人力与时间密集型的核心环节。Project Genie展示的可能性是,将部分前期概念设计、场景原型构建乃至动态分镜预览过程压缩至几分钟甚至几秒钟。这并非要取代专业创作引擎,而是可能重塑创作流程的起点,极大释放创意验证速度。
DeepMind世界模型项目Genie 3的联合负责人此前表示:“软件开发尤其是游戏开发正在发生巨大变化。”
本文由主机测评网于2026-06-17发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260648046.html