当前位置:首页 > 科技资讯 > 正文

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命

【新智元深度解读】深夜时分,OpenAI意外推出Sora 2这一震撼性产品,AI视频领域正式迈入“GPT-3.5时刻”!一系列令人惊叹的演示视频公开展示,物理智能实现显著跃升,首次达成音频与画面的完美同步,人物一致性和可控性刷新行业最高水平。但最引人注目的莫过于Sora应用,它的亮相或将彻底改变短视频社交媒体的交互模式与社区生态。

实在出乎意料,Sora 2在深夜引发轰动!

不久前,OpenAI通过直播正式宣布新一代AI视频模型——Sora 2,正面迎战谷歌Veo 3。

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第1张

该模型在物理准确性、真实感方面一举达到行业新巅峰,并在一致性和可控性上取得巨大突破。

特别值得一提的是,Sora 2首次实现了“音画同步”功能。

奥特曼发表长文兴奋地宣称,“创意领域的ChatGPT时刻已经到来”!

人类创造力即将迎来一次寒武纪式的大爆发,随之而来的艺术与娱乐品质也将大幅提升。

突然间,创作空间变得无比广阔,令人印象深刻。

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第2张

他还特别强调了一个创意玩法——将自己和朋友置入视频中,效果趣味十足!

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第3张

这不,奥特曼手持话筒,直接宣布“太平洋时间上午10点开启直播”。

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第4张

此外,他还与Sora团队负责人Bill Peebles利用Sora 2直接制作了一部长达2分钟的官宣视频,效果极为震撼。

令人惊讶的是,人物角色的一致性极高,看来我们距离好莱坞级别的大片已不遥远。

正如先前爆料所示,Sora首个应用正式开放,iOS用户可直接下载。安卓用户则需通过sora.com访问。

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第5张

Sora 2问世,视频领域GPT-3.5时刻正式来临

谈及AI视频生成,过去总给人一种“梦中万物皆可成”的感觉——篮球瞬间移入篮筐、人物刚在左侧出现,下一帧便出现分身。

技术进步迅速无疑,但“虚假”痕迹总是难以隐藏。

直至Sora 2推出,首次让人感受到AI开始尊重物理规律与常识,生成的世界不再是“随意编造”,而是真正能够映照现实。

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第6张

2024年2月,Sora首次亮相,堪称视频界的“GPT-1时刻”!这是首次让所有人看到视频生成真正具备实用性。

过去半年,OpenAI团队全力攻克“如何让模型真实模拟物理运行”这一关键难题,如今终于取得重大进展。

基于海量视频数据的预训练与后训练技术,Sora 2的高光时刻已然到来。

正如官方博客所言,Sora 2开启了“视频领域的GPT-3.5时刻”!

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第7张

接下来,具体审视Sora 2经过一年多发展,究竟实现了哪些重大突破?

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第8张

AI穿帮问题,终被有效解决

最令人感叹的是Sora 2在物理细节上的进化。

别轻视这一点,例如当要求生成人物投篮时,旧模型为“满足”指令,篮球会强行飞入篮筐(即便角度完全不合理);

如今的Sora 2,篮球打板弹开、甚至投失都成为常态,动作具备惯性、受力和材质均合乎逻辑。

头顶一只猫咪完成三周半跳?奥运冠军能否做到尚未可知,但Sora认为完全可行。

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第9张

提示:花样滑冰运动员头顶猫咪完成三周半跳

被业界誉为“AI体操界的图灵测试”,Sora 2一次性成功通过。

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第10张

提示:体操运动员在平衡木上翻转。电影质感

就连这种不符合逻辑的奇特操作:一名男子骑在一匹马背上,而这匹马又骑在另一匹马背上,Sora 2也能以出人意料的方式完成。

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第11张

提示:一名男子骑在一匹位于另一匹马背上的马

桨板上的后空翻也非简单拼接,而是力学自洽地演绎。

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第12张

提示:一名男子在桨板上完成后空翻

你甚至能感受到角色的失误、尝试与挣扎,而非一味“完美无缺”。

类似观看小型纪录片——会成功,但也会失败。

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第13张

提示:标题——上方灯笼,距离之间(10.0秒,黑白节日夜景实拍)

“世界模拟器”这一概念,终于具备了些许底气。

多镜头、多风格,连贯成片成为可能

以往要求AI连续生成多个镜头,角色的服装总莫名更换、光线杂乱、道具消失。

Sora 2此次特别强调“世界状态”连续性——即便让角色从厨房走向阳台,镜头切换时阳光、服饰、甚至地上洒落的水都能一气呵成,避免穿帮。

你还可以像导演一样指定每个镜头的顺序、节奏、景别变化,掌控故事节奏。

风格上,它已能实现写实与电影质感:

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第14张

提示:维京人出征——北海启航(10.0秒,冬日冷日光/早期中世纪)

甚至连日漫那种“超现实高燃”风格也能流畅呈现。

例如生成一场刀光剑影的动漫打斗,每一帧都能让二次元爱好者感叹“这比幻灯片流畅得多”。

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第15张

还有曾风靡网络的吉卜力风格,Sora 2在生成效果上也能精准把握。

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第16张

提示:以吉卜力工作室动漫风格,男孩与狗奔跑于绿草如茵的风景山区,俯瞰远处背景中的村庄,云彩绚丽

且音频直接同步,不仅对白与口型对齐,连环境音、动作声效都随场景变化,带来“即拿即用”体验,省去后期剪辑音频的繁琐。

更多Sora 2官方惊艳演示一览:

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第17张

新玩法:Sora应用让你“投射”自我进入故事

除模型本身外,此次最让人感到“时代变革”的是全新iOS社交应用——Sora。

打开应用,仅需录制一小段带声音的视频,系统验证身份并采集形象后,你或朋友便能立即将你的样貌和声音精准“置入”任意生成场景:

可让自己现身巴黎铁塔前开派对、与熊猫打乒乓,甚至与马斯克同框歌唱(当然,公众人物暂不支持)。

Sora 2可直接生成一只鸵鸟叼走男子帽子、在农场奔跑的视频,效果极为自然,令人难以辨认为AI生成。

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第18张

提示:鸵鸟偷走爸爸的帽子,爸爸追赶它

更令人惊喜的是,Sora 2还能赋予个人“超能力”——飞翔,仅需一个提示即可实现。

此功能亦应用于Sora应用,带来全新社交互动方式。

“狗超人”拯救人类的剧情,在Sora 2中生动上演。

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第19张

提示:@rocket是拥有超能力的超级英雄狗,飞翔于天空并拯救纽约市

更多惊艳演示,以第一视角带你畅游。

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第20张

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第21张

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第22张

此“Cameo”功能一经使用便令人欲罢不能,许多OpenAI内测员工称借此结识新朋友,AI不仅能生成内容,还能创造社交纽带。

Sora的分发逻辑也颇具趣味:推荐更偏向“具二次创作价值”的视频,而非单纯让用户无脑刷时长。

你可以用自然语言告知系统想看何种类型、风格或故事,算法会主动调整推荐。

起步为邀请制,先于美国等地推出,后续将迅速扩展。

获得邀请码还可访问sora.com网页体验,高质量专业版则专属于ChatGPT Pro用户。

历史作品不会丢失,API亦在筹备中。

全网实测震撼

提前获得内测资格的开发者已发布诸多Sora 2的震撼演示。

@Miguel | AP直言,Sora是自己所见首个能将动漫效果呈现到位的AI视频模型。

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第23张

再看Sora 2极致运镜效果,从近景拉至远景,毫无违和感。

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第24张

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第25张

有人体验后惊叹表示,我确信我们已迈入社交媒体新时代!

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第26张

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第27张

漫雪纷飞中,一对情侣翩翩起舞。

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第28张

还有OpenAI研究员@gabriel,也在第一时间公开了一些“奥特曼参演剧情”的演示。

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第29张

安全与治理:并非空谈,而是切实关注

能力增强,风险亦随之提升。

Sora 2在每一环节均设置“安全网”:

三层审核:文本提示、上传素材、视频逐帧、自动生成的场景描述和音频转写,全流程分层分类拦截。部分内容在输入时即被阻拦,有的生成后还需二次封堵,尤其未成年场景严格加倍。

肖像权与公众人物保护:上线初期,禁止使用他人视频进行“换脸”,不支持生成公众人物。仅在你本人验证授权后,他人才可使用你的形象制作视频,所有涉及你形象的作品你均可查询、撤回。

青少年守护:青少年账号内容与Cameo权限均受限制,家长可通过ChatGPT平台控制推荐、管理私信甚至关闭个性化推荐。

可追溯性:视频下载附带动态水印,所有内容均嵌入行业标准元数据。官方还开发了检测工具,便于未来判断“是否为AI生成”。

压力测试:在成人内容、极端主义、自伤、暴力、误导性政治等维度,均进行专门评测与红队攻防。对违规拦截率、误杀率的数据透明公布,核心指标大多处于95-99%区间。

核心团队介绍

在Sora 2官方博客末尾,OpenAI列出了所有参与成员名单,阵容极其豪华。

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第30张

在这份“电影谢幕工作人员表”中,OpenAI几乎全体员工均被列入致谢。

而为我们带来这场如梦似幻电影的“总导演”,即Sora负责人Bill Peebles。

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第31张

他是一名95后,本科毕业于MIT计算机专业,后于加州伯克利取得计算机博士学位。

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第32张

他曾先后在英伟达、Adobe、Meta的AI岗位实习,博士毕业后直接加入OpenAI,最大业绩是Created Sora(创造了Sora)。

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第33张

字越少事越大,言简意赅。

OpenAI深夜发布Sora 2:AI视频生成迎来GPT-3.5时代革命 Sora 2  AI视频模型 音画同步 社交媒体应用 第34张

下一步:从内容创作到“世界模拟”

OpenAI表示,Sora 2并非终点。

OpenAI坦言它仍会犯错,但路线已然清晰:继续以更多、更高质量的视频数据训练模型,世界模拟的准确性与细节感将愈发逼真。

这一进化不仅带来娱乐体验的提升,更将影响影视广告、动画分镜、教育科普、产品演示,甚至是未来AI机器人“在现实世界中学习技能”。

当然,这也意味着欺诈、非自愿肖像、青少年保护等问题将更加突出,需依靠技术、产品、社区与政策共同监管。

你想将自我“置入”哪个世界?

Sora 2这一波更新,真正将视频生成从“形似”推向“合理”,物理逻辑、镜头控制、音画同步、可玩性与安全性全面升级;

Cameo功能则将创作从“观看他人”变为“扮演自我”,让每个人都能成为主角。

不妨立即思考:若有30秒,让你出现于任何场景,你最想尝试什么?

是与偶像穿越探险,还是携带宠物环游地球,或干脆成为自己动漫的主角?

欢迎在评论区留言分享你的首条Sora 2创意。

下一个风靡网络的爆款视频,或许就源自你手中的Sora。

参考资料:

https://openai.com/index/sora-2/ 

https://openai.com/index/sora-2-system-card/ 

https://cdn.openai.com/pdf/50d5973c-c4ff-4c2d-986f-c72b5d0ff069/sora_2_system_card.pdf 

https://www.youtube.com/watch?v=gzneGhpXwjU