【新智元深度解读】深夜时分,OpenAI意外推出Sora 2这一震撼性产品,AI视频领域正式迈入“GPT-3.5时刻”!一系列令人惊叹的演示视频公开展示,物理智能实现显著跃升,首次达成音频与画面的完美同步,人物一致性和可控性刷新行业最高水平。但最引人注目的莫过于Sora应用,它的亮相或将彻底改变短视频社交媒体的交互模式与社区生态。
实在出乎意料,Sora 2在深夜引发轰动!
不久前,OpenAI通过直播正式宣布新一代AI视频模型——Sora 2,正面迎战谷歌Veo 3。
该模型在物理准确性、真实感方面一举达到行业新巅峰,并在一致性和可控性上取得巨大突破。
特别值得一提的是,Sora 2首次实现了“音画同步”功能。
奥特曼发表长文兴奋地宣称,“创意领域的ChatGPT时刻已经到来”!
人类创造力即将迎来一次寒武纪式的大爆发,随之而来的艺术与娱乐品质也将大幅提升。
突然间,创作空间变得无比广阔,令人印象深刻。
他还特别强调了一个创意玩法——将自己和朋友置入视频中,效果趣味十足!
这不,奥特曼手持话筒,直接宣布“太平洋时间上午10点开启直播”。
此外,他还与Sora团队负责人Bill Peebles利用Sora 2直接制作了一部长达2分钟的官宣视频,效果极为震撼。
令人惊讶的是,人物角色的一致性极高,看来我们距离好莱坞级别的大片已不遥远。
正如先前爆料所示,Sora首个应用正式开放,iOS用户可直接下载。安卓用户则需通过sora.com访问。
谈及AI视频生成,过去总给人一种“梦中万物皆可成”的感觉——篮球瞬间移入篮筐、人物刚在左侧出现,下一帧便出现分身。
技术进步迅速无疑,但“虚假”痕迹总是难以隐藏。
直至Sora 2推出,首次让人感受到AI开始尊重物理规律与常识,生成的世界不再是“随意编造”,而是真正能够映照现实。
2024年2月,Sora首次亮相,堪称视频界的“GPT-1时刻”!这是首次让所有人看到视频生成真正具备实用性。
过去半年,OpenAI团队全力攻克“如何让模型真实模拟物理运行”这一关键难题,如今终于取得重大进展。
基于海量视频数据的预训练与后训练技术,Sora 2的高光时刻已然到来。
正如官方博客所言,Sora 2开启了“视频领域的GPT-3.5时刻”!
接下来,具体审视Sora 2经过一年多发展,究竟实现了哪些重大突破?
最令人感叹的是Sora 2在物理细节上的进化。
别轻视这一点,例如当要求生成人物投篮时,旧模型为“满足”指令,篮球会强行飞入篮筐(即便角度完全不合理);
如今的Sora 2,篮球打板弹开、甚至投失都成为常态,动作具备惯性、受力和材质均合乎逻辑。
头顶一只猫咪完成三周半跳?奥运冠军能否做到尚未可知,但Sora认为完全可行。
提示:花样滑冰运动员头顶猫咪完成三周半跳
被业界誉为“AI体操界的图灵测试”,Sora 2一次性成功通过。
提示:体操运动员在平衡木上翻转。电影质感
就连这种不符合逻辑的奇特操作:一名男子骑在一匹马背上,而这匹马又骑在另一匹马背上,Sora 2也能以出人意料的方式完成。
提示:一名男子骑在一匹位于另一匹马背上的马
桨板上的后空翻也非简单拼接,而是力学自洽地演绎。
提示:一名男子在桨板上完成后空翻
你甚至能感受到角色的失误、尝试与挣扎,而非一味“完美无缺”。
类似观看小型纪录片——会成功,但也会失败。
提示:标题——上方灯笼,距离之间(10.0秒,黑白节日夜景实拍)
“世界模拟器”这一概念,终于具备了些许底气。
以往要求AI连续生成多个镜头,角色的服装总莫名更换、光线杂乱、道具消失。
Sora 2此次特别强调“世界状态”连续性——即便让角色从厨房走向阳台,镜头切换时阳光、服饰、甚至地上洒落的水都能一气呵成,避免穿帮。
你还可以像导演一样指定每个镜头的顺序、节奏、景别变化,掌控故事节奏。
风格上,它已能实现写实与电影质感:
提示:维京人出征——北海启航(10.0秒,冬日冷日光/早期中世纪)
甚至连日漫那种“超现实高燃”风格也能流畅呈现。
例如生成一场刀光剑影的动漫打斗,每一帧都能让二次元爱好者感叹“这比幻灯片流畅得多”。
还有曾风靡网络的吉卜力风格,Sora 2在生成效果上也能精准把握。
提示:以吉卜力工作室动漫风格,男孩与狗奔跑于绿草如茵的风景山区,俯瞰远处背景中的村庄,云彩绚丽
且音频直接同步,不仅对白与口型对齐,连环境音、动作声效都随场景变化,带来“即拿即用”体验,省去后期剪辑音频的繁琐。
更多Sora 2官方惊艳演示一览:
除模型本身外,此次最让人感到“时代变革”的是全新iOS社交应用——Sora。
打开应用,仅需录制一小段带声音的视频,系统验证身份并采集形象后,你或朋友便能立即将你的样貌和声音精准“置入”任意生成场景:
可让自己现身巴黎铁塔前开派对、与熊猫打乒乓,甚至与马斯克同框歌唱(当然,公众人物暂不支持)。
Sora 2可直接生成一只鸵鸟叼走男子帽子、在农场奔跑的视频,效果极为自然,令人难以辨认为AI生成。
提示:鸵鸟偷走爸爸的帽子,爸爸追赶它
更令人惊喜的是,Sora 2还能赋予个人“超能力”——飞翔,仅需一个提示即可实现。
此功能亦应用于Sora应用,带来全新社交互动方式。
“狗超人”拯救人类的剧情,在Sora 2中生动上演。
提示:@rocket是拥有超能力的超级英雄狗,飞翔于天空并拯救纽约市
更多惊艳演示,以第一视角带你畅游。
此“Cameo”功能一经使用便令人欲罢不能,许多OpenAI内测员工称借此结识新朋友,AI不仅能生成内容,还能创造社交纽带。
Sora的分发逻辑也颇具趣味:推荐更偏向“具二次创作价值”的视频,而非单纯让用户无脑刷时长。
你可以用自然语言告知系统想看何种类型、风格或故事,算法会主动调整推荐。
起步为邀请制,先于美国等地推出,后续将迅速扩展。
获得邀请码还可访问sora.com网页体验,高质量专业版则专属于ChatGPT Pro用户。
历史作品不会丢失,API亦在筹备中。
提前获得内测资格的开发者已发布诸多Sora 2的震撼演示。
@Miguel | AP直言,Sora是自己所见首个能将动漫效果呈现到位的AI视频模型。
再看Sora 2极致运镜效果,从近景拉至远景,毫无违和感。
有人体验后惊叹表示,我确信我们已迈入社交媒体新时代!
漫雪纷飞中,一对情侣翩翩起舞。
还有OpenAI研究员@gabriel,也在第一时间公开了一些“奥特曼参演剧情”的演示。
能力增强,风险亦随之提升。
Sora 2在每一环节均设置“安全网”:
三层审核:文本提示、上传素材、视频逐帧、自动生成的场景描述和音频转写,全流程分层分类拦截。部分内容在输入时即被阻拦,有的生成后还需二次封堵,尤其未成年场景严格加倍。
肖像权与公众人物保护:上线初期,禁止使用他人视频进行“换脸”,不支持生成公众人物。仅在你本人验证授权后,他人才可使用你的形象制作视频,所有涉及你形象的作品你均可查询、撤回。
青少年守护:青少年账号内容与Cameo权限均受限制,家长可通过ChatGPT平台控制推荐、管理私信甚至关闭个性化推荐。
可追溯性:视频下载附带动态水印,所有内容均嵌入行业标准元数据。官方还开发了检测工具,便于未来判断“是否为AI生成”。
压力测试:在成人内容、极端主义、自伤、暴力、误导性政治等维度,均进行专门评测与红队攻防。对违规拦截率、误杀率的数据透明公布,核心指标大多处于95-99%区间。
在Sora 2官方博客末尾,OpenAI列出了所有参与成员名单,阵容极其豪华。
在这份“电影谢幕工作人员表”中,OpenAI几乎全体员工均被列入致谢。
而为我们带来这场如梦似幻电影的“总导演”,即Sora负责人Bill Peebles。
他是一名95后,本科毕业于MIT计算机专业,后于加州伯克利取得计算机博士学位。
他曾先后在英伟达、Adobe、Meta的AI岗位实习,博士毕业后直接加入OpenAI,最大业绩是Created Sora(创造了Sora)。
字越少事越大,言简意赅。
OpenAI表示,Sora 2并非终点。
OpenAI坦言它仍会犯错,但路线已然清晰:继续以更多、更高质量的视频数据训练模型,世界模拟的准确性与细节感将愈发逼真。
这一进化不仅带来娱乐体验的提升,更将影响影视广告、动画分镜、教育科普、产品演示,甚至是未来AI机器人“在现实世界中学习技能”。
当然,这也意味着欺诈、非自愿肖像、青少年保护等问题将更加突出,需依靠技术、产品、社区与政策共同监管。
Sora 2这一波更新,真正将视频生成从“形似”推向“合理”,物理逻辑、镜头控制、音画同步、可玩性与安全性全面升级;
Cameo功能则将创作从“观看他人”变为“扮演自我”,让每个人都能成为主角。
不妨立即思考:若有30秒,让你出现于任何场景,你最想尝试什么?
是与偶像穿越探险,还是携带宠物环游地球,或干脆成为自己动漫的主角?
欢迎在评论区留言分享你的首条Sora 2创意。
下一个风靡网络的爆款视频,或许就源自你手中的Sora。
参考资料:
https://openai.com/index/sora-2/
https://openai.com/index/sora-2-system-card/
https://cdn.openai.com/pdf/50d5973c-c4ff-4c2d-986f-c72b5d0ff069/sora_2_system_card.pdf
https://www.youtube.com/watch?v=gzneGhpXwjU
本文由主机测评网于2026-01-05发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260115166.html