当前位置:首页 > 科技资讯 > 正文

LeCun离职后爆料Meta内幕:Llama4作弊刷榜,田渊栋无奈创业

刚刚从Meta离职的Yann LeCun,转身就给老东家沉重一击:口碑崩塌的Llama4模型确实存在刷榜造假行为!

实际情况的确存在部分篡改。为了在各项测试中取得好成绩,团队针对不同的基准测试采用了不同的模型进行提交

LeCun离职后爆料Meta内幕:Llama4作弊刷榜,田渊栋无奈创业 LeCun 田渊栋 Meta Llama4 第1张

常言道千万别惹离职员工,不单LeCun,田渊栋也在个人年终总结里透露了些许内情。

原本是被紧急调来为Llama4收拾残局的,事先设想了四种可能的结果,没想到扎克伯格给了我第五种……

(无奈苦笑.jpg)

LeCun离职后爆料Meta内幕:Llama4作弊刷榜,田渊栋无奈创业 LeCun 田渊栋 Meta Llama4 第2张

总之,谈及离职后的计划,两位大神竟异口同声地表示:

创业!

LeCun离职后爆料Meta内幕:Llama4作弊刷榜,田渊栋无奈创业 LeCun 田渊栋 Meta Llama4 第3张

Llama4造假风波引发离职潮

DeepSeek的出现确实给扎克伯格带来了巨大压力。

早先就有传闻称,DeepSeek的突然崛起使得Llama 4尚未发布便已落后,迫使扎克伯格疯狂加码AI领域的投资。

这一点LeCun也予以证实。

扎克伯格确实慌了神,对内施加压力,要求GenAI部门加速AI开发与部署,还拉来了原FAIR团队的田渊栋救场。

结果却导致团队间沟通彻底破裂。LeCun等人希望探索新方向,但扎克伯格更青睐已被验证、能快速落地的技术。

真正的导火索正是Llama 4的惨痛失败。

LeCun离职后爆料Meta内幕:Llama4作弊刷榜,田渊栋无奈创业 LeCun 田渊栋 Meta Llama4 第4张

不仅技术落败,更因排行榜造假导致声誉扫地,扎克伯格遂对团队全体成员失去信任,将他们悉数边缘化。

这也直接触发了Meta团队的大换血:一边天价从硅谷各路公司挖角,一边大刀阔斧裁撤老员工。

田渊栋及其团队首当其冲。

一月被仓促拉入Llama 4项目,十月Llama 4.5刚训练完就被卸磨杀驴。

此番遭遇连田渊栋也不禁喊冤……

迫于上级压力,全组只得搁置手头工作,投身Llama 4的烂摊子,距离发布截止日仅剩两个月,还要处理所有脏活累活。

为此,田渊栋当时还特意绘制了一个2x2回报矩阵,估算此举的四种结局

LeCun离职后爆料Meta内幕:Llama4作弊刷榜,田渊栋无奈创业 LeCun 田渊栋 Meta Llama4 第5张

但老板发话不得不从,田渊栋心想只求尽力而为,无愧于心。

结果辛苦数月后,扎克伯格却一个都没选,而是给出了Plan E:不追究负责人责任,直接将田渊栋及其组员扫地出门。

LeCun离职后爆料Meta内幕:Llama4作弊刷榜,田渊栋无奈创业 LeCun 田渊栋 Meta Llama4 第6张

难怪田渊栋复盘这段经历时感叹:

这让我对社会的复杂性有了更深刻的体会。

好在田渊栋心态豁达,他说自己在Meta已待了十余年,近年更是抱着“公司快开了我吧”的心态,所以也算是因祸得福,还为接下来的小说创作积累了丰富素材(doge)。

LeCun离职后爆料Meta内幕:Llama4作弊刷榜,田渊栋无奈创业 LeCun 田渊栋 Meta Llama4 第7张

(咳咳)言归正传,这几个月对田渊栋而言并非全无收获,在强化学习训练的核心问题上他也取得了一些新进展。

首先是大模型推理,继2024年底团队公开的连续隐空间推理(coconut)引发广泛关注后,团队又通过理论工作Reasoning by Superposition进一步阐明了连续隐空间推理的优势。

同时,他们从多个角度尝试提升模型推理效率:Token Assorted借助隐空间的离散token降低计算开销、DeepConf基于置信度提前终止推理、ThreadWeaver构建并行思维链加速推理,并在不同规模模型中用RL学习推理能力。

可解释性方面,研究聚焦于Grokking(顿悟)这一特征涌现现象,从记忆到泛化的突变过程切入,试图解释模型究竟学到了什么、与输入数据的关系、能达到怎样的泛化,即打开模型的黑箱。

简而言之,对于被拉来“背锅”一事,田渊栋对老东家仍留有余地,尽管对方不厚道,但他已选择释怀~

LeCun离职后爆料Meta内幕:Llama4作弊刷榜,田渊栋无奈创业 LeCun 田渊栋 Meta Llama4 第8张

然而随后离职的LeCun就没那么客气了,他直接痛批Meta内部对LLM过度痴迷,尤其是那些新挖来的超级智能实验室成员。

他点名批评亚历山大王:年轻且缺乏经验。

虽学习能力强,却根本不懂研究,不知如何开展工作,也不知如何与研究员们相处。

在LeCun面前,这位27岁的年轻人简直像个孩子。

但大语言模型并非他们想象的那般完美,LeCun直言,LLM虽有用但本质受限于语言,夸张点说:

LLM是死胡同。

要实现人类水平智能,必须理解物理世界的运作规律,这正是LeCun长期专注的世界模型,但Meta已对此失去兴趣。

研究路线的分歧,最终迫使LeCun离开公司,开启人生新篇章——创业

离开Meta后何去何从?创业

LeCun的新公司名为Advanced Machine Intelligence(AMI),仍聚焦于他心心念念的世界模型,且全面拥抱开源

不过据他本人透露,他只担任新公司的执行主席而非CEO。

我是一名科学家,我能激励人们投身工作,也能预判哪些技术可能成功,但我不擅长组织管理,况且年纪确实大了。

LeCun将享有与之前在Meta相同的研究自由度,而AMI的日常管理将交给法国医疗AI初创公司Nabla的联合创始人兼CEO Alex LeBrun。

LeCun离职后爆料Meta内幕:Llama4作弊刷榜,田渊栋无奈创业 LeCun 田渊栋 Meta Llama4 第9张

他们将目光投向V-JEPA架构,试图通过学习视频和空间数据来理解物理世界,让AI具备规划、推理及长期记忆能力,即他常说的 advanced machine intelligence。

LeCun预计12个月内将见证该技术的初始版本问世,并在未来几年内取得重大进展,尽管它离超级智能还相差甚远,但至少在通往AGI的道路上燃起了希望。

LeCun离职后爆料Meta内幕:Llama4作弊刷榜,田渊栋无奈创业 LeCun 田渊栋 Meta Llama4 第10张

而作为LeCun的老下属,田渊栋也拒绝了各大厂抛来的橄榄枝,刚刚正式宣布创业!

具体细节暂未披露,但他表示:

趁自己还年轻,去当一家新初创公司的联合创始人。

无论如何,先低调忙碌一阵。

参考链接:

[1]https://www.ft.com/content/e3c4c2f6-4ea7-4adf-b945-e58495f836c2

[2]https://zhuanlan.zhihu.com/p/1990809161458540818