当前位置:首页 > 科技资讯 > 正文

OpenAI首席研究官Mark Chen深度访谈:揭秘AI研究内幕、竞争与未来

近日,OpenAI首席研究官Mark Chen接受了一次深度访谈,透露了大量内部信息,内容极为丰富。

无论是公司事务、个人见解还是同事动态,他都畅所欲言,几乎无所不谈

OpenAI首席研究官Mark Chen深度访谈:揭秘AI研究内幕、竞争与未来 OpenAI  AI研究 人才竞争 模型发布 第1张

例如:

  • 爆料Meta在人才争夺中升级为送汤大战扎克伯格亲自煮汤送到OpenAI研究员嘴边。OpenAI也以送汤回击。
  • Mark Chen、Scott Gray等经常三五围坐,打扑克牌。本质被解释为概率与期望值的博弈
  • OpenAI核心研究团队规模约500人,公司内有约300个项目。
  • Mark Chen表示OpenAI本质上仍是一家纯AI研究公司
  • Gemini 3发布后,每个人都会用自己的方式试探新模型,有个“42问题”从未有语言模型能完全解决。
  • OpenAI“宫斗”,Mark Chen如何促成让Sam回归的请愿信也被聊出。
  • 透露过去半年,一直专注预训练,有信心与Gemini 3正面对决。
  • 表示内部已有性能达Gemini 3的模型,将很快发布,并发布更好下一代模型。
  • 当被问“你们真的需要那么多算力吗”会震惊:如果今天多10倍算力,几周内就能用满。 ……

网友纷纷表示,这次访谈让人耳目一新,许多人在转发Mark Chen观点。

OpenAI首席研究官Mark Chen深度访谈:揭秘AI研究内幕、竞争与未来 OpenAI  AI研究 人才竞争 模型发布 第2张

Mark Chen能言无不尽,关键在访谈来自《Core Memory》,主持人Ashlee Vance是硅谷知名科技记者,以深入采访闻名,更以《硅谷钢铁侠:埃隆·马斯克,创造未来的人》著称。

OpenAI首席研究官Mark Chen深度访谈:揭秘AI研究内幕、竞争与未来 OpenAI  AI研究 人才竞争 模型发布 第3张

量子位对完整访谈进行翻译整理,在不改变原意下,对语言做了适当润色。

完整访谈整理

人才争夺战演变成给人才送汤战

问:关于人才争夺战,Meta行为激进,这种竞争目前到哪个阶段?

Mark Chen:其实人才有限,大家都知道是谁。许多公司意识到,建优秀AI实验室关键在招最优秀人才。所以Meta积极采用这策略,不奇怪。

我们没坐以待毙,我想从OpenAI角度讲这故事。媒体渲染人才单向流向Meta。

但我看到情况,Meta挖了很多人,但多数不成功。他们挖我一半直接下属,但全都拒绝。当然,如果你一年有100亿美元预算挖人,肯定会挖到一些人。

所以我觉我们在保护核心人才上做得不错。看着这事件升级,挺有趣。

比如扎克伯格真的亲自给他想挖的人送汤,我觉他是亲手煮汤。当时我很震惊,但后来意识到这些方式以奇怪方式有效。所以我后来也给我们想从Meta挖的人送汤

OpenAI首席研究官Mark Chen深度访谈:揭秘AI研究内幕、竞争与未来 OpenAI  AI研究 人才竞争 模型发布 第4张

问:你们现在比谁送汤?

Mark Chen:我还想下次团队团建带大家上烹饪课。但我确实学到招聘事情。

问:你自己煮汤了吗?

Mark Chen:呃,其实最好买米其林级别汤,你懂吧?

但我确实在这事上学到不少,比如怎样更积极争取顶尖人才。让我很受启发一点,在OpenAI,即使最后去Meta人,我也没听谁说“AGI会先由Meta做出来”。大家都对OpenAI研究路线非常有信心。而我明确告诉团队,我们不会跟Meta追逐报价对标。在Meta报价倍数远高于我们情况下,人们仍愿留OpenAI,这让我非常有信心。他们真相信这里未来,相信我们能做成。

问:你和Alex呢?他以前擅长数学竞赛,你们肯定一起玩过。

Mark Chen:我们以前确实一起玩几次,但现在不怎么联系。

问:为什么汤会变主流?

Mark Chen:我也不知道。汤、花,或你能想任何东西都出现过。但我觉得人生就冒险嘛,我也乐得顺势玩这梗。

OpenAI首席研究官Mark Chen深度访谈:揭秘AI研究内幕、竞争与未来 OpenAI  AI研究 人才竞争 模型发布 第5张

图片由AI生成

问:那你在想策略时,会用到什么扑克心法吗?

Mark Chen:我觉得这又回媒体叙事问题。目标不是留住组织里“每一个人”,而是相信我们人才培养体系,并弄清我们必须留哪类关键人物,然后确保他们留。在这点上,我们做得非常出色。

问:Sam一直非常喜欢研究,他是老板最顶层那个人。而你和Jakub Pachocki一起塑造OpenAI研究方向,还能决定哪些项目获多少算力。所以你等于既要规划OpenAI前进方向,也要负责执行层面,比如到底怎么把那些算力投项目中。

而这在我看来完全“噩梦级别”工作,因为我脑补大家为从你那里弄GPU会用尽各种手段。

Mark Chen:人们在想办法搞GPU时会非常有创造力,各种后门交易点子都会出现。但你说得对,这确实是工作中关键部分:确定研究组织优先级,并为执行负责

关于第一点,其实Jakub和我有流程,大概每1–2月整体梳理OpenAI所有在进行项目,这是一张巨大表格,约300个项目。我们尽可能深入理解每一个项目,并给它们排优先级。

对一家500人规模公司来说,让大家理解组织核心优先事项非常重要。这些优先级不仅通过口头明确传达,也通过我们如何分配算力传达。

问:你提到500名研究人员,也就是这现在拥有数千名员工组织最核心研究团队,对吧?

Mark Chen:对。

问:你说有300个项目,我想象其中肯定有一些是巨大前沿模型,也有一些是研究人员在做小型实验。那你们到底如何跟踪所有这些项目,并得出哪些项目应该分GPU、哪些不应该?

Mark Chen:在做这类优先级梳理时,保持核心路线很重要。我认为OpenAI与其他大型实验室最大不同之一,就是OpenAI从一开始就把探索性研究作核心。

我们不是那种复现别的实验室成果、去追赶别人benchmark公司,那不是我们核心能力。我们一直在尝试找出下一种范式是什么,并愿投入资源确保我们真能找到它。

可能很多人会对此惊讶。事实上,我们在“探索下一代范式”上投入算力,比训练最终产物本身还要多

问:但问题是,你们如何避免被个人推销说服?因为每个人都会觉自己项目非常重要。当我想到这,我就会想起《纽约时报》每天都有头版头条,每个人都想上头版,每个人都觉自己故事最重要,每个人都竭尽全力告诉你为什么这事重要。他们都花数周甚至数月做出那个成果,所以对他们来说这就生死攸关。

Mark Chen:你必须做最艰难决定之一就是:这项目,我们现在就是没法给它资源。

但我也认为,这是好领导力。你必须清晰沟通,这些是我们真正优先事项,这些是我们要推进内容,这些是我们认为能推动研究方向重要结果。其他事可以做,但它们必须明确是第二优先级。

回应谷歌Gemini 3

问:你提到不要被竞争对手牵着走。你认为其他公司有时候很被动,而你们过去处在领先位置,制定行业标准,所以他们才需要对你们成果做出反应。

刚好前几天Gemini 3发布,在这种竞争回合中,你们对手有时显然根据你们行动。我知道benchmark价值常被争论,但大家确实会比这些。那你们如何在这种环境下,保持那种“我们只做我们认为正确事”心态呢?

Mark Chen:我认为如今AI研究环境比以往任何时候都更竞争激烈。但关键是不要被竞争动态困住。因为你永远可以说:“我们发布一个小更新,就能领先竞争对手几周或几个月。”

但那不是一种长期可持续研究方式。如果你能突破下一代范式,那重要性完全不在一个数量级,你将决定整个领域演化,你会理解围绕这一思想领域所有旁支方向。

以我们在“思考(Reasoning)”方向研究为例,在两年多前,我们就押注我们会在语言模型思考能力上取得突破。当时这押注非常不受欢迎。

现在看起来显而易见,但那时氛围是:预训练非常有效,后训练也非常有效,为什么还要投资源做其他东西?

而今天你问任何人,他们都会说语言模型思考能力是不可或缺。所以,我们承担是大胆押注,去探索如何扩展,如何构建能在未来成百上千倍算力下仍能工作算法。

问:随着公司发展,这显然变更难。你们一开始是一个几乎纯研究组织,但今天OpenAI有产品线,有些部门看起来更像成熟微软或谷歌。通常来说,随时间推移,公司会逐渐变更关注能带来营收部分,而非花大量钱做研究,研究经费往往会不断被挤压。

Mark Chen:我认为这正是OpenAI最特别地方之一。我们本质上仍是一家纯AI研究公司。你很难再找到另一家真能这么说公司。我们最初成立时是非营利组织,我加入时也是那个时代。

当时精神是,为推进AGI研究,可以不惜一切代价,当然要以安全方式推进。

而我确实认为,这反而是创造价值最佳方式。如果你赢研究,价值创造是顺带发生。我觉得真正陷阱是迷失在那些“让我们提升利润率吧”目标里。因为你研究做到最好,其实那部分价值非常容易实现。

问:你是2018年加入。那么你觉得,那种“灵魂”、那种核心文化与核心使命……

Mark Chen:是,那个核心文化和核心,确实持续存在。

问:埃隆怎么说?他说我们不应该叫你们研究员?这只是工程师,对吧?

Mark Chen:我觉得这话有它道理,因为一旦你设置一个“层级”,比如把研究科学置于工程之外部分,那你在某种意义上就已经输。

因为在构建大型模型时,真正重要是,你能否在实践中不断优化那些1%细节,如何让kernel快一点?如何确保数值计算足够稳定?这些都是深度工程能力。

如果你没有这些东西,就根本无法把训练规模扩大到我们今天使用GPU数量。

问:但我想说是,研究员和工程师之间确实有种神秘感上差别。你觉得保持一种“平视心态”比较好,是这个意思吗?

Mark Chen:我觉得研究员类型其实非常多样。我们最优秀一些研究员,他们特点是,能提出无数种想法。其中大部分不行,但就在你开始怀疑“这个人真值得吗”时候,他们突然又冒出一个惊为天点子。

还有一些研究员非常擅长沿明确路径执行,把事情做到极致。所以研究员类型太多,根本很难把他们塞进一个刻板类别里。

问:Gemini 3刚发布不久,我很好奇,当一个竞争对手发布新模型时,你个人,或者你们团队,会怎样反应?是大家都会去看它能做什么吗?你们会不会有一些常用prompt、常用问题,去试探这些新模型有什么能力?

Mark Chen:关于Gemini 3,具体来说,它是个不错模型。我们会做一件事是建立内部共识。

因为benchmark其实只能告诉你有限信息。就benchmark数据本身来看,我们其实相当有信心:我们内部已有性能达Gemini 3模型,而且我们相当确定很快就会发布这些模型,并且能发布表现更好下一代模型

但再次强调,benchmark只揭示一部分内容。每个人都会用自己方式去“试探”新模型。我有一个自己常用题,到目前为止,没有哪个模型真正解决过,甚至是所谓“thinking models”也没完全做出来。所以我还在等。

问:这是个秘密数学问题吗?

Mark Chen:不是,不过……如果我在这里公开讲,它可能以后就被训练进去(笑)。

这是过去一年我很喜欢一个谜题,叫作“42问题”:核心是借助若干个模数为小于42素数随机数生成器,用最少调用次数搭建出模数为42随机数生成器。

这题很可爱。语言模型总是能接近最优解,但我还没见过哪个真把它完全做出来。

问:这实际上引出我接下来本来就想问问题。但在此之前,我知道你很有竞争心,你也跟我说过一句我记得很清楚话“我热爱竞争,但我极度讨厌输”,所以如果我们知道Gemini 3会在周四发布,你会不会在凌晨12点就把那道题丢给它?还是没有那么夸张?

OpenAI首席研究官Mark Chen深度访谈:揭秘AI研究内幕、竞争与未来 OpenAI  AI研究 人才竞争 模型发布 第6张

Mark Chen:不会啦,我认为这是一个长周期事情。

我是那种会有阶段性执念人,但任何事业你都得用长期博弈心态去做。例如过去半年,我们一直专注在预训练上。这是我和Jakub一起推动方向,打造预训练核心能力、组建顶尖团队、确保预训练所有关键都得到足够重视。而正是这些投入,让我们今天能产出这样模型,在预训练方面,我们就有信心轻松与Gemini 3正面对决

大学室友带入坑编程

问:我对你刚才说那个谜题感兴趣,是因为我第一次见Jakub是在OpenAI创立之前,那时他在参加编程竞赛。我也有一段时间超迷编程比赛。我去看过一次,当时Facebook每年都会搞一个Hacker Cup,那是我第一次见到Jakub。

我知道你高中也参加数学竞赛,甚至是从小学一路参加到高中,你是不是也参加IOI?

Mark Chen:我很晚才开始写代码,是大学室友带我入坑。

当时我还是一个满怀自负数学人,觉得数学才是最纯粹、最困难科学,真正能力需要在数学中证明。回头看,那时候我可能太沉浸在竞争里。

但编程后来变成一件非常令人有成就感事情。开始它只是一个让我能继续和大学朋友保持联系方式,毕业之后,我们每个周末都会一起上线做比赛。

渐渐地,我发现自己挺有天赋。后来我开始在比赛中拿不错成绩,然后开始给比赛出题,比如给USA Coding Olympiad出题。最终我也开始担任教练,这是一个很棒社区,我也在里面遇到很多像Scott这样人。

问:你当时是在MIT?

Mark Chen:不是,我是毕业之后参加。

最近比赛还有一个让我特别有感地方,当我们把现代语言模型投入这些比赛题目时,它们表现非常强。而且它们思维方式跟人类完全不同。

我们一直以为AI擅长模式识别,如果新题能映射到旧题,它就能解。但我注意到,有些题目非常临时、技巧性、零散,这让我意识到AI+人类在前沿研究中会出现奇迹,因为AI对“什么是简单/困难”直觉与人类不一样。我以为模型绝对做不出来,结果它们觉这些题反而比较简单。

问:是类似AlphaGo那种“人类从没见过打法”感觉吗?

Mark Chen:我觉得是。

GPT-5 Pro出来之后,我真感觉到前沿科研出现一个拐点。

一个最好例子是,发布后三天,我见一个物理学家朋友,他之前玩过模型,觉得它们可爱但没啥用,我让他用Pro模型更大胆地试,他把自己最新论文丢进去,模型想30分钟,然后就把答案给出来。他反应让我想到,李世石看到AlphaGo第37/38手时表情。我觉得这种场面在数学、科学、生物、材料科学中只会越来越常见,模型真已经到这程度。

问:我知道这问题不新鲜——从深蓝、到AlphaGo,人们一直在问,当AI开始解决那些被人类视为“巅峰智力成就”问题时,会不会让人感到某种悲伤?

Mark Chen:嗯,有,也没有。我编程水平不错,但不属最顶尖那一批,所以对我来说……或许这算“复仇”

OpenAI首席研究官Mark Chen深度访谈:揭秘AI研究内幕、竞争与未来 OpenAI  AI研究 人才竞争 模型发布 第7张

但认真说,我确实经历过一种“时刻”。在我们开发思考模型期间,我们持续监控模型在竞赛题表现。

一开始,它们表现并不好,大概就普通参赛者水平。但随时间推移,它们能力不断提升,直到有一天,我走进会议室,看到模型评分曲线越过我自最高水平。那一刻我真震惊,“哇,我们到这种程度,这么快?”Jakub当时还稍稍得意,但也就过一两个月,模型也超过他

今天,模型已经稳稳站在前沿。你能从我们今年夏天在Coder比赛上成绩看出来那是世界顶级算法竞赛,模型拿第二名。它在一年内从世界第100名,跳到世界前5。

问:那十年后,我们还会办这种竞赛吗?

Mark Chen:我觉得会。它们很好玩。尽管有些人做这些比赛是为写简历,但真正热爱它人,是因为它本身有趣,这种乐趣不会消失。

问:在我写报道时,有人告诉我,一些国家,IOI拿牌基本等于“随便挑大学,免费入学”。

Mark Chen:你不觉得面试这些传统方式,很快也会被模型彻底打破吗?大学考试、作业,也基本全被打破。我们确实需要新方式来评估一个人,他学到什么?他实际能力在哪?

我其实一直有个想法,也许我们以后面试,可以直接让候选人去跟ChatGPT对话。不过是一个“特殊版本”ChatGPT,这模型任务不是回答问题,而是判断你是不是真懂相关内容、你能力水平有没有达到在OpenAI工作标准。你要通过和它对话,说服它你是一个适合OpenAI人。当然,你不能“越狱”它,然后我们再去看这段对话记录。也许未来这种测试方式,会更准确地反映一个人到底懂不懂。

联手Jony Ive,搞硬件设备开发

问:你会参与像Jony Ive设备开发这种事情吗?研究团队也参与?

Mark Chen:是。而且我昨天和Jony以及几位研究人员一起吃饭,包括我们负责预训练和后训练负责人。

我一直在想一件事,未来ChatGPT应该是什么样子?现在ChatGPT,和它交互方式,说实话很笨,完全不是原生思考那种体验。

你给它一个提示词,它给你一个回答,之后它基本上不做任何对你有生产力事情,直到你再给下一个提示。而且如果你再问类似问题,它还会花一样久思考时间。它不会因为你之前问过问题而变更聪明。

我认为未来应该是这样:它有更强记忆,每次你来,它能学到关于你一些深层东西,它会思考你为什么问这问题,它会联想到相关问题,然后下一次你来,它会变更聪明。

那么问题来,要怎样设计一个设备,让这种思考方式成为核心?和Jony合作这段时间,我觉得非常有价值。

问:你现在有一个设备吗?

Mark Chen:我可能有,也可能没有。

问:我一想到你们在和Jony合作,我就想到,苹果是一个以硬件为中心公司,乔布斯对硬件着迷,把它当成一种艺术。但你们,Sam、Greg、Jakub,据我所知没有人真做过硬件产品。

Sam很重视设计,从他房子和办公室能看出来,但做设计这种天赋……我一直觉得乔布斯那叫品味,这是天生。那你们怎么确定自己有“品味”来塑造一个新硬件产品?

Mark Chen:老实说,我们不需要自己有品味,那是Jony工作,他是我们在“品味”上鉴别者。

而最有趣是,我们最近意识到,设计团队工作方式我们做研究工作方式,其实有非常深相似性,都是大量探索、大量提出假设、大量试错、花很多时间沉淀,最终打造一个你满意作品。

让设计团队加入公司之后,我们和他们沟通更直接:“这是我们即将交付能力”“这是设备形态”“我们怎么把这两个整合起来?”

问:我花一辈子和这些人打交道,但我常常会想,真要一群数学宅男来做AI设备吗?不过你刚才讲确实在谈一种“混合型合作”。

Mark Chen:是,你说得对。擅长构建AI能力人,和有硬件/产品品味人,通常是完全不同两类。但我们内部其实也有一些团队,他们对模型行为品味特别好。

这种品味完全不同,他们会问非常奇怪、但很关键问题,比如“ChatGPT最喜欢数字应该是什么?”

OpenAI首席研究官Mark Chen深度访谈:揭秘AI研究内幕、竞争与未来 OpenAI  AI研究 人才竞争 模型发布 第8张

问:最后几几几个问题,ChatGPT提醒我问你,如果5年后回头看现在,有哪些非常脆弱、非常微妙小想法,你觉得未来可能变突破核心?

Mark Chen:有几个,我手里大概有一小撮这样想法。不能讲太细,但我真非常期待把它们规模化。

问:能不能给点提示?比如方向类别?

Mark Chen:主要还是集中在预训练相关东西,也有少量是RL相关,也有少量是关于“如何把所有东西整合起来”方向。

问:你觉得外界有哪些关于OpenAI误解?

Mark Chen:我认为最重要一点是,OpenAI本质上是一家研究为中心公司,我们是一家纯粹押注AI公司,公司核心目标就是构建AGI,并尽可能减少干扰,产品是顺研究自然流出来。

至于研究,我们最核心目标是:自动化AI研究、自动化科学发现、自动化经济生产力工作。而过去一年最大更新其实是第二个部分,它正在发生。

问:你现在多大?你还有办法维持社交生活吗?

Mark Chen:34,快35。老实说,没有。过去两周每天都是工作到凌晨1–2点。但我很喜欢这样,有很多事要做、很多人要招、很多方向要推动。如果我们正处在下一次工业革命里,那为什么不把握这黄金时刻?

问:听说你甚至睡在办公室?你睡一个月在办公室?

Mark Chen:是啊,那段时间挺好玩。

那是Barret离职、去创立自己公司之后。那段时间工作需求就是这样。我仔细想过我当时那种强烈情绪,其实是一种强烈保护研究本能。

问:你们经历“宫斗”、大规模挖角、Meta启动巨大研究团队……现在战火算过去吗?

Mark Chen:我每次和团队开会都会说:“等我处理完这事,我会抬起头看看有没有新火要救。”

但现在我已完全接受,构建AGI赌注够大,所以永远会有新火。关键是,在混乱中,你要能判断什么才是真正重要事。

原视频链接

https://www.youtube.com/watch?v=ZeyHBM2Y5_4&t=19s