当前位置:首页 > 科技资讯 > 正文

AI数学家Axiom Math:24岁创始人Carina Hong与她的可信AI革命

AI数学家Axiom Math:24岁创始人Carina Hong与她的可信AI革命 AI数学家  形式化验证 Lean语言 可信AI 第1张

由24岁华裔创业者Carina Hong领衔的初创企业Axiom Math,正致力于打造能够自主验证逻辑严谨性的“AI数学家”。该公司于2025年成功募集6400万美元资金,其核心团队汇集了来自Meta和Google的人工智能专家以及著名数学家。与传统大型语言模型不同,Axiom的系统采用Lean编程语言,确保每一步推理均可追溯和检查,从而破解了AI输出结果难以验收的信任难题。通过在Putnam数学竞赛中的出色表现,Axiom证明了AI能够从简单的答案生成跃升至严密的形式化证明。这种对可信度的执着追求,旨在将AI从不够稳定的辅助工具转变为能够在科研和工业领域真正落地、可被验收的可靠伙伴。

2025年,AI发布会几乎都在高喊“我们能做什么”。

然而,企业真正面临的瓶颈是另一个问题:AI给出的结果,如何证明其正确性?

众多AI产品上线前演示完美,一旦投入实际应用便问题频发:

错误无法定位,

责任难以追溯,

结果无法复现。

最后只能得出一个结论:无法验收。

Axiom Math,一家总部位于旧金山的AI初创公司,另辟蹊径:不追求AI能做什么,而是证明它做对了什么。

这家刚在2025年10月完成种子轮融资(6400万美元,估值3亿美元,B Capital领投)的公司,正在打造一位AI数学家,既能独立给出答案,也能自行验证对错

正因如此,这个团队吸引了一批技术底蕴深厚的人才:来自Meta FAIR、Google Brain的前核心研究员,以及创始人Carina Hong在MIT的导师、著名数学家Ken Ono。

Carina Hong,24岁。

2025年12月21日,有媒体问及她的招聘秘诀,她回答得简洁明了:

问题够难,人自然会聚过来。

这并非空谈。她的策略就是找到一个值得投入十年去攻克的难题,然后等待真正的高手主动上门。

24岁,6400万美元,估值3亿。

她押注的不是一个产品,而是AI的下一个及格线。

第一节|24岁,3亿估值,她要让AI学会自证

她叫Carina Hong,出生在广州。

童年解奥数题时,她未曾想到自己未来会站在硅谷讲述AI的故事。但她记得,每解开一道题,就像孩子通关游戏,欲罢不能。

她一路从广州考入MIT,再获罗德奖学金赴牛津攻读神经科学,最后进入斯坦福攻读数学博士+法学博士联合项目。

在MIT,她修读了20门研究生数学课程,发表了9篇论文,还研究了神经网络如何理解函数。在牛津,她待在UCL盖茨比研究所(DeepMind的诞生地),首次近距离观察AI解决真实问题:图像识别、序列建模、控制优化。

她开始自问:如果AI能玩游戏、能写代码,为何不能做数学?

真正的转折发生在硅谷。

她在斯坦福读博期间,常去一家咖啡馆写论文。一次偶然的机会,她结识了Meta FAIR团队的AI科学家Shubho Sengupta。

一个是数学家,渴望让AI理解数学。

一个是工程师,希望找到AI真正值得解决的问题。

他们畅谈两小时,没有谈论项目,也没有涉及融资,只围绕一个假设展开:能否造出一位AI数学家?

那次对话后,她开始认真思考这件事。不久,她退学了。

她说:有些问题,在学校里解决太慢了。

她要做的,不是聊天机器人,也不是代码助手,而是一个能验证定理、甚至提出新猜想的AI系统。

这个系统名为Axiom,意为“公理”,即数学理论最基础的起点。

从这个起点出发,开发一整套系统,让AI也能探索数学的边界。

第二节|Putnam考试9/12,但重点不是分数

大多数人理解AI学数学,想到的往往是考试、给答案。

但Carina说,那只是第一步。真正重要的,是它是否知道自己答得对不对。

这不仅关乎数学,也是工程挑战。AI的答案如果不能被验证,就无法用于关键场景。

人类做数学题,有个天然优势:我们可以回头检查,看证明是否有逻辑漏洞,推理有无跳步,细节是否一致。

Carina把这种检查过程称为“验收”。

但大模型做不到。

它们能生成大量内容,却很难自我确认这些内容是否正确。尤其在数学领域,哪怕多一个字母,整个结论就可能崩塌。

要解决这个问题,必须依靠形式化语言。

Carina的团队采用一种名为Lean的数学编程语言。所有公式、步骤、证明,必须像程序一样清晰书写,并且能够通过机器验证。

这意味着,不是AI说对就算对,而是它每走一步都要留下可检查的痕迹,最终像软件测试一样通过验证。

为了验证这套方法的可行性,他们进行了一次测试。

2025年12月,美国Putnam数学竞赛落下帷幕,这是全美难度最高的本科生数学竞赛,参赛者约4000人。Carina团队在X平台上发布结果:AxiomProver自主解出其中9道题,并用Lean语言给出了形式化证明,全部通过验证。

这不仅仅是做对9道题,而是AI自己解题、自己检查、自己确认通过。

Carina说:

“我们追求的不是一个能抄答案的AI,而是一个能完成所有数学细节的合作者。”

验收的真正含义是什么?

就是AI不仅要给出答案,还要证明答案是对的。

在芯片设计、科学研究、金融系统这些容错率极低的场景中,模糊的答案毫无价值。AI必须能呈现过程、解释思路、接受检验。

能被验收,才意味着能被信任。

第三节|Meta、Google的人为什么离职来这里

要实现这一目标,需要怎样的团队?

这个团队目前仅17人,但每一位都是各自领域的顶尖研究者。

CTO Shubho Sengupta,是Carina在斯坦福附近咖啡馆偶遇的。他曾在Meta FAIR带队开发OpenGo和CrypTen,也参与过早期CUDA GPU架构设计。他深知大模型的局限,也明白数学领域的特殊挑战。

但在大公司,目标过于分散。他渴望找到一个地方,专注解决一个极限难题。

另一位核心成员François Charton,早在2019年就开始研究如何用Transformer解决积分问题。他注重细节,不关心大模型能生成多少内容,而是关注它是否会在某一步出错。

还有Hugh Leather,专注于深度学习与编译器的结合。他并非传统数学家,但在用代码表达复杂逻辑方面积累了深厚经验。

他们都从Meta、Google等大厂走出,放弃了更稳定的研究路径。

Carina提供的不是职位,而是一种愿景:用AI做出可验证的数学成果,每一步清晰,每个结论都经得起推敲。

这个愿景吸引的不仅是业界的AI研究员。

2025年12月初,57岁的数学家Ken Ono辞去了弗吉尼亚大学的终身教职,全职加入Axiom。

他曾是Carina的导师,领导过多个数学奥林匹克研究项目,是拉马努金理论的专家,也曾登上超级碗广告,将数论带入大众视野。

他说,作为纯数学家,他很少有机会参与改变世界的事。这一次,他不想错过,带着家人搬到硅谷,成为Axiom的第15位成员,身份是创始数学家。

他的任务不是写代码,而是设计难题,测试模型推理的极限。

Carina说,这些人之所以愿意来,并非追逐热潮,而是想做一件真正值得投入的事。

“我们不是在做一个产品,而是在定义一套新标准:每个公式都可检查,每道推理过程都可追溯。AI不是生成一个答案,而是展示完整的思考过程。”

这就是他们17个人正在做的事。

第四节|不是解题,而是教AI提问

定义新标准,只是Carina的第一步。

她真正的目标是让AI学会发现问题本身。

他们最近在研究数学界一个著名的未解难题:Collatz猜想。这个问题看似简单如小学生游戏,却困扰了研究者数十年。

Axiom的研究员用Transformer模型学习这个问题,模型虽未能直接给出证明,但展现出了另一种能力:

在预测Collatz序列时,对万亿级数字的准确率达到了99.8%。

更重要的是,它为什么错、错在哪里,都能被清晰解释。这些错误背后存在明确的规律,而非随机的幻觉。

这意味着什么?

意味着AI不是在记忆答案,而是在学习数学思维。

在Carina看来,他们不是让AI寻找已知答案,而是训练它像一个真正的数学家那样去思考、去探索。

她所说的探索,主要分为三个阶段:

第一步,用形式语言表达定理,模仿已有的逻辑结构。

第二步,验证旧问题的不同解法,提出新的证明路径。

第三步,提出新猜想,创造从未出现过的问题并给出数学依据。

整个过程,不是ChatGPT式的随机对话,而是在证明空间里有规则地探索,不断尝试,直到发现新的路径。

这种探索为何重要?

因为数学是人类最严密的语言,也是现实世界运转的底层逻辑。每一个数学突破,都可能推动这些领域的飞跃。

Carina相信,数学研究曾以十年一进展的速度运行,现在AI可以把周期缩短到几个月。

而AI数学家未来能做的,不只是解题,更是与人一起重新定义问题本身。

这不限于数学领域。无论是密码学、芯片架构、物理建模,背后都依赖于能被精确描述与检验的数学原理。一旦AI做到可验证,它就能从“只能试试看”的辅助工具,变成“可以放心用”的合作者。

这,正是Carina在押注的那条线:

AI的下一个及格线,不是能力,而是可信度。

结语|能被验收的,才叫AI

Carina的想法很简单。

她只给出一个判断标准:AI说得对不对,不是看有没有人信,而是看它能不能自己交代清楚。

Axiom Math所做的,就是让AI必须讲明白。不是让模型更像人,而是让它能被信任。

真正能用的AI,不靠Demo,靠验收。

这个标准一旦确立,AI走进科研、金融、芯片、法律,才算真正开始。

而她,只是把这扇门推开了一点点。

原文链接:

https://www.youtube.com/watch?v=b_UMhn8E8lI&t=264s

https://e.vnexpress.net/news/tech/personalities/building-math-ai-startup-how-24-year-old-stanford-dropout-carina-hong-is-attracting-big-tech-talent-4993367.html

https://www.businessinsider.com/axiom-math-stanford-dropout-meta-ai-researchers-startup-2025-12

https://www.turingpost.com/p/carina

来源:官方媒体/网络新闻