当前位置:首页 > 科技资讯 > 正文

LMArena A轮融1.5亿美元,AI大模型评估赛道领跑

AI大模型竞技场LMArena正式宣布完成1.5亿美元的A轮融资,这标志着公司在AI评估领域的实力再度升级。

本轮融资后,LMArena的估值达到了17亿美元,为新的一年开了个好头。这不仅是资本的认可,更是对AI大模型评估赛道前景的肯定。

LMArena A轮融1.5亿美元,AI大模型评估赛道领跑 A轮融资 AI大模型 评估赛道 第1张

此次融资由Felicis和加州大学投资公司UC Investments联合领投,Andreessen Horowitz、The House Fund等多家知名机构跟投。资本的注入无疑为LMArena的发展注入了强劲动力。

LMArena的团队是一支以90后华人为主的精英队伍,占比高达99%。这支队伍的崛起与ChatGPT的横空出世息息相关。自那时起,他们便致力于通过技术创新推动AI大模型的评估与发展。

从学术探索到商业崛起

LMArena的前身是曾经火爆AI圈的Chatbot Arena,由LMSYS这个自发的开源组织创建。其成员皆为来自UC伯克利、斯坦福等顶尖高校的学霸。

他们开发的SGLang推理引擎,在业内首次实现了在96块H100上运行,其吞吐量几乎媲美DeepSeek官方报告。目前,SGLang已被多家企业和机构采用。

然而,比起硬核技术,他们更为人所知的工作是对大模型进行评估。在ChatGPT、Claude等模型初现时,他们便创办了Chatbot Arena这一第三方众包基准测评平台。

LMArena A轮融1.5亿美元,AI大模型评估赛道领跑 A轮融资 AI大模型 评估赛道 第2张

他们希望通过用户的实际交互来评估模型性能,从而推动AI模型的进步与发展。

动态竞技场

LMArena作为lmarena.ai的主要项目,是全球大模型的动态竞技场。

LMArena A轮融1.5亿美元,AI大模型评估赛道领跑 A轮融资 AI大模型 评估赛道 第3张

其核心评估规则包括匿名对战、Elo式评分和人机协同框架。用户只需输入问题,系统便会随机匹配两个模型进行匿名回答。

投票结束后,系统才会揭晓模型的真实身份。同时,平台还设计了基于Bradley–Terry模型的Elo评分机制,确保评估过程的公平与客观。

目前,Gemini 3 Pro以1490分位居榜首。自去年获得1亿美元种子轮融资后,LMArena的发展速度超乎预期。

不仅完成了对5000万张跨模态投票的累计,还完成了对400余种开放及专有模型的评估。此外,还产出了覆盖多个类别的14.5万个开源战斗数据点。

未来,LMArena计划将新筹集的资金用于平台运营和技术团队扩大,以进一步提升用户体验和平台实力。