当前位置：首页 > 科技资讯 > 正文

AI界的《创造101》：LMArena众包投票掀起AI新风潮

主机测评网
科技资讯
2026-06-08
611

AI界的《创造101》掀起热潮！LMArena引领盲投风暴，三年从校园项目跃升，刚融1.5亿美元，估值飙升至17亿美元。众包投票挑战权威，争议不断，却已成行业标杆。你的每一票，决定AI未来之星！

一场AI界的《创造101》正火热进行中！

ChatGPT、Claude、Gemini、Grok等AI「练习生」整装待发，紧张筹备着他们的「公演」。

这不是一场普通的选秀，而是真实发生在lmarena.ai上的AI大乱斗。

这个曾风靡校园的开源项目，最近刚完成1.5亿美元的融资，估值高达17亿美元。

顶级AI实验室如OpenAI、Google、xAI、Microsoft等，纷纷将自家模型送来「试镜」。

如今，AI的强弱不再由大公司说了算，而是掌握在全球网民手中。

这场「AI创造营」究竟如何运作？谁会成为下一个顶流？让我们一同揭开它的神秘面纱。

LMArena的「选秀之旅」，从校园项目到硅谷舞台

故事要从2023年开始讲起。当时，加州大学伯克利分校Sky Computing Lab里，一群研究生和教授搞了个开源小项目，叫Chatbot Arena。

创始人包括伯克利计算机科学教授Ion Stoica（Databricks联合创始人）、研究生Anastasios Angelopoulos（现CEO）和Wei-Lin Chiang（现CTO）。

AI界的《创造101》：LMArena众包投票掀起AI新风潮 LMArena 众包投票 AI评估民主投票第1张

他们最初的目的是做个简单实验：让网友匿名比拼不同AI聊天机器人，看哪个回答更好。

没想到，这个项目一上线就火了，迅速成为AI圈最受欢迎的众包基准平台。

短短三年时间，Chatbot Arena就积累了海量用户。2025年5月，它正式转为营利性公司，更名为LMArena，并完成1亿美元种子轮融资，估值6亿美元。

转折点发生在2026年1月6日——就在昨天！

LMArena宣布完成1.5亿美元新一轮融资，由Felicis和加州大学投资臂联合领投，Andreessen Horowitz、The House Fund、LDVP、Kleiner Perkins、Lightspeed Venture Partners等明星机构跟投。

公司估值直接飙升到17亿美元，总融资额超过2.5亿美元！

如今，LMArena已经拥有超过500万月活跃用户，覆盖150个国家，每月产生超过6000万次对话。

这些用户如同投票的「全民制作人」。连最顶级AI实验室，都把自家最新模型悄悄送来PK。

AI界的《创造101》：LMArena众包投票掀起AI新风潮 LMArena 众包投票 AI评估民主投票第2张

从学术小实验到硅谷新贵，LMArena用三年时间完成了许多选秀冠军都羡慕的逆袭。

但真正让它火起来的秘密武器，正是那个简单却上瘾的「盲盒PK」投票机制。

盲盒PK与网民投票，「全民制作人」的权利游戏

选秀节目的高潮在于舞台公演和现场投票。LMArena的「公演舞台」也一样刺激：它叫Arena模式，核心就是一个字——盲！

打开lmarena.ai，进入战斗模式，随便输入一个问题，系统开始随机匹配两个匿名AI模型，同时给出答案。

你无法知道答案来自何方，只能凭感觉投票。投完票后，网站才会揭晓：哦，原来左边是Gemini-3-Pro，右边是Grok-4.1！

这种形式很像拆盲盒——公平又上瘾。

总得票数也算入评分体系。LMArena用Elo评分系统实时计算，每赢一次加分，输了扣分。

AI界的《创造101》：LMArena众包投票掀起AI新风潮 LMArena 众包投票 AI评估民主投票第3张

7天前的总分榜单显示，Gemini-3-pro稳居榜首

总得分汇总之后，还会公开不同类别的榜单：文本对话、网页开发、视觉理解文本生成图像、图像编辑、搜索、甚至文本/图像生成视频。

在热门类别里，Gemini-3-Pro在文本和视觉领域遥遥领先，Grok-4.1-thinking紧随其后。图像编辑领域则是由GPT-Image-1.5和Gemini的变种轮流占据榜首。

顶级模型为何下场参与这场「选秀比赛」？CEO Anastasios Angelopoulos揭示了真相：

领先的AI公司选择我们，是因为他们自己都很难判断模型到底好不好。

还没公开发布的新模型都会偷偷托管到LMArena先测试一下，根据网友反馈快速更新迭代。

网友也不只是实验的小白鼠。他们甚至感到十分爽快——不用懂技术就能当「全民制作人」，把喜欢的AI投上C位。

「黑幕」质疑与「付费导师」的对决

选秀节目再火也逃不过「黑幕」质疑和粉丝撕X。LMArena同样无法避免——它一出道就卷入各种争议中。有人高呼「太民主了」，也有人大骂「太乱了」。

吐槽最多的就是众包投票容易被操纵。

2025年的一篇论文直接曝出黑幕：Meta在Llama 4发布前偷偷提交了36个私有变体模型进行反复测试，「刷分」成功并影响了排行榜。

AI界的《创造101》：LMArena众包投票掀起AI新风潮 LMArena 众包投票 AI评估民主投票第4张

研究者来自Cohere、Stanford、MIT等机构直指顶级实验室能通过多次私测优化让中小玩家根本玩不起。

类似指控还包括：某些大公司被怀疑刷票或优先托管新模型让排行榜看起来「偏心」。

还有人认为网民投票不够专业。随便一个网友的票怎么能跟专家比？

AI界的《创造101》：LMArena众包投票掀起AI新风潮 LMArena 众包投票 AI评估民主投票第5张

免费服务器服务器教程性价比服务器

本文由主机测评网于2026-06-08发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://vpshk.cn/20260647645.html

AI界的《创造101》：LMArena众包投票掀起AI新风潮

LMArena的「选秀之旅」，从校园项目到硅谷舞台

盲盒PK与网民投票，「全民制作人」的权利游戏

「黑幕」质疑与「付费导师」的对决

国产AI芯片巨头：昆仑芯与摩尔线程的生态耐力赛

2025科技圈：幻梦破碎，AI新贵与旧王更迭

AI界的《创造101》：LMArena众包投票掀起AI新风潮

LMArena的「选秀之旅」，从校园项目到硅谷舞台

盲盒PK与网民投票，「全民制作人」的权利游戏

「黑幕」质疑与「付费导师」的对决

国产AI芯片巨头：昆仑芯与摩尔线程的生态耐力赛

2025科技圈：幻梦破碎，AI新贵与旧王更迭

相关文章