当前位置:首页 > 科技资讯 > 正文

K2 Think:全球最快开源AI模型,每秒2000 tokens的数学推理突破

全球速度领先的开源大模型正式登场——其推理速度突破每秒2000个tokens!

虽然参数规模仅为320亿(32B),但吞吐量表现惊人,相比典型GPU部署提升超过10倍。

这款模型由阿联酋的穆罕默德·本·扎耶德人工智能大学(MBZUAI)与初创企业G42 AI联合研发,命名为K2 Think

名称听起来是否耳熟?

没错,它与月之暗面此前推出的Kimi K2在命名上略有重合,但阿联酋版本多了“Think”后缀。

有趣的是,K2 Think背后蕴含着浓厚的“中国制造”元素。

从HuggingFace的模型树可见,K2 Think是基于Qwen 2.5-32B架构深度优化而来:

K2 Think:全球最快开源AI模型,每秒2000 tokens的数学推理突破 Think 开源大模型 高速推理 数学推理 第1张

除了“全球最快开源AI模型”的称号,MBZUAI官方还宣称K2 Think是“有史以来最先进的开源AI推理系统”

那么,它的实际能力究竟如何?接下来我们深入探究。

实测速度全面超越2000 tokens/秒

目前,K2 Think已提供在线体验地址(文末附链接)。

我们首先尝试一道国际数学奥林匹克(IMO)试题:

Let a_n = 6^n + 8^n. Determine the remainder when dividing a_{83} by 49.

K2 Think:全球最快开源AI模型,每秒2000 tokens的数学推理突破 Think 开源大模型 高速推理 数学推理 第2张

直观可见,在无额外加速条件下,K2 Think经过思考后输出答案的速度极快,近乎“瞬间完成”。

底部数据显示,速度达到2730.4 tokens/秒

K2 Think:全球最快开源AI模型,每秒2000 tokens的数学推理突破 Think 开源大模型 高速推理 数学推理 第3张

接下来,用中文测试一个经典问题:

Strawberry这个单词里面有几个字母R?

K2 Think:全球最快开源AI模型,每秒2000 tokens的数学推理突破 Think 开源大模型 高速推理 数学推理 第4张

速度仍保持在2224.7 tokens/秒,并准确给出答案:包含3个R。

K2 Think:全球最快开源AI模型,每秒2000 tokens的数学推理突破 Think 开源大模型 高速推理 数学推理 第5张

我们再实测几道AIME 2025数学题目:

Find the sum of all integer bases $b>9$ for which $17_{b}$ is a divisor of $97_{b}$.

K2 Think:全球最快开源AI模型,每秒2000 tokens的数学推理突破 Think 开源大模型 高速推理 数学推理 第6张

Find the number of ordered pairs $(x,y)$, where both $x$ and $y$ are integers between $-100$ and $100$, inclusive, such that $12x^{2}-xy-6y^{2}=0$.

K2 Think:全球最快开源AI模型,每秒2000 tokens的数学推理突破 Think 开源大模型 高速推理 数学推理 第7张

可见,K2 Think的突出特点是所有问题均能维持超过2000 tokens/秒的高速响应,且实测中答案均正确。

功能方面,目前K2 Think暂不支持文档上传、多模态等能力。

对此,MBZUAI高级研究员Taylor W. Killian在X平台解释:

该模型主要专注于数学推理任务开发。

K2 Think:全球最快开源AI模型,每秒2000 tokens的数学推理突破 Think 开源大模型 高速推理 数学推理 第8张

技术报告详细公开

从参数规模看,K2 Think仅32B,但官方声称其性能可与OpenAI和DeepSeek的旗舰推理模型媲美。

K2 Think:全球最快开源AI模型,每秒2000 tokens的数学推理突破 Think 开源大模型 高速推理 数学推理 第9张

测试结果显示,K2 Think在多项数学基准中取得优异成绩,如AIME’24得分90.83、AIME’25得分81.24、HMMT25得分73.75,以及在Omni-MATH-HARD上获得60.73分。

K2 Think:全球最快开源AI模型,每秒2000 tokens的数学推理突破 Think 开源大模型 高速推理 数学推理 第10张

K2 Think团队已发布技术报告

K2 Think:全球最快开源AI模型,每秒2000 tokens的数学推理突破 Think 开源大模型 高速推理 数学推理 第11张

总体而言,K2 Think团队在六大技术层面实现创新:

K2 Think:全球最快开源AI模型,每秒2000 tokens的数学推理突破 Think 开源大模型 高速推理 数学推理 第12张

长链路思维的监督微调(SFT):通过精心设计的链式推理数据,训练模型进行逐步思考,而非直接输出答案,提升复杂问题处理的条理性。

可验证奖励的强化学习(RLVR):模型以答案正确性为直接奖励信号,而非依赖人类偏好评分,显著增强数学、逻辑等领域的表现。

推理前的智能规划(Plan-Before-You-Think):先由规划代理提炼问题核心并制定解题大纲,再交由模型展开详细推理,模拟人类先提纲后解题的思维过程。

推理时扩展(Best-of-N采样):针对同一问题生成多个答案版本,从中筛选最优结果,以提高准确率。

推测解码(Speculative Decoding):在推理过程中并行生成并验证答案,减少冗余计算,加速输出效率。

硬件加速(Cerebras WSE晶圆级引擎):依托全球最大的单芯片计算平台,实现单请求每秒超2000 tokens的生成速度,确保长链路推理的流畅交互体验。

此外,研究团队对K2 Think进行了全面安全测试,涵盖有害请求拒绝、多轮对话鲁棒性、信息泄露防护和越狱攻击防范等方面,整体安全水平较高。

K2 Think:全球最快开源AI模型,每秒2000 tokens的数学推理突破 Think 开源大模型 高速推理 数学推理 第13张

体验地址:https://www.k2think.ai/

技术报告:https://k2think-about.pages.dev/assets/tech-report/K2-Think_Tech-Report.pdf

参考链接:

[1]https://www.k2think.ai/k2think

[2]https://x.com/mbzuai/status/1965386234559086943

[3]https://huggingface.co/LLM360/K2-Think

[4]https://venturebeat.com/ai/k2-think-arrives-from-uae-as-worlds-fastest-open-source-ai-model

[5]https://www.youtube.com/watch?v=8C6_B1QeyBo