当前位置：首页 > 科技资讯 > 正文

K2 Think：全球最快开源AI模型，每秒2000 tokens的数学推理突破

主机测评网
科技资讯
2025-12-30
583

全球速度领先的开源大模型正式登场——其推理速度突破每秒2000个tokens！

虽然参数规模仅为320亿（32B），但吞吐量表现惊人，相比典型GPU部署提升超过10倍。

这款模型由阿联酋的穆罕默德·本·扎耶德人工智能大学（MBZUAI）与初创企业G42 AI联合研发，命名为K2 Think。

名称听起来是否耳熟？

没错，它与月之暗面此前推出的Kimi K2在命名上略有重合，但阿联酋版本多了“Think”后缀。

有趣的是，K2 Think背后蕴含着浓厚的“中国制造”元素。

从HuggingFace的模型树可见，K2 Think是基于Qwen 2.5-32B架构深度优化而来：

K2 Think：全球最快开源AI模型，每秒2000 tokens的数学推理突破 Think 开源大模型高速推理数学推理第1张

除了“全球最快开源AI模型”的称号，MBZUAI官方还宣称K2 Think是“有史以来最先进的开源AI推理系统”。

那么，它的实际能力究竟如何？接下来我们深入探究。

实测速度全面超越2000 tokens/秒

目前，K2 Think已提供在线体验地址（文末附链接）。

我们首先尝试一道国际数学奥林匹克（IMO）试题：

Let a_n = 6^n + 8^n. Determine the remainder when dividing a_{83} by 49.

K2 Think：全球最快开源AI模型，每秒2000 tokens的数学推理突破 Think 开源大模型高速推理数学推理第2张

直观可见，在无额外加速条件下，K2 Think经过思考后输出答案的速度极快，近乎“瞬间完成”。

底部数据显示，速度达到2730.4 tokens/秒。

K2 Think：全球最快开源AI模型，每秒2000 tokens的数学推理突破 Think 开源大模型高速推理数学推理第3张

接下来，用中文测试一个经典问题：

Strawberry这个单词里面有几个字母R？

K2 Think：全球最快开源AI模型，每秒2000 tokens的数学推理突破 Think 开源大模型高速推理数学推理第4张

速度仍保持在2224.7 tokens/秒，并准确给出答案：包含3个R。

K2 Think：全球最快开源AI模型，每秒2000 tokens的数学推理突破 Think 开源大模型高速推理数学推理第5张

我们再实测几道AIME 2025数学题目：

Find the sum of all integer bases $b>9$ for which $17_{b}$ is a divisor of $97_{b}$.

K2 Think：全球最快开源AI模型，每秒2000 tokens的数学推理突破 Think 开源大模型高速推理数学推理第6张

Find the number of ordered pairs $(x,y)$, where both $x$ and $y$ are integers between $-100$ and $100$, inclusive, such that $12x^{2}-xy-6y^{2}=0$.

K2 Think：全球最快开源AI模型，每秒2000 tokens的数学推理突破 Think 开源大模型高速推理数学推理第7张

可见，K2 Think的突出特点是所有问题均能维持超过2000 tokens/秒的高速响应，且实测中答案均正确。

功能方面，目前K2 Think暂不支持文档上传、多模态等能力。

对此，MBZUAI高级研究员Taylor W. Killian在X平台解释：

该模型主要专注于数学推理任务开发。

K2 Think：全球最快开源AI模型，每秒2000 tokens的数学推理突破 Think 开源大模型高速推理数学推理第8张

技术报告详细公开

从参数规模看，K2 Think仅32B，但官方声称其性能可与OpenAI和DeepSeek的旗舰推理模型媲美。

K2 Think：全球最快开源AI模型，每秒2000 tokens的数学推理突破 Think 开源大模型高速推理数学推理第9张

测试结果显示，K2 Think在多项数学基准中取得优异成绩，如AIME’24得分90.83、AIME’25得分81.24、HMMT25得分73.75，以及在Omni-MATH-HARD上获得60.73分。

K2 Think：全球最快开源AI模型，每秒2000 tokens的数学推理突破 Think 开源大模型高速推理数学推理第10张

K2 Think团队已发布技术报告：

K2 Think：全球最快开源AI模型，每秒2000 tokens的数学推理突破 Think 开源大模型高速推理数学推理第11张

总体而言，K2 Think团队在六大技术层面实现创新：

K2 Think：全球最快开源AI模型，每秒2000 tokens的数学推理突破 Think 开源大模型高速推理数学推理第12张

长链路思维的监督微调（SFT）：通过精心设计的链式推理数据，训练模型进行逐步思考，而非直接输出答案，提升复杂问题处理的条理性。

可验证奖励的强化学习（RLVR）：模型以答案正确性为直接奖励信号，而非依赖人类偏好评分，显著增强数学、逻辑等领域的表现。

推理前的智能规划（Plan-Before-You-Think）：先由规划代理提炼问题核心并制定解题大纲，再交由模型展开详细推理，模拟人类先提纲后解题的思维过程。

推理时扩展（Best-of-N采样）：针对同一问题生成多个答案版本，从中筛选最优结果，以提高准确率。

推测解码（Speculative Decoding）：在推理过程中并行生成并验证答案，减少冗余计算，加速输出效率。

硬件加速（Cerebras WSE晶圆级引擎）：依托全球最大的单芯片计算平台，实现单请求每秒超2000 tokens的生成速度，确保长链路推理的流畅交互体验。

此外，研究团队对K2 Think进行了全面安全测试，涵盖有害请求拒绝、多轮对话鲁棒性、信息泄露防护和越狱攻击防范等方面，整体安全水平较高。

K2 Think：全球最快开源AI模型，每秒2000 tokens的数学推理突破 Think 开源大模型高速推理数学推理第13张

体验地址：https://www.k2think.ai/

技术报告：https://k2think-about.pages.dev/assets/tech-report/K2-Think_Tech-Report.pdf

参考链接：

[1]https://www.k2think.ai/k2think

[2]https://x.com/mbzuai/status/1965386234559086943

[3]https://huggingface.co/LLM360/K2-Think

[4]https://venturebeat.com/ai/k2-think-arrives-from-uae-as-worlds-fastest-open-source-ai-model

[5]https://www.youtube.com/watch?v=8C6_B1QeyBo

性价比服务器云服务器高防服务器

本文由主机测评网于2025-12-30发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://vpshk.cn/20251213934.html

上一篇

英伟达Rubin CPX GPU直面博通ASIC挑战，AI芯片市场竞争白热化

下一篇

抖音支付全面扩张：线上线下同步进军，挑战支付双雄格局