全球速度领先的开源大模型正式登场——其推理速度突破每秒2000个tokens!
虽然参数规模仅为320亿(32B),但吞吐量表现惊人,相比典型GPU部署提升超过10倍。
这款模型由阿联酋的穆罕默德·本·扎耶德人工智能大学(MBZUAI)与初创企业G42 AI联合研发,命名为K2 Think。
名称听起来是否耳熟?
没错,它与月之暗面此前推出的Kimi K2在命名上略有重合,但阿联酋版本多了“Think”后缀。
有趣的是,K2 Think背后蕴含着浓厚的“中国制造”元素。
从HuggingFace的模型树可见,K2 Think是基于Qwen 2.5-32B架构深度优化而来:
除了“全球最快开源AI模型”的称号,MBZUAI官方还宣称K2 Think是“有史以来最先进的开源AI推理系统”。
那么,它的实际能力究竟如何?接下来我们深入探究。
目前,K2 Think已提供在线体验地址(文末附链接)。
我们首先尝试一道国际数学奥林匹克(IMO)试题:
Let a_n = 6^n + 8^n. Determine the remainder when dividing a_{83} by 49.
直观可见,在无额外加速条件下,K2 Think经过思考后输出答案的速度极快,近乎“瞬间完成”。
底部数据显示,速度达到2730.4 tokens/秒。
接下来,用中文测试一个经典问题:
Strawberry这个单词里面有几个字母R?
速度仍保持在2224.7 tokens/秒,并准确给出答案:包含3个R。
我们再实测几道AIME 2025数学题目:
Find the sum of all integer bases $b>9$ for which $17_{b}$ is a divisor of $97_{b}$.
Find the number of ordered pairs $(x,y)$, where both $x$ and $y$ are integers between $-100$ and $100$, inclusive, such that $12x^{2}-xy-6y^{2}=0$.
可见,K2 Think的突出特点是所有问题均能维持超过2000 tokens/秒的高速响应,且实测中答案均正确。
功能方面,目前K2 Think暂不支持文档上传、多模态等能力。
对此,MBZUAI高级研究员Taylor W. Killian在X平台解释:
该模型主要专注于数学推理任务开发。
从参数规模看,K2 Think仅32B,但官方声称其性能可与OpenAI和DeepSeek的旗舰推理模型媲美。
测试结果显示,K2 Think在多项数学基准中取得优异成绩,如AIME’24得分90.83、AIME’25得分81.24、HMMT25得分73.75,以及在Omni-MATH-HARD上获得60.73分。
K2 Think团队已发布技术报告:
总体而言,K2 Think团队在六大技术层面实现创新:
长链路思维的监督微调(SFT):通过精心设计的链式推理数据,训练模型进行逐步思考,而非直接输出答案,提升复杂问题处理的条理性。
可验证奖励的强化学习(RLVR):模型以答案正确性为直接奖励信号,而非依赖人类偏好评分,显著增强数学、逻辑等领域的表现。
推理前的智能规划(Plan-Before-You-Think):先由规划代理提炼问题核心并制定解题大纲,再交由模型展开详细推理,模拟人类先提纲后解题的思维过程。
推理时扩展(Best-of-N采样):针对同一问题生成多个答案版本,从中筛选最优结果,以提高准确率。
推测解码(Speculative Decoding):在推理过程中并行生成并验证答案,减少冗余计算,加速输出效率。
硬件加速(Cerebras WSE晶圆级引擎):依托全球最大的单芯片计算平台,实现单请求每秒超2000 tokens的生成速度,确保长链路推理的流畅交互体验。
此外,研究团队对K2 Think进行了全面安全测试,涵盖有害请求拒绝、多轮对话鲁棒性、信息泄露防护和越狱攻击防范等方面,整体安全水平较高。
体验地址:https://www.k2think.ai/
技术报告:https://k2think-about.pages.dev/assets/tech-report/K2-Think_Tech-Report.pdf
参考链接:
[1]https://www.k2think.ai/k2think
[2]https://x.com/mbzuai/status/1965386234559086943
[3]https://huggingface.co/LLM360/K2-Think
[4]https://venturebeat.com/ai/k2-think-arrives-from-uae-as-worlds-fastest-open-source-ai-model
[5]https://www.youtube.com/watch?v=8C6_B1QeyBo
本文由主机测评网于2025-12-30发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20251213934.html