当前位置:首页 > 科技资讯 > 正文

以色列AI创企开源Jamba 3B模型,性能超越谷歌Gemma

以色列创企推出开源3B模型,性能直逼谷歌Gemma。

智东西10月9日报道,以色列AI创企AI21Labs昨日发布了轻量级推理模型Jamba Reasoning 3B。该模型拥有30亿个参数,能在手机、电脑等多种设备端运行,性能远超业界顶尖模型如Qwen3-4B和Gemma 3-4B。

以色列AI创企开源Jamba 3B模型,性能超越谷歌Gemma Jamba Reasoning 3B SSM-Transformer 设备端运行 智能性能 第1张

Jamba Reasoning 3B开源截图

Hugging Face地址:http://huggingface.co/ai21labs/AI21-Jamba-Reasoning-3B

据A21称,Jamba Reasoning 3B基于其创新的SSM-Transformer架构构建,上下文窗口长度达256K个token,能够处理高达1M token,与DeepSeek、谷歌、Llama和微软等竞争对手相比效率提升了2-5倍,在基准测试中表现优异。

以色列AI创企开源Jamba 3B模型,性能超越谷歌Gemma Jamba Reasoning 3B SSM-Transformer 设备端运行 智能性能 第2张

Jamba Reasoning 3B在人类最后测试等测评中超越Qwen 3-4B等模型。

其优势可总结为三点:

1、智能性能不下降:Jamba Reasoning 3B采用混合SSM-Transformer架构,比纯Transformer模型更高效。大多数基于Transformer的模型在上下文长度超过32K个token时性能会显著下降,而Jamba Reasoning 3B能够处理更长的上下文长度,包括高达100万个token。这使得它在高级智能体系统或多模态应用中非常有用。

以色列AI创企开源Jamba 3B模型,性能超越谷歌Gemma Jamba Reasoning 3B SSM-Transformer 设备端运行 智能性能 第3张

2、领先的智能:Jamba Reasoning 3B的表现优于DeepSeek、谷歌、Meta和微软的其他设备端模型。在指令跟踪任务(IFBench)和常识性知识(MMLU-Pro和Humanity's Last Exam)方面尤为出色。

以色列AI创企开源Jamba 3B模型,性能超越谷歌Gemma Jamba Reasoning 3B SSM-Transformer 设备端运行 智能性能 第4张

3、专为设备安全使用而构建:此模型获得Apache 2.0许可,可直接下载到用户的计算机或手机上,并使用用户自己的文件在设备上进行定制。即使在断网的情况下,它们也可以继续运行。

该模型目前支持的语言包括:英语、西班牙语、法语、葡萄牙语、意大利语、荷兰语、德语、阿拉伯语和希伯来语。

结语:轻量模型加速迭代,开启智能体新篇章

随着企业将AI融入运营,基于云端的大型语言模型暴露出效率低下的问题。A21援引研究报告称,40%-70%的AI任务可以通过小型语言模型处理,通过智能路由将成本降低10-30倍。

设备端轻量模型如Jamba Reasoning 3B能够实现经济高效的异构计算分配,在本地处理简单任务,同时保留云端资源用于复杂推理。这为制造业和医疗保健领域的实时应用提供了低延迟,为远程操作提供了离线恢复能力,并增强了数据隐私保护,有望引领一个去中心化的AI时代。