智东西最新报道,2月7日,中文医疗大模型评测平台MedBench揭晓最新多模态大模型评测榜单,数坤科技的数坤坤多模态医学大模型V3以63.6分荣获榜首。
此次榜单中,V3表现卓越,超越了微医、云知声等医疗行业大模型,以及OpenAI、谷歌、阿里千问等通用大模型。
数坤科技自2017年成立以来,已推出超过100款数字医生产品组合,广泛应用于超过5000家公立医院和超过1000家体检机构,覆盖90%的Top 100医院及目标公立三甲医院。
数坤科技创始人兼董事长毛新生透露,该模型的性能提升得益于其丰富的训练数据与独特的训练策略。公司深耕医疗领域8年,积累了PB级医疗专业数据。训练策略上,研究人员采用医学MDT(多学科会诊)式训练,使模型如同人类专家会诊,对同一病种的影像特征、病理报告、临床指标进行深度关联学习。
数坤科技于2025年6月发布数坤坤多模态医学大模型V3,参数规模达72B。V3具备系统化、逻辑化的诊疗思维链,能胜任如鉴别诊断、个体化治疗等复杂任务。
MedBench由上海AI实验室发起,基于医学权威标准评估大模型在医疗领域的能力。其4.0版本是首个面向垂直模型、专业模型和应用场景的医疗大模型评测与验证体系。
榜单考验模型在影像信息、文字描述间完成稳定跨模态关联,并顺利完成多项需要综合理解的医疗任务。
榜单列出医疗视觉感知与文本提取、跨模态语义理解与推理、临床决策支持与推理三大细分指标。
V3在医疗视觉感知中排名第一,考验模型对医学影像、医疗文档的识别、定位与病灶检测能力。在跨模态语义理解与推理中同样位居榜首,展现了对多模态信息的统一表征与关联推理能力。
V3在MedBench综合能力排名第一,从感知理解到跨模态推理,再到临床决策,三大能力环环相扣。
对于此次登顶,数坤科技CTO郑超表示,模型得分越高,说明其在医疗领域的应用能力越接近临床医生水平,但分数不是唯一标准。
数坤科技在训练大模型时,始终围绕真实医疗问题的形成逻辑展开,使不同模态的信息能够按临床路径被理解和使用。
真实医疗场景中,医学信息连续且多序列,存在不完整、不确定的情况。数坤科技在训练数据积累与训练策略选择上进行了优化。
创始人兼董事长毛新生透露,公司已与全球上千家医院合作,积累大量医疗专业数据,训练数据规模达PB级。
采用“医学MDT(多学科会诊)式训练策略”,模拟医生看病过程,综合分析多模态检查数据,形成对病情的综合判断。
AI医疗赛道热度飙升,数坤科技凭借在AI医疗领域的积累助力V3登顶。
公司首创“数字人体技术平台”,是国内唯一覆盖影像全模态的AI企业,已渗透到放射、超声、手术等领域。
医疗大模型长期稳定应用在医疗领域难度较高。毛新生提到两大技术难点:一是让大模型多方位了解某一疾病的相关医学数据;二是减少模型输出幻觉。
每个疾病全生命周期涉及大量医学专业知识,对大模型输出错误的容忍度极低。因此,这对大模型企业提出极高要求,需要医学和AI领域知识的双重积累。
对于医疗领域模型而言,榜单评测不是终点。模型是否真正“懂医疗”,需接受真实诊疗流程的检验。
不过,V3模型以较小参数超越国内外通用大模型与垂直医疗模型,证明医疗大模型的核心竞争力不仅是参数规模与训练算力。数坤科技积累的海量真实医院经验或能加速医疗大模型应用。
本文由主机测评网于2026-07-06发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260748909.html