当前位置：首页 > 科技资讯 > 正文

数坤科技V3大模型登顶医疗评测，多模态应用展现强大实力

数坤科技V3大模型登顶医疗评测，多模态应用展现强大实力数坤科技 V3大模型医疗评测多模态应用第1张

智东西最新报道，2月7日，中文医疗大模型评测平台MedBench揭晓最新多模态大模型评测榜单，数坤科技的数坤坤多模态医学大模型V3以63.6分荣获榜首。

此次榜单中，V3表现卓越，超越了微医、云知声等医疗行业大模型，以及OpenAI、谷歌、阿里千问等通用大模型。

数坤科技V3大模型登顶医疗评测，多模态应用展现强大实力数坤科技 V3大模型医疗评测多模态应用第2张

数坤科技自2017年成立以来，已推出超过100款数字医生产品组合，广泛应用于超过5000家公立医院和超过1000家体检机构，覆盖90%的Top 100医院及目标公立三甲医院。

数坤科技创始人兼董事长毛新生透露，该模型的性能提升得益于其丰富的训练数据与独特的训练策略。公司深耕医疗领域8年，积累了PB级医疗专业数据。训练策略上，研究人员采用医学MDT（多学科会诊）式训练，使模型如同人类专家会诊，对同一病种的影像特征、病理报告、临床指标进行深度关联学习。

细分指标表现卓越，贴近临床医生水平

数坤科技于2025年6月发布数坤坤多模态医学大模型V3，参数规模达72B。V3具备系统化、逻辑化的诊疗思维链，能胜任如鉴别诊断、个体化治疗等复杂任务。

MedBench由上海AI实验室发起，基于医学权威标准评估大模型在医疗领域的能力。其4.0版本是首个面向垂直模型、专业模型和应用场景的医疗大模型评测与验证体系。

榜单考验模型在影像信息、文字描述间完成稳定跨模态关联，并顺利完成多项需要综合理解的医疗任务。

数坤科技V3大模型登顶医疗评测，多模态应用展现强大实力数坤科技 V3大模型医疗评测多模态应用第3张

榜单列出医疗视觉感知与文本提取、跨模态语义理解与推理、临床决策支持与推理三大细分指标。

V3在医疗视觉感知中排名第一，考验模型对医学影像、医疗文档的识别、定位与病灶检测能力。在跨模态语义理解与推理中同样位居榜首，展现了对多模态信息的统一表征与关联推理能力。

数坤科技V3大模型登顶医疗评测，多模态应用展现强大实力数坤科技 V3大模型医疗评测多模态应用第4张

V3在MedBench综合能力排名第一，从感知理解到跨模态推理，再到临床决策，三大能力环环相扣。

对于此次登顶，数坤科技CTO郑超表示，模型得分越高，说明其在医疗领域的应用能力越接近临床医生水平，但分数不是唯一标准。

数坤科技在训练大模型时，始终围绕真实医疗问题的形成逻辑展开，使不同模态的信息能够按临床路径被理解和使用。

真实医疗场景中，医学信息连续且多序列，存在不完整、不确定的情况。数坤科技在训练数据积累与训练策略选择上进行了优化。

创始人兼董事长毛新生透露，公司已与全球上千家医院合作，积累大量医疗专业数据，训练数据规模达PB级。

采用“医学MDT（多学科会诊）式训练策略”，模拟医生看病过程，综合分析多模态检查数据，形成对病情的综合判断。

AI医疗赛道热度飙升，数坤科技凭借在AI医疗领域的积累助力V3登顶。

公司首创“数字人体技术平台”，是国内唯一覆盖影像全模态的AI企业，已渗透到放射、超声、手术等领域。

医疗大模型长期稳定应用在医疗领域难度较高。毛新生提到两大技术难点：一是让大模型多方位了解某一疾病的相关医学数据；二是减少模型输出幻觉。

每个疾病全生命周期涉及大量医学专业知识，对大模型输出错误的容忍度极低。因此，这对大模型企业提出极高要求，需要医学和AI领域知识的双重积累。

对于医疗领域模型而言，榜单评测不是终点。模型是否真正“懂医疗”，需接受真实诊疗流程的检验。

不过，V3模型以较小参数超越国内外通用大模型与垂直医疗模型，证明医疗大模型的核心竞争力不仅是参数规模与训练算力。数坤科技积累的海量真实医院经验或能加速医疗大模型应用。

本文由主机测评网于2026-07-06发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://vpshk.cn/20260748909.html