冠军!深兰科技团队登顶MedBench中文医疗大模型榜首

互联网
2025
04/27
17:40
分享
评论

近日,国内权威医疗大模型评测平台MedBench在官网更新了榜单,多个知名医疗AI产品及研究团队入榜,其中深兰DeepBlue-MR-v1医疗大模型以复杂医学推理评测第一的成绩领跑MedBench医疗大模型权威榜单。

MedBench是中文医疗大模型第一权威评测平台,由上海人工智能实验室与上海市数字医学创新中心联合国内多家医疗机构和科研单位‌‌设立,该平台汇聚了顶级医疗机构的专家经验和知识储备,已为全球超387个模型提供评测,华为、百度等头部企业将其视为技术验证门槛,部分医院更将评测结果纳入采购参考,同时其评测体系被纳入国家药监局AI三类证申报支持范畴,并发表于中科院一区期刊,形成“产学研用评”闭环生态。在国际层面,MedBench垂域深度可比肩MIMIC-CXR等国际知名评测体系,但更加适配中文医疗场景需求,成为全球医疗AI赛道的重要参考系。

深兰科技DeepBlue-MR-v1医学推理大模型是由深兰科技自主研发的医学推理大模型,擅长临床医学问诊、辅助医学诊断和制定诊疗方案等任务。通过对医学教科书、诊疗指南、专家论文、病案病历、医学推理、医学术语以及心理咨询等海量数据的清洗、构建和医学专家团队标注,运用自研训练体系,实现了人类医学推理能力对齐的基于Transformer架构的稠密大语言模型。DeepBlue-MR-v1医学推理大模型在海量高质量的医学数据上进行预训练,构建医学推理语义空间,然后通过后训练监督微调、医学推理指令增强和多阶段自适应强化学习算法实现医学推理能力迭代提高。

评测平台的相关负责人表示,在此次评测中,深兰科技DeepBlue-MR-v1医疗大模型充分展现了其在复杂医学推理场景处理中的卓越能力,在临床问诊、医学诊断和治疗方案等核心任务上,该模型表现出了远超常规模型的精准度和实用性。

已落地应用于健康医疗多个领域

医疗行业是复杂度较高的领域,医疗大模型实时评估体系对应用稳定落地尤为关键,深兰DeepBlue-MR-v1医疗大模型登顶榜单,意味着其当前的技术能力转化为医疗AI产品具备专业度和领先性。目前,基于深兰DeepBlue-MR-v1医疗大模型研发的产品已经在医疗健康多个方面落地应用。

在医疗问诊方面,研发的“AI问诊助手”已在武汉中心医院55个科室全面启用,系统基于千亿级Tokens医疗知识库与400万医学知识图谱打造,覆盖32个科室的6万+专业医学术语,通过语音识别与大模型技术的应用,可以实时记录医生与患者的谈话并自动生成病例,将书写病历的时间压缩至近乎为零,使医生问诊效率大幅提升。

在精神健康方面,研发的“心心语AI心理热线”已经在武汉市精神卫生中心落地,产品支持24×7小时不间断即时响应,能够AI识别咨询者心理健康状态,以及提供个性化情感建议和情绪缓解支持,并且在发现危机情况下迅速转人工处理,该项目还荣获了“卫生健康科技创新大赛优秀成果奖”。

同时,在眩晕智能医疗方面,深兰充分发挥大模型技术方面的优势,结合武汉协和医院在业务及权威数据方面的丰富资源,率先在国内将智能进化型医疗认知中枢体系应用于眩晕症专家智能体,为武汉协和医院成功构建医患交互的眩晕症主动健康管理平台,为医患双方提供更优质、高效的服务。

不仅如此,深兰科技还正在与武汉市中心医院联合开发“患者健康全生命周期多智能体服务平台”,构建智能进化型医疗认知中枢体系、医疗数据价值化中枢架构、医疗认知协同决策网络等技术护城河,打造覆盖诊前智能导诊、诊中辅助决策、诊后随访管理的全场景AI问诊服务矩阵。整个平台规划包含AI问诊助手、大模型专业医疗知识库、AI科研辅助、AI数字人智能客服、个性化治疗方案推荐、智能就医规划、AI智能陪诊、AI智能随访等十余项创新应用板块,以此推动全社会医疗服务模式,从“被动治疗”向“主动健康管理”转型。

目前,深兰科技所开发的AI医疗产品,已形成涵盖“AI问诊助手”、“远程视频问诊”、“辅助诊断系统”及“医学专家知识库”等在内的智能体产品矩阵。与武汉市中心医院、武汉协和医院、武汉市血液中心、武汉市精卫中心、武汉市武东医院等多家医疗机构达成合作,将联手推动AI技术在问诊、诊断、专科服务等场景的深度应用。

此外,深兰科技还在加速布局“深兰科技家庭医生智能体”项目,计划联合全国50余家三甲医院,构建涵盖200多种常见病、30多种罕见病的智能化居家诊疗体系,通过县域医共体智能化中枢,实现患者问诊看病“大病不出县”的目标,预计三年内将覆盖千万家庭。

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

相关推荐

1
3