欢迎访问中国上市公司协会网站!
欢迎访问中国上市公司协会网站!
协会简介 协会章程 组织结构 协会领导 会员管理 会费管理 内设机构 廉政举报 联系我们
协会要闻 通知公告 培训通知 地方协会动态 行业专业委员会 采购信息公开 招商引资
发起人会员 副会长 副监事长 常务理事 理事会 监事会 普通会员 联系会员专区 上市公司动态
欢迎访问中国上市公司协会网站!
一带一路 境外动态
法律法规 公司治理 ESG专栏 民营党建案例 专题活动 数字化转型案例
您当前所在的位置:首页 > 会员自律 > 专题活动 > 上市公司在行动 > 正文

共迎AI时代 上市公司在行动丨DeepSeek能否满足医院需求?病理大模型被神化了吗?商汤医疗CEO张少霆这样说

来源:中国上市公司协会      发布时间:2025-04-15     字体大小 [ ]         【打印本页】

“全靠大家支持,才能顺利迈出第一步,不过晨跑最难的就是早起上跑道迈出第一步。”最近,张少霆在朋友圈转发了一则消息,庆祝商汤医疗完成过亿元Pre-A轮融资。

作为国内AI(人工智能)龙头商汤科技的副总裁、研究院副院长、商汤医疗CEO,张少霆在2018年加入商汤时,就是以“智慧健康负责人”的身份亮相的。

2025041516011744704079721097770.png

                                                                                        本视频由《每日经济新闻》提供技术支持

去年夏天,国内首个AI病理大模型PathOrchestra就出自商汤科技、西京医院及清华大学的合作团队,号称“实现了全球最广泛的临床科研任务赋能,完成了人工智能病理研究领域从‘单模专病’到‘一模多病’的跨越式突破”。近日,国内通信技术龙头华为参与发布“瑞智病理大RuiPath”,让病理大模型再次受到公众关注。

都知道DeepSeek,但什么是病理大模型?作为AI医疗大模型领域最具挑战性的“明珠”,病理大模型为何让龙头频频驻足?近日,张少霆就这些热点话题,向我们阐述了他的看法。

2025041516081744704492462045799.jpg

商汤科技副总裁、研究院副院长、商汤医疗CEO张少霆


什么是病理大模型?

病理大模型和DeepSeek的区别是什么?对此,张少霆介绍,DeepSeek等属于语言大模型,病理大模型大多属于图像模型,也有部分是多模态模型,这是两种完全不同的模型。前者(语言大模型)通常拥有数百亿到数千亿级参数,使用不同的提示词就能胜任成百上千种不同的任务;后者(病理大模型)的参数规模则在亿到十亿级别,针对特定的下游任务,仍然需要再加入相关数据后进行微调训练,才能更好地适配这些任务。

“所以,病理大模型并不是大家常说的“大模型”,它更接近传统的预训练模型(Pre-trained Model),还不能像语言大模型一样“大杀四方”,还需要往下游任务深化。”张少霆这样说。

2025041516101744704658451049964.jpg

谈及商汤医疗为什么选择做病理大模型,张少霆表示,病理大模型的优势在于,它可以在长尾问题上减少对传统数据收集和标注的需求,从而提高模型的训练效率,更好地适配并解决子问题。

回过头看,我们对病理领域的大模型研究是伴随着技术范式的变化自然而然地发生的,经历了三个阶段。2018年起,专注于胃肠和宫颈TCT(液基薄层细胞学检测)的单点应用;2021年起,与瑞金医院合作将下游任务拓展到9种不同的疾病,在迁移学习方面取得了一定的成果;2023年起,开始尝试训练病理大模型,来覆盖多达几十种“长尾”疾病。


病理大模型不容易做,但能有效解决两大问题

2023年是大模型技术突破之年,当年发布医疗大模型产品的医疗企业多达数十家,资本市场曾掀起一股AI医疗热潮。但由于应用落地存在挑战,这些医疗大模型在2024年的声量明显下降。如今,当以病理大模型为代表的专科大模型登场,它们面临的挑战似乎只多不少。

开发病理大模型,面临着哪些技术上的挑战?对此,张少霆的回答是,第一个是数据覆盖面,例如覆盖不同疾病且注重数量比例,不能只是追求总数量。比如大模型在某一疾病上的性能表现良好,但可能会影响对其他疾病的性能。我们需要找到一个平衡点,使模型能够兼顾多种疾病。第二个是大模型虽然泛化性更强、适用场景更多,但参数量大幅增加,导致运行效率降低。如何在保持性能的同时控制运行时间效率,是一个亟待解决的问题。

2025041516111744704693081033211.png

既然有这么多挑战,为什么还要做病理大模型?对此,张少霆进行了深入分析。

他表示,专有模型也面临两大挑战,首先是之前提到的长尾问题,其次是病理检测属于体外诊断,个别医院尤其是基层医院的制片流程可能不够规范,导致病理图像特征差异巨大,从而对专有模型的泛化性提出更高的挑战。”

而大模型能够有效解决这两个问题。在长尾问题上,大模型至少能提供比“没有解决方案”更好的选择;在泛化性上,大模型可以作为一个编码器(encoder),提取病理图像特征后再针对某个疾病的专项诊断模型进行优化,这种机制让大模型能够更好地总结病理数据的特征,从而具备更广泛的疾病覆盖能力。

不过,需要再次强调的是,病理大模型目前还无法像语言大模型那样全面且直接地解决很多问题,更多是集中在科研领域。


医院院长们怎么看待AI潮?

医院是病理大模型等专科模型的直接买方。在张少霆看来,公司去年参与的湖北省“‘小切片’守护大民生”工程,是病理AI模型落地的标志性事件。这场发生在湖北全省医院的智慧化、数字化和AI化转型,覆盖了数百家基层医院。这一事件也预示着,病理大模型落地应用似乎已经达到了突破的临界点。

对于病理AI的落地,有人支持,有人怀疑。根据张少霆的观察,在技术发展的过程中,总有保守派和激进派,国内的决策者目前更倾向于拥抱新技术。对于头部医院,它们不仅希望引入AI,节省医生的时间、提高诊断精度,更希望借助AI赋能其医联体医院的业务。对基层医院而言,这同样是一个节省成本的过程。

然而,医院决策采购的核心考量之一是能否带来增量收入。有时候说服决策层支持采购的难点在于,大多数AI医疗产品的卖点是帮助医生更准确地诊断和节省时间,而不是直接为医院带来新增收入或快速回本,这也是之前AI医疗产品的推广面临困难的原因之一。

各家医院接入DeepSeek或发布自有大模型已经成为趋势,对此,张少霆分析,在不少医院接入DeepSeek平台后,通用大语言模型在医疗领域真正带来的临床效果还有待时间验证。事实上,现在很多头部医院都基于自有的研发团队,或与合作企业一起尝试基于通用模型开发垂类大模型,打造自有品牌。在这种趋势下,曾经的“百模大战”已经逐渐演变为垂直领域的“万模大战”。从底层架构来看,这些模型大多基于开源的通用基座,且这些开源基座占据了主流地位,而在此基础上,医疗知识的注入才是关键。

“在这波AI热中,你觉得AI是不是被神化了?”面对这个焦点问题,张少霆给出了这样的回答——需要具体问题具体分析。例如,早期开发的影像类模型(如肺结节检测)以及刚刚提到的胃肠病理和宫颈TCT(液基薄层细胞学检测)等专有模型,不仅没有被神化,反而可能被低估了。事实上,如今在国内的大部分三甲医院,报告撰写背后都有AI的支持。

但从另一个角度看,通用大模型的医疗价值可能确实被夸大了。这些大模型的通用性能很强,在很多任务上实现了超出预期的效果,但幻觉问题(指大模型生成的内容与现实世界事实或用户输入的指令不一致)也不可忽视。从某种角度来看,幻觉问题在通用领域或许并非坏事,因为模型可以像人一样“编故事”,但在严肃领域,尤其是医疗领域,这可能是致命问题。

扫一扫在手机打开当前页