对于对网络要求较高的用户,比如游戏玩家、
2025年初,DeepSeek用更低的训练成本做出比肩全球主流大模型的能力,被不少业内人士称为“DeepSeek时刻”。
这件事的意义,不只是多了一个模型。
更关键的是,它动摇了一个长期被默认的前提——模型能力是否必须依赖更大的参数规模。
类似的变化,正在医疗AI领域出现。
一个不太一样的技术路径
近期,国内医疗科技公司良医汇联合智谱AI及多家三甲医院团队,在一项针对非小细胞肺癌(NSCLC)TNM分期的研究中,给出了一种不同于主流路径的解法。
他们没有选择更大的模型,而是基于国产32B模型GLM-4-Air,通过一套被称为 Medical-based Harness Engineering(医学工程化) 的方法,对模型进行重构。
简单来说,这种思路不是让模型“自己学会医学”,而是:
先把医学规则结构化,再让模型按规则推理。
为什么医疗场景很难被“通用能力”覆盖
TNM分期是肺癌诊疗中的核心环节,但同时也是一个典型的“复杂规则系统”:
· 需要同时判断肿瘤大小、侵犯范围、转移情况
· 不同分期之间存在严格定义边界
· 错误分期可能直接影响治疗路径
这类任务对AI的要求,不只是“理解文本”,而是遵循医学规则进行多步骤推理。
也是在这样的场景下,单纯依赖大模型的通用能力,开始出现边界。
实验结果:中等规模模型反超GPT-4o
在发表于《JMIR AI》的研究中,良医汇团队将TNM分期任务拆解为多个可解释步骤,并针对不同子任务采用差异化优化策略。
在由三甲医院医生标注的数据集上,模型表现如下:
· 整体分期准确率:90%(GPT-4o为80%)
· M分期实现零重大临床错误
· 多项指标全面优于对照模型
一个更关键的变化是:模型在输出结果的同时,会给出完整推理过程,包括每一步判断依据及对应的医学规则。
这意味着,医生不仅可以“用”,还可以“审”。
一个正在被验证的趋势:专业化优先于规模
如果把这次结果放在更大的背景下,它指向一个正在被反复验证的趋势:
在垂直领域,模型能力的上限,越来越取决于专业化适配能力,而不是参数规模。
类似的信号,在法律、金融等领域也开始出现。
从研究走向产品
上述方法已经被产品化。
良医汇推出的医生工具 MedSeek.Ai,目前已覆盖多个临床科室,并在实际医疗场景中服务超过10万名医生。
与依赖海外通用模型的产品不同,这类系统更强调:
· 本地部署与数据安全
· 与临床路径一致的推理逻辑
· 可解释的决策过程
在基层医疗机构中,这种能力的意义更直接——
它可能在一定程度上弥补专科医生资源不足带来的差距。
医疗AI的下一阶段,可能不是“更大”
从DeepSeek到类似MedSeek的尝试,一个变化正在变得清晰:
在通用大模型之外,越来越多行业开始探索自己的“专属解法”。
对于医疗这样的高门槛场景而言,问题可能不再是“有没有更大的模型”,而是:
有没有真正理解这个行业的AI产品。
对于对网络要求较高的用户,比如游戏玩家、
很多第一次买随身wifi的新手,面对五花
去年春天,一场刷新上海创意市集规模纪录的
为深化汽车产业与数字化资产服务的融合发展
作为超耐磨瓷砖品类开创者,大角鹿超耐磨技
近日,鸿蒙版四川人社App正式升级上线身
一扇好窗,界定生活边界;一门匠心,承载人
2026年家用电梯行业进入安全标准升级、
在2026年台北国际自行车展(TAIPE
