张 勤:首先从技术上我要说明一下,DUCG 不是基于当前全世界流行的大数据机器学习,而是基于临床专家的不确定因果知识。这里有一个误区:将人工智能等同于大数据机器学习。无论是媒体的误解,还是企业和学者的误导,我认为这没有反映学术的真实情况。人工智能发展 60 多年,跟我同岁,前 30 年主要是基于逻辑的,即基于规则的专家系统,但成功的极少,或者说最后还是没办法满足实际应用的需求,原因就在于规则的碎片化。那种基于特定句式的一条条的碎片化规则多了之后,就会出现重叠、循环,矛盾,就难以管理了。这是第一个大问题。第二个大问题就是规则的不确定性传播尚无严谨的数学理论。不确定性是现实中大量存在的。所以基于规则的专家系统逐渐淡出,让位于能够处理不确定性的大数据机器学习。
大数据机器学习主要是用加工后的大数据训练机器,获得一个可并行计算的非线性函数或模型,使输入与输出尽可能匹配。就全科临床诊断而言,输出就是疾病,输入则是患者的症状、体征、风险因素、化验结果、影像结果等等,至少有一万个变量,每一个变量至少有阴性、阳性、未知三种状态,一个输入就是这些变量的一个状态组合,这种组合比 3 的 1 万次方还多,是一个天文数字。不同样本空间的数据覆盖的组合区域是不同的。大数据覆盖的通常是三甲医院病历中的变量状态组合,但基层的变量状态组合往往与之不同,导致大数据机器学习模型在训练和测试数据集上实现的输入输出匹配在基层失灵。这就是著名的泛化问题。我们的应用场景在基层,但我们学习的数据集来自三甲医院。这种样本空间的错位导致实际使用中诊断正确率大幅降低。换句话说,大数据机器学习模型在测试集上的正确率不能代表实际应用的正确率,原因就在于泛化问题。我们可不可以用基层的数据来学习呢?理论上可以,实际上不可行。因为基层的数据难以保证诊断结论正确性和信息记载完备性,不同的基层情况也不同,即不同基层的样本空间是不一致的,千变万化。因此,解决之道在于避免泛化问题。怎么才能在全科临床诊断中避免泛化问题呢?答案就是基于临床专家的包含不确定性的医学知识,而非匹配式或黑箱式的数据学习。知识是鲁棒的,其正确性不以应用场景变化而不同,即知识不存在泛化问题——这就是我们原创的新一代人工智能 DUCG 的解决之道。
DUCG 的优点首先在于其无泛化问题,且诊断正确率高。我们构建的 DUCG 系统的正确率首先由自己验证,然后再拿到第三方的三甲医院去验证,之后我们才投入实际应用,并在实际应用中验证。我们目前已上线的知识库都是基于主诉症状的跨科室的知识库,覆盖了咳嗽咳痰、腹痛、呕血、发热、胸痛、心悸、头晕、头痛、颈腰背痛、呼吸困难、下尿路症状、肥胖、妇科症状、儿童发热等 36 个主诉症状,每个库包含十几到上百个能引起该主诉症状的疾病,DUCG 根据患者病情信息进行鉴别诊断,第三方测试验证每个库的正确率 95% 以上,其中少见病正确率 80% 以上。基层非常需要对少见病的正确诊断,因为基层对常见病通常还能正确诊断,出问题的主要是少见病。少见病数量虽少,但病种繁多。如果存在大量漏诊误诊,就难以让患者放心,难以实现基层首诊。
DUCG 的第二个优点是诊断结果和知识库的可解释性。哪些风险因素怎么影响疾病的发病率?疾病与症状、体征、实验室检查结果和影像学检查结果存在什么因果关系?不确定性如何计量和表述?我们都采用图形直观的方式进行表达,清晰可解释,包括计算方法也是全透明的,每个计算公式都具有清晰的物理意义,可证实或证伪。我们采用模块合成方式来构建大型复杂 DUCG 知识库,每个知识模块不大,可解释性强,更新可在模块层面进行。模块更新后将自动合成为新知识库,即可用于疾病鉴别诊断。例如国家卫健委发布第五版新冠肺炎指南后,我们在一天内增加了新冠肺炎诊断模块,合成知识库后用于包括新冠肺炎在内的各种疾病的鉴别诊断,即不仅诊断患者是否患新冠肺炎,而且诊断若不是新冠肺炎的话是那种疾病、如何治疗。如果只判断是否新冠肺炎,那是筛查,而不是鉴别诊断。鉴别诊断就是要从众多可能疾病中诊断出病人患的是什么病。这样才能实现基层首诊,有效防控疫情。
作为辅助诊断,人工智能医疗尚不能代替医生看病,法律责任还要由医生来负,那么诊断结果就必须要有可解释性。否则医生怎么相信智能系统的诊断是正确的呢?按照现在大数据的技术路线,难以解决可解释性问题,包括模型本身和诊断结果的可解释性。DUCG 具有强可解释性。
DUCG 的第三个优点是能动态生成患者个体优化临床检查路径。看病的过程其实是一个动态找寻病情信息并据此进行诊断的过程,并不是已经收集了病情信息后由智能系统来下是什么病的结论,也不是针对某个疾病考虑做什么检查以收集病情信息,而是在不知道疾病的情况下基于已知病情信息确定下一步应当优先收集什么病情信息,遵循动态生成的患者个体优化临床检查路径准确获取病情信息,并做出正确诊断,由此实现精准医疗,大幅减少检查项和节省看病费用。
DUCG 的以上三个全球领先的技术优点同时也是基层首诊最需要的基本功能。总之,DUCG 辅助诊疗平台给临床诊断带来了颠覆性的冲击,使基于经验的临床诊断变成了精密的科学计算,大大缩短了基层医生诊断疾病的培训过程,大幅提高了其诊病水平。