文章信息
- 喻颖, 何丽敏, 陈炀, 等.
- YU Ying, HE Limin, CHEN Yang, et al.
- 基于决策树算法的卒中后抑郁肝郁脾虚证诊断模型研究
- The study on the diagnosis model for post-stroke depression with the pattern of liver depression and spleen deficiency based on decision tree algorithm
- 天津中医药, 2026, 43(3): 292-297
- Tianjin Journal of Traditional Chinese Medicine, 2026, 43(3): 292-297
- http://dx.doi.org/10.11656/j.issn.1672-1519.2026.03.04
-
文章历史
- 收稿日期: 2025-11-17
2. 北京中医药大学东方医院康复科, 北京 100078
卒中后抑郁(PSD)是临床常见的卒中后并发症,表现为心境低落、丧失兴趣或愉悦感及易疲劳等情绪障碍及躯体化症状[1],是脑卒中患者自杀的重要危险因素[2],对患者的预后及神经康复造成严重影响。
抑郁症属中医“郁证”“脏躁”“百合病”等范畴[3],中医辨证论治的特有诊疗模式以及形神一体的心身医学理念使得中医在治疗情志病方面具有独特优势。肝郁脾虚证是临床常见的抑郁症证候类型[4-6],但对于PSD肝郁脾虚证诊断标准的意见仍未统一,其证候的规范化、标准化仍有待进一步的研究[7]。
现代关于中医辨治抑郁症的研究以传统统计学方法居多[8-10],而随着科技的发展,机器学习、人工智能已经广泛应用于各领域,在中医病证诊断、方药配伍决策[11]等方面的研究中,起到了越来越重要的作用。赵书颖等[12]通过决策树及神经网络建立高血压病阴阳两虚证诊断模型,在32个输入变量中筛选出最佳识别变量;迟辉等[13]通过决策树研究失眠治疗的方证规律,机器学习对中医客观化提供了新的探索方向。决策树算法属于机器学习中的有监督学习,包括分类回归树(CART)、卡方自动交互诊断器(CHAID)、快速无偏有效统计树(QUEST)及C5.0等,与其他机器学习方法相比,决策树具有直观、易懂的特点,与人类社会的决策逻辑相似,有较强的可解释性[11]。
本研究通过收集PSD病例临床数据,使用CART、CHAID、QUEST及C5.0决策树算法,通过分析患者临床症状,建立PSD肝郁脾虚证诊断模型,为PSD肝郁脾虚证的决策逻辑及临床表现规律探索提供参考。
1 资料与方法 1.1 病例来源本研究的病例资料来源于2015年1月至2025年6月期间就诊于北京中医药大学东方医院的PSD患者共402例,经筛选剔除临床症状信息不完整的患者后共纳入389例。2015年1月至2023年12月共纳入患者314例,该数据集用于模型的构建与内部验证,其中男87例(27.7%),女227例(72.3%),年龄47~98岁,平均年龄(66.20±11.46)岁;总病程1~480个月,中位病程10(2,12)个月;汉密尔顿抑郁量表 17项(HAMD-17)评分17~41分,平均(23.11±5.03)分;美国国立卫生研究院卒中量表(NIHSS)评分3~21分,平均(9.96±3.39)分。2024年1月至2025年6月共纳入患者75例,作为外部验证数据集用于对已构建完成的模型进行时序验证以评估模型的真实泛化能力,其中男29例(38.7%),女46例(61.3%),年龄42~85岁,平均年龄(68.37±8.75)岁;总病程1~112个月,中位病程7(2,11)个月;汉密尔顿抑郁量表 17项(HAMD-17)评分17~39分,平均(26.81±6.64)分;美国国立卫生研究院卒中量表(NIHSS)评分4~21分,平均(10.25±3.55)分。本研究经北京中医药大学东方医院临床研究伦理委员会批准(伦理审查批件号:JDF-IRB-2020031701)。
1.2 诊断标准PSD西医诊断标准参考中国卒中杂志发布的《卒中后抑郁临床实践的中国专家共识》[1]。
1.3 纳入标准1)符合PSD诊断标准。2)年龄≥18周岁。3)个人基本信息及临床症状等资料完整。
1.4 排除标准1)合并器官衰竭、恶性肿瘤等严重疾病患者。2)合并精神分裂症、双相情感障碍等其他严重精神疾病患者。3)妊娠期或哺乳期患者。
1.5 数据采集及预处理参考《抑郁症中西医结合诊疗专家共识》《中医诊断学》及《中医内科学》等相关文献[14-16],结合团队既往研究经验[17]制定《临床病例调查表》,从病案中提取患者个人基本信息以及临床症状信息录入调查表中。由专家团队对患者进行证候类型诊断,对诊断存在疑问的由1名主任医师进行最终判断。样本共包括肝郁脾虚证(共75例,23.9%)及非肝郁脾虚证(共239例,76.1%)。将个人基本信息、临床症状信息及中医证候类型诊断数据录入SPSS 20.0,对分类变量进行编码,临床症状变量以“1”表示“有”,“0”表示“无”,中医证候类型诊断以“1”表示诊断肝郁脾虚证,“0”表示诊断非肝郁脾虚证,对以上录入内容由双人进行核对。
1.6 决策树模型的建立本研究使用SPSS Modeler 18.0软件建立决策树模型。以是否诊断肝郁脾虚证为目标变量,以临床症状共36个变量为输入变量,使用SPSS Modeler的随机分区功能,将样本数据以70%∶30%的比例随机划分训练集和测试集,通过软件生成的随机分配,最终得到的实际样本分布为训练集215例(68.5%),测试集99例(31.5%)。分别使用CART、CHAID、QUEST及C5.0决策树算法构建诊断模型,最后使用测试集数据进行模型评估。
2 结果 2.1 决策树模型 2.1.1 CART模型基于CART算法构建模型见开放科学(资源服务)标识码(OSID)。树深为5,叶节点数为10,该模型纳入9个症状变量,包括:神疲懒言,胁肋胀痛,腹胀,肢体麻木,潮热,口干咽燥,便秘,口苦,发枯易落。主要推理规则包括:1)如果“神疲懒言=有”且“腹胀=有”且“胁肋胀痛=有”,则“肝郁脾虚=是”,该规则覆盖43个样本观测,规则置信度为88.4%。2)如果“神疲懒言=无”且“口干咽燥=有”且“心悸多梦=无”,则“肝郁脾虚=否”,该规则覆盖13个样本观测,规则置信度为92.3%。3)如果“神疲懒言=无”且“口干咽燥=有”且“心悸多梦=有”,则“肝郁脾虚=否”,该规则覆盖65个样本观测,规则置信度为100%。4)如果“便秘=有”且“神疲懒言=有”且“胁肋胀痛=无”且“自汗=无”,则“肝郁脾虚=否”,该规则覆盖13个样本观测,规则置信度为100%。5)如果“神疲懒言=有”且“胁肋胀痛=无”且“自汗=有”,则“肝郁脾虚=否”,该规则覆盖27个样本观测,规则置信度为100%。
2.1.2 CHAID模型基于CHAID算法构建模型见开放科学(资源服务)标识码(OSID)。树深为5,叶节点数为10,该模型纳入9个症状变量,包括:胁肋胀痛,腹胀,神疲懒言,胸脘痞闷,发枯易落,口干咽燥,潮热,小便短赤,心悸多梦。主要推理规则包括:1)如果“神疲懒言=有”且“胁肋胀痛=有”且“腹胀=有”且“胸脘痞闷=有”,则“肝郁脾虚=是”,该规则覆盖37个样本观测,规则置信度为94.6%。2)如果“神疲懒言=无”且“口干咽燥=有”且“心悸多梦=无”,则“肝郁脾虚=否”,该规则覆盖13个样本观测,规则置信度为92.3%。3)如果“神疲懒言=无”且“口干咽燥=有”且“心悸多梦=有”,则“肝郁脾虚=否”,该规则覆盖65个样本观测,规则置信度为100%。4)如果“神疲懒言=有”且“胁肋胀痛=无”,则“肝郁脾虚=否”,该规则覆盖57个样本观测,规则置信度为94.7%。5)如果“神疲懒言=有”且“胁肋胀痛=有”且“腹胀=无”且“潮热=有”,则“肝郁脾虚=否”,该规则覆盖11个样本观测,规则置信度为100%。
2.1.3 QUEST模型基于QUEST算法构建模型见开放科学(资源服务)标识码(OSID)。树深为4,叶节点数为5,该模型纳入9个症状变量,包括:胁肋胀痛,胸闷喜太息,腹胀,神疲懒言。主要推理规则包括:1)如果“神疲懒言=有”且“胁肋胀痛=有”且“腹胀=有”且“胸闷喜太息=有”,则“肝郁脾虚=是”,该规则覆盖40个样本观测,规则置信度为95.0%。2)如果“神疲懒言=有”且“胁肋胀痛=有”且“腹胀=有”且“胸闷喜太息=无”,则“肝郁脾虚=否”,该规则覆盖3个样本观测,规则置信度为100%。3)如果“神疲懒言=有”且“胁肋胀痛=有”且“腹胀=无”,则“肝郁脾虚=否”,该规则覆盖23个样本观测,规则置信度为82.6%。4)如果“神疲懒言=有”且“胁肋胀痛=无”,则“肝郁脾虚=否”,该规则覆盖57个样本观测,规则置信度为94.7%。5)如果“神疲懒言=无”,则“肝郁脾虚=否”,该规则覆盖92个样本观测,规则置信度为95.7%。
2.1.4 C5.0模型基于C5.0算法构建模型见开放科学(资源服务)标识码(OSID)。树深为5,叶节点数为8,该模型纳入7个症状变量,包括:胁肋胀痛,神疲懒言,疲倦乏力,胸闷喜太息,腹胀,小便短赤,五心烦热。主要推理规则包括:1)如果“神疲懒言=有”且“胁肋胀痛=有”且“腹胀=有”且“胸闷喜太息=有”且“疲倦乏力=有”,则“肝郁脾虚=是”,该规则覆盖38个样本观测,规则置信度为100%。2)如果“神疲懒言=无”,则“肝郁脾虚=否”,该规则覆盖92个样本观测,规则置信度为95.7%。3)如果“神疲懒言=有”且“胁肋胀痛=无”,则“肝郁脾虚=否”,该规则覆盖57个样本观测,规则置信度为94.7%。4)如果“神疲懒言=有”且“胁肋胀痛=有”且“腹胀=无”且“小便短赤=有”,则“肝郁脾虚=否”,该规则覆盖11个样本观测,规则置信度为100%。
2.2 变量重要性分析预测变量重要性代表了不同预测变量对于分类结果的重要性,具体排序及数值见图 1-4及表 1。结果显示,“胁肋胀痛”“神疲懒言”“腹胀”在所有模型中均表现出较高的重要性权重,提示以上3种症状为判断是否诊断PSD肝郁脾虚证最核心的分类特征。不同模型对其他变量的选择有所差异,“胸闷喜太息”在QUEST和C5.0中表现较为突出,而“胸脘痞闷”在CHAID中具有较高权重,说明以上两种症状在PSD肝郁脾虚证诊断中具有一定的重要性,为诊断的次要特征。这种变量选择的差异也反映了模型在特征分布上的侧重点:C5.0模型更倾向于关注少数关键变量,而CART和QUEST模型对多种变量赋予的权重则更为分散。此外,“潮热”“口干咽燥”“小便短赤”变量在多个模型中均有所体现,这些变量在模型中的权重较低,提示它们可能是影响“肝郁脾虚=否”诊断的次要因素。
|
| 图 1 CART预测变量重要性 Fig. 1 Predictor importance for the CART model |
|
| 图 2 CHAID预测变量重要性 Fig. 2 Predictor importance for the CHAID model |
|
| 图 3 QUEST预测变量重要性 Fig. 3 Predictor importance for the QUEST model |
|
| 图 4 C5.0预测变量重要性 Fig. 4 Predictor importance for the C5.0 model |
| 决策树 | 预测变量重要性 |
| CART | 神疲懒言(0.24),胁肋胀痛(0.17),腹胀(0.17),肢体麻木(0.06),潮热(0.03),口干咽燥(0.02),便秘(0.02),口苦(0.01),发枯易落(0.01),两目干涩、视物模糊(0.01) |
| CHAID | 胁肋胀痛(0.26),腹胀(0.23),神疲懒言(0.23),胸脘痞闷(0.12),发枯易落(0.05),口干咽燥(0.04),潮热(0.03),小便短赤(0.02),心悸多梦(0.02) |
| QUEST | 胁肋胀痛(0.21),胸闷喜太息(0.16),腹胀(0.15),神疲懒言(0.11),口干咽燥(0.03),发枯易落(0.03),两目干涩、视物模糊(0.03),脘痞(0.03),潮热(0.03),胸脘痞闷(0.03) |
| C5.0 | 胁肋胀痛(0.38),神疲懒言(0.26),疲倦乏力(0.13),胸闷喜太息(0.13),腹胀(0.05),小便短赤(0.03),五心烦热(0.03) |
决策树模型的性能评估主要依据准确率、AUC、Gini系数等指标。准确率是模型预测正确的样本数占总样本数的比例,是最为直观的模型性能指标;AUC为ROC曲线下面积,ROC曲线以假阳性率和真阳性率为横轴和纵轴,用于评估二元分类模型的性能(见图 5),Gini系数与AUC意义相同,两者用于量化模型整体的分类能力,值越大表明分类能力越强(见表 2)。
|
|
注:曲线 |
| 决策树 | 训练集 | 测试集 | |||||
| 准确率(%) | AUC | Gini系数 | 准确率(%) | AUC | Gini系数 | ||
| CART | 92.56 | 0.902 | 0.805 | 91.92 | 0.903 | 0.805 | |
| CHAID | 93.02 | 0.968 | 0.935 | 88.89 | 0.883 | 0.766 | |
| QUEST | 93.95 | 0.913 | 0.827 | 92.93 | 0.911 | 0.822 | |
| C5.0 | 95.81 | 0.940 | 0.879 | 90.91 | 0.930 | 0.860 | |
比较各模型的评估指标,在训练集中,C5.0模型的准确率最高,AUC和Gini系数最高的为CHAID模型;在测试集中,准确率最高的是QUEST模型,C5.0模型的AUC和Gini系数在所有模型中得分最高。AUC和Gini系数相较准确率来说评价更为全面,对于不平衡数据模型的区分能力更好,PSD肝郁脾虚证患者数量较多,但在临床中与非肝郁脾虚证患者样本数据往往难以达到平衡,因此,尽管C5.0模型测试集的准确率低于QUEST模型,但其AUC和Gini系数得分高于其他模型,说明了其在PSD肝郁脾虚证诊断中的良好分类能力。综上所述,在本研究中,性能最优的应为C5.0模型。
2.4 决策树模型的时序外部验证使用外部验证数据集评估模型的真实泛化能力,各模型的ROC曲线及评估结果见图 6及表 3。结果显示,在该验证集上,C5.0模型的准确率为85.33%,AUC为0.884,相较于其他模型,其综合性能表现最佳,具有良好的跨时期应用的可行性。
|
|
注:曲线 |
| 决策树 | 准确率(%) | AUC | Gini系数 |
| CART | 72.00 | 0.737 | 0.475 |
| CHAID | 62.67 | 0.68 | 0.360 |
| QUEST | 81.33 | 0.857 | 0.714 |
| C5.0 | 85.33 | 0.884 | 0.768 |
PSD属中医“中风”“郁证”等范畴,为因病致郁之症。《证治汇补·郁症》曰:“郁病虽多,皆因气不周流,法当顺气为先。”“治郁之法,多以调中为要者……盖脾胃居中……而脾胃亦先受伤。”说明了肝气郁滞,脾胃受伤为郁证的重要病机。田苑等[18]研究认为,肝与脑卒中发病密切相关,肝失疏泄,升降失调,以致气机逆乱或气郁血瘀是脑卒中发病的重要机制。“中风”与“郁证”的病机特点均与肝郁脾虚证密切相关,而现代研究[4-6]也证明,肝郁脾虚证为抑郁症的常见证型。本研究通过CART、CHAID、QUEST及C5.0决策树算法分析PSD病例临床症状数据,建立PSD肝郁脾虚证诊断模型,为临床决策提供思路,为中医证候类型诊断的客观化、标准化提供参考。
决策树算法属于机器学习中的分类预测模型,其分裂规则与临床思维过程具有一定的相似性,运用于医学诊断领域与神经网络、支持向量机等其他机器学习方法相比能直观地体现疾病的诊断推理逻辑,其结果对于临床医生而言具有更好的可解释性和应用价值。不同的决策树算法在处理不同类型变量、树的结构以及分裂标准上具有差异,为探究最优的模型构建选择,本研究选取了CART、CHAID、QUEST及C5.0这4种应用广泛、具有代表性的决策树算法进行比较。CART由美国斯坦福大学和加州大学伯克利分校的Breiman等于1984年提出,其理论基于非参数识别算法,当目标变量为二分类变量时使用Gini系数选择最佳分组变量和分割点;CHAID由Kass等于1980年提出,使用卡方检验处理分类型输入变量,对数值型输入变量预先进行分箱处理;QUEST由Loh和Shih在1997年提出,使用卡方检验、F检验处理分类型和数值型输入变量,只能用于建立分类树;C5.0由ID3算法发展而来,采用信息增益率处理分类型或数值型输入变量以选择最佳分裂,目标变量要求为分类型[11]。研究结果显示,在PSD肝郁脾虚证的诊断模型构建中,C5.0模型具有更优的性能。
通过建立决策树模型,筛选出“胁肋胀痛”“神疲懒言”“腹胀”共3个PSD肝郁脾虚证最核心的分类特征。其中,4种决策树模型均以“神疲懒言”为根节点变量,说明“神疲懒言”症状对是判断否为肝郁脾虚证具有最强的区分能力。《素问·六节藏象论》中“肝者,罢极之本”指出肝为耐受疲劳的根本。《景岳全书·郁证》中“惟中气受伤矣……而或为倦怠……此以木邪克土,损在脾矣”,说明了肝木郁滞,克伐脾土,出现脾土受伤而致郁从而导致倦怠疲惫症状的重要病机变化,“神疲懒言”症状与肝、脾二脏功能失调均密切相关。王宏涛[19]认为肝郁气滞、脾失健运乃是诱发卒中后疲劳的重要病机。吴雨静等[20]认为卒中后的脏腑功能紊乱导致的肝失疏泄、肝气乘脾是产生疲惫感的原因。现代研究亦证实,抑郁是卒中后疲劳严重程度的独立影响因素[21]。与“胁肋胀痛”等病位关联相对单一的症状相比,是否存在“神疲懒言”症状对于PSD肝郁脾虚证的诊断具有更强的区分能力。
《证治汇补·郁症》曰:“胁胀满……此木郁也。”《赤水玄珠·郁证门》曰:“肝郁者,两胁微膨。”“气郁者,其状胸满胁痛。”说明“胁肋胀痛”症状为肝木气机郁滞的重要特征。《证治汇补·郁症》曰:“郁久成病……或为腹胀”,“脾郁中满不食。”表明了“腹胀”症状为脾郁的重要特征。此外,“胸闷喜太息”与“胸脘痞闷”在部分模型中具有较高权重,考虑为诊断的次要特征。“潮热”“口干咽燥”“小便短赤”是影响“肝郁脾虚=否”诊断的次要因素,在模型中的权重均较低,在特定情况下对诊断非肝郁脾虚证的结果可能存在一定辅助作用。
4 总结与展望通过对模型的性能评估分析,C5.0模型的性能最优,其主要推理规则:如果“神疲懒言=有”且“胁肋胀痛=有”且“腹胀=有”且“胸闷喜太息=有”且“疲倦乏力=有”,则“肝郁脾虚=是”为PSD肝郁脾虚证诊断较可信规则。而C5.0模型更关注少数关键变量的变量重要性分布特征,也符合中医“抓主症”的临床辨治特点,正如《伤寒论》中所述“但见一证便是,不必悉具”。
综上所述,运用决策树算法建立PSD肝郁脾虚证诊断模型,能够从大量临床数据中寻找规律,为探寻中医客观化及诊断精准化方法提供参考。然而,本研究亦存在局限性。首先,本研究为回顾性研究,作为中医辨证重要依据的舌、脉信息由于患者病历舌脉象数据的非标准化及部分数据缺失等原因未能纳入模型。其次,本研究未能反映肝郁脾虚证患者症状随病程和治疗干预而发生变化的动态演变过程。最后,本研究的病例资料均来自同一家医院,模型的泛化能力有限。在未来的研究中,应考虑引进卷积神经网络等深度学习算法,对标准化采集的舌象图像、脉象波形进行智能分析与特征提取,从而实现舌、脉信息的客观化,建立标准化的四诊信息采集流程,并开展大样本、多中心、多时间点随访的临床研究,为建立PSD肝郁脾虚证诊断模型提供更丰富的数据支持。
2. Department of Rehabilitation, Dongfang Hospital, Beijing University of Chinese Medicine, Beijing 100078, China
2026, Vol. 43



