天津中医药  2024, Vol. 41 Issue (7): 829-834

文章信息

孙雪鸽, 赵虎雷, 焦莉, 等.
SUN Xuege, ZHAO Hulei, JIAO Li, et al.
基于数据挖掘技术的肺结节常见证候诊断依据分析
Analysis of common syndromes diagnosis basis of pulmonary nodules based on data mining
天津中医药, 2024, 41(7): 829-834
Tianjin Journal of Traditional Chinese Medicine, 2024, 41(7): 829-834
http://dx.doi.org/10.11656/j.issn.1672-1519.2024.07.04

文章历史

收稿日期: 2024-04-15
基于数据挖掘技术的肺结节常见证候诊断依据分析
孙雪鸽1,2 , 赵虎雷1,3 , 焦莉3,4 , 周淼3,4 , 王中超3,4 , 黄艳3,4 , 蒋艳丽3,4 , 刘元元3,4 , 李建生1,2,3     
1. 河南中医药大学第一附属医院呼吸科, 郑州 450000;
2. 河南中医药大学第一临床医学院, 郑州 450000;
3. 河南中医药大学呼吸疾病诊疗与新药研发省部共建协同创新中心, 河南省中医药防治呼吸病重点实验室, 郑州 450046;
4. 河南中医药大学第三附属医院, 郑州 450004
摘要:[目的] 初步确立肺结节常见证候诊断依据。[方法] 基于746份肺结节临床资料,采用关联规则结合贝叶斯网络数据挖掘技术,分析肺结节常见证候中关联较强的症状群及其对该证候诊断的贡献度。[结果] 各常见证候关系密切的症状群及其对证候的贡献度分别为:1)肺气虚证:乏力 & 神疲(0.22);2)肺脾气虚证:咳嗽 & 痰色白(0.27)、咳嗽 & 气短(0.19)、舌苔白腻 & 舌质淡(0.57)、舌质淡 & 脉细弱(0.36)、乏力 & 纳呆(0.14);3)痰浊阻肺证:咳嗽 & 痰色白(0.32)、胸闷 & 气短(0.19)。瘀阻肺络证尚未得到关系密切的症状群。[结论] 基于症状群对常见证候的贡献度,初步确立诊断条件与依据,可为肺结节证候诊断标准的建立提供依据,对瘀阻肺络证有贡献度的症状群有待进一步研究。
关键词肺结节    常见证候    症状    贡献度    诊断依据    

证候是中医认识疾病和临床诊疗的核心,缺乏规范的证候诊断标准是目前制约提供高级别中医药疗效证据的最大障碍[1]。症状是辨识证候的主要依据,症状量化是建立量化证候诊断标准的前提和基础[2]。症状群指同一病症中相伴出现的几个症状组成的集合,可解构复杂的证候,实现症状结构化、体系化,进一步提高诊断的精准度和效度[3-4]。基于已明确的常见证候的主要症状及其主次症,分析常见证候中关联较强的症状群及其对证候诊断的贡献度,对明确证候诊断依据,提高证候诊断标准的诊断效能具有重要价值[5]。团队前期基于文献研究和746例肺结节患者临床调查数据,结合专家咨询等方法,明确了肺结节肺气虚证、肺脾气虚证、痰浊阻肺证、瘀阻肺络证4个常见证候及其主次症[6-7]。本研究在此基础上,采用关联规则结合贝叶斯网络技术,进一步探讨肺结节各证候中症状群对证候的贡献度,初步确立肺结节常见证候诊断依据,为进一步肺结节证候诊断标准的建立提供依据。本研究获得河南中医药大学第三附属医院伦理委员会审查通过(意见号:2021HL-001)。

1 资料与方法 1.1 病例来源

2019年3月—2021年3月在河南中医药大学第三附属医院等3家医院就诊的746例肺结节患者。

1.2 数据挖掘技术 1.2.1 关联规则

通过SPSS Modeler 14.1构建“数据源-类型-Apriori-网络”数据流,将肺结节各常见证候主次症输入关联规则模型,设最小支持度10%,最小置信度55%,指定前项中包含最大项目数为1,构建肺结节各常见证候关联较强的症状组合。

1.2.2 贝叶斯网络

通过SPSS Modeler 14.1软件,以证候为目标变量,主次症为输入变量,生成肺结节各个证候症状间因果关系贝叶斯网模型图,其因果关系强度采用条件概率定量法表示。

1.3 常见症状群及其贡献度的确定

以“关联规则中支持度>10%、置信度>55%及提升度>1的2项关联组合且贝叶斯网络条件概率≥0.30”的症状组合,作为常见症状群。以贝叶斯公式推导得出的每组症状群出现时各证候出现的条件概率,作为证候诊断的贡献度。

2 结果 2.1 肺气虚证 2.1.1 关联规则分析

将已得出的肺气虚证主次症(主症:神疲、气短、乏力、恶风、易感冒、舌质淡、脉弱;次症:脉沉、脉细)输入到关联规则模型中,进行2项关联分析,挖掘关联较强的症状组合,见表 1

表 1 肺气虚证症状间的关联规则 Tab. 1 Association rules in symptoms of lung qi deficiency syndrome
2.1.2 贝叶斯网络判别分析

基于贝叶斯网络模型,得出肺结节肺气虚证中存在直接因果关系的症状及条件概率分布,见图 1表 2

图 1 肺气虚证症状贝叶斯网络图 Fig. 1 Bayesian network of symptoms of lung qi deficiency syndrome
表 2 肺气虚证症状群条件概率 Tab. 2 Conditional probability of symptom group of lung qi deficiency syndrome
2.1.3 常见症状(群)的确定及其对证候诊断的贡献度

乏力 & 神疲1组症状组合满足条件,将其作为肺气虚证中常见症状(群)。通过贝叶斯公式推导,得出症状(群)出现时发生肺气虚证条件概率0.22,为对肺气虚证的诊断贡献度。

2.2 肺脾气虚证 2.2.1 关联规则分析

将已得出的肺脾气虚证主次症(主症:气短、乏力、恶风、大便溏、舌质淡、舌苔白腻、舌体胖大、舌有齿痕、脉细弱;次症:咳嗽、痰色白、纳呆、面色萎黄)输入到关联规则模型中,进行2项关联分析,挖掘关联较强的症状组合,见表 3

表 3 肺脾气虚证症状间的关联规则 Tab. 3 Association rules in symptoms of lung spleen qi deficiency syndrome
2.2.2 贝叶斯网络判别分析

基于贝叶斯网络模型,得出肺结节肺脾气虚证中存在直接因果关系的症状及条件概率分布,见图 2表 4

图 2 肺脾气虚证症状贝叶斯网络图 Fig. 2 Bayesian network of symptoms of lung spleen qi deficiency syndrome
表 4 肺脾气虚证症状群条件概率 Tab. 4 Conditional probability of symptom group of lung spleen qi deficiency syndrome
2.2.3 常见症状(群)的确定及其对证候诊断的贡献度

咳嗽 & 痰色白、咳嗽 & 气短、舌苔白腻 & 舌质淡、舌质淡 & 脉细弱、乏力 & 纳呆5组症状组合满足条件,将其作为肺脾气虚证中常见症状(群)。经贝叶斯公式进一步推导,得出每组症状(群)出现时肺气虚证出现的条件概率,分别为0.27、0.19、0.57、0.36和0.14,作为对肺脾气虚证的诊断贡献度。

2.3 痰浊阻肺证 2.3.1 关联规则分析

将已得出的痰浊阻肺证主次症(主症:咳嗽、痰色白、胸闷、肢体困倦、舌苔白腻、脉滑;次症:纳呆、气短、舌质淡、舌体胖大、舌有齿痕、脉弦)输入到关联规则模型中,进行2项关联分析,挖掘关联较强的症状组合,见表 5

表 5 痰浊阻肺证症状间的关联规则 Tab. 5 Association rules in symptoms of phlegm turbid obstructing the lung syndrome
2.3.2 贝叶斯网络判别分析

基于贝叶斯网络模型,得出肺结节痰浊阻肺证中存在直接因果关系的症状及条件概率分布,见图 3表 6

图 3 痰浊阻肺证症状贝叶斯网络图 Fig. 3 Bayesian network of symptoms of phlegm turbid obstructing the lung syndrome
表 6 痰浊阻肺证症状群条件概率 Tab. 6 Conditional probability of symptom group of phlegm turbid obstructing the lung syndrome
2.3.3 常见症状(群)的确定及对证候诊断的贡献度

咳嗽 & 痰色白,胸闷 & 气短2组症状组合满足条件,将其作为痰浊阻肺证中常见症状(群)。经贝叶斯公式进一步推导,得出每组症状(群)出现时痰浊阻肺证出现的条件概率,分别为0.32和0.19,作为对痰浊阻肺证的诊断贡献度。

2.4 瘀阻肺络证 2.4.1 关联规则分析

将已得出的瘀阻肺络证主次症(主症:舌质暗、舌有瘀斑、舌下静脉迂曲粗乱、面色晦暗;次症:胸闷、脉细、脉涩、脉沉)输入到关联规则模型中,进行2项关联分析,挖掘关联较强的症状组合,显示强关联规则有1条,舌质暗→面色晦暗。

2.4.2 贝叶斯网络判别分析

基于贝叶斯网络模型,得出肺结节瘀阻肺络证中存在直接因果关系的症状及条件概率分布,见图 4表 7

图 4 瘀阻肺络证症状贝叶斯网络图 Fig. 4 Bayesian network of symptoms of syndrome of stasis obstructing lung collateral
表 7 瘀阻肺络证症状群条件概率 Tab. 7 Conditional probability of symptom group of syndrome of stasis obstructing lung collateral
2.4.3 常见症状(群)的确定及其对证候诊断的贡献度

瘀阻肺络证中无满足条件的症状组合的常见症状(群)。无法统计相关症状群及其对证候诊断的贡献度。

2.5 肺结节常见证候诊断依据的初步确立

将以上最终得到的常见症状群作为证候的诊断依据,经贝叶斯公式,进一步得出各常见症状群对证候诊断的贡献度。肺气虚证:乏力 & 神疲。对证候诊断的贡献度为0.22。肺脾气虚证:1)咳嗽 & 痰色白;2)咳嗽 & 气短;3)舌苔白腻 & 舌质淡;4)舌质淡 & 脉细弱;5)乏力 & 纳呆。对证候诊断的贡献度分别为0.27、0.19、0.57、0.36、0.14。痰浊阻肺证:1)咳嗽 & 痰色白;2)胸闷 & 气短。对证候诊断的贡献度分别为0.32、0.19。

3 讨论

辨证论治是中医诊疗疾病的核心,中医证候的规范化研究是促进中医理论现代化及中医药推广的核心内容[8]。近年来,证候诊断的量化、标准化研究日益成为研究的热点与重点,研究者分别基于不同的技术(方法)建立了多种相关证候的诊断标准。李建生等[9]基于长期科研实践,提出证候分类、常见证候的确定、主次症判别、诊断标准建立的形式与依据、诊断标准的建立与考核为建立证候诊断标准的5个关键环节,创建中医证候诊断标准研制技术体系,为证候诊断标准的建立提供了可借鉴的思路与方法。基于已确定的疾病常见证候及其主次症,采用何种技术(方法)建立诊断标准也是证候诊断标准规范化研究中的关键环节[9-10]。近年来,多种数据挖掘方法[11-15]被应用于中医证候研究领域,但既往研究[16-19]多针对单一症状,只考虑单一症状对证候的影响,忽视了一组症状构成的症状群与证候之间的关系,具有一定的局限性[20]。春柳等[21]通过关联规则和贝叶斯网络筛选出新型冠状病毒感染9个常见证候的症状群,进一步通过贝叶斯公式推导出常见症状群对证候的贡献度,为新型冠状病毒感染中医证候诊断标准的建立提供了科学依据。

关联规则可以从由患者症状、舌象、脉象等组成的繁杂数据库内部挖掘出数据之间隐含的关联性,是较为成熟的挖掘相关关系的成熟的技术之一,目前已被广泛应用于中医药研究领域,经过验证被广泛认可[22-27]。基于频率算法的贝叶斯网络结构学习及推理原理与中医辩证思维过程具有良好吻合性[28]。因此,针对中医辨证的复杂性及高度非线性特性,可采用贝叶斯网络处理不确定性知识的方法进行挖掘[29-30]。然而,贝叶斯网络也存在着不能全面体现中医辨证思维能力的不足。将关联规则和贝叶斯网络结合可为有效方法[21]

本研究采用两种数据挖掘方法,结合肺结节患者临床症状较少的现况,将“关联规则中支持度>10%、置信度>55%及提升度>1的2项关联组合且贝叶斯网络条件概率≥0.30”的症状组合作为常见症状群。如肺气虚证关联分析发现乏力神疲,支持度31.90%、置信度66.81%、提升度1.85,提示在肺气虚证中乏力症状的出现能明显提高神疲症状出现的概率;贝叶斯网络显示当乏力作为子节点,神疲、肺气虚证作为父节点,条件概率为0.57,提示在肺气虚证中神疲、乏力同时出现的概率为57%,神疲、乏力关系密切,可能是阐释肺气虚证病因病机的代表性症状群,进一步通过贝叶斯公式推导,得出神疲 & 乏力症状群对肺气虚证的证候诊断贡献度为0.22。联合2种数据挖掘方法,得到对建立肺结节各个常见证候诊断标准具有较好参考价值的症状群及贡献度,其中肺气虚证1组:乏力 & 神疲(0.22);肺脾气虚证5组:咳嗽 & 痰色白(0.27)、咳嗽 & 气短(0.19)、舌苔白腻 & 舌质淡(0.57)、舌质淡 & 脉细弱(0.36)和乏力 & 纳呆(0.14);痰浊阻肺证2组:咳嗽 & 痰色白(0.32)和胸闷 & 气短(0.19)。瘀阻肺络证尚未得到相关症状群及其对证候诊断的贡献度,考虑可能与瘀阻肺络证为兼证有关,尚待进一步研究。

本研究基于团队前期研究已确定的肺结节常见证候及其主次症,采用数据挖掘技术探讨各证候症状群对证候的贡献度,初步确立常见证候诊断条件,一定程度上阐释了证候的内涵并为证候诊断标准的建立提供客观基础。然而,考虑到临床证候诊断多变性、复杂性,仍需结合各证候特点及临床实际,并广泛集成临床专家意见,对证候诊断条件间如何组合进行充分探讨,对该初步诊断条件加以修改、完善和验证。在此基础上,进一步建立具有客观性、规范性的证候诊断标准,以更好地满足临床诊疗需要。

参考文献
[1]
赵晖, 李淳, 李志更. 证候诊断标准研究的关键问题探讨[J]. 中华中医药杂志, 2017, 32(8): 3561-3565.
[2]
赵勇, 邹小娟, 白赟, 等. 证候量化诊断标准的探讨与研究[J]. 世界中西医结合杂志, 2010, 5(4): 354-355. DOI:10.3969/j.issn.1673-6613.2010.04.035
[3]
李凌香, 李亚茹, 秦宇宁, 等. 基于真实世界诊疗数据的失眠症状群分类方法研究[J]. 世界中医药, 2022, 17(5): 635-644. DOI:10.3969/j.issn.1673-7202.2022.05.008
[4]
张佳乐, 张震, 代金刚. 基于症状群的方证对应模式解构与优化[J]. 时珍国医国药, 2020, 31(10): 2442-2444.
[5]
李建生, 春柳, 冯贞贞, 等. 基于关联规则结合贝叶斯网络的症状间关系及其对证候诊断贡献度的研究: 以新型冠状病毒肺炎湿热蕴肺证为例[J]. 中华危重病急救医学, 2020, 32(9): 1045-1050. DOI:10.3760/cma.j.cn121430-20200619-00923
[6]
李建生, 赵虎雷, 周淼, 等. 746例肺结节临床调查的中医常见证候规律研究[J]. 中华中医药杂志, 2022, 37(12): 6995-7001.
[7]
周淼, 赵虎雷, 焦莉, 等. 基于临床调查的肺结节常见证候主次症判定[J]. 中华中医药杂志, 2023, 38(10): 5000-5004.
[8]
刘槟, 张培彤. 建立中医证候量化诊断标准关键步骤的方法学评述[J]. 中医杂志, 2020, 61(24): 2204-2208.
[9]
李建生, 余学庆, 王至婉. 病证结合模式下证候诊断标准建立的关键环节[J]. 中医杂志, 2013, 54(15): 1261-1264.
[10]
李建生, 余学庆, 胡金亮, 等. 中医证候标准建立的思路与方法[J]. 河南中医学院学报, 2004, 19(6): 4-6.
[11]
闫蔷薇, 王至婉, 李海霞. 关联规则技术在中医药中的应用现状及思考[J]. 中医学报, 2019, 34(3): 464-467.
[12]
孙文军, 冯玉桥, 唐启盛. 基于贝叶斯网络的阈下焦虑抑郁中医证候学研究[J]. 中华中医药杂志, 2018, 33(7): 3112-3115.
[13]
郝婷. 基于人工神经网络算法对临床症状进行中医证候分类的研究[D]. 兰州: 兰州大学, 2017.
[14]
董雪燕, 祁烁, 姜苗, 等. 数据挖掘在中医药研究中的应用分析[J]. 环球中医药, 2017, 10(3): 364-368. DOI:10.3969/j.issn.1674-1749.2017.03.034
[15]
谷鑫, 吴承玉, 王嘉. 基于关联规则算法研究慢性肾炎证候与病位病性的相关性[J]. 世界科学技术-中医药现代化, 2020, 22(1): 212-217.
[16]
王至婉, 李羚, 李建生, 等. 基于贝叶斯网络的慢性阻塞性肺疾病急性加重期证候与症状间的关联模式[J]. 中华中医药杂志, 2019, 34(9): 3964-3969.
[17]
王伟杰, 唐晓颇, 王新昌, 等. 基于临床辨证的类风湿关节炎常见中医证候Logistic回归分析[J]. 中华中医药杂志, 2019, 34(2): 807-810.
[18]
王至婉, 闫蔷薇, 李建生, 等. 慢性阻塞性肺疾病急性加重期各证候症状间关联模式研究[J]. 中医杂志, 2018, 59(24): 2120-2125.
[19]
赵艳青, 李青松, 黄丽, 等. 干眼中医证型分布规律及症状相关性研究[J]. 中国中医眼科杂志, 2019, 29(1): 19-24.
[20]
陈蔚文. 证候研究要把握证候的本质特征[J]. 中国中西医结合杂志, 2002, 22(6): 409-410.
[21]
春柳, 冯贞贞, 李建生, 等. 基于症状间关系及其对证候的贡献度初步建立新冠肺炎常见证候诊断依据[J]. 世界科学技术-中医药现代化, 2021, 23(3): 874-882.
[22]
冯贞贞, 谢洋, 春柳, 等. 基于关联规则结合隐结构模型的慢性阻塞性肺疾病稳定期文献的基础证候特征研究[J]. 世界科学技术-中医药现代化, 2021, 23(2): 552-559.
[23]
春柳, 谢洋, 冯贞贞, 等. 基于关联规则结合贝叶斯网络的新型冠状病毒肺炎证素规律的文献研究[J]. 世界科学技术-中医药现代化, 2020, 22(3): 652-657.
[24]
陈丽平, 李建生, 蔡永敏. 基于聚类分析和关联规则的名老中医辨治风温规律研究[J]. 辽宁中医杂志, 2016, 43(10): 2017-2020.
[25]
吴嘉瑞, 王凯欢, 纪凯, 等. 基于数据挖掘的中医治疗糖尿病处方用药规律分析[J]. 中国实验方剂学杂志, 2015, 21(22): 214-217.
[26]
马金辉, 王志飞, 谢雁鸣, 等. 真实世界大数据30034例高血压病住院患者中西医诊疗规律初探[J]. 中国中药杂志, 2014, 39(18): 3435-3441.
[27]
周志焕, 沈莉, 张建勋. 基于关联规则的抑郁症中医用药配伍规律分析[J]. 天津中医药, 2015, 32(2): 117-120.
[28]
蓝鋆, 王晶, 尤圣富, 等. 贝叶斯网络技术在中医证候研究中的运用[J]. 中国中医骨伤科杂志, 2015, 23(2): 70-72.
[29]
朱文锋, 朱咏华, 黄碧群. 采用贝叶斯网络运算进行中医辨证的探讨[J]. 广州中医药大学学报, 2006, 23(6): 449-452. DOI:10.3969/j.issn.1007-3213.2006.06.001
[30]
朱咏华, 朱文锋. 基于贝叶斯网络的中医辨证系统[J]. 湖南大学学报(自然科学版), 2006, 33(4): 123-125. DOI:10.3321/j.issn:1000-2472.2006.04.028
Analysis of common syndromes diagnosis basis of pulmonary nodules based on data mining
SUN Xuege1,2 , ZHAO Hulei1,3 , JIAO Li3,4 , ZHOU Miao3,4 , WANG Zhongchao3,4 , HUANG Yan3,4 , JIANG Yanli3,4 , LIU Yuanyuan3,4 , LI Jiansheng1,2,3     
1. Department of Respiratory Medicine, The First Affiliated Hospital of Henan University of Chinese Medicine, Zhengzhou 450000, China;
2. The First Clinical Medical College, Henan University of Chinese Medicine, Zhengzhou 450000, China;
3. Henan University of Chinese Medicine Respiratory Disease Diagnosis and Treatment and New Drug Research and Development Provincial and Ministry Co-built Collaborative Innovation Center, Henan Key Laboratory of Chinese Medicine for Respiratory Diseases, Zhengzhou 450046, China;
4. Third Affiliated Hospital of Henan University of Traditional Chinese Medicine, Zhengzhou 450004, China
Abstract: [Objective] To preliminarily establish the diagnosis basis for common syndromes of pulmonary nodules. [Methods] The correlation between symptoms and their contribution to common syndromes was analyzed using association rules combined with a Bayesian network based on the clinical data of 746 clinical data of pulmonary nodules. [Results] Among the common syndromes, the closely related symptom groups and their contribution to the syndrome were as follows: 1)lung qi deficiency syndrome: fatigue & spiritual tiredness(0.22); 2) lung spleen qi deficiency syndrome: cough & white phlegm(0.27), cough & shortness of breath(0.19), white greasy tongue fur & thin tongue(0.57), thin tongue & fine weak pulse(0.36), fatigue & poor appetite(0.14); 3) phlegm turbid obstructing the lung syndrome: cough & white phlegm(0.32), chest tightness & shortness of breath(0.19). The syndrome of stasis obstructing lung collateral has not yet obtained a closely related symptom group. Conclusion based on the contribution of symptom clusters to common syndromes, the preliminary establishment of diagnostic conditions and basis can provide an objective basis for the establishment of diagnostic criteria for pulmonary nodules syndromes. The symptom clusters that contribute to the stasis lung collateral syndrome need to be further studied. [Conclusion] Based on the correlated symptom clusters and their contribution to syndromes, the diagnostic basis for common syndromes of pulmonary nodules were formed, which can provide a basis for the establishment of diagnostic criteria for pulmonary nodule common syndromes. However, the symptom clusters that contribute to the stasis lung collateral syndrome need to be further studied.
Key words: pulmonary nodules    common syndrome    symptom    contribution degree    diagnosis basis