天津中医药  2021, Vol. 38 Issue (7): 885-890

文章信息

杨晓南, 赵铁牛, 王泓午
YANG Xiaonan, ZHAO Tieniu, WANG Hongwu
糖尿病证候的数据挖掘方法概述
Summary of data mining methods of traditional Chinese medicine syndromes on diabetes
天津中医药, 2021, 38(7): 885-890
Tianjin Journal of Traditional Chinese Medicine, 2021, 38(7): 885-890
http://dx.doi.org/10.11656/j.issn.1672-1519.2021.07.15

文章历史

收稿日期: 2021-03-26
糖尿病证候的数据挖掘方法概述
杨晓南1 , 赵铁牛2 , 王泓午2     
1. 天津市红桥区中医医院, 天津 300131;
2. 天津中医药大学, 天津 301617
摘要:[目的] 系统总结运用数据挖掘方法分析糖尿病证候的特征规律。[方法] 归纳近10年采用Logistic回归分析、因子分析、聚类分析、决策树、关联规则、人工神经网络、结构方程模型、贝叶斯网络和支持向量机等数据挖掘方法分析2型糖尿病的文献。[结果] 总结了2型糖尿病的病性要素归纳为气虚、血虚、阴虚和阳虚4种虚证和血热、血瘀、火旺和湿热4种实证,病位要素为肾、肝和脾;主要包括肺热津伤证、胃热炽盛证、气阴两虚证、肾阳虚证、气虚证、痰湿证、血瘀证、肾阴虚证和阴阳两虚证等常见证型,并分析数据挖掘方法的优缺点。[结论] 数据挖掘方法用于糖尿病证候的特征规律的分析是可行的,不仅为糖尿病证候诊断提供客观化依据,还为中医治疗糖尿病提供临床指导。
关键词数据挖掘    糖尿病    证候    决策树    关联规则    

糖尿病是一种因胰岛素分泌缺陷或胰岛素作用受损引发糖、脂肪和蛋白质代谢紊乱的代谢性疾病,其临床特征是患者血糖持续性增高、多饮、多尿、多食及消瘦,导致患者器官和组织受损,危害患者健康。调查表明,中国糖尿病患病率已经达到10.4% [1]。与西医治疗糖尿病的药物常伴不同程度的副作用相比较而言,中医药在辨证论治基础上指导糖尿病正确选方用药,更具有独特的优势。但2型糖尿病的辨证标准不统一和证候术语欠规范等问题却在一定程度上给2型糖尿病的诊治带来一定的难度。近年来,数据挖掘方法在2型糖尿病证候研究中的运用越来越广泛。研究者运用数据挖掘方法从大量的数据资料中挖掘规律和蕴藏的有价值信息,有助于总结糖尿病证候特征和规律。现将有关2型糖尿病证候数据挖掘的文献归纳如下。

1 数据挖掘的概念

数据挖掘是应用统计学、机器学习和模式识别等学科的知识,从已经存在的、不完全的、模糊的、随机的数据中,补齐不完整的数据,在模糊和随机的数据中提取隐含在其中的、人们以往需要依赖经验才能体会的信息和知识的过程[2]。数据挖掘的特征是在没有明确假设的前提下去挖掘信息和发现知识。其优势在于数据挖掘的过程中,根据研究目的进行多角度分析,利用科学且系统化的归类要求对原本混乱的数据库信息进行整合和深层次分析,透过数据表面现象挖掘数据的本质。

2 数据挖掘方法在糖尿病证候研究中的可行性

数据挖掘方法在糖尿病证候研究中有很好的应用前景。糖尿病四诊信息数据包括病因、四诊信息、舌诊、脉诊和实验室检查等数据,可以来源于临床流行病学调查,也可以间接来源于电子病历和实验室检查结果,这些数据与糖尿病证候诊断密切相关。糖尿病具有病因复杂、体征和症状指标较多、危险因素多的特点,调查数据有二分类、多分类数据和定量数据,研究者利用数据挖掘技术强大的处理能力和适用性好的特性,结合糖尿病四诊信息数据和实验室指标,通过数据挖掘辨别证候与症状的关系,归纳糖尿病的辨证规律,有助于丰富中医理论,提高糖尿病证候诊断的准确率,促进中医药产业化和国际化[3]

3 常见的数据挖掘方法 3.1 Logistic回归分析

logistic回归分析是一种概率模型方法,结果变量要求二分类或多项分类,广泛应用于中医证候调查横断面研究和随访研究。张倩采用Logistic回归分析糖尿病周围神经病变患者,发现阴阳两虚证的危险因素是年龄、周围神经症状、病程和舒张压[4]。张倩采用Logistic回归分析糖尿病周围神经病变患者,发现阴虚血瘀证与糖化血红蛋白相关,阳虚血瘀证与尿白蛋白排泄率相关;阴虚风动证与血清总胆固醇和血肌酐相关;痰瘀滞络证与血肌酐相关[5]。范译丹采用Logistic回归分析2型糖尿病患者合并非酒精性脂肪肝患者,发现肝肾阴虚证与三酰甘油和体质指数相关,气阴两虚兼瘀证与三酰甘油相关[6]。Logistic回归的优点对自变量类型不做要求、系数的可解释性等;其缺点是当样本含量过少时,估计的方程不稳定,结果无法解释;也会出现拟合过度的问题,适用于大样本的中医证候临行病学调查资料。

3.2 因子分析

因子分析是由英国心理学家C.E.Spearman提出,以指标间的相关矩阵为基础,探索支配多个指标相关关系的有限个潜在因子的一种非线性多元统计分析方法,是高维度数据降维的一种统计分析方法。因子分析找到能准确反映2型糖尿病症状的潜在因子,将每个因子归纳为某一证候因素,具有指导临床实践的价值。而证候要素是通过辨识证候的病位和病性,来确定证名的基本要素[7]。目前,2型糖尿病尚未形成统一的证候要素共识,多数学者借助因子分析来提取2型糖尿病证候的要素。王佳笑采用因子分析对2型糖尿病合并高血压病患者的症状进行分析,提取7个病性要素:气虚、阴虚、阳虚、血瘀、阳亢、湿痰和热盛[8]。龚燕冰采用因子分析对2型糖尿病患者的症状进行分析,提取出6个病性要素:阴虚、气虚、血瘀、湿热、热盛和气滞,病位为肝、脾、肾[9]。孟庆扬采用因子分析对2型糖尿病合并血脂异常患者的症状进行分析,提取出4个病性要素:阴虚、阳虚、气虚、痰,病位为肾、肝和脾[10]。齐方洲采用因子分析对糖尿病早期微血管病变患者的症状进行分析,提取出11个病性证素:气虚、阴虚、阳虚、热、湿、燥、血瘀、气滞、气郁、气逆和血虚,病位为肾、肝、脾、肺和胃[11]。曹晶晶采用因子分析对糖尿病视网膜病变患者的症状进行分析,提取10种病性要素:阴虚、气虚、血瘀、阳虚、痰、血虚、精亏、气滞、湿和热[12]。赵灵燕采用因子分析糖尿病患者中医四诊信息,提取出阳虚证、阴虚证和气虚证[13]。归纳出2型糖尿病的证候要素以阴虚为本,燥热为标,虚证表现气虚、血虚、阴虚和阳虚4种类型,实证表现为血热、血瘀、火旺和湿热。可以看出,因子分析的优点是根据糖尿病的原始指标的信息进行重新组合,找出影响变量的共同因子,并通过旋转使得因子更具有可解释性,对应于某一证候;其缺点是易出现估计方法选择不当,导致估计结果失真。

3.3 聚类分析

聚类分析根据物以类聚的原理,将本身没有类别的数据聚集成不同的类别,将性质相近的事物归为一类,将性质差别较大的归入不同的类,并对每一个这样的类进行描述的一种统计方法。因此,聚到同一个组中的样本应该彼此相似,而属于不同组的样本应该足够不相似。组内的相似性越大,组间差别越大,聚类就越好。在证候研究中,聚类分析可对疾病的症状和体征等信息进行统计学分析,客观地进行分类。采用聚类分析探索2型糖尿病证候,从数据中挖掘出其自然类别,依据各个指标之间的相关系数,建立有统计学依据的证候关联,把高度的同质性一组症状和体征聚为一类。目前,采用聚类分析对2型糖尿病证候规律分析方面取得一些共识。巩璇采用聚类分析对2型糖尿病患者进行聚类,聚为脾肾气虚证、阴虚热盛证、肝肾阴虚证、阳虚血瘀证和气阴两虚夹痰湿证[14]。牟新采用聚类分析对2型糖尿病患者进行聚类,聚为痰瘀化火证、气阴两虚夹瘀证、肝胃火盛证、肾阳虚证和肝气郁滞证[15]。张志龙采用聚类分析对2型糖尿病患者进行聚类,聚为痰湿血瘀证、阴阳两虚证、血瘀水停证、气阴两虚证、脾虚湿盛证和阴虚热盛证[16]。杨江成采用聚类分析对2型糖尿病患者进行聚类,聚为气虚证、阳虚证和阳虚水泛证[17]。孟庆扬采用聚类分析对2型糖尿病合并血脂异常患者进行聚类,聚为肾阳气虚证、肝肾阴虚夹湿热证、胃气滞证、脾肾阴阳两虚夹心气血虚证和气滞血瘀证[10]。张锦明采用聚类分析对2型糖尿病患者进行聚类,聚为气虚证、阴虚证、血瘀证、湿证和热证[18]。林兰采用聚类分析对2型糖尿病患者进行聚类,聚为阴虚热盛证、气阴两虚证、阴阳两虚证、湿热证、痰湿证、血瘀证和气滞证[19]。周迪夷采用聚类分析对2型糖尿病患者的症状进行聚类,聚为气虚证、阴虚证、气阴两虚证、阴阳两虚证、血瘀证、湿热证和郁热证[20]。聚类分析可以为2型糖尿病证候的分类提供客观依据,具有一定的可行性及科学性。聚类分析的优点是直观、结论形式简明;其缺点是样本量较大时,要获得聚类结论有一定困难,无法准确对应于某一证候。

3.4 决策树

决策树是一种以树结构形式表达进行预测的数据挖掘方法,是证候的量化与客观化研究的数据挖掘工具之一。结点有两种类型:根结点和叶节点。通过从根结点一直到达叶子结点的路径转换,生成简单易懂的分类规则。赵灵燕采用决策树对2型糖尿病检测指标数据进行分析,提取出痰浊证的核心指标是尿素氮、白细胞、平均红细胞体积、超敏C反应蛋白、红细胞和甲状腺素,建立了痰浊证决策树模型,其灵敏度为75.47%、特异度为76.22%,正确率为75.90%[21]。采用决策树分析2型糖尿病痰浊证的检测指标,有利于2型糖尿病证候客观化研究。决策树的优点是能快速地学习证候特征,分类准确率高;训练集数据量较大的情况下,决策树模型效率较高,稳定性好。其缺点是容易过度拟合问题,忽略属性之间的相关性。

3.5 关联规则

关联规则是一种挖掘隐藏在数据集中的不同事件之间的关联和相关性。如果两项或多项事件之间存在关联,那么其中一项的属性可以依靠其他属性值进行预测。关联规则是用来分析症状之间的关系,以支持度与置信度来量化高频症状之间的相互关系,并作为一组关键症状组合来评判糖尿病。赵艳青采用关联规则挖掘出2型糖尿病15组症状群,如口渴喜饮—视物昏花—五心烦热—目睛干涩,五心烦热—气短懒言—口干咽燥等,症状与脉象组合如睛干涩—脉细涩,五心烦热—脉细数,症状与舌象组合如气短懒言—舌胖。采用关联规则辨识糖尿病中医证候,为糖尿病的中医证候分型提供了一种新的研究思路[22]。可以看出,关联规则的优点是可以产生清晰有用的结果;其缺点关联分析输出的规则数量较多,且多数并无利用价值,给关联规则的解释带来难度。

3.6 人工神经网络

人工神经网络以神经元为运算单位,模拟生物神经网络结构与功能的特点,建立算法数学模型对分布式数据并行信息进行处理,完成对信息的加工与处理的一种统计方法。人工神经网络有强大的非线性处理能力,采用合适的学习算法,对糖尿病四诊信息数据进行准确地处理,达到糖尿病证候诊断的目的。近年来,人工神经网络预测2型糖尿病证候是人工智能发展的新趋势,被广泛应用于糖尿病证候数据分析中。采用神经网络建立糖尿病诊断预测模型,可以辅助诊断糖尿病。吴燎采用BP神经网络对糖尿病患者的症状分析,构建糖尿病诊断预测模型,正确率达到95%[23]。可以看出,人工神经网络的优点是具有容错性和自组织性,可学习和自适应不知道或不确定的数据,能够同时处理定量和定性数据;其缺点是把一切问题的特征都变为数字,把一切推理都变为数值计算,其结果易丢失信息;输出结果难以解释,会影响到结果的可信度和可接受程度。

3.7 结构方程模型

采用结构方程模型研究糖尿病证候,把证候看成潜在变量,四诊信息看成外显变量,建立糖尿病证候的预测模型,衡量证候与症状的关系,有助于指导糖尿病证候诊断。柴可夫采用结构方程模型对糖尿病早期微血管病变患者的四诊信息进行分析,构建了气阴两虚证、肝肾阴虚证、湿热困脾证、阴阳两虚证、脾肾阳虚证和脾虚气滞证模型。其中气阴两虚证的症状有气短、心悸、自汗、少气懒言、困倦乏力、视物模糊、两目干涩、盗汗、潮热、烘热、颧红、手足心热和大便干结[24]。孔丽娅采用结构方程模型构建病位证素组合的模型,发现肝脾两脏关系最为密切,脾肾其次,再者肝肾、肝胃、肾胃;阴虚与实热相关性最高[25]。杨晓南采用结构方程模型构建2型糖尿病气阴亏虚证和四诊信息的模型,气阴亏虚证的症状有神疲、四肢乏力、胸闷、自汗、咽干、面色苍白、口干、神疲、舌淡红和脉弱。结构方程模型可以分析证候与症状的关系,为2型糖尿病证候分析提供了客观依据[26]。结构方程模型的优点是允许自变量和因变量存在测量误差,可提供总体模型检验和独立参数估计检验,可处理变量的多重相互关系;其缺点是由于假设误差项不相关,导致结果不能如实反映实际情况。

3.8 贝叶斯网络

贝叶斯网络是一种基于概率推理的图形化网络的统计分析方法。它包括网络结构和概率推理两部分,用概率测度的权重表达变量间的相互关系。贝叶斯网络是由一个节点集合和一个节点间的有向边集合组成的有向无环图,能将不确定的信息进行学习和推理,有助于辨识证候。龚燕冰采用贝叶斯网络分析2型糖尿病合并脑病、肾病、高血压病患者,发现2型糖尿病合并高血压病,空腹血糖、餐后2 h血糖和糖化血红蛋白异常者阴虚为主;2型糖尿病合并脑病,空腹血糖、餐后2 h血糖异常以气虚为主;2型糖尿病合并肾病,空腹血糖异常者以阳虚为主[27]。龚燕冰采用贝叶斯网络分析2型糖尿病患者,发现空腹血糖异常的患者以阴虚热盛多见,餐后2 h血糖异常的患者以阴虚多见,糖化血红蛋白异常的患者以阴虚热盛多见,血脂异常者以气虚为主,血压异常者伴见血瘀[28]。刘瑜采用贝叶斯网络分析2型糖尿病合并脂代谢紊乱病历,发现湿痰、血瘀贯穿2型糖尿病合并脂代谢紊乱始终,主要方剂有丹参饮、玉女煎、生脉散和六味地黄汤[29]。贝叶斯网络可以揭示症状与证候间的复杂关系,有助于早期诊断2型糖尿病。可以看出,贝叶斯网络的优点是具有方向性,用简明的图形方式定性的表示事件之间复杂的因果关系,比较适合于解决中医诊断问题;其缺点是在属性之间相关性较大时,分类效果不好。

3.9 支持向量机

支持向量机是以达到结构风险最小化为原则,通过将非线性数据赋予高维特征性,构造出最优分类超平面的一种统计方法。阚红星采用支持向量机识别2型糖尿病气阴两虚夹瘀证的舌图像,其灵敏度为93.85%,特异度为62.79%,正确率为79.63%[30]。说明采用支持向量机法分类识别舌图像,有助于诊断患者中医证型。支持向量机的优点是在小样本高维数据上具有分类精度高的特点,解决二分类识别问题,可有效弥补传统算法中维数过多的缺陷;其缺点是容易出现过拟合问题,对缺失数据敏感。支持向量机用于解决小样本、非线性及高维模式识别的问题。

4 结语

近几年,中国2型糖尿病具有病因复杂和危险因素多的特点,其患病率呈现逐年增高的趋势。中医药在治疗糖尿病患者方面发挥了重要作用,中医临床医生和科研人员以全新的视角利用数据挖掘方法分析糖尿病症状与证候、实验室与证候指标之间的关系,分析糖尿病证候与症状之间的关联,揭示糖尿病数据蕴藏的规律,尤为重要。目前,尽管存在2型糖尿病的辨证标准不统一和证候术语欠规范等诸多问题,很多学者已经达成2型糖尿病的证候特征研究的共识。2型糖尿病的虚证表现气虚、血虚、阴虚和阳虚,实证表现为血热、血瘀、火旺和湿热,主要包括肺热津伤证、胃热炽盛证、气阴两虚证、肾阳气虚证、气虚证、痰湿证、血瘀证、肾阴亏虚证和阴阳两虚证等常见证型。学者以中医理论为基础,采用数据挖掘技术分析2型糖尿病的证候特征,以客观数据的形式辅助医生进行糖尿病证候识别,为临床医生诊疗服务提供了科学依据,从而提高糖尿病证候诊断的准确性和客观性,促进现代医学和中医学有效融合,有助于2型糖尿病证候研究规范化和科学化,为其他疾病证候研究提供了新的思路。

参考文献
[1]
中华医学会糖尿病学分会. 中国2型糖尿病防治指南(2017年版)[J]. 中华糖尿病杂志, 2018, 10(1): 4-67.
Diabetes branch of Chinese Medical Association. Guidelines for the prevention and treatment of type 2 diabetes in China (2017 edition)[J]. Chinese Journal of Diabetes, 2018, 10(1): 4-67. DOI:10.3760/cma.j.issn.1674-5809.2018.01.003
[2]
宋万清. 数据挖掘[M]. 北京: 中国铁道出版社, 2019: 2-3.
SONG W Q. Data mining[M]. Beijing: China Railway Publishing House, 2019: 2-3.
[3]
DAI Z G, HAN Y Y. Study on application of data mining technology in syndrome differentiation of TCM[J]. Advanced Materials Research, 2013, 765-767: 282-285. DOI:10.4028/www.scientific.net/AMR.765-767.282
[4]
张倩, 梁晓春, 孙青, 等. 糖尿病周围神经病变的中医证候特点研究[J]. 中华中医药杂志, 2012, 27(6): 1522-1525.
ZHANG Q, LIANG X C, SUN Q, et al. Study on the characteristics of syndrome of traditional Chinese medicine for diabetic peripheral neuropathy[J]. China Journal of Traditional Chinese Medicine and Pharmacy, 2012, 27(6): 1522-1525.
[5]
张倩, 梁晓春, 王超, 等. 660例糖尿病周围神经病变患者中医证型及临床特点分析[J]. 中国中西医结合杂志, 2017, 37(1): 62-67.
ZHANG Q, LIANG X C, WANG C, et al. Syndrome types of traditionalChinese medicine and clinical characteristics of 660 patients with diabetic peripheral neuropathy[J]. Chinese Journal of Integrated Traditional and Western Medicine, 2017, 37(1): 62-67.
[6]
范译丹, 华杰, 范源. 2型糖尿病患者合并非酒精性脂肪肝与血脂异常及中医辨证分型的关系[J]. 现代中西医结合杂志, 2019, 28(18): 1955-1958, 1963.
FAN Y D, HUA J, FAN Y. Relationship between non-alcoholic fatty liver disease and dyslipidemia and TCM syndrome differentiation in patients with type 2 diabetes mellitus[J]. Modern Journal of Integrated Traditional Chinese and Western Medicine, 2019, 28(18): 1955-1958, 1963. DOI:10.3969/j.issn.1008-8849.2019.18.005
[7]
吴敏, 朱成晟, 施荣伟, 等. 2型糖尿病中医证素研究进展[J]. 中国中医药信息杂志, 2013, 20(7): 106-107.
WU M, ZHU C S, SHI R W, et al. Research progress on TCM syndrome elements of type 2 diabetes mellitus[J]. Chinese Journal of Information on Traditional Chinese Medicine, 2013, 20(7): 106-107. DOI:10.3969/j.issn.1005-5304.2013.07.049
[8]
王佳笑, 赵时鹏, 倪青, 等. 运用因子分析法探索2型糖尿病合并高血压病中医证候要素分布特点[J]. 陕西中医, 2015, 36(2): 155-157.
WANG J X, ZHAO S P, NI Q, et al. Exploration on the distribution characteristics of TCM syndrome elements of type 2 diabetes mellitus complicated with hypertension by using factor analysis[J]. Shaanxi Journal of Traditional Chinese Medicine, 2015, 36(2): 155-157. DOI:10.3969/j.issn.1000-7369.2015.02.013
[9]
龚燕冰, 罗增刚, 高思华, 等. 运用因子分析方法探索2型糖尿病证候要素及其靶位特征[J]. 中医杂志, 2011, 52(13): 1100-1102.
GONG Y B, LUO Z G, GAO S H, et al. Exploration on thesyndrome elements and target characteristics of type 2 diabetes mellitus by using factor analysis[J]. Journal of Traditional Chinese Medicine, 2011, 52(13): 1100-1102.
[10]
孟庆扬, 马建伟, 董静, 等. 基于因子与聚类分析的2型糖尿病合并血脂异常中医证素特点及辨证分型研究[J]. 解放军医药杂志, 2015, 27(9): 30-33.
MENG Q Y, MA J W, DONG J, et al. A Study on characteristics of TCM syndrome factors and syndrome differentiation types of type 2 diabetes mellitus patients with dyslipidemia by factor analysis and cluster analysis[J]. Medical & Pharmaceutical Journal of Chinese People's Liberation Army, 2015, 27(9): 30-33.
[11]
齐方洲, 孔丽娅, 马纲, 等. 基于聚类和因子分析的糖尿病早期微血管病变证素研究[J]. 中华中医药杂志, 2017, 32(2): 794-797.
QI F Z, KONG L Y, MA G, et al. Researoh on TCM syndrome elements of early diabetic microangiopathy based on cluster and factor analysis[J]. China Journal of Traditional Chinese Medicine and Pharmacy, 2017, 32(2): 794-797.
[12]
曹晶晶, 杨卫杰, 曹轶. 糖尿病视网膜病变的中医证候要素研究[J]. 中医学报, 2017, 32(229): 939-941.
CAO J J, YANG W J, CAO Y. Study on the syndrome elements of traditional Chinese medicine about diabetic retinopathy[J]. Acta Chinese Medicine, 2017, 32(229): 939-941.
[13]
赵灵燕, 毕力夫, 陈建新, 等. 2型糖尿病中医证候要素诊断量表的研制及考评[J]. 北京中医药大学学报, 2018, 41(10): 848-853.
ZHAO L Y, BI L F, CHEN J X, et al. Development and evaluation of the TCM pattern element diagnostic scale for type 2 diabetes mellitus[J]. Journal of Beijing University of Chinese Medicine, 2018, 41(10): 848-853. DOI:10.3969/j.issn.1006-2157.2018.10.010
[14]
巩璇, 马建伟, 董静, 等. 基于聚类分析的2型糖尿病中医证候规律研究[J]. 解放军医药杂志, 2015, 27(9): 24-28.
GONG X, MA J W, DONG J, et al. A study based on cluster analysis for the regularity of type 2 diabetes mellitus syndromes[J]. Medical & Pharmaceutical Journal of Chinese People's Liberation Army, 2015, 27(9): 24-28.
[15]
牟新, 周迪夷, 庄爱文, 等. 2型糖尿病和糖尿病肾病人群的中医证候演变规律[J]. 中华中医药杂志, 2016, 31(9): 3707-3710.
MOU X, ZHOU D Y, ZHUANG A W, et al. Evolution rules of TCM syndrome of patients with type 2 diabetes and diabetic nephropathy[J]. China Journal of Traditional Chinese Medicine and Pharmacy, 2016, 31(9): 3707-3710.
[16]
张智龙, 陈宏, 吉学群, 等. 2型糖尿病慢性并发症中医证候特点分析[J]. 中医杂志, 2011, 52(16): 1379-1382, 1386.
ZHANG Z L, CHEN H, JI X Q, et al. Characteristics of TCM syndromes of chronic complications of typeⅡdiabetes[J]. Journal of Traditional Chinese Medicine, 2011, 52(16): 1379-1382, 1386.
[17]
杨江成, 辛梅芳, 姜淑蓉, 等. 50例糖尿病早期肾病患者的中医证候及聚类情况分析[J]. 光明中医, 2017, 32(7): 921-923.
YANG J C, XIN M F, JIANG S R, et al. Analysis of TCM syndromes and clustering of 50 cases of early diabetic nephropathy[J]. Guangming Journal of Chinese Medicine, 2017, 32(7): 921-923. DOI:10.3969/j.issn.1003-8914.2017.07.001
[18]
张锦明, 田滢舟, 赵玲. 基于"动-定序贯"理论浅析新诊断2型糖尿病中医证候及病机特点[J]. 中医学报, 2016, 31(212): 44-46.
ZHANG J M, TIAN Y Z, ZHAO L. Diagnosis of type 2 diabetes syndromes and pathogenesis based on the theory of "moving-sequential sequential"[J]. Acta Chinese Medicine, 2016, 31(212): 44-46.
[19]
林兰, 倪青, 庞健丽, 等. 基于数据挖掘技术的2型糖尿病辨证规范前瞻性研究[J]. 中国中医药信息杂志, 2011, 18(7): 9-12.
LIN L, NI Q, PANG J L, et al. Prospective study on specification of syndrome differentiation of type 2 diabetes[J]. Chinese Journal of Information on Traditional Chinese Medicine, 2011, 18(7): 9-12. DOI:10.3969/j.issn.1005-5304.2011.07.004
[20]
周迪夷, 赵进喜, 牟新, 等. 基于"症"的2型糖尿病中医证候聚类分析[J]. 中华中医药杂志, 2012, 27(12): 3121-3124.
ZHOU D Y, ZHAO J X, MOU X, et al. Cluster analysis of syndrome differentiation types of type 2 diabetes mellitus based on symptoms[J]. Chinese Journal of Traditional Chinese Medicineand Pharmacy, 2012, 27(12): 3121-3124.
[21]
赵灵燕, 毕力夫, 张亚军, 等. 基于决策树方法的2型糖尿病患者痰浊证与临床指标关联模式的建立[J]. 世界中西医结合杂志, 2014, 9(3): 297-299, 318.
ZHAO L Y, BI L F, ZHANG Y J. Establishment of the associated model between turbid phlegm syndrome and clinical indicators in the patients of diabetes type 2 based on decision tree method[J]. World Journal of Integrated Traditional and Western Medicine, 2014, 9(3): 297-299, 318.
[22]
赵艳青, 李青松, 项敏泓, 等. 糖尿病视网膜病变中医证候分布规律及症状相关性研究[J]. 中国中药杂志, 2017, 42(14): 2796-2801.
ZHAO Y Q, LI Q S, XIANG M H, et al. Distribution of traditional Chinese medicine syndromes of diabetic retinopathy and correlation between symptoms[J]. China Journal of Chinese Materia Medica, 2017, 42(14): 2796-2801.
[23]
吴燎, 程小恩. 基于共轭梯度下降算法的BP神经网络的中医糖尿病诊断模型研究[J]. 电脑知识与技术, 2019, 15(23): 218-220.
WU L, CHENG X E. Study on TCM diabetes diagnosis model based on BP neural network with conjugate gradient descent algorithm[J]. Computer Knowledge and Technology, 2019, 15(23): 218-220.
[24]
柴可夫, 孔丽娅, 马纲, 等. 基于结构方程模型的糖尿病早期微血管病变的证型研究[J]. 中华中医药杂志, 2016, 31(9): 3522-3524.
CHAI K F, KONG L Y, MA G, et al. Research on syndromes of early diabetic microangiopathy based on structural equation modeling[J]. China Journal of Traditional Chinese Medicine and Pharmacy, 2016, 31(9): 3522-3524.
[25]
孔丽娅, 齐方洲, 柴可夫, 等. 基于多元统计分析方法的糖尿病早期微血管病变的证候规律探析[J]. 浙江中医药大学学报, 2015, 39(9): 654-661.
KONG L Y, QI F Z, CHAI K F, et al. Based on multivariate statistical analysis method of early diabetic microvascular disease syndromes law analysis[J]. Journal of Zhejiang Chinese Medical University, 2015, 39(9): 654-661.
[26]
杨晓南, 刘宝忠, 闫丽辉, 等. 基于结构方程模型的2型糖尿病气阴亏虚证实证研究[J]. 中国中医药信息杂志, 2016, 23(9): 28-31.
YANG X N, LIU B Z, YAN L H, et al. Empirical study on qi-yindeficiency syndrome of type 2 diabetes based on structural equation model[J]. Chinese Journal of Information on Traditional Chinese Medicine, 2016, 23(9): 28-31. DOI:10.3969/j.issn.1005-5304.2016.09.007
[27]
龚燕冰, 倪青, 高思华, 等. 2型糖尿病不同并发症中医证候与血糖相关性的贝叶斯网络分析[J]. 北京中医药大学学报, 2009, 32(12): 815-818.
GONG Y B, NI Q, GAO S H, et al. Bayesian network analysis on correlation between TCM syndromes and plasma glucose changes in different complications of type 2 diabetes[J]. Journalof Beijing Universityof Chinese Medicine, 2009, 32(12): 815-818. DOI:10.3321/j.issn:1006-2157.2009.12.006
[28]
龚燕冰, 倪青, 高思华, 等. 2型糖尿病主要理化指标与中医证候相关性的贝叶斯网络分析[J]. 中华中医药杂志, 2010, 25(1): 31-33.
GONG Y B, NI Q, GAO S H, et al. Bayesian network analysis on relevance between main physical and chemical indicators and symptoms of TCM in type 2 diabetes[J]. China Journal of Traditional Chinese Medicine and Pharmacy, 2010, 25(1): 31-33.
[29]
刘瑜, 倪青, 王佳笑, 等. 数据挖掘探讨2型糖尿病合并脂代谢紊乱治证规律[J]. 西部中医药, 2016, 29(9): 91-95.
LIU Y, NI Q, WANG J X, et al. Exploration on the laws of syndrome and treatment for type two diabetes mellitus complicated with lipid metabolism disorder by data mining[J]. Western Journal of Traditional Chinese Medicine, 2016, 29(9): 91-95. DOI:10.3969/j.issn.1004-6852.2016.09.028
[30]
阚红星, 张璐瑶, 董昌武. 一种2型糖尿病中医证型的舌图像识别方法[J]. 中国生物医学工程学报, 2016, 35(6): 658-664.
KAN H X, ZHANG L Y, DONG C W. A tongue image recognition method based on type Ⅱ diabetes traditional Chinese medicine syndrome classification[J]. Chinese Journal of Biomedical Engineering, 2016, 35(6): 658-664. DOI:10.3969/j.issn.0258-8021.2016.06.003
Summary of data mining methods of traditional Chinese medicine syndromes on diabetes
YANG Xiaonan1 , ZHAO Tieniu2 , WANG Hongwu2     
1. Tianjin Hongqiao District Hospital of Traditional Chinese Medicine, Tianjin 300131, China;
2. Tianjin University of Traditional Chinese Medicine, Tianjin 301617, China
Abstract: [Objective] To systematically summarize and analyz ethe characteristics of diabetes syndrome by using data mining method. [Methods] The literature of the characteristicson type 2 diabetes using data mining methods such as Logistic regression analysis, factor analysis, cluster analysis, decision tree, association rule, artificial neural network, structural equation model, Bayesian networks, and support vector machines in the past 10 years was summarized in this paper. [Results] The pathogenic elements of type 2 diabetes are summarized as four types of deficiency syndromes: qi deficiency, blood deficiency, yin deficiency and yang deficiency, and four excess syndromes of blood heat, blood stasis, fire prosperity, and damp-heat. The disease location elements are kidney, liver and spleen. It mainly include the syndrome of lung heat and fluid injury, the syndrome of stomach heat flourishing, the syndrome of qi and yin deficiency, the syndrome of kidney yang deficiency, the syndrome of qi deficiency, the syndrome of phlegm dampness, the syndrome blood stasis, the syndrome of kidney yin deficiency, the syndrome of yin and yang deficiency, and analyzes the advantages and disadvantages of data mining methods. [Conclusion] The data mining method is feasible for the analysis of the characteristics of diabetes syndrome. It not only provides objective basis for the diagnosis of diabetes syndrome, but also provides clinical guidance for TCM treatment of diabetes.
Key words: data mining    diabetes    traditional Chinese medicine syndrome    decision tree    correlation analysis