收稿日期: 2022-08-10
作者简介:
孟棵(1992-), 男, 硕士研究生在读, 主要研究方向为心血管.
Discussion on the rule and molecular mechanism of traditional Chinese medicine prescription for treatment of myocardial ischemia based on data mining and network pharmacology
Tianjin University of Traditional Chinese Medicine, Tianjin 301617, China
心肌缺血(myocardial ischemia)是常见的病理状态,是指心脏的血液灌注减少,导致心脏的供氧减少,心肌能量代谢不正常,不能支持心脏正常工作的一种病理状态。缺血性心脏病严重危害着人们的身体健康,仅在2010年缺血性心脏病造成700万的病死率,较1990年上升了35%[1]。研究表明,截止到2017年,缺血性心脏病在中国仍是威胁生命的5个主要因素之一,该病每10万人中的平均致残年龄标准较1990年下降了4.6%[2]。
中医在治疗心肌缺血方面也有突出贡献,同时在治疗过程中具有风险小,副作用低,患者经济压力小等优势。网络药理学具有多靶点多成分多靶点多途径的特点,对于研究中医药疗效具有独特的优势。因此本研究采用数据挖掘与网络药理学此案结合的方法探讨中医药治疗心肌缺血的用药规律以及对其分子机制的预测。
1 方法与资料
1.1 方剂来源
登录国家专利网(http://epub.sipo.gov.cn),按照国家专利网格式输入“中药心肌缺血”所得方剂。
1.2 纳排标准
1.2.1 纳入标准
将所有主要治疗心肌缺血的方剂纳入。
1.2.2 排除标准
1) 不以心肌缺血为主要治疗方向的方剂;2)重复方剂;3)大量包含不常见中药或非中药类方剂;4)以食疗为主的食疗食谱。
1.3 中药名称规范
按照《中华人民共和国药典》上的中药名称将所有录入中药进行规范,将“仙灵脾”统一为“淫羊藿”,“土元”统一成“土鳖虫”,“全虫”统一为“全蝎”,“杞果”统一为“枸杞子”等。
1.4 用药规律分析
1.4.1 药频及性味归经分析
将筛选所得的149首方剂中的所有中药输入Microsoft Excel 2016中进行药频统计。
1.4.2 主成分分析
采用R语言版本3.6.0,通过对高维度数据(中药组成)进行正交变换,不断寻找方差最大化的线性组合,最终取方差最大的前几个线性组合作为描述整个数据的关键点。
1.4.3 聚类分析
采用R语言版本3.6.0,通过Kmeans聚类法和分层聚类法对原数据在高维空间中的欧式距离来判断不同观测间的相似度,将相似度接近的观测分为同一类,最终将数据投影至二维空间,以此判断对原数据贡献度大的类别。
1.4.4 关联规则
采用R语言版本3.6.0,通过Apriori算法分析数据变量间的频数发生规律,设置最低支持度为0.05,最小置信度为0.8,分别从三个角度(支持度、置信度、提升度)寻找出变量间关联或相关的关系,并且基于置信度和提升度给出具体规则的可视化图。
1.5 靶点获取与数据集的建立
取药频大于50的4味药物进行网络药理学分析。通过中药系统生物学分析数据库TCMSP(http://lsp.nwu.edu.cn/tcmsp.php),以口服生物利用度(OB),血脑屏障(BBB),类药性(DL)作为药物成分ADME的重要参数,获取上述四味药的化学成分以及作用靶点的信息(OB≥15;BBB≥-0.3;DL≥0.1)。使用Cytoscape3.7构建“药物-成分-靶点”的可视化网络图。同时采用DisGeNET网站(http://www.disgenet.org/)通过搜索疾病关键词“myocardialischemia”,获取治疗心肌缺血的所作用的药物靶点。将药物靶点和疾病靶点取交集获得共有基因。
1.6 PPI关系分析
采用STRING数据库(https://string-db.org/cgi/network.pl)进行蛋PPI网络可视化分析,将药物和疾病的共同基因输入STRING数据库,将物种设置为“人类”进行分析,将结果输入Cytoscape3.71进行可视化网络分析。
1.7 Kegg通路和Go功能的富集分析
将共同基因集输入Enrichr数据库(http://amp.pharm.mssm.edu/Enrichr/),获取药物靶点与疾病靶点的重合基因进行GO功能富集分析和KEGG通路富集分析,其中GO富集分析选择生物过程(biological proces)。富集分析结果选择按校正后的P值从小到大排列。
2 结果
2.1 药频分析
通过纳排标准筛选得出149首方剂,并对药频进行统计,发现丹参、黄芪,川芎,三七用药频次大于50,其中丹参最多为82次。
2.2 主成分分析
在主成分分析中,按照贡献度选取最高的两个维度进行分析,如图 1所示。在第一维度中,贡献度前20的药物多是补气养血,收敛安神之药。而在第二维度中,贡献度前20的药多为滋阴活血、理气走窜之药。同时可以在主成分向量图中可以观察到,在第一维度中,党参的作用效果最强,山楂则在第二维度中作用最明显,黄芪在一、二维度中,均有较强的作用。
2.3 聚类分析
通过聚类分析可以看出,如图 2所示,采用不同算法进行聚类分析,其中左图按贡献度将药物分为4类,其中绿色区域,在可见的2个维度中集中于0点附近,多为加减用药,紫色和蓝色区域则明显有较强重要性,其中紫色区域多是活血化瘀、行气走窜之药;而蓝色区域则多为补气养血、敛阴助阳的药物组成。右图采用层次聚类法同样将所有药物分为4类,其中绿色仍以加减药物为主,紫色以补气活血药居多,红色区域以行气通络药为主,而蓝色区域则以养血安神药为主。
2.4 关联规则分析
在关联规则分析中,如图 3所示,左图表明丹参和酸枣仁等药在用于治疗心肌缺血时经常与其他药联用,而石斛和远志的高置信度则显示了其作为后项经常被关联使用的事实。我们将置信度前30的药对进行观察,如右图所示,研究发现丹参、红花、黄芪、川芎、党参、桃仁这几位药与其他药关联度和提升度最高。
2.5 靶点的获取及数据库的建立
采用在药频分析中用药频率≥50的四味中药“丹参”“黄芪”“川芎”“三七”构建“药物-成分-靶点”的可视化网络分析图,如图 4。将在DisGeNET网站搜索的疾病靶点和药物靶点相交获得共有基因。其中四味药物对应靶点共有240个,疾病靶点共有447个,其中共有基因64个。表 1见开放科学(资源服务)标识码。
2.6 PPI分析
通过STRING数据库与Cytoscape3.7进行可视化分析的PPI网络,如图 5所示,节点颜色越鲜亮说明节点的关联度越高。其中关联度最高的前3位蛋白是白细胞介素-6(IL-6)、血管内皮生长因子A(VEGFA)、基质金属蛋白酶9(MMP9)。
2.7 KEGG通路富集分析和GO富集分析
通过Enrichr数据库过共有基因进行富集分析,根据校正后P值升序取前十条通路进行分析,其中排名第1的是糖尿病并发症中的AGE-RAGE信号通路,其余通路还包括动脉粥样硬化流体剪切力信号通路、癌症信号通路、TNF信号通路等如图 6。在GO功能分析中,根据校正后P值从小到大排列,取前十功能进行分析,其中大多为炎症因子、细胞因子和趋化因子或是血管生成或发育功能,包括细胞对细胞因子刺激的回应、细胞因子介导的信号通路、血管生成的积极调节,炎症反应等,如图 6。
3 讨论
本研究发现,中医理论治疗心肌缺血多采用“补气养血,行气活血”的药物治疗,或以“行气活血”之药加以辅助。同时本研究基于网络药理学方法,发现其中互作水平最高的两个基因为IL-6与VEGFA;在KEGG富集分析中排名前2的通路是糖尿病并发症中的AGE-RAGE信号通路和脉粥样硬化流体剪切力信号通路;GO功能富集分析中大部分功能以炎症、细胞因子和血管功能为主。
IL-6在缺血性心脏疾病的诊断和治疗中有着重大的意义。IL-6在再灌注损伤中表达上升,其表达在溶栓后12~24 h含量可达到峰值[3]。而VEGFA与心血管疾病息息相关,其可以有效提高心脏中血浆酶原活化因子的活性,进而加速细胞外蛋白水解,最终形成新生的毛细血管的作用[4]。VEGFA在动物实验中还被证明可以作为致死性心律失常的诊断标准之一[5]。AGE-RAGE通路的表达与心肌纤维化密切相关,研究表明Ⅱ型糖尿病大鼠的AGE-RAGE的上调与Ⅱ型糖尿病大鼠的心肌纤维化程度程显著正相关[6-8]。此外剪切应力的不良变化不仅可以加快心血管中斑块的形成,而且还可以通过炎症通路来影响基质金属蛋白酶和细胞外基质从而导致心肌和血管的重塑[9]。同时,众多炎症因子的表达也是心肌缺血的重要机制[10],有研究表明重组人白细胞介素-1β(IL-1β)受体拮抗剂,可以抑制实验性急性心肌梗死细胞凋亡[11]。
在中医角度讲,心肌缺血的辨证基本可分为痰瘀痹阻,寒凝心脉,气阴两虚,心阳不振4个证型。其中虚症多为气阴两虚、心阳不振为主[11]。而实证多为气痰瘀痹阻,寒凝心脉为主。笔者从纳入的方剂中分析所得的用药规律可以了解到,中药治疗心肌缺血,对于虚症而言,多以补气养血的药物来滋补心肾,心主血脉,肾纳精气,心肾双补,气血同养;而针对实证来说,多采用活血化瘀,行气通络的药物作为主要治疗手段;从性味归经上来看,多以甘温药物用以滋补,佐以苦寒药物以防滋补太过,体现了中医的平衡理论。
本研究从数据挖掘和网络药理学角度探讨了中药方剂治疗心肌缺血的用药规律与分子机制,其结果具有可靠性,但仍需要临床试验和基础研究对其用药规律和分子机制进行更加科学系统的验证和阐释。