天津中医药  2020, Vol. 37 Issue (11): 1268-1274

文章信息

蔡慧姿, 张明妍, 牛柏寒, 李凯, 张俊华
CHUA Hui Zi, ZHANG Mingyan, NIU Baihan, LI Kai, ZHANG Junhua
中医药治疗慢性心力衰竭随机对照临床试验评价指标分析
Evaluation index analysis of randomized controlled clinical trials of traditional Chinese medicine in treating chronic heart failure
天津中医药, 2020, 37(11): 1268-1274
Tianjin Journal of Traditional Chinese Medicine, 2020, 37(11): 1268-1274
http://dx.doi.org/10.11656/j.issn.1672-1519.2020.11.15

文章历史

收稿日期: 2020-06-20
中医药治疗慢性心力衰竭随机对照临床试验评价指标分析
蔡慧姿1,2 , 张明妍2 , 牛柏寒2 , 李凯2 , 张俊华2     
1. 新加坡;
2. 天津中医药大学循证医学中心, 天津 301617
摘要:[目的] 对已发表的中医药治疗慢性心力衰竭(CHF)随机对照试验(RCTs)采用的疗效评价指标进行分析,为构建慢性心力衰竭的核心指标集提供基础数据。[方法] 计算机检索8个数据库,搜集中医药干预的CHF的RCTs。中文数据库为CNKI、WanFang、VIP、SinoMed;英文数据库为PubMed、Cochrane Library、EMBASE、Web of Science。论文发表年份限定为2018年。由2名研究者严格根据标题和摘要筛选所有纳入研究,并按照纳入和排除标准选择相关研究进行进一步评估。如有分歧,由第三方协商解决。资料提取包括纳入研究的基本信息、研究对象的基线特征、干预措施、结局指标及不良反应。[结果] 最终纳入157个RCTs,共计17 459位患者,平均样本量为111,共涉及138个疗效评价指标。单个研究采用指标数量为1~13个,平均为6个。使用频次排前15位的指标依次为:超声心动图、临床疗效、NT-proBNP/BNP、不良反应、6 min步行试验、心功能(分级)疗效、中医证候积分、中医证候疗效、生活质量评分量表、心衰(计分)疗效、生命体征、C反应蛋白(CRP)、中医症状积分、肿瘤坏死因子-α(TNF-α)、白介素-6(IL-6)。指标存在的主要问题:不同研究采用的指标及数量均存在较大差异,且相同指标测量时间与测量方法也存在差异;指标报告信息不完整性,连续性变量被转成等级资料以百分比率报告;指标缺乏实用性,存在脱离临床需求问题,且远期预后及安全性指标使用不足。[结论] 中医药治疗CHF临床试验评价指标存在差异大、不规范、不实用等问题,需要开展核心指标集研究,以提高相关临床研究的方法学质量及临床价值。
关键词中医药    慢性心力衰竭    结局指标    核心指标集    随机对照试验    

慢性心力衰竭(CHF)是各种心脏疾病的严重和终末阶段,发病率高,最常见于老年人[1]。中医药对慢性心力衰竭的各个分期治疗具有一定的优势,但需要通过对相关指标的测量和分析来体现。选择科学合理的结局指标不仅可用于评估干预措施的效果、预测疾病对患者的影响,也可以支持循证临床医疗决策,减少研究资源的浪费[2-3]。针对临床试验中评价指标在选择、测量与报告中存在的问题,如缺乏规范化、一致性及实用性,国际学术组织(COMET)推动开展核心指标集(COS)研究[4]。COS即在某特定医疗保健领域中所有临床试验必须测量和报告的、最少、最重要的指标集合[5]。天津中医药大学循证医学中心张俊华教授团队率先提出开展中医药核心指标集研究,以解决中医药临床试验指标存在的诸多问题[6]。本研究以中医药治疗CHF为样本,对2018年发表的中医药治疗CHF随机对照临床试验(RCT)进行分析,收集统计相关结局指标并分析存在的问题,为构建中医药治疗慢性心力衰竭核心指标集(COS-CHF)提供依据。

1 资料与方法 1.1 文献检索

计算机检索CNKI、WanFang Data、VIP、SinoMed、PubMed、Cochrane Library、EMBASE和Web of Science 8个数据库。文献发表日期限定为2018年。检索采用主题词与自由词相结合的方式检索。中文库检索词为“心衰”“心力衰竭”“临床试验”“临床研究”“临床观察”“临床评价”“临床调查”“随机对照试验”“中医”“中药”。英文库检索词为“heart failure”“cardiac failure”“heart decompensation”“right sided heart failure”“myocardial failure”“left sided heart failure”“congestive heart failure”“Chinese medicine”“traditional Chinese medicine”“herbal medicine”“zhongyi”“zhongyao”,限制“article type:clinical trial”。

1.2 纳入与排除标准

1)研究类型:RCT,排除非人类研究。2)研究对象:临床试验中明确纳入符合CHF诊断的患者,排除其他疾病或合并其他疾病的研究。3)干预措施:中医药相关疗法,包括中药方剂(汤剂、颗粒剂、膏剂)与中成药(包括注射液),可单独使用中医药或中医药加西医治疗,排除以针灸、推拿、穴位敷贴等为干预措施的研究。4)对照组措施:不做限制。5)结局指标:不限定任何评价指标。

1.3 资料提取

由2名研究者严格根据标题和摘要筛选所有纳入研究,并按照纳入和排除标准选择相关研究进行进一步评估。如有分歧,由第三方协商解决。通过审查纳入研究后,两名研究者独立进行资料提取,并交叉检查数据。缺乏的资料尽量与原作者联系予以补充。进行资料提取是采用预先设计的Access表格提取,提取信息主要包括:

1)文题、第一作者名称、发表年份。2)研究对象的人口学特征如年龄、性别等,以及临床特征如病程、疾病严重程度、西医诊断标准、中医证候、中医诊断标准等。3)干预措施如药物名称、给药方式、疗程、频次、用量等。4)结局指标如测量方法、时间点、指标的属性、疗效判断标准等。5)安全性指标,包括不良反应、不良事件等。

2 结果 2.1 文献筛选流程

初检共获得1 289篇相关文献,剔除重复文献后,通过文题和摘要初筛715篇文献。根据纳入排除标准,经阅读全文复筛后最终纳入157个RCTs,其中155篇为中文文献,2篇为英文文献,见图 1

图 1 文献筛选流程 Fig. 1 Literature search and selection process
2.2 纳入研究基本信息 2.2.1 样本量

157个RCT研究中共包含17 459例患者,年龄30~86岁。样本量为40~1 125例,平均每项研究的样本量为111例。

2.2.2 病程

报告病程的研究有86项(86/157,54.8%),71个研究未报告病程。具体病程为1个月~26年。

2.2.3 严重程度

共有100项(100/157,63.7%)说明了CHF的严重程度,57个研究未报告严重程度。其中92项(92/100,92%)以美国纽约心脏病学会(NYHA)心功能分级(Ⅰ~Ⅳ级)报告严重程度,分别有Ⅰ~Ⅳ级(3项)、Ⅰ~Ⅲ级(3项)、Ⅱ~Ⅲ级(34项)、Ⅱ~Ⅳ级(46项);28项以左室射血分数(LVEF)比值描述严重程度,分别有LVEF≥45%(5项)、LVEF<50%或LVEF≤45%(9项)、LVEF<45%(14项)。

2.2.4 中医证型

89个(56.7%)研究报告了中医证型,分为虚证(23项)、虚实夹杂证(62项)、邪实证(6项)3大类。其中有2个研究记录了多过1个中医证型(气虚血瘀型、心肾阳虚型;气虚血瘀水停型、气阴两虚兼血瘀水停型、心肾阳虚兼血瘀水停型)。气虚血瘀型(19/89,21.3%)、阳气虚型(14/89,15.7%)、阳虚水泛型(12/89,13.5%)为CHF最常见的3个中医证型。

2.2.5 干预措施

干预措施为中药方剂和中成药,分别有114个RCTs给予中药方剂(96个为汤剂,16个为颗粒剂,2个为膏剂)、39个RCTs给予中成药(22个为口服制剂,17个为注射液)、3项同时给予2种剂型(汤剂+注射液,口服中成药+汤剂,汤剂+中成药粉剂)。

2.2.6 疗程

除4项研究未报告疗程相关信息,其余153项RCT研究均对试验疗程进行描述。疗程跨度为7 d~6个月,具体分布为:≤2周有30个(19.6%),2~4周有59个(38.6%),1~2个月有31个(20.3%),2~6个月有33个(21.6%)

3 评价结局指标情况 3.1 指标域及归类

将提取的指标名称进行规范化、统一化处理,在保证原意不变的情况下进行规范表述,如体温、心率、呼吸、呼吸频率、脉搏、血压、心胸比例、总抗氧化能力、氧合指数、二氧化碳分压都可统一规范为“生命体征”;或对同一指标不同表达方式进行合并,如将心衰症状疗、心衰总疗效、心衰积分、Lee氏心衰计分、心力衰竭症状积分、NYHA心功能疗效分级统一称为“心衰疗效”;或将同一类指标可统一合并,如ST-T改变、动态心电图、心电图疗效归为“心电图指标”。经规范及剔除重复性指标后,将138个指标最终规范为97个指标,以指标的功能属性为依据,按照中医证候/症状、症状体征、理化检查、生活质量、远期预后、安全性事件和经济学评估7个域进行归类[7],见图 2

图 2 CHF临床评价指标分类 Fig. 2 Classification of clinical evaluation outcomes for CHF
3.2 指标频次

纳入的157项研究共报告138个结局指标,单个研究指标数量最少为1个,最多达13个,平均每个研究结局指标的数量为6个,采用≥7个结局指标有61项研究(38.9%)。仅有1项研究(英文)按照主要与次要指标来报告。2个研究报告远期预后指标(终点事件、心力衰竭再住院率)和1个研究报告经济学评估指标(成本分析、治疗效果分析、成本-效果分析、贴现率分析、不贴现率分析)。

根据指标采用的频次进行排序,前15位的评价指标依次为:超声心动图、临床疗效、NT-proBNP/BNP、不良反应、6 min步行试验、心功能(分级)疗效、中医证候积分、中医证候疗效、生活质量评分量表、心衰(计分)疗效、生命体征、CRP、中医症状积分、TNF-α、IL-6。在118项研究(75.2%)应用超声心动图指标中,测量射血分数(LVEF、EF)共有111项,测量心脏重构指标(LVEDD、LVESD、LVESV、LVST等)及血流动力学(E/A、SV、CO、CI等)则有83项。见表 1

表 1 使用率排前15位的CHF结局指标 Tab. 1 Top 15 utilization rate of CHF outcomes
3.3 有效性指标组合使用情况

在157项研究中,有152个研究同时使用2~11个指标。在2~5个指标同时使用最常被应用的组合如以下:80个研究(51.0%)同时使用超声心动图、临床疗效2个指标;51个研究(32.5%)同时使用超声心动图、临床疗效、NT-proBNP/BNP 3个指标;15项研究(9.6%)同时使用超声心动图、临床疗效、NT-proBNP/BNP、6min步行试验4个指标;4个研究选用超声心动图、临床疗效、NT-proBNP/BNP、6 min步行试验、生活质量评分量表 5个指标;4个研究用超声心动图、NT-proBNP/BNP、6 min步行试验、心功能(分级)疗效、生活质量评分量表 5个指标。见表 2

表 2 有效性指标组合(排位前三)使用情况 Tab. 2 Usage of combination of effectiveness outcomes (Top 3)
3.4 有效性指标测量时间点

排列前5位的有效性指标测量时间点如下:1)超声心动图:118项研究测量时间点有13个,其中40个研究(33.9%)选择以治疗4周后为测量时间点,其次为8周后(19/118,16.1%)、治疗2周后(18/118,15.3%)及治疗3个月后(17/118,14.4%)。其中3项研究未记录测量时间点。2)临床疗效:共有13个测量时间点。在107项研究中报告最多的测量时间点为治疗4周后(38/96,39.6%),其次为治疗2周后(21/96,21.9%),3项研究测量时间点不详。3)NT-proBNP/BNP:93项研究报告时间点为7 d~6个月,以治疗4周后(41/93,44.1%)为最常用的测量时间点,其次为治疗2周后(16/93,17.2%)及治疗8个月后(13/93,14.0%)。其中1项研究报告需测量治疗7、30、60 d后的NT-proBNP/BNP指标。4)6 min步行试验:全部报告了测量时间点,为治疗7 d~3个月后。其中最多报告为治疗4周后(18/46,39.1%)、其次治疗8周后(10/46,21.7%),其余时间点选择较少。5)心功能(分级)疗效:全部报告了测量时间点,为治疗10 d~4个月后。多过一半测量心功能(分级)疗效的研究都使用了治疗4周后(40%)及治疗8周后(20%)两个测量时间点。将近95%的研究报告心功能分级依据NYHA[8]的标准,即Ⅰ~Ⅳ级。

从指标测量时间点数据可以看出,最常用的测量时间点为治疗4周后,其次为治疗8周后或2周后。而在以上5个有效性指标的研究,使用治疗≥ 3个月后的测量时间点<17%(4~17个研究),因较少数研究采用远程观察结局指标。测量时间点多为基线和疗程结束,仅有2个研究设置多个测量时间点,其中有1个研究设置了3个测量时间点(7 d、1个月、2个月后)。

3.5 安全性指标

少于一半的研究(23/55,41.8%)明确报告说明安全性相关指标的具体内容。报告的不良反应,可分为过敏反应、呼吸系统、消化道系统、心脏相关、生化指标相关、症状体征、死亡及疾病复发率。最常见的不良反应(≥3个研究)有皮疹、消化道反应、恶心或伴呕吐、头晕头痛、咽干干咳。

4 讨论

研究通过系统搜索8个数据库(4个中文、4个英文),对已发表的文献报告的中医药治疗CHF临床疗效评价指标进行整理、分类及统计,以指标的功能属性为依据,分为中医证候/症状、症状体征、理化检查、生活质量、远期预后、经济学评估、安全性事件7个指标域[7]进行归纳,将杂乱的信息变为有序的资料,为CHF指标域和条目池的形成奠定基础。本研究对所有评价指标统计分析,发现原始研究中采用的指标存在较多问题。

4.1 指标数量差异问题

研究纳入的157 RCTs中评价指标的数量存在较大差异,单个研究使用的指标少则1个,最多可达13个。采用≥7个结局指标有61项研究(38.9%)。此外,仅有一项研究设定了1个主要与5个次要结局指标,其余156个研究对主要与次要指标概念不明确,未对选择评价指标分为主要与次要指标。

4.2 指标表达规范性问题

1)指标表达不准确性,如NYHA心功能分级、射血分数值、血流动力学值、症状体征等均用“心功能疗效”作为指标报告。2)指标连续性变量被转变为百分率或分类变量报告,如LVEF、心衰疗效(Lee氏心衰计分)、6 min步行试验、中医证候积分、中医症状积分、临床疗效等连续性变量指标在研究中被转化为等级资料。如“中医症状积分”多以分为显效、有效、无效、加重/恶化等不同等级,最后多以总有效率的形式进行描述,判断有效的标准也不统一,甚至有5项研究把心功能(分级)疗效及中医证候积分(连续变量)2个指标配合计算在临床疗效指标,转为等级的总有效率形式。这种不规范的指标报告表达方式抹除原始数据,对数据再应用或与其他同类研究合并分析均不利。

4.3 指标测量时间点问题

本研究纳入的157个研究方案,3个研究未对指标测量时间点进行报告,其余研究大多测量时间点以基线和疗程结束时,有7个研究设置测量随访后,也有2个研究在疗程内进行测量一段时间,如10~14 d内进行测量。纳入的157个研究报告的测量时间点时间跨度大,如“超声心动图”、“临床疗效”2个指标测量时间点多达13个,时点跨越度从治疗后7 d到6个月,不利于同类研究合并分析。

4.4 临床价值问题

临床研究结果应充分回应临床价值或实用性。数据完整性和报告透明度对于确保临床试验数据得到适当利用至关重要[9]。纳入的研究方案中,有91个研究(58%)未报告指标测量方法,相同指标采用的测量方法也不一致,如测量NT-proBNP/BNP的方法有酶联免疫吸附法(ELISA)、酶脱联免疫吸附法、化学发光法、免疫发光法、BNP-Triage仪器等。仅有28项研究明确对CHF射血分数的不同分级作为诊断标准,而这种数据不完整性会影响CHF不同分级时选择侧重评价哪些指标,不利于选择临床有价值的指标。本次研究评价的结局指标主要以中间指标为主,如理化或生化指标等,而远期终点事件或心衰再住院率(2个研究,1.9%)、生活质量(22个研究,14%)等临床重要指标较少使用。中医药临床试验应强调体现与中医证候或含有中医特色相关的结局指标[10]。对于中医药相关指标问题,仅有31个研究使用中医药相关的指标(中医症状积分或疗效、中医证候积分或疗效等),68个研究(43.3%)未报告中医证型及中医诊断依据,明显忽视中医四诊合参特色,缺乏重视中医药特色的结局指标。

由于本研究为初步探讨中医药治疗CHF临床试验结局指标的现状,样本为已发表文献的RCT,缺乏临床对照试验与病例报告指标分析,仅纳入2018年整年发表的文献,导致样本的代表性有一定的局限性。因本次研究未对纳入的文献进行报告指标方法的可行性与质量评估,所以无法评估纳入的临床研究测量和实用性方面。笔者将会通过检索国外(ClinicalTrials.gov)及国内中国临床试验注册中心(ChiCTR)两个临床试验注册库、增加纳入临床对照与病例报告文献类型,并选择多个年份文献补充研究,再进行对比分析,通过文献资料遴选中医药治疗CHF核心指标集初始条目池提供标准及规范化建议。

5 小结

本次文献研究发现原始研究中采用的指标存在诸多问题,如指标普遍存在指标数量差异大,组合使用随意化,且相同指标存在测量时点差异明显[10];连续性变量转成等级资料以百分比率报告,导致原始数据丢失;以理化检查等中间指标为主,缺少生活质量、远期预后及经济性评价指标,缺乏被公认的中医药特色评价指标。因此,需要加快研制中医药治疗CHF核心指标集。这将可以减少报告的异质性,提高临床试验评估的质量和透明度,并支持临床试验数据的合成,不仅利于提高临床试验的质量,也利于不同研究结果的比较和合并分析,减少研究浪费[11]

参考文献
[1]
中华医学会心血管病学分会心力衰竭学组, 中国医师协会心力衰竭专业委员会与中华心血管病杂志编辑委员会. 中国心力衰竭诊断和治疗指南2018[J]. 中华心力衰竭和心肌病杂志(中英文), 2018, 46(4): 196-225.
Heart Failure Group of Chinese Society of Cardiology of Chinese Medical Association, Chinese Heart Failure Association of Chinese Medical Doctor Association, Editorial Board of Chinese Journal of Cardiology. Chinese guidelines for the diagnosis and treatment of heart failure 2018[J]. Chinese Journal of Heart Failure and Cardiomyopathy, 2018, 46(10): 760-789.
[2]
CHANG S, NEWTON P J, INGLIS S, et al. Are all outcomes in chronic heart failure rated equally? An argument for a patient-centred approach to outcome assessment[J]. Heart Failure Reviews, 2014, 19(2): 153-162.
[3]
CHALMERS I, GLASZIOU P. Avoidable waste in the production and reporting of research evidence[J]. Lancet, 2009, 374(9683): 86-89. DOI:10.1016/S0140-6736(09)60329-9
[4]
WILLIAMSON P R, ALTMAN D G, Bagley H, et al. The COMET handbook:version 1.0[J]. Trials, 2017, 18(3): 280.
[5]
KIRKHAM J J, GORST S, ALTMAN D G, et al. COS-STAR:a reporting guideline for studies developing core outcome sets (protocol)[J]. Trials, 2015, 16: 373. DOI:10.1186/s13063-015-0913-9
[6]
邢冬梅, 张俊华, 张伯礼. 中医临床研究核心结局指标集形成路径[J]. 中华中医药杂志, 2014, 29(5): 1352-1355.
XING D M, ZHANG J H, ZHANG B L. Formation path of core outcome index set in clinical research of traditional Chinese medicine[J]. China Journal of Traditional Chinese Medicine and Pharmacy, 2014, 29(5): 1352-1355.
[7]
张明妍, 张俊华, 张伯礼. 2015年中药治疗稳定性心绞痛临床试验结局指标文献研究[J]. 中国中西医结合杂志, 2018, 38(2): 191-197.
ZHANG M Y, ZHANG J H, ZHANG B L. Outcome measures of clinical trials of stable angina pectoris treated by Chinese medicine in 2015:Literature research[J]. Chinese Journal of Integrated Traditional and Western Medicine, 2018, 38(2): 191-197.
[8]
YANCY C W, JESSUP M, BOZKURT B, et al. 2013 ACCF/AHA guideline for the management of heart failure:a report of the American College of Cardiology Foundation/American Heart Association Task Force on Practice Guidelines[J]. Circulation, 2013, 16(62): 147-239.
[9]
WHITEHEAD L, PERKINS G D, CLAREY A, et al. A systematic review of the outcomes reported in cardiac arrest clinical trials:The need for a core outcome set[J]. Resuscitation, 2015(88): 150-157.
[10]
ZHANG L, ZHANG J H, CHEN J, et al. Clinical research of traditional Chinese medicine needs to develop its own system of core outcome sets[J]. Evidence-based Complementary and Alternative Medicine, 2013(2013): 202703.
[11]
杨丰文, 季昭臣, 张明妍, 等. 中医药临床研究浪费原因及对策[J]. 中国循证医学杂志, 2018, 18(11): 1212-1215.
YANG F W, JI Z C, ZHANG M Y, et al. Causes and countermeasures of waste in clinical research of Chinese medicine[J]. Chinese Journal of Evidence-Based Medicine, 2018, 18(11): 1212-1215.
Evaluation index analysis of randomized controlled clinical trials of traditional Chinese medicine in treating chronic heart failure
CHUA Hui Zi1,2 , ZHANG Mingyan2 , NIU Baihan2 , LI Kai2 , ZHANG Junhua2     
1. Singapore;
2. Evidence Based Medicine Center, Tianjin University of Traditional Chinese Medicine, Tianjin 301617, China
Abstract: [Objective] To analyze the efficacy evaluation indexes in randomized controlled trials (RCTs) of chronic heart failure (CHF) published in recent years (focusing on year 2018), using traditional Chinese medicine (TCM) as an intervention, to provide fundamental data for the development of core outcome set (COS) for CHF using TCM treatment. [Methods] Online search of 8 databases including CNKI, WanFang Data, VIP, SinoMed (4 Chinese databases), PubMed, Cochrane Library, EMBASE and Web of Science (4 English databases) were searched to collect RCTs of CHF intervened by TCM in 2018. Two reviewers independently screened selected literature and extracted data according to the inclusion and exclusion criteria. Any discrepancy in the study selection was resolved by discussion with a third reviewer. Basic information, baseline characteristics, intervention measures, outcome measures and adverse events were extracted. [Results] A total of 157 RCTs were included, involving 17 459 patients and 138 efficacy evaluation indicators. The number of outcomes used in a single study was 1 to 13, with an average of 6. After frequency analysis, the top 15 outcomes were:echocardiography, clinical efficacy, NT-proBNP/BNP, adverse events, 6min walking test, cardiac function (classification) efficacy, scores of TCM syndrome, TCM syndrome efficacy, quality of life rating scale, heart failure scores, vital signs, CRP, TCM symptom score, TNF-α and IL-6. The main problems of indicators are as follows:the number of outcomes used in different studies varied greatly, with the measurement time and method of the same outcome are also different; incomplete reporting of information for outcomes in the included studies, with the continuous variables being converted to ranked ordinal data or reported in percentages; outcomes reported also show a lack of practicability, with a lack of usage on long-term prognosis and safety outcomes. [Conclusion] Outcomes reported in clinical trials of TCM for CHF vary greatly, with a lack of standardization and practicality. Hence, it is necessary to develop COS to improve the methodological quality and clinical value of relevant clinical studies.
Key words: traditional Chinese medicine    chronic heart failure    outcome indicator    core outcome set    randomized controlled trial