MathJax.Hub.Config({tex2jax: {inlineMath: [['$','$'], ['\\(','\\)']]}}); 药用动物乌梢蛇线粒体基因组全序列分析
  天津中药大学学报  2016, Vol. 35 Issue (3): 187-191

文章信息

刘杰, 田晓轩, 崔英, 朱彦
LIU Jie, TIAN Xiao-xuan, CUI Ying, ZHU Yan
药用动物乌梢蛇线粒体基因组全序列分析
Analysis of mitochondrial genome of Ptyas dhumnades
天津中药大学学报, 2016, 35(3): 187-191
Journal of Tianjin University of Traditional Chinese Medicine, 2016, 35(3): 187-191
http://dx.doi.org/10.11656/j.issn.1673-9043.2016.03.10

文章历史

收稿日期: 2016-02-24
药用动物乌梢蛇线粒体基因组全序列分析
刘杰, 田晓轩, 崔英, 朱彦     
天津中医药大学, 天津市现代中药重点实验室-省部共建国家重点实验室(培育), 天津 300193
摘要: 目的 获取药用动物乌梢蛇线粒体基因组全序列。 方法 采用Ion Torrent PGM技术,对乌梢蛇全基因组DNA进行提取测序,采用MIRA方法从头组装方法和近缘种mapping方法进行组装拼接,应用MITOS等方法进行注释。 结果 获得17 162 bp乌梢蛇线粒体基因组全序列。其共编码22个tRNA,13个蛋白编码基因,2个rRNA(16S rRNA、12S rRNA)并有1个轻链(L链)复制起始区。 结论 获取乌梢蛇线粒体基因组全序列,并可用于该药用动物的资源调查与保护研究。
关键词乌梢蛇     线粒体基因组     线粒体DNA     序列分析    
Analysis of mitochondrial genome of Ptyas dhumnades
LIU Jie, TIAN Xiao-xuan, CUI Ying, ZHU Yan     
Tianjin University of Traditional Chinese Medicine, Tianjin State Key Laboratory of Modern Chinese Medicine, Tianjin 300193, China
Abstract: Objective To investigate the complete mitochondrial genome of medical animal Ptyas dhumnades (Cantor, 1842). Methods The Ion Torrent PGM technique was chosed to sequence genomic DNA of Ptyas dhumnades, and then the strategy of de novo assembly and mapping versu mtgenome of closely related species by MIRA 4.0 was adopted to get the complete mitochondrial sequence. This genome was annotated by Online server MITOS etc. Results The 17 162 bp complete mitochondrial genome of Ptyas dhumnade with high coverage contains 22 transfer RNA, 13 protein coding genes, 2 ribosomal RNA genes and 1 putative L-strand replication origin. Conclusion The mtgenome of Ptyas dhumnades was obtained, and could be furher applied in the resources survey and protection of this medical animal.
Key words: Ptyas dhumnades     mitochondrial genome     mitochondrial DNA     sequence analysis    

乌梢蛇Ptyas dhumnades(Cantor,1842)在分类上属于蛇亚目(Serpentes)游蛇科(Colubridae)游蛇亚科(Colubrinae)鼠蛇属(Ptyas)。历史上,其异名包括Zaocys dhumnad(Cope,1860),Ablabes vittatus(Duméril,Bibron & Duméril,1854) 及Coluber dhumnades(Cantor,1842) 等,后被归入Ptyas[1-2]。本物种俗名中国鼠蛇(Chinese rat snake)、大眼鼠蛇(Big-eyed rat snake),或俗称过山刀。该物种主要分布于中国,生存于海拔50~1 570 m的区域,在河北、河南、山西、陕西、甘肃、四川、湖北、湖南、江西、江苏、福建、云南、贵州、广东、广西、台湾等省份均有发现[3]。乌梢蛇属无毒蛇类,其分类除去内脏的干燥体,有祛风、通络、止痉的功效,常用于治疗风湿顽痹、抽搐痉挛、瘰疠恶疮等症[4]。其分类特征包括头部鳞呈黑褐色,脊背耸立成屋脊状,背鳞有端窝两个,行数为偶数等[5-6]。近年来,基于CYTB及CO1基因序列以及高特异性聚合酶链式反应(PCR)的乌梢蛇分子鉴定方法也得到建立与应用[7-9]

动物线粒体基因组包含了从分子序列到基因结构的全面信息,其基因组成排列相对保守,具母系遗传特征,且易于扩增测序[10],被广泛用于动物系统发育,以及种群保护等领域研究。蛇类的线粒体基因组编码2个rRNA、22个左右的tRNA和13个蛋白,1~2个非编码的控制区,并常包括1个轻链复制起始区。本文采用Ion torrent PGM二代测序技术[11],获得了乌梢蛇线粒体DNA全序列,此为国内外有关鼠蛇属动物线粒体基因组的首次公开报道。

1 材料与方法 1.1 动物

乌梢蛇购于福建福州,并经形态学及CO1基因分子鉴定。取新鲜肌肉组织立即使用。Voucher ID为wss-1。

1.2 总DNA提取

参照经典的酚氯仿抽提方法,获得总基因组DNA,并经A260/A280粗略估计浓度及纯度。

1.3 Ion Torrent PGM高通量测序 1.3.1 鸟枪法建库

鸟枪法是指将目的DNA随机打断成大小不同的片段,再将这些片段的序列连接起来的测序方法。

1.3.2 OneTouch(油包水PCR)

每个微小磁珠通过接头连接相应的DNA片段,然后把含有DNA片段的磁珠和扩增试剂的溶液注入矿物油中,形成了油包水的小体系,使得每个小水滴只含一个磁珠,每个小水滴就是一个微反应体系。通过扩增,DNA片段可以增加几百万个拷贝,并且都连接在磁珠上。

1.3.3 ES富集

油包水PCR之后,加入Dynabeads® MyOneTM Streptavidn C1 beads,它通过亲和素-生物素与带有双链模板的磁珠结合,最后加入氢氧化钠(NaOH)使得双链解链,制备单链模板。

1.3.4 PGM上机测序

将带有单链模板的磁珠、测序引物、DNA聚合酶混匀,离心使其进入318芯片的微孔中,然后上机测序。

1.4 序列拼接

从测序服务器上下载鸟枪法文库测序的原始数据至本地,预处理过滤掉低质量序列、过短序列以及错误序列,根据目的基因组大小(约16K bp),分割文件,调整合适的覆盖倍数(基因组大小的20X为佳),使用MIRA 4.0进行de novo拼接,结合近缘物种mapping组装,经反复迭代补全控制区(重复区)后,进行最高质量碱基合意,得到合意后的完整线粒体全基因组序列。

1.5 注释分析和提交

使用MITOS server线粒体在线注释系统[12],对全序列进行注释,结合tRNAscan-SE 1.21软件,进行tRNA定位。以游蛇亚科Elaphe anomala,Elaphe bimaculata,Oligodon ningshaanensisEuprepiophis perlacea的线粒体基因组全序列为参照,对蛋白质编码基因、tRNA、rRNA及控制区等进行注释,L链复制起始区二级结构由RNA structure折叠生成。使用软件MEGA 4.0及Bioedit等统计序列总长、碱基组成和GC含量等。完整的乌梢蛇线粒体基因组全序列经Sequin注释后,提交GenBank,登录号为KR812112。

2 结果 2.1 序列拼接结果

获取乌梢蛇线粒体基因组后,经bowtie2比对[13],确认共189 977条序列(reads)可拼接至该基因组,序列平均长度214.4 bp,测序深度达1 958倍。

2.2 整体结构

乌梢蛇线粒体基因组结构见图 1表 1。与大多数脊椎动物类似,乌梢蛇共编码37个基因,包括了22个tRNA,13个蛋白编码基因,2个rRNA(16S rRNA、12S rRNA)并有1个轻链(L链)复制起始区。其中除ND6和8个tRNA(Ala、Asn、Cys、Gln、Glu、Pro、Ser和Tyr)由L链编码,其余28个基因均由重链(H链)编码。其基因的排布顺序与大部分游蛇类动物相同。

图 1 乌梢蛇线粒体基因组结构图 ND 1~6/4l:NADH dehydrogenase subunit 1~6/4l;ATP6/8:ATP synthase F0 subunit 6/8;CO 1-3:cytochrome c oxidase subunit I-III;CYTB:cytochrome b;箭头方向表示基因的转录方向;曲线示各个位点GC含量。
表 1 乌梢蛇线粒体基因组结构
名称 起始位置 终止位置 长度
(bp)
反密码子 起始密码子 终止密码子 间隔( + )
/重叠(-)
tRNA-Phe H 1 61 61 GAA
12S rRNA H 62 982 921
tRNA-Val H 983 1 045 63 TAC
16S rRNA H 1 046 2 526 1 481
ND1CDS H 2 527 3 490 964 ATA T--
tRNA-Ile H 3 491 3 558 68 GAT
control region 2 H 3 559 4 580 1 022
tRNA-Leu H 4581 4 653 73 TAA
tRNA-Gln L 4 655 4 725 71 TTG +1
tRNA-Met H 4 727 4 790 64 CAT +1
ND2 CDS H 4 791 5 820 1 030 ATT T--
tRNA-Trp H 5 821 5 885 65 TCA
tRNA-Ala L 5 886 5 950 65 TGC
tRNA-Asn L 5 951 6 022 72 GTT
rep origin H 6 023 6 055 33
tRNA-Cys L 6 056 6115 60 GCA
tRNA-Tyr L 6116 6 178 63 GTA
CO1CDS H 6 180 7 781 1 602 GTG AGA +1
tRNA-Ser L 7 772 7 838 67 TGA -10
tRNA-Asp H 7 839 7 901 63 GTC
CO2CDS H 7 903 8 587 685 ATG T-- +1
tRNA-Lys H 8 588 8 650 63 TTT
ATP8CDS H 8 652 8 810 159 ATG TAA +1
ATP6CDS H 8 801 9 481 681 ATG TAA -10
CO3CDS H 9 481 10 264 784 ATG T-- -1
tRNA-Gly H 10 265 10 325 61 TCC
ND3CDS H 10 326 10 668 343 ATT T--
tRNA-Arg H 10 669 10 732 64 TCG
ND4LCDS H 10 733 11 023 291 ATG TAA
ND4CDS H 11 023 12 359 1 337 ATG TA- -1
tRNA-His H 12 360 12 424 65 GTG
tRNA-Ser H 12 425 12481 57 GCT
tRNA-Leu H 12 479 12 549 71 TAG -3
ND5CDS H 12 550 14316 1 767 ATG TAG
ND6CDS L 14313 14819 507 ATG TAG -4
tRNA-Glu L 14 829 14 890 62 TTC +9
CYTBCDS H 14 891 16 007 1 117 ATG T--
tRNA-Thr H 16 008 16 075 68 TGT
tRNA-Pro L 16 076 16 137 62 TGG
control region 1 H 16 138 17 162 1 025
2.3 碱基组成

乌梢蛇线粒体基因组全长17 162 bp,其中L链的碱基含量为:A=5 932 bp(34.6%),C=4 843 bp(28.2%),G=2 139 bp(12.5%),T=4 248 bp(24.8%),GC=6 982 bp(40.7%),A > C > T >G,AT% > GC%。且呈AT偏斜(0.165)和CG偏斜(0.387),这也与蛇类普遍情况相同。

2.4 蛋白编码基因

乌梢蛇线粒体基因组中蛋白编码基因全长11 267 bp,约占全基因组的65.65%。A=3 967 bp(35.2%),C=3 298 bp(29.3%),G=1 267 bp(11.2%),T=2 735 bp(24.3%),GC=4 565 bp(40.5%),A > C > T >G,AT% > GC%。所有蛋白编码基因无内含子。除ND1以ATA为起始密码子,ND2和ND3以ATT起始,CO1以GTG起始外,其余均使用ATG为起始密码子。除CO1以AGA为终止密码子,ND5和ND6以TAG终止,其余蛋白均使用T或TA碱基终止,并通过转录过程中3’端的poly A补全,形成完整终止密码子。氨基酸使用频率的分析见表 2。在一共3 747个氨基酸中,出现频率较低的为Cys(0.77%)、Asp(1.52%)和Arg(1.65%),而频率较高的为Leu(14.87%)和Thr(12.09%)。

表 2 乌梢蛇线粒体基因组蛋白编码基因氨基酸组成分析
基因及氨基酸名称 Ala Cys Asp Glu Phe Gly His Ile Lys Leu Met Asn Pro Gln Arg Ser Thr Val Trp Tyr
ND1 21 1 3 11 14 17 3 19 8 61 22 15 21 8 7 25 39 6 8 12
ND2 24 1 2 5 7 9 7 36 11 49 29 16 19 5 4 30 67 5 10 7
CO1 36 4 13 9 45 45 18 46 12 62 34 19 32 7 9 35 42 30 19 16
CO2 16 3 8 17 7 10 9 14 3 27 12 6 13 12 6 14 23 15 5 8
ATP8 1 0 1 0 1 0 2 3 3 9 5 1 6 2 1 0 11 1 3 2
ATP6 13 2 1 6 9 8 4 19 5 42 21 12 14 6 3 15 28 11 3 4
CO3 14 1 5 9 19 19 16 15 7 34 11 3 11 6 4 16 30 18 12 11
ND3 5 1 3 5 5 5 1 17 2 21 5 6 8 2 1 3 16 2 3 3
ND4L 7 2 1 2 4 3 3 9 3 18 8 2 2 2 1 7 12 9 0 1
ND4 31 4 3 10 20 15 11 36 12 82 41 14 24 15 9 30 58 8 9 13
ND5 36 3 9 12 23 25 18 61 24 81 50 37 26 17 8 43 84 11 10 10
ND6 5 5 2 3 14 18 0 10 3 28 6 3 2 2 3 12 4 35 5 8
CYTB 22 2 6 5 30 20 14 37 9 43 20 21 21 7 6 29 39 17 12 12
sum 231 29 57 94 198 194 106 322 102 557 264 155 199 91 62 259 453 168 99 107
% 6.16 0.77 1.52 2.51 5.28 5.18 2.83 8.59 2.72 14.87 7.05 4.14 5.31 2.43 1.65 6.91 12.09 4.48 2.64 2.86
2.5 rRNA和tRNA基因

乌梢蛇的12S rRNA和16S rRNA长度分别为921 bp和1 481 bp,GC含量分别为44.7%和40.2%。22个tRNA基因中,最短的为tRNA-Ser(anticodon=GCT,57 bp),最长的为tRNA-Leu(anticodon=TAA,73 bp)。大部分tRNA可折叠成三叶草二级结构,但tRNA-Ser(anticodon=GCT)折叠后缺失D臂,tRNA-Cys缺失TΨC环,见图 2

图 2 tRNA-Ser(anticodon=GCT),tRNA-Cys及L链复制起始区二级结构图 A:tRNA-Ser(anticodon=GCT);B:tRNA-Cys;C:L链复制起始区
2.6 非编码区

乌梢蛇的1号控制区(control region 1)位于tRNA-Pro与tRNA-Phe之间,2号控制区(control region 2)位于tRNA-Ile与tRNA-Leu(anticodon=TAA)之间,长度分别为1 025 bp和1 022 bp,比对后发现两者一致碱基为1 018 bp,一致率为99.5%。除控制区外,乌梢蛇线粒体基因组中有14 bp的6个非编码间隔区域,其中最长的间隔区为9 bp,位于ND6和tRNA-Glu之间,显示该物种线粒体基因组结构较为紧凑。

2.7 L链复制起始区

乌梢蛇基因组的L链复制起始区,长度为33 bp,可折叠成稳定的茎环结构,见于图 2C。其中茎由9对碱基组成,环为11个碱基。

3 讨论

线粒体全基因组测序方法,在以往多基于PCR技术[14],该方法需根据目标物种的近缘物种,设计合适引物,进行普通PCR或Long-PCR( > 4 kb),并对扩增产物进行测序或步移测序。而近年来,随着高通量测序技术的成熟,测序成本的大幅下降,更多的目光集中在利用总基因组DNA测序结果,从中筛选拼接线粒体基因组序列[15-17]。本实验即采取后者策略,建立了基于高通量测序结果的线粒体基因组拼接工作流程。此方法可快速、低成本的得到目标物种的高深度线粒体基因组,并避免PCR过程中产生的碱基错配可能。

在系统发育学研究中,线粒体中蛋白编码区以及tRNA区的结构变化应用较多。而另一方面,控制区(重复区)序列由于受进化压力较小,其碱基替换速率较快,这对药用动物的种下研究尤有意义。与其他真蛇类动物类似,本研究同样在结构紧凑的线粒体基因组中,发现了两个控制区序列,其形成原因尚无定论。但已有研究发现,蛇类中这两个控制区在同一物种内相似度很高,而不同的物种间又有较大的分歧。这提示了其可能是协同进化的结果[18]

中药资源的研究是目前中药研究的热点问题,较多的工作集中在药用植物上[19-20],而动物上开展较少。通过线粒体基因组数据的累积,研究以上双控制区序列在种内(种群间)的变化,也可作为研究药用蛇类种群分化的分子标记,为药用蛇类的资源普查及保护提供参考。

参考文献
[1] David P, Vogel G. The Snakes of Sumatra:an annotated checklist and key with natural history notes[M]. Germany:Frankfurt am Main:Chimaira, 1996.
[2] David P, Das I. On the grammar of the gender of Ptyas Fitzinger, 1843(Serpentes:Colubridae)[J]. Hamaddryad, 2004, 28 (1-2) : 113–116.
[3] 李军德, 黄璐琦, 曲晓波. 中国药用动物志[M]. 福州: 福建科学技术出版社, 2013
[4] 国家药典委员会. 中华人民共和国药典(一部)[S]. 北京:中国医药科技出版社, 2010.
[5] 宋秀菊. 动物乌梢蛇的鉴别[J]. 时珍国医国药, 2012, 23 (7) : 1824.
[6] 林喆, 胡丽娜, 李娜. 动物药整理研究——乌梢蛇[J]. 吉林中医药, 2009, 29 (11) : 982–984.
[7] 廖婧, 梁镇标, 张亮, 等. 常见药用蛇类的DNA条形码研究[J]. 中国药学杂志, 2013, 48 (15) : 1255–1260.
[8] 唐晓晶, 冯成强, 黄璐琦, 等. 高特异性PCR方法鉴别乌梢蛇及其混淆品[J]. 中国药学杂志, 2007, 42 (5) : 333–336.
[9] 王义权, 周开亚, 徐珞珊, 等. 中药材乌梢蛇及其混淆品的DNA序列分析鉴别[J]. 药学学报, 1999, 34 (1) : 68–72.
[10] Wolstenholme DR. Animal mitochondrial DNA:structure and evolution[J]. Int Rev Cytol, 1992, 141 (6) : 173–216.
[11] Morinha F, Clemente C, Cabral JA, et al. Next-generation sequencing and comparative analysis of Pyrrhocorax pyrrhocorax and Pyrrhocorax graculus (Passeriformes:Corvidae) mitochondrial genomes[J]. Mitochondrial DNA, 2014 (28) : 1–4.
[12] Bernt M, Donath A, Juhling F, et al. MITOS:improved denovo metazoan mitochondrial genome annotation[J]. Mol Phylogenet Evol, 2013, 69 (2) : 313–319.
[13] Langmead B, Salzberg SL. Fast gapped-read alignment with Bowtie 2[J]. Nat Methods, 2012, 9 (4) : 357–359.
[14] Zardoya R, Suárez M. Sequencing and phylogenomic analysis of whole mitochondrial genomes of animals[J]. Methods in Molecular Biology, 2007, 422 : 185–200.
[15] Tang M, Tan M, Meng G, et al. Multiplex sequencing of pooled mitochondrial genomes-a crucial step toward biodiversity analysis using mito-metagenomics[J]. Nucleic Acids Res, 2014, 42 (22) : e166.
[16] Gillett CP, Crampton-Platt A, Timmermans MJ, et al. Bulk de novo mitogenome assembly from pooled total DNA elucidates the phylogeny of weevils (Coleoptera:Curculionoidea)[J]. Mol Biol Evol, 2014, 31 (8) : 2223–2237.
[17] Hahn C, Bachmann L, Chevreux B. Reconstructing mitochondrial genomes directly from genomic next-generation sequencing reads——a baiting and iterative mapping approach[J]. Nucleic Acids Res, 2013, 41 (13) : e129.
[18] Jiang ZJ, Castoe TA, Austin CC, et al. Comparative mitochondrial genomics of snakes:extraordinary substitution rate dynamics and functionality of the duplicate control region[J]. BMC Evol Biol, 2007 (7) : 123.
[19] 李天祥, 李国辉, 张春艳, 等. 天津黄精属植物的资源考察[J]. 天津中医药, 2013, 30 (12) : 749–753.
[20] 田春雨, 薄海美, 许静, 等. 唐山山区野生药用植物资源及其分布组成特点的初步研究[J]. 天津中医药, 2014, 31 (1) : 56–58.