人类染色体结构变异研究

中国科技纵横 / 2018年09月13日 00:18

新闻

...no开发新一代染色体结构分析变异产品

李超

摘 要:人类染色体结构变异是多种疾病产生的根源,研究人体中结构变异对癌症和相关基因疾病的治疗具有十分重要的意义。本文介绍了人类染色体结构变异的主要情况,总结了目前已有的性能优良的结构变异检测方法,并分析了结构变异研究所面临的主要挑战。

关键词:染色体;结构变异;检测

中图分类号:Q343.2,S565.1 文献标识码:A 文章编号:1671-2064(2017)10-0188-02

1 染色体结构变异

1.1 染色体结构变异简介

染色体的结构变异 (Genomic structural variants, SVs),是人类基因变异的一个主要来源[1],同时结构变异也是一些常见疾病产生的主要原因。虽然基因组中的结构变异并不如单核苷酸多态(single nucleotide polymorphisms, SNPs)[2]更加常见,但是由于它比起SNPs有更大的尺寸及更复杂的结构,使其在染色体组的变异中扮演着更重要的角色。

结构变异的类型主要包括两类,一类是不改变基因片段拷贝数目的平衡性结构变异(balanced structural variation),另一类是改变基因片段拷贝数目的非平衡性结构变异(unbalanced structural variation)[3]。基本类型的结构变异主要包括删除(deletions)、插入(Insertion)、倒位(Inversions)、易位(Translocations)、随即复制(Duplications)和拷贝数变异(Copy-Number Variants)[4]。基于这几种基本类型的结构变异,在实际情况中会出现一个变异包含多种基本类型变异的情况,例如倒位易位,甚至更复杂的情况。通常情况下,一个结构变异在序列中的长度约为1Kb到3Mb。

1.2 染色体结构变异与疾病的关系

结构变异和某些基因疾病的产生具有紧密相关的联系。结构变异存在于不同个体之间,可引起个体之间的表型差异[5],例如外貌、行为、环境适应性等[6]。同一个体不同细胞间的结构变异的类型及数目也存在差异,这些结构变异可能直接或间接的影响某些关键基因的表达,从而导致癌症、21-三体综合征(唐氏综合征)[7]、猫叫综合性征[8]和一些精神类疾病的产生。

随着对癌症研究的不断深入,人们已经意识到在癌症的形成和发展过程中,结构变异起到举足轻重的作用。当人体染色体中的某些关键基因发生突变时,细胞的生成速度会大于细胞的凋亡速度,进而细胞群落不断扩大,导致患者体内的肿瘤逐渐形成,病情进一步恶化,形成癌症。如果能够把癌症患者体内的变异基因识别清楚,这将对癌症的治疗具有很重要的作用。目前,导致癌症的典型原癌基因和抑癌基因已经识别的比较全面。但由于检测方法的限制,必定还有一些与癌症的产生关系很大的基因未被识别出来,对这类基因的识别依然有很重要的意义。

2 染色体结构变异的检测

2.1 检测染色体结构变异的重要意义

对基因测序数据中结构变异的检测是对结构变异进行研究的一项重要内容。高通量测序技术的引进,对于生殖细胞和体细胞中结构变异的检测起到了巨大的推动作用。目前已有许多种基于不同统计方法所开发的结构变异检测方法,这些方法主要包括以下几种类型:通过分析读片的覆盖度来检测结构变异的方法称之为读深度分析(read-depth analysis)[9];通过分析高通量测序数据中不正常的映射对(mapping pairs)的检测方法称为双末端映射方法(paired-end mapping methods)[10];通过分析断点类型及断点区间的方法称之为split-read分析。识别结构变异需要将读片与参考序列进行比对,根据比对信息,提取异常测序片段对(discordant read pairs)[11],并对其聚类,根据聚类结果判断基因组上的结构变异类型,进而识别出结构变异的断点连接点(breakpoint)即间断点。对高通量测序平台产生的原始数据重建待检序列,理论上可以用于检测任何结构变异类型,但是由于基因组中存在着大量的重复区域,这使得在序列组装过程中很难确定测序读片在基因组上的准确位置。同时,由于测序错误的存在以及基因组结构的复杂性,从而加大了结构变异检测的困难。针对一个样本,所用的模型不仅需要将识别出的体细胞基因组结构变异个数控制在几十个或者几百个,而且还要给出每个结构变异发生的概率值,这为癌症早期发现以及诊断治疗提供了一个重要的参考对象。此外,大量的检测结果表明,对于不同类型的癌症以及同一种癌症的不同样本,每种结构变异的类型所占比重不同。如何分析并解释肿瘤异质性,就要对癌症样本中的结构变异进行识别,进而可以对癌症病人进行靶向用药,促进精准医疗的发展[12]。

2.2 结构变异的检测方法

結构变异检测方法性能的优劣主要用敏感性和精确性两个值来衡量,而敏感性和精确性在一定程度上又是两个相互对立的概念,这就使得敏感性和精确性俱佳的方法难以得到。我们只能在尽量保证精确性的前提下提高检测方法的敏感性,这就要求我们尽量多的结合已经得到的序列比对信息,并且运用与碱基的分布相贴合的分布模型,来统计已知信息,得到更可靠的结构变异位点。现在的结构变异检测方法中,有的结合信息不够,从而导致检测方法的精确性不高,有的检测方法所用的概率分布与实际情况出入较大,这就会对检测结果的敏感性和精确性都造成较大的不利影响。表1中总结了目前已经发布并且应用比较广的四种检测结构变异的软件,并且对他们的性能特点做了简要的概述。

除了上述的四种检测结构变异的软件之外,还有很多与之相似的软件,例如:Pindel,GASV,HYDRA,Swan等。值得注意的是,由于不同的软件各有自己不同的特点,所以在进行结构变异检测的时候,要根据测序数据的实际情况,选用合适的软件进行检测。

3 结语

染色体中结构变异的研究,对各种基因疾病尤其是癌症的治疗具有十分重要的意义。结构变异研究的一项重要内容是对其进行检测。目前已有一些优秀的检测方法和软件,它们都有各自的优点,但也存在很多不足。建立敏感度和精确度俱佳的结构变异检测方法,是当前结构变异研究的一项重要内容。

参考文献

[1]G. R. Abecasis,D. Altshuler,A. Auton等. A map of human genome variation from population-scale sequencing[J]. Nature,2010, 467(7319):1061-1073.

[2]G. H. Roffler,S. J. Amish,S. Smith等. SNP discovery in candidate adaptive genes using exon capture in a free-ranging alpine ungulate[J]. Mol Ecol Resour,2016, 16(5):1147-1164.

[3]R. M. Layer,C. Chiang,A. R. Quinlan等.LUMPY: a probabilistic framework for structural variant discovery[J]. Genome Biol,2014,15(6):R84.

[4]H. Parikh,M. Mohiyuddin,H. Y. Lam等. svclassify: a method to establish benchmark structural variant calls[J]. BMC Genomics,2016, 17:64.

[5]龚强. 基因组变异的深度挖掘[M]:中国科学院北京基因组研究所,2013. 135.

[6]P. H. Sudmant,T. Rausch,E. J. Gardner等. An integrated map of structural variation in 2,504 human genomes[J]. Nature,2015, 526(7571):75-81.

[7]李冲.唐氏综合症外周血表达谱分析和21号染色体DNA甲基化谱分析[M].复旦大学,2012. 150.

[8]周焕庚,康雪珍,张蒨蒨.猫叫综合症的细胞遗传学研究[J].遗传学报,1982(01):20-23.

[9]K. Chen,J. W. Wallis,M. D. McLellan等. BreakDancer: an algorithm for high-resolution mapping of genomic structural variation[J]. Nat Methods,2009, 6(9):677-681.

[10]A. Abyzov,M. Gerstein. AGE: defining breakpoints of genomic structural variants at single-nucleotide resolution, through optimal alignments with gap excision[J]. Bioinformatics,2011, 27(5):595-603.

[11]H. Li,B. Handsaker,A. Wysoker等. The Sequence Alignment/Map format and SAMtools[J]. Bioinformatics,2009, 25(16):2078-2079

[12]劉军兰,姜军.精准医学的新计划[J].中华乳腺病杂志(电子版),2016(02):124-125

1.环球科技网遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.环球科技网的原创文章,请转载时务必注明文章作者和"来源:环球科技网",不尊重原创的行为环球科技网或将追究责任;3.作者投稿可能会经环球科技网编辑修改或补充。