86
阅读
0
评论
分享
论著
临床级致病基因的审核归档策略及其在下一代测序研究矮小症遗传病因中的应用实例
中华检验医学杂志, 2017,40(07): 500-504. DOI: 10.3760/cma.j.issn.1009-9158.2017.07.006
摘要
目的

利用基因的审核归档策略进行矮小测序基因包设计。

方法

本研究详细介绍了基因审核归档策略,通过收集遗传学证据和功能证据,对基因-疾病关系进行分类,并且以身材矮小诊断基因包的设计为例,展示了基因审核归档过程对靶向测序基因列表设计的影响。

结果

通过基因审核归档,将机械搜索到的身材矮小基因包基因数量从1 276个精简到有效的705个,利用该基因包对全国371例身材矮小患者进行测序分析,诊断率可达到19.7%。该基因审核归档过程降低了假阳性的几率,同时在不影响诊断率的前提下降低了诊断成本和劳动时间。

结论

基因审核归档是二代测序诊断中的重要环节,应随着基因诊断的普及而得到广泛重视和应用。(中华检验医学杂志,2017, 40:500-504)

引用本文: 胡旭昀, 桂宝恒, 李红豆, 等.  临床级致病基因的审核归档策略及其在下一代测序研究矮小症遗传病因中的应用实例 [J]. 中华检验医学杂志,2017,40( 7 ): 500-504. DOI: 10.3760/cma.j.issn.1009-9158.2017.07.006
正文
作者信息
基金  关键词  主题词
English Abstract
评论
阅读 86 引用 0
相关资源
视频 0 论文 0 大综述 0
以下内容和版式版权归属中华医学会,未经授权不得转载 ×

二代测序目前已经在临床诊断实验室广泛应用,成为罕见遗传病诊断的有力工具。根据测序的范围可分为全基因组测序、全外显子组测序和panel测序。与全基因组或全外显子组测序不同,panel测序靶向于有限数量的与某一表型有明确关系的基因,由于测序数据量显著少于全基因组或全外显子组测序,所以成本和分析难度都相应降低。最重要的是在降低成本的同时可以保证理想的诊断率。测序panel的设计离不开基因审核归档。基因审核归档的过程是利用公共资源来评估基因与疾病相关关系强弱。通过从文献中整理关于基因与疾病关系的信息,包括遗传学信息和功能信息,以及矛盾信息,利用标准对基因-疾病关系的临床准确性进行分类。审核归档的过程并不要求系统回顾所有关于某一基因或疾病的文献。而是对分类所需要的最合适证据的收集。通过明确基因-疾病关系后设计疾病诊断panel,可以减少不必要的数据浪费而节约成本,同时降低数据分析的难度。本文以身材矮小panel为例详细表述了对基因-疾病关系收集相关证据以及分类的方法。

材料与方法
一、材料

通过"short stature"、"poor growth"、"growth retardation"、"low height"等关键词搜索,在University of California Santa Cruz Genome Browser(UCSC,genome.ucsc.edu),Online Mendelian Inheritance in Man(OMIM,omim.org),Human Phenotype Ontology(HPO,human-phenotype-ontology.github.io/),Human Gene Mutation Database(HGMD,www.hgmd.cf.ac.uk/),Ingenuity Pathway Analysis(IPA,www.ingenuity.com/products/ipa)等数据库中进行搜索,合并所得基因列表用于下一步的审核归档。

二、方法
1.收集证据:

证据收集主要基于已发表的文献,也可以是其他公共资源,如变异数据库,但应谨慎使用。已发表的文献可在PubMed(www.ncbi.nlm.nih.gov/pubmed)和Google Scholar(scholar.google.com/)进行搜索。高级搜索往往可获得更多信息。并不需要针对每对基因-疾病关系甄别所有证据,而是关注与以下分析流程相关的证据。

2.证据鉴定:

甄别者需要分别鉴定遗传学证据和实验证据。遗传学证据可分为两类:病例水平的数据和病例/对照数据。一般而言,描述具有某一特定基因突变的个体或家系的研究被分为病例水平的数据,而利用统计学分析变异在患者组和正常对照组的富集情况的研究被分为病例/对照数据。基因水平的功能实验包括可以提示基因和疾病因果关系的体内和体外实验。

3.临床准确性分类:

评估证据并根据评分系统打出相关分值,计算得出总分并以此对临床准确性进行分类,交由相关的疾病专家进行复审。

结果
一、证据收集

根据ClinGen Gene Curation工作组的基因审核归档指南(http://biorxiv.org/content/early/2017/03/01/111039.full.pdf+html),利用文献搜索需找证据,最初的搜索应该是全面的,可在PubMed中搜索"基因名AND疾病名",如果文献量较多(如超过50篇)可选择仅看综述性文章,如果综述性文章未包含审核归档所需要的信息,则需要返回原始文献中。基因功能的证据往往需要额外的搜索,可在PubMed中搜索"基因AND function"、"蛋白AND function"、"基因AND animal",或在OMIM的"Gene function"或"Biochemical Features"的部分,GeneReviews (http://www.ncbi.nlm.nih.gov/books/NBK1116/)的"Molecular Genetics"部分,以及其他数据库如UniProt (www.uniprot.org/), MGI (www.informatics.jax.org/)等找到基因功能的相关数据。等所有证据都收集全时就可以开始甄别并评分了。下文将对遗传学证据和功能实验证据进行详述。

1.遗传学证据:

分为病例水平的数据和病例/对照数据,一篇文献中可能既包括病例水平的证据又包括病例/对照水平的证据。这种情况下,单一的病例不能被重复算分。下表提供了各个证据以及评分的具体使用方法,表中所涉及的变异应相对于该疾病足够罕见(表1)。遗传学证据打分最高为12.0分。

表1

遗传学证据汇总

表1

遗传学证据汇总

证据类型证据信息及判断标准每个单独证据打分范围最大分值
常染色体显性或者男性受累的X连锁疾病先证者携带对基因有影响的非功能缺失性变异,其影响有证据支持0~1.57.0
 先证者携带非功能缺失性变异0.5~2.010.0
 变异是新发的1.0~3.012.0
常染色体隐性或者女性受累的X连锁疾病两个反式非功能缺失性变异0.5~1.512.0
 两个顺式变异中至少有一个是非功能缺失性变异或者新发变异1.0~3.0 
在一个家系或多个家系中分离情况优势对数=35.07.0
 优势对数=24.0 
 优势对数=1.53.0 
 优势对数=12.0 
 优势对数=0.61.0 
单个位点分析检测方法,样本量大小,样本选取情况0~6.012.0
集合变异分析统计学差异0~6.0 
2.功能实验证据:

功能实验可在生化、分子、细胞、动物等水平对基因-疾病关系进行评估,见表2。功能实验证据打分最高为6分。

表2

功能实验证据汇总

表2

功能实验证据汇总

证据类别证据类型建议评分范围最大分值
功能生化功能0.5~2.02.0
 蛋白相互作用0.5~2.0 
 表达0.5~2.0 
功能的改变基因改变在患者细胞引起功能改变1.0~2.02.0
 基因改变在非患者细胞引起功能改变0.5~1.0 
模型与挽救实验基因改变在动物模型中引起相关表型2.0~4.04.0
 基因改变在培养细胞中引起相关表型0.5~2.0 
 动物模型中挽救实验2.0~4.0 
 人工等效物可进行表型挽救0.5~2.0 
3.矛盾性证据:

最常见的有以下几类:(1)病例/对照水平差异不明显。(2)次要等位基因频率过高。(3)基因-疾病关系不能被复制。(4)基因型与表型不分离。(5)不支持的功能实验。

二、总结分类

ClinGen Gene Curation工作组(www.clinicalgenome.org/working-groups/gene-curation/)制定了利用遗传学证据和功能实验证据将基因-疾病关系分类的方法。这种疾病关系的临床准确性可分为以下7个级别,见表3。根据上述评分系统可以对基因-疾病关系进行"暂时性"分类,最终的分类将交由专家审阅决定。其中"明确"和"强"的区别在于该结果最初的报道至今是否已经有3年以上。

表3

临床准确性描述

表3

临床准确性描述

证据级别分类描述
支持性证据 
 明确(12~18分)该基因突变在该特定疾病中的作用被反复报道,并且在遗传学和功能实验中都得到证实。并且该结论长期内得到支持(通常为3年以上),没有矛盾结论的证据被提出来
 强(12~18分)该基因突变在该特定疾病中的作用至少有2次独立的报道,并提供了强有力的支持证据,包括以下2种证据:(1)强有力的变异证据表明有众多独立的先证者,其基因变异具有与该疾病的因果关系。(2)强烈的基因水平证据,包括多种不同类型的支持性实验数据。此外,没有矛盾结论的证据被提出来
 中等(7~11分)该基因突变在该特定疾病中的作用有报道,并提供了中等的支持证据,包括以下2种证据:(1)变异证据表明有至少3个先证者,其基因变异具有与该疾病的因果关系。(2)中等的基因水平证据支持基因-疾病关系。此外,上述证据的报道可以是不独立的,但是没有矛盾结论的证据被提出来
 有限(1~6分)有有限的证据支持基因与疾病的因果关系,如:已报道的仅有少于3个先证者,其基因变异具有与该疾病的因果关系,或者变异在先证者中发现,但是没有足够的支持性证据;有限的实验证据证明基因与疾病的因果关系。此外,上述证据的报道可以是不独立的,但是没有矛盾结论的证据被提出来
无证据报道没有基因与疾病的因果关系证据的报道。该基因可能仅根据连锁距离、动物模型、相关通路就被认为是"候选基因",但是没有引起疾病的直接证据
矛盾性证据 
 有冲突性报道尽管认为可能引起疾病,但是自最初报道之后,有矛盾性的证据被提出。根据这种矛盾性证据的数量和质量可进一步分为以下两类:(1)存在争议:自最初报道之后,矛盾性的证据对基因与疾病的因果关系提出了争议;矛盾性的证据与支持性证据权重相当。(2)反驳:自最初报道之后,矛盾性的证据驳倒对基因与疾病的因果关系的支持性证据;该分类需要专家严谨审阅,慎重使用
三、身材矮小panel设计

经过关键词搜索,在OMIM上共搜索到241个基因,HPO上搜索到278个基因,HGMD上搜索到397个基因,IPA上搜索到729个基因,UCSC上搜索到66个基因。通过合并删除重复项,还有1 276个基因进入进一步的审核归档。对于预测性的产前诊断而言,只有明确相关和强相关的基因才能以入选诊断panel,对于一般诊断而言,中等强度的也可以加入诊断panel。而对于有诊断和科研双重功能的测序panel可包含关系分类为有限强度的基因。

经过基因审核归档,从1 276个基因中筛选出705个基因分类为有限强度级以上,进一步利用该结果设计针对身材矮小患者诊断的高通量测序捕获探针。这些基因可进一步根据引起的疾病特点分为4类:(1)与骨发育有关;(2)内分泌相关;(3)综合征型矮小;(4)伴有小头畸形的矮小症;(5)其他。其各类别的基因总数见图1

图1
705个身材矮小致病基因分类
图1
705个身材矮小致病基因分类

以下列4个基因(2个阳性结果和2个阴性结果)为例展示分析过程:文献报道FGFR3基因突变引起常染色体显性遗传的软骨发育不全,患者特点为出生时即可发现的四肢短小性矮小,平均成年男性身高131 cm,女性身高124 cm[1,2]。目前已有大量(超过表格上限)携带功能缺失性变异或者对基因功能有影响的其他变异的先证者的报道。同时有过大量家系报道,提供了分离情况,所以遗传学证据可以得到上限分数12分。在功能方面,该基因的改变对功能的影响得到了证实,同时构建了小鼠模型[3,4,5],得到了3分。所以总分大于12分,而原始报道距今已超过3年且无矛盾性证据提出,故该基因-疾病关系可分类为明确致病。SOS2基因突变可能引起常染色体显性遗传的努南综合征,其特点是身材矮小、颅面部畸形、短颈、颈蹼、隐睾、心脏异常、凝血异常等。曾有报道携带功能缺失性变异或者对基因功能有影响的其他变异的先证者诊断为努南综合征[6,7],并且提供了一定的分离情况。这两项证据可各得7分和2分。Cordeddu等[7]在报道患者的同时进行了简单的功能实验,经过评估可得1分,故可判断为中等强度关系。C1R和C1S基因收录在HPO数据库中被认为与身材矮小相关,故包含在1 276个基因的原始列表中。然而这两个基因的突变仅报道过1次[8],作者认为其与牙周型Ehlers-Danlos综合征有关。经典型Ehlers-Danlos综合征确实可以引起矮小表型,但是牙周型Ehlers-Danlos综合征的主要临床表现为早发性牙周炎、牙龈萎缩等口腔问题以及皮肤和关节异常。文中未提到患者身高异常,故C1R和C1S基因被分类为第5类(无证据报道),从而从原始列表中剔除。

经过基因审核归档后设计的包含705个基因的矮小身材测序panel,目前已经在全国371例身材矮小患者进行验证,综合诊断率为19.7%。其中非综合征性矮小311例,诊断率为14.1%,综合征性矮小60例,诊断率为48.3%。根据2015年变异解读指南[9],非综合征性矮小患者中,在COL2A1、IGFALS、ACAN、GH1、MYH3、SLC5A5、COL9A3、PTPN11、GHRHR、EVC、RECQL4、GLI2、TSHR、TRAPPC2、RAF1、PIEZO2、NF1、FGFR3、CYP21A2、SMPD1、SLC7A7、OFD1、PAX8、ABCC8、COL27A1、TINF2、TP63、AQP2、IDS、STAT5B、PTHLH、FBN1、NOTCH2、SHOX、COMP、DUOX2、BLM等基因上发现了致病变异或可能致病变异。在综合征性矮小患者中,在OBSL1、RECQL4、CHD7、KMT2A、GNPTAB、RUNX2、IGF1R、IHH、NF1、SMAD4、CUL7、VPS13B、KRAS、FGFR3、NPR2、GLI2、KAT6B、NBAS、PHEX、EXT1、MAP2K1等基因上发现了致病变异或可能致病变异。以上数据证明了该panel的临床有效性。

讨论

人类的身高性状的遗传学基础十分复杂,目前仅部分了解。身材矮小既可以是正常生长的一种合理范围内的变异,又可以是病理性改变所致[10]。目前可引起身材矮小的基因有数百个,在高通量测序普及之前,对身材矮小患者做基因诊断非常困难。现在随着技术的成熟,我们可以利用panel测序靶向所有的矮小相关基因进行诊断。然而,在设计矮小诊断panel之前,应先对相关基因进行审核归档。

随着基因诊断的普及,明确基因-疾病的致病关系就显得尤其重要。通过基因审核归档的过程判断该关系目前仍处在起步阶段,其重要性仍未得到有效认识。根据以往的经验,众多基因与疾病的致病关系被错误报道。以CLCN2基因为例,尽管杂合的CLCN2突变曾报道过引起儿童癫痫小发作、青年型肌阵挛性癫痫以及清醒时的癫痫大发作[11,12],但是这些结果仍存在着争议,最初的文章已经被撤回[11]。尽管作者仍然认为在某些病例中,CLCN2确实和癫痫发作有关,但是功能实验的结果并不支持这一结论,同时,后续的结果发现在正常人中也携带以往认为CLCN2的致病变异[13]。在氯离子通道2相关脑白质病的观察结果也不支持CLCN2的功能缺失性变异可以提高癫痫的发病风险。然而在许多诊断实验室的癫痫panel中仍然存在该基因。未经过审核归档过程设计的panel在临床诊断过程中不仅会增加经济成本和人力资源,同时提高了假阳性、误诊、漏诊的风险。

所幸的是,ClinGen成立Gene Curation工作组,试图建立一种以证据为导向的方法,用来评估基因与疾病的关系并为后续的项目提供依据[14]。对于评估某一基因是否引起某一特定疾病所需要的证据,该工作组制定了一套框架来对这类证据进行评价。并制定了这些证据的种类以及审核归档的标准。审核归档的过程应该是可重现、广泛性、可修正的,而其作用在于指导疾病特异性panel设计的纳入准则,辅助变异的临床意义解读,以及帮助起草报告。值得注意的是,目前基因审核归档的指南依赖于以往的文献报道以及数据库信息,对于分类存在争议的基因不能进行较好地解读。对此,审核者可以根据自己的实验数据(如一代测序、dd-PCR验证等手段)对该基因进行进一步评估。

经过基因审核归档的过程,本文涉及的身材矮小panel基因数量从1 276个精简到有效的705个。该过程在不影响诊断率的前提下,通过减少测序数据量以及不相关的基因变异,不仅减小了假阳性的风险,也明显降低了诊断成本以及人工成本。综上所述,随着基因测序用于罕见病诊断的普及,基因与特定疾病的致病关系的明确变得尤为重要。基因审核归档为这一问题的解决提供了新的思路,虽然目前仍在起步阶段,但需要得到广泛重视,期待得到普及应用。

志谢 本研究部分受长春金赛药业有限责任公司资助

参考文献
[1]
RousseauF, BonaventureJ, Legeai-MalletL, et al. Mutations in the gene encoding fibroblast growth factor receptor-3 in achondroplasia[J]. Nature, 1994, 371(6494): 252254. DOI: 10.1038/371252a0.
[2]
ShiangR, ThompsonLM, ZhuYZ, et al. Mutations in the transmembrane domain of FGFR3 cause the most common genetic form of dwarfism, achondroplasia[J]. Cell, 1994, 78(2): 335342.
[3]
ChoJY, GuoC, TorelloM, et al. Defective lysosomal targeting of activated fibroblast growth factor receptor 3 in achondroplasia[J]. Proc Natl Acad Sci U S A, 2004, 101(2): 609614. DOI: 10.1073/pnas.2237184100.
[4]
NaskiMC, ColvinJS, CoffinJD, et al. Repression of hedgehog signaling and BMP4 expression in growth plate cartilage by fibroblast growth factor receptor 3[J]. Development, 1998, 125(24): 49774988.
[5]
WangY, SpatzMK, KannanK, et al. A mouse model for achondroplasia produced by targeting fibroblast growth factor receptor 3[J]. Proc Natl Acad Sci U S A, 1999, 96(8): 44554460.
[6]
YamamotoGL, AguenaM, GosM, et al. Rare variants in SOS2 and LZTR1 are associated with Noonan syndrome[J]. J Med Genet, 2015, 52(6): 413421. DOI: 10.1136/jmedgenet-2015-103018.
[7]
CordedduV, YinJC, GunnarssonC, et al. Activating mutations affecting the Dbl homology domain of SOS2 cause noonan syndrome[J]. Hum Mutat, 2015, 36(11): 10801087. DOI: 10.1002/humu.22834.
[8]
Kapferer-SeebacherI, PepinM, WernerR, et al. Periodontal Ehlers-Danlos Syndrome is caused by mutations in C1R and C1S, which encode subcomponents C1r and C1s of complement[J]. Am J Hum Genet, 2016, 99(5): 10051014. DOI: 10.1016/j.ajhg.2016.08.019.
[9]
RichardsS, AzizN, BaleS, et al. Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology[J]. Genet Med, 2015, 17(5): 405424. DOI: 10.1038/gim.2015.30.
[10]
DauberA, RosenfeldRG, HirschhornJN. Genetic evaluation of short stature[J]. J Clin Endocrinol Metab, 2014, 99(9): 30803092. DOI: 10.1210/jc.2014-1506.
[11]
HaugK, WarnstedtM, AlekovAK, et al. Mutations in CLCN2 encoding a voltage-gated chloride channel are associated with idiopathic generalized epilepsies[J]. Nat Genet, 2003, 33(4): 527532. DOI: 10.1038/ng1121.
[12]
Kleefuss-LieA, FriedlW, CichonS, et al. CLCN2 variants in idiopathic generalized epilepsy[J]. Nat Genet, 2009, 41(9): 954955. DOI: 10.1038/ng0909-954.
[13]
NiemeyerMI, CidLP, SepúlvedaFV, et al. No evidence for a role of CLCN2 variants in idiopathic generalized epilepsy[J]. Nat Genet, 2010, 42(1): 3. DOI: 10.1038/ng0110-3.
[14]
RehmHL, BergJS, BrooksLD, et al. ClinGen-the clinical genome resource[J]. N Engl J Med, 2015, 372(23): 22352242. DOI: 10.1056/NEJMsr1406261.
 
 
关键词
主题词
生长障碍
高通量核苷酸序列分析
分子诊断技术