GB∕T 37872-2019
基本信息
标准号:
GB∕T 37872-2019
中文名称:目标基因区域捕获质量评价通则
标准类别:国家标准(GB)
标准状态:现行
出版语种:简体中文
下载格式:.rar .pdf
下载大小:305KB
相关标签:
目标
基因
区域
捕获
质量
评价
标准分类号
关联标准
出版信息
相关单位信息
标准简介
GB∕T 37872-2019 目标基因区域捕获质量评价通则
GB∕T37872-2019
标准压缩包解压密码:www.bzxz.net
标准内容
ICS07.080
中华人民共和国国家标准
GB/T37872—2019
自标基因区域捕获质量评价通则Guidelines for validation of next-generation target region sequencing2019-08-30发布
国家市场监督管理总局
中国国家标准化管理委员会
2019-08-30实施
本标准按照GB/T1.1-2009给出的规则起草本标准由国家标准物质研究中心提出并归口。GB/T37872—2019
本标准起草单位:深圳华大生命科学研究院(原深圳华大基因研究院)、中国计量科学研究院、深圳华大智造科技有限公司、深圳华大基因科技有限公司、深圳华大临床检验中心有限公司、艾吉泰康生物科技(北京)有限公司。
本标准主要起草人:耿春雨、王晶、傅书锦、郝世杰、刘心、蒋慧、牛春艳、蔡万世、李雅乔、杜佳婷、李倩一、李岱怡、谢强、唐美芳、刘继龙、王瑞超。1
1范围
自标基因区域捕获质量评价通则GB/T37872—2019
本标准规定了基于液相捕获技术的目标基因区域捕获质量评价的术语和定义、质量要求和评价方法。
本标准适用于应用高通量基因测序对人类基因组DNA样本进行目标基因区域捕获的质量评价本标准不适用于单分子测序
规范性引用文件
下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件GB/T298592013生物信息学术语
术语和定义、缩略语
3.1术语和定义
GB/T29859一2013界定的以及下列术语和定义适用于本文件。为了便于使用,以下重复列出了GB/T29859—2013中的某些术语和定义3.1.1
测序sequencing
测定氨基酸或者核苷酸序列的过程。[GB/T29859—2013,定义2.4.13]3.1.2
外显子exon
真核生物基因的一部分,在剪接后会被保留在成熟核糖核酸分子中的序列。[GB/T29859—2013,定义2.2.8]3.1.3
内含子
intron
真核生物基因的一部分,在剪接后未被保留在成熟核糖核酸分子中的序列。[GB/T298592013.定义2.2.20]
胚系突变
germlinemutation
遗传自父本、母本或者在胚胎形成时期产生的基因突变。3.1.5
体细胞突变
somatic mutation
发生于胚胎形成时期之后,只存在于特定组织部分细胞中的细胞特异性突变GB/T37872—2019
目标基因区域捕获targetregioncapture对一个或多个基因的核苷酸序列定制目标基因区域特异性探针,与基因组DNA进行杂交,并富集目标基因DNA片段的过程。
缩略语
下列缩略语适用于本文件。
DNA:脱氧核糖核酸(deoxyribonucleicacid)4质量要求
目标基因区域捕获质量要求由测序统计后的平均测序深度、测序覆盖度、捕获特异性确定。4.2
平均测序深度下载标准就来标准下载网
胚系突变检测的目标基因区域平均测序深度应大于或等于60倍,体细胞突变检测(等位基因频率≥5%)的目标基因区域平均测序深度应大于或等于200倍,体细胞突变检测(1%≤等位基因频率<5%)的目标基因区域平均测序深度应大于或等于500倍。4.3
测序覆盖度
胚系突变检测的测序覆盖度在60倍平均测序深度条件下应满足表1的要求,体细胞突变检测(等位基因频率≥5%)的测序覆盖度在200倍平均测序深度条件下应满足表2的要求,体细胞突变检测(1%≤等位基因频率<5%)的测序覆盖度在500倍平均测序深度条件下应满足表3的要求表1胚系突变检测的测序覆盖度要求目标基因区域覆盖深度
≥4倍
≥10倍
》20倍
≥30倍
测序覆盖度
≥99%
≥97%
≥92%
≥65%
体细胞突变检测的测序覆盖度要求(等位基因频率5%)目标基因区域覆盖深度
》1倍
≥4倍
≥10倍
≥20倍
≥100倍
测序覆盖度
≥97%
≥75%
GB/T37872—2019
体细胞突变检测的测序覆盖度要求(1%≤等位基因频率<5%)目标基因区域覆盖深度
≥4倍
≥10倍
》20倍
≥100倍
捕获特异性
测序覆盖度
≥99%
≥98%
≥97%
≥90%
大于10Mb的目标基因区域探针捕获特异性应不低于45%,小于或等于10Mb的目标基因区域探针捕获特异性应不低于12%。
注1:目标基因区域不包含侧翼序列区域。注2:按照比对的碱基数据量进行统计。注3:针对目标基因区域较为特殊的(如目标基因区域较小或包含基因组重复序列)可视重复区域长度对该指标进行调整。
评价方法
试验材料
采用人源基因组DNA。
文库制备
根据高通量基因测序平台的文库长度、产量、浓度等要求,按照对应的目标基因区域捕获建库流程进行操作。
GB/T37872—2019
3数据产出与分析
5.3.1高通量测序
制备完成的文库在高通量基因测序平台进行上机前处理和测序,得到高通量测序原始数据。5.3.2数据过滤
根据不同的数据过滤参数,对原始数据进行过滤,去除未达到过滤参数要求的序列或者N碱基含量较多的序列,
5.3.3序列比对c
使用局部比对算法按照匹配打分规则,将过滤后得到的序列与参考基因组进行比对,从而确定最佳比对位置。
注:本标准人参考基因组使用hg19。5.4结果计算
5.4.1平均测序深度
基于序列比对后的数据进行重复序列去除,统计比对到目标基因区域的碱基数据量与目标基因区域总长度的比值,按照式(1)进行计算。r
式中:
D一目标基因区域平均测序深度;比对到目标基因区域的碱基数据量;r
1——目标基因区域总长度。
5.4.2测序覆盖度
基于序列比对后的数据进行重复序列去除。(1)
对胚系突变,分别统计自标基因区域内覆盖深度不低于1倍、4倍、10倍、20倍和30倍的位点数量与目标基因区域总长度的百分比,按照式(2)进行计算。对体细胞突变,分别统计目标基因区域内覆盖深度不低于1倍、4倍、10倍、20倍和100倍的位点数量与目标基因区域总长度的百分比,按照式(2)进行计算。c(X)=
式中:
自标基因区域覆盖度(≥X倍);d(X)
d(X)一目标基因区域内覆盖深度不低于X倍的位点数量;X
一1倍、4倍、10倍、20倍、30倍、100倍的目标基因区域覆盖深度;一
——目标基因区域总长度。
5.4.3捕获特异性
............(2)
基于序列比对后的数据进行重复序列去除,比对到目标基因区域的碱基数据量与比对到全基因组4
区域的碱基数据量的比值,按照式(3)进行计算式中:
目标基因区域捕获特异性;
R×100%
r——比对到目标基因区域的碱基数据量;R一—比对到全基因组区域的碱基数据量。注:目标基因区域不包括侧翼序列区域GB/T37872—2019
.·(3)
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。