GB/T 43636-2024
基本信息
标准号:
GB/T 43636-2024
中文名称:法庭科学 DNA二代测序检验规范
标准类别:国家标准(GB)
英文名称:Forensic sciences—Specifications for next generation sequencing-based DNA examination
标准状态:现行
发布日期:2024-03-15
实施日期:2024-10-01
出版语种:简体中文
下载格式:.pdf .zip
下载大小:3101374
相关标签:
法庭
科学
DNA
二代
测序
检验
规范
标准分类号
标准ICS号:07.140
中标分类号:综合>>社会公共安全>>A92犯罪鉴定技术
关联标准
出版信息
出版社:中国标准出版社
页数:24页
标准价格:43.0
相关单位信息
起草人:叶健 季安全 王乐 康克莱 侯一平 周洲 张驰 李海燕 刘开会 张广峰 汤鹏 袁丽 戴文申 赵杰
起草单位:公安部鉴定中心、四川大学、中国医学科学院阜外医院、广东省公安厅、中央军委政法委员会侦查技术中心、中国政法大学、北京生物医药研究所
归口单位:全国刑事技术标准化技术委员会(SAC/TC 179)
提出单位:中华人民共和国公安部
发布部门:国家市场监督管理总局 国家标准化管理委员会
标准简介
本文件规定了利用二代测序技术进行法庭科学人类DNA遗传标记靶向测序检验的总体要求以及检验器材和试剂、检验流程,以及数据分析、遗传参数计算的基本要求。本文件适用于从事法庭科学人类遗传标记检验的实验室和产品制造商针对人类生物检材与样本的STR、SNP、InDel等遗传标记以及线粒体DNA进行二代测序检验分析。
标准内容
ICS07.140
cCs A 92
中华人民共和国国家标准
GB/T43636—2024
法庭科学
DNA 二代测序检验规范
Forensic sciences-Specifications for next generationsequencing-based DNA examination2024-03-15发布
国家市场监督管理总局
国家标准化管理委员会
2024-10-01实施
规范性引用文件
术语和定义、缩略语
总体要求
器材和试剂
检验流程
数据分析
遗传参数计算
附录A(资料性)法庭科学DNA二代测序检验记录表参考文献
GB/T436362024
GB/T43636—2024
本文件按照GB/T1.1一2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由中华人民共和国公安部提出。本文件由全国刑事技术标准化技术委员会(SAC/TC179归口。
本文件起草单位:公安部鉴定中心、四川大学、中国医学科学院阜外医院、广东省公安厅、中央军委政法委员会侦查技术中心、中国政法大学、北京生物医药研究所。本文件主要起草人:叶健、季安全、王乐、康克莱、侯一平、周洲、张驰、李海燕、刘开会、张广峰、汤鹏、袁丽、戴文申、赵杰。
1范围
法庭科学DNA二代测序检验规范
GB/T43636—2024
本文件规定了利用二代测序技术进行法庭科学人类DNA遗传标记靶向测序检验的总体要求以及检验器材和试剂、检验流程、数据分析、遗传参数计算的基本要求。本文件适用于从事法庭科学人类遗传标记检验的实验室和产品制造商针对人类生物检材与样本的STR.SNP,InDel等遗传标记以及线粒体DNA进行二代测序检验分析。2规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T27025
检测和校准实验室能力的通用要求GB/T43633
GB/T43635
法庭科学DNA实验室建设规范
法庭科学DNA实验室检验规范
3术语和定义、缩略语
3.1术语和定义
下列术语和定义适用于本文件。3.1.1
DNA测序
DNAsequencing
对DNA分子的核苷酸排列顺序的测定,即测定组成核酸分子的腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)的排列顺序。3.1.2
二代测序
nextgenerationsequencing;NGS区别于传统Sanger(双脱氧链终止法)测序,能够一次并行对大量核酸分子进行序列测定的技术。3.1.3
靶向测序
targeted sequencing
针对特定基因集或基因组区域内已知和新型变异进行的测序。3.1.4
bridgepolymerasechainreaction桥式PCR
单链文库DNA一端序列与芯片表面固定的寡核苷酸特异性结合,当连接片段的另一端弯曲,与芯片表面固定的另一条互补寡核苷酸“形成桥”,以文库DNA为模板进行扩增的反应。3.1.5
emulsionpolymerasechainreaction乳化PCR
将用于PCR扩增的水相体系与油相体系混合,形成大量油包水的微乳液独立PCR扩增空间,在其中扩增得到大量相同来源扩增产物的反应。1
GB/T43636—2024
求DNAnanoball;DNB
DNA纳米球
在二代测序的模板扩增过程中,先将DNA进行片段化处理,加接头序列和环化形成单链坏状DNA,然后通过滚环扩增将单链环状DNA扩增2~3个数量级最终产生的产物3.1.7
单次测序singlerun sequencing测序仪器运行一个测序流程,如一次单向测序或一次双向测序的行为。[来源:GB/T
30989—2014,3.20]
Elibrary
通过生物来源的、人工合成的或克隆技术等所得到的一个重建分子群。注:例如基因组文库、互补DNA文库、噬菌体展示肽文库等。[来源:GB/T30989—2014,3.5,有修改
adapter
用于标记和固定待测序片段的一小段已知序列的DNA片段。3.1.10
条码barcode
一段特征性的脱氧核苷酸短片段,在多样本混合检测时,充当识别特定样本来源的唯一标志。3.1.11
测序通量
sequencing throughput
单次测序可获得序列信息的基因片段数量或可测定的脱氧核糖核酸和核糖核酸(以碱基表示)数量。
[来源:GB/T
30989—2014,3.21]
测序读长
readlength of sequencing
测序能测得的最长DNA片段的长度。注:通常以碱基数表示。
[来源:GB/T30989—2014,3.24,3.1.13
测序深度
depth of sequencing
有修改
待测样本中某个指定的核苷酸或某条指定的序列被检测的次数。[来源:GB/T
30989—2014,3.31,有修改
碱基识别正确率
accuracyofbasecalling
单次测序正确碱基数占可识别碱基总数的比例。[来源:GB/T
碱基识别错误率
30989—2014,3.27,有修改
inaccuracy of base calling
单次测序错误碱基数占可识别碱基总数的比例,与碱基识别正确率(3.1.14)相对。[来源:GB/T
30989—2014,3.28,有修改
碱基识别质量
qualityofbasecalling
衡量碱基正确识别的概率。通常以数字值直接表示。碱基识别质量与碱基识别错误率之间的关系可用式(1)表示:Q=-10-lgP
式中:
Q—碱基识别质量;
P一碱基识别错误率。
[来源:GB/T30989—2014,3.29,有修改]3.1.17
analytical threshold
分析阈值
能将检测到的信号与基线噪声进行可靠区分的最低测序深度(占比)。3.2缩略语
下列缩略语适用于本文件。
DNA:脱氧核糖核酸(DeoxyribonucleicAcid)DNB:DNA纳米球(DNANanoball)
InDel:插入或缺失(InsertionDeletion)NGS:二代测序(Next Generation Sequencing)PCR:聚合酶链式反应(PolymeraseChainReaction)SNP:单核苷酸多态性(SingleNucleotidePolymorphism)STR:短串联重复序列(ShortTandemRepeat)4总体要求
4.1实验室建设应符合GB/T43633(法庭科学DNA实验室建设规范)的要求GB/T43636—2024
(1)
4.2实验人员应熟悉并掌握基丁二代测序进行法庭科学遗传标记检验的原理和方法,并能正确使用分析软件对测序结果进行分析与评价。4.3实验室应有完备的文书体系,准确、清晰、完整地记录实验流程和结果,相关格式参见附录A。原始记录、报告等应归档留存,保证其具有可追溯性。4.4实验室的环境与设施应符合GB/T27025的要求。实验室应设置文库构建区、核酸定量区。为了有效防止DNA污染,实验室应设置分隔独立的工作区域进行PCR扩增前操作(试剂配制、样本制备等)和后续PCR扩增、测序分析等检验操作,并标识区分不同工作区。检验流程应单向流动,必要时实现人员的单向流动。所有实验操作应在规定区域进行。5原理
将生物检材或样本制备成待测样品,通过桥式PCR、乳化PCR或DNA纳米球扩增等PCR扩增技术,将待测样品量放大,并收集成文库,然后进行平行循环测序。利用边合成边测序的策略,加入一种或多种带标记或不带标记的底物核苷酸,在聚合酶的作用下,按照碱基互补配对原则,进行DNA链的延伸,延伸一轮测取一轮底物与模板结合后发出的信号,包括荧光信号、电信号或半导体芯片检测的离子信号等,收集该信号并确定所测位点的碱基信息。当上一轮测序完成后,重复测序过程,即实现大规模并行基因测序。
GB/T43636—2024
6器材和试剂
6.1通则
6.1.1对于采用的检验器材和试剂等产品应按照GB/T27025的要求经方法确认后方可使用。6.1.2对于采用的商业化或自行开发的法庭科学遗传标记二代测序检测试剂应进行质量评价验证,包括但不限于准确性、灵敏度、稳定性、均衡性、重复性、检材适应性、种属特异性等。6.2器材
主要检验器材包括:
a)二代测序仪;碱基识别质量大于20,碱基识别质量过滤之后的测序准确率大于或等于99.9%,测序通量适合相应法庭科学遗传标记检验;b) PCR仪;
c)荧光定量PCR仪;
离心机;
低温冰箱:
f)移液器。
6.3试剂
主要检验试剂包括:
a)DNA提取试剂:用于释放、分离获得各类生物样本中的所有DNA并进行纯化;PCK复合扩增试剂:用于大规模平行复合扩增针对STR、SNP、InDel等遗传标记或线粒体b)
DNA的各目标位点靶序列,试剂盒内至少应包含:扩增引物、扩增酶及缓冲液:文库构建试剂:用于核酸样品的测序文库构建,试剂盒内至少应包含:接头、DNA连接酶或c)
DNA聚合酶、缓冲液;
测序试剂:用于对测序文库进行二代测序,试剂盒内至少应包含:测序引物、测序反应酶及缓冲液。
7检验流程
7.1通则
检验流程应符合相应试剂说明书和仪器操作规范要求,并进行实验室内部方法验证,制定相应的作业指导书,内容至少包括:
a)检验步骤:至少包括DNA提取与定量、测序文库构建、测序文库纯化与定量、测序检验等;b)质量控制:至少包括DNA质量和浓度控制、文库片段长度和浓度控制、测序原始数据质量控制、测序结果质量评价等。
7.2DNA提取与纯化
按照GB/T43635(法庭科学DNA实验室检验规范)的方法开展实验,并对DNA提取的质量和浓度进行质量控制。宜采用荧光定量方法对DNA浓度进行定量,应对符合文库构建的质量要求指标进行方法验证。如果核酸样品质量不符合要求,应重新提取或增加样品量再进行相应操作。4
7.3目标序列扩增
GB/T43636—2024
将适量的DNA加至引物混合液和PCR预混体系中进行PCR扩增,扩增后选择合适的方式对PCR产物进行纯化。扩增反应体系及循环参数参照相应试剂说明书操作。实验应设置阳性对照和阴性对照。
7.4文库构建
主要步骤包括添加接头、文库纯化、文库质量控制和文库均一化。材料和方法以文库构建试剂说明书为准,其他注意事项包括:
清晰标记添加的标签接头,防止标签之间造成污染:a)
标签接头连接后采用磁珠法或相关文库纯化试剂对扩增产物进行纯化处理;b)
文库质量控制宜采用荧光定量方法检测文库浓度,可选择采用生物分析仪检测文库片段大c)
小,实验室应采用方法验证确定符合测序要求的文库质量要求指标;符合质量要求的文库进行均一化和混合,均一化浓度以测序试剂和测序仪器要求为准。d)
7.5测序模板制备
测序文库均一化、混合后,宜采用桥式PCR、乳化PCR或DNA纳米球扩增等方法进行信号放大处理,使信号强度满足测序识别要求。材料和方法以测序模板制备试剂说明书为准。7.6测序
测序即加入底物核苷酸,在测序酶的作用下使底物核苷酸与测序文库中的待测样品进行结合,同时收集该过程中产生的信号,包括但不限于荧光信号、电信号或离子信号。材料和方法参照相应二代测序试剂说明书,其他注意事项包括:a)
根据采用的检测试剂和二代测序平台摸索确定合适的文库上机浓度:b)
根据检测的法庭科学遗传标记特性选择合适的测序读长以保证测序结果准确和完整:c)
根据不同测序平台的特性和检测样本量选择合适测序通量的测序试剂、确定合适的测序深度并进行充分验证,保证测序结果准确。8数据分析
8.1通则
8.1.1软件的分析流程开放
应选用公开数据分析流程、算法和数据分析参数的生物信息学软件,进行法庭科学遗传标记二代测序数据分析,确保二代测序实验结果准确、可溯源。8.1.2测序原始数据质量控制
8.1.2.1原始数据质量评估
通过测序质量值量化评估原始数据质量,宜评估的指标包括碱基质量、序列质量、序列长度、N(未测到或不确定碱基)的比例、接头含量等。8.1.2.2数据过滤
根据评估结果过滤去除原始数据中的接头、低质量或未检出的碱基及序列,宜过滤的内容包括(以GB/T43636—2024
下过滤参数应根据检测不同的法庭科学遗传标记或使用不同的二代测序平台进行调整,并经过实验室验证):
检测接头序列并进行剪切;
b)去除含一定数目N碱基的序列;设定低质量碱基的判定阐值,去除含一定比例以上低质量碱基的序列;c)
设定滑动窗口,去除序列平均碱基值低于阈值的序列:d)
去除剪切后低于一定长度的序列;e)
其他经过验证的剪切去除序列方式。f
8.1.3数据比对分析
采用适合的软件分析数据质量控制后的测序数据,对目标法庭科学遗传标记进行分型并统计测序深度。
8.2STR分型
8.2.1二代测序STR数据分析软件应支持将STR作为序列多态遗传标记进行分型,即长度相同而序列不同的STR等位基因可被识别为不同的等位基因。序列多态分型结果命名应与现有长度多态命名兼容,并具备序列唯一性。
8.2.2以GRCh38作为比对参考序列,以其正向序列作为STR序列比对依据。8.2.3测序读长应足够覆盖STR扩增子长度,不应通过序列拼接的方式进行STR分型,应舍去未测通扩增子的数据。
8.3SNP分型
8.3.1以GRCh38作为比对参考序列。8.3.2采用dbSNP数据库中ID号码(rs#)的方式进行SNP位点命名。8.4InDel分型
8.4.1以GRCh38作为比对参考序列。8.4.2插入等位基因以序列信息标示,缺失等位基因用“_”进行标示。8.5线粒体DNA测序
以人类线粒体DNA参考序列(NCBIReferenceSequence:NC_012920.1)作为比对参考序列,进行序列比对、拼接和定位,标出与之不同的碱基作为特征点。8.6测序深度阈值设定与使用
8.6.1各基因座/位点设定合适的测序深度(占比)作为分型研判的分析阈值。若序列的测序深度占比(在该基因座/位点总测序深度中的比例)低于分析阈值时研判为噪声序列可被过滤;若序列的测序深度占比高于或等于分析阈值时应进一步研判序列的类型8.6.2实验室应根据自行检测数据设定分析阈值中的测序深度占比。阈值设定方法参照表1、表2和图1的示例。针对已知分型的单一来源样本,统计某位点的噪声序列最高测序深度占该位点总测序深度的比例达1%(位点总测序深度为5000,噪声序列最高测序深度为50,见表1)。检测不少于50例样本,获得每例样本某位点的噪声序列最高测序深度占该位点总测序深度的比例(见图1),在图1的示例中可设定测序深度占比1.5%作为该位点的阈值比例。对于STR基因座,应先确定等位基因和影子峰,再统计噪声序列的最高测序深度占比,在表2的示例样本中噪声序列的最高测序深度占比1.8%。6
表1已知分型样本的某SNP位点的序列情况已知类型
TGAATGCCATCCGTATCACCTGTTGAAGGTTCACCTGAATGCCATCCGTATCACCTGTAGAAGGTTCACCTGAATGCCATCCGTATCACCTGTCGAAGGTTCACC51
等位基因
噪声序列
噪声序列
样本数
SNP分型
测序深度
图1各样本中某位点的噪声序列最高测序深度占比情况表2已知分型样本的某STR
R基因座的序列情况
[ATCT]12
[ATCT]10
[ATCT]i
[ATCT]。
[ATCT]sAACT[ATCT]s
AACT[ATCT]
AACA[ATCT],
已知类型
等位基因
等位基因
影子峰
影子峰
噪声序列
噪声序列
噪声序列
测序深度
GB/T43636—2024
测序深度占比
4940/5000=98.8%
50/5000=1%
10/5000=0.2%
测序深度占比
2500/5000=50%
2100/5000=42%
150/5000=3%
130/5000=2.6%
90/5000=1.8%
25/5000=0.5%
5/5000=0.1%
设定待分析样本的某基因座/位点的分析阈值时,根据8.6.2中的方法设定测序深度占比,再计8.6.3
算得到对应测序深度值(即某基因座/位点的总测序深度与测序深度占比的乘积)。若该值大于或等丁10则作为该基因座/位点的分析阈值,若该值小于10则以测序深度10作为该基因座/位点的分析阈值。
参照以下示例样本应用分析阈值进行分型研判。示例1:按照8.6.2中的方法设定测序深度占比1%作为某SNP位点的阈值比例。样本A的该SNP位点的总测序深度为4000,则测序深度小于40的序列(该示例中分别为30、20、10)研判为噪声序列,详见表3。GB/T
43636—2024
表3某SNP位点的序列情况示例
SNP分型
TACATAGGTGGGAAAGCAGAACACATGGGTACTAATTACATAGGTGGGAAAGCAGAACACGTGGGTACTAATTACATAGGTGGGAAAGCAGAACACTTGGGTACTAATTACATAGGTGGGAAAGCAGAACACCTGGGTACTAATA
测序深度
测序深度占比研判类型
等位基因
噪声序列
噪声序列
噪声序列
示例2:按照8.6.2中的方法设定测序深度占比2%作为某STR基因座的阈值比例。样本B的该STR基因座的总测序深度为10000,则测序深度小于200的序列(该示例中分别为100、20)研判为噪声序列。对于测序深度占比3%的序列,需进一步研判确定为等位基因或者噪声序列,详见表4。表4某STR基因座的序列情况示例长度
[GGAA]i2 [GGCA]6
[GGAA],[GGCA],
[GGAA],[GGCA]。
[GGAA]O[GGCA],
[GGAA],[GGCA]2GGAA[GGCA]。
[GGAA]2[GGCA]2GGGA[GGCA]2
[GGAA];GGGA[GGCA] s
测序深度bzxz.net
测序深度占比
研判类型
等位基因
等位基因
影子峰
影子峰
噪声序列
噪声序列
噪声序列
示例3:按照8.6.2中的方法设定测序深度占比1%作为某SNP位点的阑值比例。样本C的该SNP位点的总测序深度为500,根据设定测序深度占比计算对应测序深度值为5,则按照8.6.3中的要求设定测序深度10作为分析阅值。测序深度为8和9的序列即使满足测序深度占比大于1%,但需要根据分析阅值测序深度的最低要求判定为噪声序列,详见表5。
表5某SNP位点的序列情况示例
TACATAGGTGGGAAAGCAGAACACATGGGTACTAATTACATAGGTGGGAAAGCAGAACACGTGGGTACTAATTACATAGGTGGGAAAGCAGAACACTTGGGTACTAAT9
遗传参数计算
SNP分型
测序深度
测序深度占比研判类型
等位基因
噪声序列
噪声序列
将STR作为序列多态性遗传标记进行法庭科学参数和亲权指数计算。即长度相同而序列不同的STR等位基因是独立的不同等位基因,所采用人群频率数据应是序列多态STR数据。
等位基因频率统计
在进行法庭科学参数和亲权指数计算过程中,需要充分考虑所检遗传标记间连锁关系的影响。
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。