一种对未知来源个体进行非、欧、东亚群体遗传主成分析的方法和系统.pdf

摘要
申请专利号：	CN201410361064.4	申请日：	2014.07.25
公开号：	CN104212886A	公开日：	2014.12.17
当前法律状态：	授权	有效性：	有权
法律详情：	授权\|\|\|实质审查的生效IPC(主分类):C12Q 1/68申请日:20140725\|\|\|公开
IPC分类号：	C12Q1/68; C12N15/11	主分类号：	C12Q1/68
申请人：	公安部物证鉴定中心
发明人：	李彩霞; 魏以梁; 叶健
地址：	100038 北京市西城区木樨地南里17号
优先权：
专利代理机构：	北京同立钧成知识产权代理有限公司 11205	代理人：	刘芳
PDF下载：	PDF下载

内容摘要

本发明提供一种对未知来源个体进行非、欧、东亚群体遗传主成分析的方法和系统，所述方法包括提取未知来源个体的DNA；获得所述DNA的27个非、欧、东亚群体特异性位点的基因型；将所述各特异性位点的基因型利用STRUCTURE软件获得群体遗传主成分分析结果。本发明提供的方案能实现对未知来源个体的非、欧、东亚群体遗传主成分析，并为未知来源个体进行非、欧、东亚群体来源推断提供数据支持。

权利要求书

权利要求书
1.  一种对未知来源个体进行非、欧、东亚群体遗传主成分析的方法，其特征在于，该方法包括：
1)提取未知来源个体的DNA；
2)获得所述DNA的27个非、欧、东亚群体特异性位点的基因型，所述27个非、欧、东亚群体特异性位点为：rs595961,rs2710684,rs260690,rs10496971,rs10497191,rs6444724,rs1586861,rs28777,rs13182883,rs1366220,rs159606,rs7752055,rs321198,rs366178,rs3780962,rs4244304,rs1498553,rs3825663,rs728404,rs1448485,rs7170869,rs1453858,rs2342747,rs4787040,rs881929,rs1197062和rs4789193；
3)将所述各特异性位点的基因型利用STRUCTURE软件获得群体遗传主成分分析结果。

2.  根据权利要求1所述的方法，其特征在于，2)包括采用与所述27个特异性位点一一对应的27对扩增引物对其进行扩增以获得扩增产物的步骤；以及使用与所述27个特异性位点一一对应的27条延伸引物对所述扩增产物进行延伸以获得延伸产物的步骤。

3.  根据权利要求2所述的方法，其特征在于，所述扩增引物为序列表中SEQ ID No.1至SEQ ID No.54的核苷酸序列；所述延伸引物为序列表中SEQ ID No.55至SEQ ID No.81的核苷酸序列。

4.  根据权利要求3所述的方法，其特征在于，其中2)还包括在获得延伸产物后，使用遗传分析仪分析该延伸产物，以获得所述27个特异性位点的基因型的步骤。

5.  一种对未知来源个体进行非、欧、东亚群体遗传主成分析的系统，其特征在于，所述系统包括DNA提取体系，复合扩增检测体系，数据获取体系；
所述DNA提取体系用于提取未知来源个体的DNA；
所述复合扩增检测体系用于获得所述DNA的27个非、欧、东亚群体特异性位点的基因型，所述27个非、欧、东亚群体特异性位点为：rs595961,rs2710684,rs260690,rs10496971,rs10497191,rs6444724,rs1586861,rs28777,rs13182883,rs1366220,rs159606,rs7752055,rs321198,rs366178,rs3780962,rs4244304,rs1498553,rs3825663,rs728404,rs1448485,rs7170869,rs1453858, rs2342747,rs4787040,rs881929,rs1197062和rs4789193；
所述数据获取体系用于由所述各特异性位点的基因型利用STRUCTURE软件获得群体遗传主成分分析结果。

6.  根据权利要求5所述的系统，其特征在于，所述复合扩增检测体系用于采用与所述27个特异性位点一一对应的27对扩增引物对其进行扩增以获得扩增产物，并使用与所述27个特异性位点一一对应的27条延伸引物对该扩增产物进行延伸以获得延伸产物，并由获得的延伸产物得到未知来源个体的DNA的27个特异性位点的基因型。

7.  根据权利要求6所述的系统，其特征在于，所述扩增引物为序列表中SEQ ID No.1至SEQ ID No.54的核苷酸序列，所述延伸引物为序列表中SEQ ID No.55至SEQ ID No.81的核苷酸序列。

8.  一种复合扩增检测体系，其特征在于，所述体系包括未知来源个体DNA，27个非、欧、东亚群体特异性位点，扩增引物以及延伸引物，
所述复合扩增检测体系用于利用扩增引物扩增未知来源个体的DNA的27个特异性位点获得扩增产物，并使用延伸引物对该扩增产物进行延伸，并由获得的延伸产物得到未知来源个体的DNA的27个特异性位点的基因型；
所述27个非、欧、东亚群体特异性位点为：rs595961,rs2710684,rs260690,rs10496971,rs10497191,rs6444724,rs1586861,rs28777,rs13182883,rs1366220,rs159606,rs7752055,rs321198,rs366178,rs3780962,rs4244304,rs1498553,rs3825663,rs728404,rs1448485,rs7170869,rs1453858,rs2342747,rs4787040,rs881929,rs1197062和rs4789193；
所述扩增引物由与所述27个特异性位点一一对应的27对扩增引物组成，所述扩增引物为序列表中SEQ ID No.1至SEQ ID No.54的核苷酸序列；
所述延伸引物由与所述27个特异性位点一一对应的27条延伸引物组成，所述延伸引物为序列表中SEQ ID No.55至SEQ ID No.81的核苷酸序列。

9.  一种检测试剂盒，其特征在于，包括权利要求8所述的复合扩增检测体系。

说明书

说明书一种对未知来源个体进行非、欧、东亚群体遗传主成分析的方法和系统
技术领域
本发明涉及一种推断未知个体来源的方法和系统，尤其涉及一种对未知来源个体进行非、欧、东亚群体遗传主成分析的方法和系统。
背景技术
伴随经济全球化，不同国家、区域间的人员流动加大，涉外、反恐、跨区域流动作案等复杂案件不断增多，案件侦查的难度日益加大。例如，北京、上海、广东等大城市经常出现涉外案件。目前国际人种主要分为欧洲、非洲、东亚三大人种及由这些人种形成的混合人种，我国境内的混合人群主要包括新疆的维吾尔族、哈萨克族、柯尔克孜族等欧洲和东亚的混合人群。
通常，从案件现场生物检材中提取到的DNA会进行STR检测，分型结果录入数据库比对查找，或者直接与目标嫌疑人的STR分型进行比对。而在比对不中的情况下，我们还可以利用DNA中蕴含的祖先信息(例如群体遗传主成分析)来推测供者的群体来源，这对案件的侦破能起到指导性作用。在基因组DNA中，有一部分常染色体SNPs等位基因在不同人群中会存在较大的频率分布差异，差值δ>0.3，这部分位点被定义为AIMs。
国际上针对洲际层面非、欧、东亚这3大最主要人群的分类划分已经研究的较为深入，形成了很多不同的AIMs位点组合，并构建了少数几套复合扩增检测体系用于实践检验。目前，由于已有的AIMs位点组合包含的位点数目较多，不易于构建复合扩增检测体系，且由于受到SNP检测平台的限制，这些已经构建的检测体系也很难推广使用。
因此，如何提供一种能有效的对未知来源个体进行非、欧、东亚群体遗传主成分析的方法和系统，并具有广泛的适用性成为有待解决的问题。
发明内容
本发明提供了一种对未知来源个体进行非、欧、东亚群体遗传主成分析的方法，通过获得未知来源个体的DNA的27个非、欧、东亚群体特异性位点的基因型，结合STRUCTURE软件对未知来源个体的非、欧、东亚群体遗传主成分析，从而为进行未知来源个体的非、欧、东亚群体来源推断提供数据支持。
本发明还提供了一种对未知来源个体进行非、欧、东亚群体遗传主成分析的系统，利用该系统中的复合扩增检测体系能快速获得未知来源个体的DNA27个非、欧、东亚群体特异性位点的基因型，进而与现有软件结合，实现对未知来源个体的非、欧、东亚群体遗传主成分析。
本发明还提供了一种复合扩增检测体系，能快速获得未知来源个体的DNA27个非、欧、东亚群体特异性位点的基因型，为获得未知来源个体的非、欧、东亚群体遗传主成分分析结果提供数据支持。
本发明还提供了一种检测试剂盒，含有所述复合扩增检测体系。该试剂盒能快速获得未知来源个体的DNA 27个非、欧、东亚群体特异性位点的基因型。
本发明提供的一种对未知来源个体进行非、欧、东亚群体遗传主成分析的方法，该方法包括：
1)提取未知来源个体的DNA；
2)获得所述DNA的27个非、欧、东亚群体特异性位点的基因型，所述27个非、欧、东亚群体特异性位点为：rs595961,rs2710684,rs260690,rs10496971,rs10497191,rs6444724,rs1586861,rs28777,rs13182883,rs1366220,rs159606,rs7752055,rs321198,rs366178,rs3780962,rs4244304,rs1498553,rs3825663,rs728404,rs1448485,rs7170869,rs1453858,rs2342747,rs4787040,rs881929,rs1197062和rs4789193；
3)将所述各特异性位点的基因型利用STRUCTURE软件获得群体遗传主成分分析结果。
进一步的，上述2)包括采用与所述27个特异性位点一一对应的27对扩增引物对其进行扩增以获得扩增产物的步骤；以及使用与所述27个特异性位点一一对应的27条延伸引物对所述扩增产物进行延伸以获得延伸产物的步骤。
更进一步的，所述扩增引物为序列表中SEQ ID No.1至SEQ ID No.54的核苷酸序列；所述延伸引物为序列表中SEQ ID No.55至SEQ ID No.81的核苷酸序列。
在本发明的一个具体实施方式中，2)还包括在获得延伸产物后，使用遗传分析仪分析该延伸产物，以获得所述27个特异性位点的基因型的步骤。在本发明的方案中，所述遗传分析仪可以是本领域技术人员常规使用的遗传分析仪，例如ABI3130或ABI3500型遗传分析仪，通过ID-X软件或其他GeneMapper软件等分析该延伸产物中所述27个特异性位点的基因型。
本发明提供的一种对未知来源个体进行非、欧、东亚群体遗传主成分析的系统，包括DNA提取体系，复合扩增检测体系，数据获取体系；
所述DNA提取体系用于提取未知来源个体的DNA；
所述复合扩增检测体系用于获得所述DNA的27个非、欧、东亚群体特异性位点的基因型，所述27个非、欧、东亚群体特异性位点为：rs595961,rs2710684,rs260690,rs10496971,rs10497191,rs6444724,rs1586861,rs28777,rs13182883,rs1366220,rs159606,rs7752055,rs321198,rs366178,rs3780962,rs4244304,rs1498553,rs3825663,rs728404,rs1448485,rs7170869,rs1453858,rs2342747,rs4787040,rs881929,rs1197062和rs4789193；
所述数据获取体系用于由所述各特异性位点的基因型利用STRUCTURE软件获得群体遗传主成分分析结果。
在本申请的方案中，STRUCTURE软件为本领域现有的数据分析软件，其使用方法为本领域已知的，利用上述软件实施本发明的方案对本领域技术人员来说是可以实现的。
进一步的，所述复合扩增检测体系用于采用与所述27个特异性位点一一对应的27对扩增引物对其进行扩增以获得扩增产物，并使用与所述27个特异性位点一一对应的27条延伸引物对该扩增产物进行延伸以获得延伸产物，并由获得的延伸产物得到未知来源个体的DNA的27个特异性位点的基因型。
更进一步的，所述扩增引物为序列表中SEQ ID No.1至SEQ ID No.54的核苷酸序列，所述延伸引物为序列表中SEQ ID No.55至SEQ ID No.81的核苷酸序列。
本发明提供的一种复合扩增检测体系，包括未知来源个体DNA，27个非、欧、东亚群体特异性位点，扩增引物以及延伸引物，
所述复合扩增检测体系用于利用扩增引物扩增未知来源个体的DNA的27个特异性位点获得扩增产物，并使用延伸引物对该扩增产物进行延伸，并由获得的延伸产物得到未知来源个体的DNA的27个特异性位点的基因型；
所述27个非、欧、东亚群体特异性位点为：rs595961,rs2710684,rs260690,rs10496971,rs10497191,rs6444724,rs1586861,rs28777,rs13182883,rs1366220,rs159606,rs7752055,rs321198,rs366178,rs3780962,rs4244304,rs1498553,rs3825663,rs728404,rs1448485,rs7170869,rs1453858,rs2342747,rs4787040,rs881929,rs1197062和rs4789193；
所述扩增引物由与所述27个特异性位点一一对应的27对扩增引物组成，所述扩增引物为序列表中SEQ ID No.1至SEQ ID No.54的核苷酸序列；
所述延伸引物由与所述27个特异性位点一一对应的27条延伸引物组成，所述延伸引物为序列表中SEQ ID No.55至SEQ ID No.81的核苷酸序列。
本发明提供的一种检测试剂盒，其特征在于，包括所述的复合扩增检测体系。
在本发明的方案中，本发明利用所述复合扩增检测体系进行27个特异性位点的分型的方法，包括：1)将提取的未知来源个体DNA作为模板；2)使用所述扩增引物对作为模板的未知来源个体DNA进行多重PCR扩增反应以得到扩增产物；3)使用延伸引物对该扩增产物进行延伸(例如SNaPshot延伸)；4)将所述延伸产物利用遗传分析仪进行分析，以获得27个特异性位点的分型结果。
上述27个特异性位点的组合是申请人通过查阅大量参考文献，通过对非、欧、东亚人群的生活环境、种族起源等进行综合分析，考察各地区民族人口的表型特征差异，包括外形特征，生理指标等，针对这些差异进行文献和网络数据库调研，在已有研究的基础上获得的能进行非洲、欧洲、东亚个体来源推断的位点的组合。并且这些位点的组合适合构建one-tube复合扩增体系。
所述未知来源个体可以为来自非洲、欧洲、东亚人群，以及其混合人群的样本，例如血样、脱落细胞、骨头、牙齿、精斑和口腔拭子等样本，这些样本的个体来源未知。
本发明的所述27个非、欧、东亚群体特异性位点的信息如表1所示：
表1
序号SNP位点染色体等位基因1rs5959611A/G2rs27106842C/T3rs2606902A/C4rs104969712G/T5rs104971912C/T6rs64447243A/G7rs15868613C/T8rs287775A/C9rs131828835A/G10rs13662205C/T11rs1596065A/G12rs77520556C/T13rs3211987A/G14rs3661788G/T15rs378096210A/G16rs424430410C/T17rs149855311A/G18rs382566314C/T19rs72840415A/G20rs144848515A/C21rs717086915A/G22rs145385815A/T23rs234274716A/G24rs478704016A/T25rs88192916G/T26rs119706217A/C27rs478919317A/T
本发明提供的优选扩增引物序列如下。27对扩增引物用PRIMER PREMIER 5.0(PREMIER Biosoft,Palo Alto,CA,USA)设计，所述27对扩增引物及其相对应的基因座如下表2所示，PCRU代表上游引物，PCRL代表下游引物；

本发明的方案具有以下优点：
1、本发明方法和系统可以进行非洲、欧洲、东亚人群，以及其混合人群(例如中亚人群(欧、东亚人群的混合)等)的祖先成分划分(即群体遗传主成分分析)，在涉外、反恐案件中，尤其对于在上述案件中提取到的不同种族地域来源人群的生物样本，在STRs分型比对不中的情况下，确定涉案人员的群体身份来源，使案件快速定性和明确侦查方向，能发挥重要作用。
2、本申请的方法和系统，采用27个特异性位点的组合，构成出能对未知来源个体进行有效的复合扩增的检测体系，尤其是one-tube复合扩增体系，可以节省DNA模板量，并适用于毛细管电泳分析方法。这使得本发明的方法和系统能有效在各种涉及非、欧、东亚群体来源推断的案件中广泛应用。
3、由实施例数据可以看出，本申请的方法和系统应用于2起案件4例DNA供者的非、欧、东亚群体遗传主成分构成进行了分析，分析结果与案例的已知群体来源一致，进一步，针对从HapMap数据库中挑选的已知来源的422份样本(包括来自非洲、欧洲、东亚人群，以及其混合人群的样本)的群体遗传主成分构成进行分析，由该分析结果得出的群体主成分构成结果同样与这些样本的已知来源一致，说明由本发明的的方法和系统获得的非、欧、东亚群体遗传主成分析结果，可以为非、欧、东亚群体来源推断提供准确的数据支持。
附图说明
图1.27个SNP位点采用STRUCTURE软件分析得到14个人群STRUCTURE(K＝3)群体成分分析结果图。其中，YRI和LWK作为典型非洲人群的代表，CEU和TSI作为典型欧洲人群的代表，CHB和JPT作为典型东亚人群代表。ASW美国西南地区非裔人群；CEU美国犹他州的北欧和西欧人后裔人群；CHB北京汉族人群；CHD美国科罗拉多州丹佛市华人人群；GIH德克萨斯州休斯顿的古吉拉特语系印度人群；JPT东京的日本人群；LWK肯尼亚Webuye的Luhya人群；MEX加利福尼亚州洛杉矶的墨西哥人后裔人群；MKK肯尼亚Kinyawa的Maasai人群；TSI意大利的Toscani人群；YRI尼日利亚伊巴丹的约鲁巴人群；CHN中国北方的汉族人群；CTT中国西藏的藏族人群；CUX中国新疆的维吾尔族人群(欧洲和东亚混合人群)。
图2：案件1中样本非、欧、东亚群体遗传主成分构成图。
图3：案件2中样本1非、欧、东亚群体遗传主成分构成图。
图4：案件2中样本2非、欧、东亚群体遗传主成分构成图。
图5：案件2中样本3非、欧、东亚群体遗传主成分构成图。
图6A-6E:对随机抽取的来自个非洲人，欧洲人，亚洲人的样本采用本发明方法和系统检测群体遗传主成分构成的图。图6A为非洲人样本YRI330，图6B为欧洲人样本CEU998，图6C为南亚人(非、欧、东亚混合)样本GIH1179，图6D为东亚人样本CHN870，图6E为中亚人(欧、东亚混合)样本CUX1066。
具体实施方式
实施例1采用本发明的对未知来源个体进行非、欧、东亚群体遗传主成分分析的方法和系统对未知来源个体进行来源推断
图1为本申请方案中的27个SNP位点采用STRUCTURE软件针对14个人群STRUCTURE(K＝3)群体成分分析结果。图1的结果表明了这组位点可以有效区分出非洲、欧洲、东亚三大人群及其混合人群遗传主成分。
采用本发明的所述方法和系统对案例1和案例2中的个体进行来源推断。案例1在中国东北发现的骨骼残骸，(案件1中骨骼残片已移交美方，身份已经确认为56年前坠落的美国空军飞行员，欧洲人来源)；
案例2中3具烧焦尸体，需识别其民族来源，以明确案件的侦查方向(案件2中3名死者的身份已经确认，均来自新疆南部地区，维吾尔族人(即欧-东亚混合人群来源))。
1、提取待检测个体的DNA作为模板
案例1：1份骨骼残片，使用有机法提取DNA溶液。
案例2：3份静脉血(0.5ml)，使用DNA blood midi试剂盒(QIAGEN,Hilden,Germany)提取DNA溶液。
2、对提取的DNA模板进行多重PCR扩增反应
2.1、引物池配置
扩增引物池的配置，其中所述扩增引物组中为所述27个SNP位点一一对应的27对扩增引物，每对扩增引物能扩增待检测DNA上包括其相应的SNP位点；本实施例中，优选的，所述27个SNP位点的扩增引物组为序列表中SEQ ID No.1至SEQ ID No.54的核苷酸序列；本发明提供的各种引物序列由上海生工生物工程技术服务有限公司合成。
2.2、多重PCR反应
本实施例使用具有96孔PCR板的AB 9700型DNA扩增仪进行多重PCR反应。
(1)配置PCR mix(27-plex PCR(5μL反应体系))
试剂名称配置量(μL)浓度PCR引物池(27-plex)0.135每条引物0.05μΜdNTP(10mM)0.050.1mM10×PCR buffer(缓冲液，含15mM Mg2+)0.5Mg2+1.5mMMgCl2(25mM Mg2+)0.7Mg2+3.5mMHotstar Taq plus(5U/μL)0.10.1UddH2O(去离子水)1.515 DNA22-10ng/μL总体积5(μL)
按上表中的比例分别配置27重PCR mix，将扩增体系的PCR mix混匀后，取5μL加入到96孔PCR板的反应孔中，再分别在上述反应孔的3μL的PCRmix中加入2μL待检测的DNA模板(5μL反应体系)。封膜后，3000rcf离心1分钟。
(2)扩增程序

2.3、PCR产物纯化,加入3μL纯化试剂
(1)按照下表的体系，配制Clean-up试剂
试剂名称配置量(μL)浓度ExoⅠ(10U/μL)0.22USAP(1U/μL)11U10×SAP缓冲液0.31×ddH2O1.5 总计3
(2)将PCR反应后的96孔PCR板3000 rcf离心1分钟，再加入配好的Clean-up试剂，每孔3μL(每孔终体系为8μL)。封膜后，3000rcf离心1分钟，运行下表所示的程序。
步骤温度时间137℃30min296℃10min34℃∞
注：纯化好的PCR产物可以在-20℃条件下存放。
3、对纯化后的DNA扩增产物进行SNaPshot延伸反应
(1)解冻纯化好的96孔PCR板(含有步骤2扩增好的DNA产物作为延伸模板)按照下表所示体系配制27-plex的引物延伸反应混合物。
27-plex延伸反应(10μL反应体系)

(2)将解冻后的96孔PCR板3000 rcf离心1分钟，向每个孔中加入7μL配制好的27-plex引物延伸反应混合物(每孔终体系为15μL)，封膜，3000rcf离心1分钟，运行下表所示的程序。

注：引物延伸反应结束后的DNA产物可以在-20℃条件下存放。
(3)延伸产物纯化(去除ddNTPs)
在延伸产物中加入1U SAP(1U/μL,1μL)，进行以下的纯化反应程序：
步骤温度时间137℃60min275℃15min34℃∞
(4)毛细管电泳分型
纯化后的延伸产物在3500 XL遗传分析仪(Applied Biosystems)上检测，使用GeneMapper ID X软件(Applied Biosystems公司)分析数据。
4、分型结果

将所述各特异性位点的基因型利用STRUCTURE软件获得群体遗传主成分分析结果。结果如图2-5所示。
图2为案件1中样本非、欧、东亚群体遗传主成分构成图。由图2可以看出，非洲人成分占0.2％，欧洲人成分为99.2％，东亚人成分占0.6％；该群体遗传主成分分析结果支持DNA供者为欧洲人来源。
图3为案件2中样本1非、欧、东亚群体遗传主成分构成图。由图3可以看出，非洲人成分占0.4％，欧洲人成分为38.9％，东亚人成分占60.7％；该群体遗传主成分分析结果支持DNA供者为欧-东亚混合人群来源。
图4为案件2中样本2非、欧、东亚群体遗传主成分构成图。由图4可以看出，非洲人成分占2.3％，欧洲人成分为51.1％，东亚人成分占46.6％；该群体遗传主成分分析结果支持DNA供者为欧-东亚混合人群来源。
图5为样本3非、欧、东亚群体遗传主成分构成图。由图5可以看出，非洲人成分占2.6％，欧洲人成分为43.0％，东亚人成分占54.4％；该群体遗传主成分分析结果支持DNA供者为欧-东亚混合人群来源。
由本实施例方法获得的上述检材的非、欧、东亚群体遗传主成分分析结果，分析结果与案例样本的已知群体来源一致，说明由本发明方法和系统获得的群体遗传主成分分析结果能为进行非、欧、东亚群体来源推断提供数据支持。
实施例2
利用实施例1相同的方法和系统，采用相同的步骤对上述样本的对随机抽取的来自个非洲人，欧洲人，亚洲人的样本采用本发明方法和系统检测群体遗传主成分构成分析。
抽取的样本为以下5份：图6A为非洲人样本YRI330，图6B为欧洲人样本CEU998，图6C为南亚人(非、欧、东亚混合)样本GIH1179，图6D为东亚人样本CHN870，图6E为中亚人(欧、东亚混合)样本CUX1066。结果如图6所示，饼图为个体的非、欧、东亚群体遗传主成分构成比例。按数值从大到小表示个体可能的人群来源，可以看出群体遗传主成分的分析结果与样本的已知群体来源一致。
实施例3
利用本发明的方法和系统对HapMap数据库中挑选的已知来源的422份样本重新进行人种来源推断，来检验上述非、欧、东亚以及其混合人种推断系统的准确性，结果如表4所示：
表4非、欧、东亚人种推断系统对挑选的422份样本推断结果

其中，422份样本已知，非洲人样本(样本量84人)，欧洲人样本(样本量85人)，东亚人样本(样本量86人)，中亚人(欧、东亚混合)样本(样本量165人)
通过本发明的方法和系统对上述422份样本进行主成分分析，可以将非洲人样本全部推断为非洲人，欧洲人样本全部推断为欧洲人，东亚人样本全部推断为东亚人，中亚人的结果均为欧、东亚的混合成分，所有样本均符合其已知的人种来源。因此通过上述系统可以为进行非、欧、东亚群体来源推断提供准确的数据支持。

资源描述

《一种对未知来源个体进行非、欧、东亚群体遗传主成分析的方法和系统.pdf》由会员分享，可在线阅读，更多相关《一种对未知来源个体进行非、欧、东亚群体遗传主成分析的方法和系统.pdf（40页珍藏版）》请在专利查询网上搜索。

1、(10)申请公布号 CN 104212886 A (43)申请公布日 2014.12.17 CN 104212886 A (21)申请号 201410361064.4 (22)申请日 2014.07.25 C12Q 1/68(2006.01) C12N 15/11(2006.01) (71)申请人公安部物证鉴定中心地址 100038 北京市西城区木樨地南里 17 号 (72)发明人李彩霞魏以梁叶健 (74)专利代理机构北京同立钧成知识产权代理有限公司 11205 代理人刘芳 (54) 发明名称一种对未知来源个体进行非、欧、东亚群体遗传主成分析的方法和系统 (57) 摘要。

2、本发明提供一种对未知来源个体进行非、欧、东亚群体遗传主成分析的方法和系统，所述方法包括提取未知来源个体的 DNA ；获得所述 DNA 的 27 个非、欧、东亚群体特异性位点的基因型；将所述各特异性位点的基因型利用 STRUCTURE 软件获得群体遗传主成分分析结果。本发明提供的方案能实现对未知来源个体的非、欧、东亚群体遗传主成分析，并为未知来源个体进行非、欧、东亚群体来源推断提供数据支持。 (51)Int.Cl. 权利要求书 2 页说明书 14 页序列表 20 页附图 3 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请权利要求书2。

3、页说明书14页序列表20页附图3页 (10)申请公布号 CN 104212886 A CN 104212886 A 1/2 页 2 1. 一种对未知来源个体进行非、欧、东亚群体遗传主成分析的方法，其特征在于，该方法包括： 1) 提取未知来源个体的 DNA ； 2) 获得所述 DNA 的 27 个非、欧、东亚群体特异性位点的基因型，所述 27 个非、欧、东亚群体特异性位点为： rs595961,rs2710684,rs260690,rs10496971,rs10497191,rs6444724, rs1586861,rs28777,rs13182883,rs136。

4、6220,rs159606,rs7752055,rs321198,rs366178,r s3780962,rs4244304,rs1498553,rs3825663,rs728404,rs1448485,rs7170869,rs1453858 ,rs2342747,rs4787040,rs881929,rs1197062 和 rs4789193 ； 3) 将所述各特异性位点的基因型利用 STRUCTURE 软件获得群体遗传主成分分析结果。 2. 根据权利要求 1 所述的方法，其特征在于， 2) 包括采用与所述 27 个特异性位点一一对应的 27 对扩增引物对其进行扩增以获得扩增产物的步骤。

5、；以及使用与所述 27 个特异性位点一一对应的 27 条延伸引物对所述扩增产物进行延伸以获得延伸产物的步骤。 3.根据权利要求2所述的方法，其特征在于，所述扩增引物为序列表中SEQ ID No.1至 SEQ ID No.54 的核苷酸序列；所述延伸引物为序列表中 SEQ ID No.55 至 SEQ ID No.81 的核苷酸序列。 4.根据权利要求3所述的方法，其特征在于，其中2)还包括在获得延伸产物后，使用遗传分析仪分析该延伸产物，以获得所述 27 个特异性位点的基因型的步骤。 5. 一种对未知来源个体进行非、欧、东亚群体遗传主成分析的系统，其特征在于，所述。

6、系统包括 DNA 提取体系，复合扩增检测体系，数据获取体系；所述 DNA 提取体系用于提取未知来源个体的 DNA ；所述复合扩增检测体系用于获得所述 DNA 的 27 个非、欧、东亚群体特异性位点的基因型，所述 27 个非、欧、东亚群体特异性位点为： rs595961,rs2710684,rs260690,rs10496971 ,rs10497191,rs6444724,rs1586861,rs28777,rs13182883,rs1366220,rs159606,rs77520 55,rs321198,rs366178,rs3780962,rs4244304,rs1。

7、498553,rs3825663,rs728404,rs14484 85,rs7170869,rs1453858,rs2342747,rs4787040,rs881929,rs1197062 和 rs4789193 ；所述数据获取体系用于由所述各特异性位点的基因型利用 STRUCTURE 软件获得群体遗传主成分分析结果。 6. 根据权利要求 5 所述的系统，其特征在于，所述复合扩增检测体系用于采用与所述 27 个特异性位点一一对应的 27 对扩增引物对其进行扩增以获得扩增产物，并使用与所述 27 个特异性位点一一对应的 27 条延伸引物对该扩增产物进行延伸以获得延伸产物，并由获得。

8、的延伸产物得到未知来源个体的 DNA 的 27 个特异性位点的基因型。 7.根据权利要求6所述的系统，其特征在于，所述扩增引物为序列表中SEQ ID No.1至 SEQ ID No.54 的核苷酸序列，所述延伸引物为序列表中 SEQ ID No.55 至 SEQ ID No.81 的核苷酸序列。 8. 一种复合扩增检测体系，其特征在于，所述体系包括未知来源个体 DNA， 27 个非、欧、东亚群体特异性位点，扩增引物以及延伸引物，所述复合扩增检测体系用于利用扩增引物扩增未知来源个体的 DNA 的 27 个特异性位点获得扩增产物，并使用延伸引物对该扩增产物进行延伸，并由获。

9、得的延伸产物得到未知来源个体的 DNA 的 27 个特异性位点的基因型；权利要求书 CN 104212886 A 2 2/2 页 3 所述 27 个非、欧、东亚群体特异性位点为： rs595961,rs2710684,rs260690,rs1049697 1,rs10497191,rs6444724,rs1586861,rs28777,rs13182883,rs1366220,rs159606,rs7752 055,rs321198,rs366178,rs3780962,rs4244304,rs1498553,rs3825663,rs728404,rs1448 485,rs。

10、7170869,rs1453858,rs2342747,rs4787040,rs881929,rs1197062 和 rs4789193 ；所述扩增引物由与所述 27 个特异性位点一一对应的 27 对扩增引物组成，所述扩增引物为序列表中 SEQ ID No.1 至 SEQ ID No.54 的核苷酸序列；所述延伸引物由与所述 27 个特异性位点一一对应的 27 条延伸引物组成，所述延伸引物为序列表中 SEQ ID No.55 至 SEQ ID No.81 的核苷酸序列。 9. 一种检测试剂盒，其特征在于，包括权利要求 8 所述的复合扩增检测体系。权利要求书 CN 1。

11、04212886 A 3 1/14 页 4 一种对未知来源个体进行非、欧、东亚群体遗传主成分析的方法和系统技术领域 0001 本发明涉及一种推断未知个体来源的方法和系统，尤其涉及一种对未知来源个体进行非、欧、东亚群体遗传主成分析的方法和系统。背景技术 0002 伴随经济全球化，不同国家、区域间的人员流动加大，涉外、反恐、跨区域流动作案等复杂案件不断增多，案件侦查的难度日益加大。例如，北京、上海、广东等大城市经常出现涉外案件。目前国际人种主要分为欧洲、非洲、东亚三大人种及由这些人种形成的混合人种，我国境内的混合人群主要包括新疆的维吾尔族、哈萨克。

12、族、柯尔克孜族等欧洲和东亚的混合人群。 0003 通常，从案件现场生物检材中提取到的DNA会进行STR检测，分型结果录入数据库比对查找，或者直接与目标嫌疑人的 STR 分型进行比对。而在比对不中的情况下，我们还可以利用 DNA 中蕴含的祖先信息 ( 例如群体遗传主成分析 ) 来推测供者的群体来源，这对案件的侦破能起到指导性作用。在基因组 DNA 中，有一部分常染色体 SNPs 等位基因在不同人群中会存在较大的频率分布差异，差值 0.3，这部分位点被定义为 AIMs。 0004 国际上针对洲际层面非、欧、东亚这 3 大最主要人群的分类划分已经研究的较为深入，形。

13、成了很多不同的 AIMs 位点组合，并构建了少数几套复合扩增检测体系用于实践检验。目前，由于已有的 AIMs 位点组合包含的位点数目较多，不易于构建复合扩增检测体系，且由于受到 SNP 检测平台的限制，这些已经构建的检测体系也很难推广使用。 0005 因此，如何提供一种能有效的对未知来源个体进行非、欧、东亚群体遗传主成分析的方法和系统，并具有广泛的适用性成为有待解决的问题。发明内容 0006 本发明提供了一种对未知来源个体进行非、欧、东亚群体遗传主成分析的方法，通过获得未知来源个体的 DNA 的 27 个非、欧、东亚群体特异性位点的基因型，结合 STRUC。

14、TURE 软件对未知来源个体的非、欧、东亚群体遗传主成分析，从而为进行未知来源个体的非、欧、东亚群体来源推断提供数据支持。 0007 本发明还提供了一种对未知来源个体进行非、欧、东亚群体遗传主成分析的系统，利用该系统中的复合扩增检测体系能快速获得未知来源个体的 DNA27 个非、欧、东亚群体特异性位点的基因型，进而与现有软件结合，实现对未知来源个体的非、欧、东亚群体遗传主成分析。 0008 本发明还提供了一种复合扩增检测体系，能快速获得未知来源个体的 DNA27 个非、欧、东亚群体特异性位点的基因型，为获得未知来源个体的非、欧、东亚群体遗传主成分。

15、分析结果提供数据支持。 0009 本发明还提供了一种检测试剂盒，含有所述复合扩增检测体系。该试剂盒能快速说明书 CN 104212886 A 4 2/14 页 5 获得未知来源个体的 DNA 27 个非、欧、东亚群体特异性位点的基因型。 0010 本发明提供的一种对未知来源个体进行非、欧、东亚群体遗传主成分析的方法，该方法包括： 0011 1) 提取未知来源个体的 DNA ； 0012 2) 获得所述 DNA 的 27 个非、欧、东亚群体特异性位点的基因型，所述 27 个非、欧、东亚群体特异性位点为： rs595961,rs2710684,rs260690,r。

16、s10496971,rs10497191,rs6444 724,rs1586861,rs28777,rs13182883,rs1366220,rs159606,rs7752055,rs321198,rs3661 78,rs3780962,rs4244304,rs1498553,rs3825663,rs728404,rs1448485,rs7170869,rs145 3858,rs2342747,rs4787040,rs881929,rs1197062 和 rs4789193 ； 0013 3) 将所述各特异性位点的基因型利用 STRUCTURE 软件获得群体遗传主成分分析结果。 0014 进。

17、一步的，上述 2) 包括采用与所述 27 个特异性位点一一对应的 27 对扩增引物对其进行扩增以获得扩增产物的步骤；以及使用与所述 27 个特异性位点一一对应的 27 条延伸引物对所述扩增产物进行延伸以获得延伸产物的步骤。 0015 更进一步的，所述扩增引物为序列表中SEQ ID No.1至SEQ ID No.54的核苷酸序列；所述延伸引物为序列表中 SEQ ID No.55 至 SEQ ID No.81 的核苷酸序列。 0016 在本发明的一个具体实施方式中， 2) 还包括在获得延伸产物后，使用遗传分析仪分析该延伸产物，以获得所述 27 个特异性位点的基因型的步骤。在。

18、本发明的方案中，所述遗传分析仪可以是本领域技术人员常规使用的遗传分析仪，例如 ABI3130 或 ABI3500 型遗传分析仪，通过ID-X 软件或其他 GeneMapper 软件等分析该延伸产物中所述 27 个特异性位点的基因型。 0017 本发明提供的一种对未知来源个体进行非、欧、东亚群体遗传主成分析的系统，包括 DNA 提取体系，复合扩增检测体系，数据获取体系； 0018 所述 DNA 提取体系用于提取未知来源个体的 DNA ； 0019 所述复合扩增检测体系用于获得所述 DNA 的 27 个非、欧、东亚群体特异性位点的基因型，所述 27 个非、欧、。

19、东亚群体特异性位点为： rs595961,rs2710684,rs260690,rs 10496971,rs10497191,rs6444724,rs1586861,rs28777,rs13182883,rs1366220,rs1596 06,rs7752055,rs321198,rs366178,rs3780962,rs4244304,rs1498553,rs3825663,rs72 8404,rs1448485,rs7170869,rs1453858,rs2342747,rs4787040,rs881929,rs1197062 和 rs4789193 ； 0020 所述数据获取体系用于由。

20、所述各特异性位点的基因型利用 STRUCTURE 软件获得群体遗传主成分分析结果。 0021 在本申请的方案中， STRUCTURE 软件为本领域现有的数据分析软件，其使用方法为本领域已知的，利用上述软件实施本发明的方案对本领域技术人员来说是可以实现的。 0022 进一步的，所述复合扩增检测体系用于采用与所述 27 个特异性位点一一对应的 27 对扩增引物对其进行扩增以获得扩增产物，并使用与所述 27 个特异性位点一一对应的 27 条延伸引物对该扩增产物进行延伸以获得延伸产物，并由获得的延伸产物得到未知来源个体的 DNA 的 27 个特异性位点的基因型。 0023 更进一步的，。

21、所述扩增引物为序列表中SEQ ID No.1至SEQ ID No.54的核苷酸序说明书 CN 104212886 A 5 3/14 页 6 列，所述延伸引物为序列表中 SEQ ID No.55 至 SEQ ID No.81 的核苷酸序列。 0024 本发明提供的一种复合扩增检测体系，包括未知来源个体 DNA， 27 个非、欧、东亚群体特异性位点，扩增引物以及延伸引物， 0025 所述复合扩增检测体系用于利用扩增引物扩增未知来源个体的 DNA 的 27 个特异性位点获得扩增产物，并使用延伸引物对该扩增产物进行延伸，并由获得的延伸产物得到未知来源个体的 DNA 的 27。

22、个特异性位点的基因型； 0026 所述 27 个非、欧、东亚群体特异性位点为： rs595961,rs2710684,rs260690,rs1 0496971,rs10497191,rs6444724,rs1586861,rs28777,rs13182883,rs1366220,rs15960 6,rs7752055,rs321198,rs366178,rs3780962,rs4244304,rs1498553,rs3825663,rs728 404,rs1448485,rs7170869,rs1453858,rs2342747,rs4787040,rs881929,rs119706。

23、2 和 rs4789193 ； 0027 所述扩增引物由与所述 27 个特异性位点一一对应的 27 对扩增引物组成，所述扩增引物为序列表中 SEQ ID No.1 至 SEQ ID No.54 的核苷酸序列； 0028 所述延伸引物由与所述 27 个特异性位点一一对应的 27 条延伸引物组成，所述延伸引物为序列表中 SEQ ID No.55 至 SEQ ID No.81 的核苷酸序列。 0029 本发明提供的一种检测试剂盒，其特征在于，包括所述的复合扩增检测体系。 0030 在本发明的方案中，本发明利用所述复合扩增检测体系进行 27 个特异性位点的分型的方法，包括： 1)。

24、将提取的未知来源个体 DNA 作为模板； 2) 使用所述扩增引物对作为模板的未知来源个体 DNA 进行多重 PCR 扩增反应以得到扩增产物； 3) 使用延伸引物对该扩增产物进行延伸 ( 例如 SNaPshot 延伸 ) ； 4) 将所述延伸产物利用遗传分析仪进行分析，以获得 27 个特异性位点的分型结果。 0031 上述 27 个特异性位点的组合是申请人通过查阅大量参考文献，通过对非、欧、东亚人群的生活环境、种族起源等进行综合分析，考察各地区民族人口的表型特征差异，包括外形特征，生理指标等，针对这些差异进行文献和网络数据库调研，在已有研究的基础上获得的能进。

25、行非洲、欧洲、东亚个体来源推断的位点的组合。并且这些位点的组合适合构建 one-tube 复合扩增体系。 0032 所述未知来源个体可以为来自非洲、欧洲、东亚人群，以及其混合人群的样本，例如血样、脱落细胞、骨头、牙齿、精斑和口腔拭子等样本，这些样本的个体来源未知。 0033 本发明的所述 27 个非、欧、东亚群体特异性位点的信息如表 1 所示： 0034 表 1 0035 序号SNP 位点染色体等位基因 1rs5959611A/G 2rs27106842C/T 3rs2606902A/C 4rs104969712G/T 说明书 CN 104212886 A 6。

26、 4/14 页 7 5rs104971912C/T 6rs64447243A/G 7rs15868613C/T 8rs287775A/C 9rs131828835A/G 10rs13662205C/T 11rs1596065A/G 12rs77520556C/T 13rs3211987A/G 14rs3661788G/T 15rs378096210A/G 16rs424430410C/T 17rs149855311A/G 18rs382566314C/T 19rs72840415A/G 20rs144848515A/C 21rs717086915A/G 22rs145385815A/T 23r。

27、s234274716A/G 24rs478704016A/T 25rs88192916G/T 26rs119706217A/C 27rs478919317A/T 0036 本发明提供的优选扩增引物序列如下。27 对扩增引物用 PRIMER PREMIER 5.0(PREMIER Biosoft,Palo Alto,CA,USA) 设计，所述 27 对扩增引物及其相对应的基因座说明书 CN 104212886 A 7 5/14 页 8 如下表 2 所示， PCRU 代表上游引物， PCRL 代表下游引物； 0037 说明书 CN 104212886 A 8 6/14 页 9 003。

28、8 0039 说明书 CN 104212886 A 9 7/14 页 10 0040 本发明的方案具有以下优点： 0041 1、本发明方法和系统可以进行非洲、欧洲、东亚人群，以及其混合人群 ( 例如中亚说明书 CN 104212886 A 10 8/14 页 11 人群(欧、东亚人群的混合)等)的祖先成分划分(即群体遗传主成分分析)，在涉外、反恐案件中，尤其对于在上述案件中提取到的不同种族地域来源人群的生物样本，在 STRs 分型比对不中的情况下，确定涉案人员的群体身份来源，使案件快速定性和明确侦查方向，能发挥重要作用。 0042 2、本申请的方法和。

29、系统，采用 27 个特异性位点的组合，构成出能对未知来源个体进行有效的复合扩增的检测体系，尤其是one-tube复合扩增体系，可以节省DNA模板量，并适用于毛细管电泳分析方法。这使得本发明的方法和系统能有效在各种涉及非、欧、东亚群体来源推断的案件中广泛应用。 0043 3、由实施例数据可以看出，本申请的方法和系统应用于 2 起案件 4 例 DNA 供者的非、欧、东亚群体遗传主成分构成进行了分析，分析结果与案例的已知群体来源一致，进一步，针对从 HapMap 数据库中挑选的已知来源的 422 份样本 ( 包括来自非洲、欧洲、东亚人群，以及其混合人群。

30、的样本 ) 的群体遗传主成分构成进行分析，由该分析结果得出的群体主成分构成结果同样与这些样本的已知来源一致，说明由本发明的的方法和系统获得的非、欧、东亚群体遗传主成分析结果，可以为非、欧、东亚群体来源推断提供准确的数据支持。附图说明 0044 图1.27个SNP位点采用STRUCTURE软件分析得到14个人群STRUCTURE(K3)群体成分分析结果图。其中， YRI 和 LWK 作为典型非洲人群的代表， CEU 和 TSI 作为典型欧洲人群的代表， CHB和JPT作为典型东亚人群代表。 ASW美国西南地区非裔人群； CEU美国犹他州的北欧和西欧人后裔人群； C。

31、HB北京汉族人群； CHD美国科罗拉多州丹佛市华人人群； GIH 德克萨斯州休斯顿的古吉拉特语系印度人群； JPT 东京的日本人群； LWK 肯尼亚 Webuye 的 Luhya 人群； MEX 加利福尼亚州洛杉矶的墨西哥人后裔人群； MKK 肯尼亚 Kinyawa 的 Maasai 人群； TSI意大利的Toscani人群； YRI尼日利亚伊巴丹的约鲁巴人群； CHN中国北方的汉族人群； CTT 中国西藏的藏族人群； CUX 中国新疆的维吾尔族人群 ( 欧洲和东亚混合人群 )。 0045 图 2 ：案件 1 中样本非、欧、东亚群体遗传主成分构成图。 0046 图。

32、 3 ：案件 2 中样本 1 非、欧、东亚群体遗传主成分构成图。 0047 图 4 ：案件 2 中样本 2 非、欧、东亚群体遗传主成分构成图。 0048 图 5 ：案件 2 中样本 3 非、欧、东亚群体遗传主成分构成图。 0049 图 6A-6E: 对随机抽取的来自个非洲人，欧洲人，亚洲人的样本采用本发明方法和系统检测群体遗传主成分构成的图。图 6A 为非洲人样本 YRI330，图 6B 为欧洲人样本 CEU998，图 6C 为南亚人 ( 非、欧、东亚混合 ) 样本 GIH1179，图 6D 为东亚人样本 CHN870，图 6E 为中亚人 ( 欧、东亚混合。

33、 ) 样本 CUX1066。具体实施方式 0050 实施例 1 采用本发明的对未知来源个体进行非、欧、东亚群体遗传主成分分析的方法和系统对未知来源个体进行来源推断 0051 图 1 为本申请方案中的 27 个 SNP 位点采用 STRUCTURE 软件针对 14 个人群 STRUCTURE(K 3) 群体成分分析结果。图 1 的结果表明了这组位点可以有效区分出非洲、说明书 CN 104212886 A 11 9/14 页 12 欧洲、东亚三大人群及其混合人群遗传主成分。 0052 采用本发明的所述方法和系统对案例 1 和案例 2 中的个体进行来源推断。案例 1 在中国东北发现的。

34、骨骼残骸， ( 案件 1 中骨骼残片已移交美方，身份已经确认为 56 年前坠落的美国空军飞行员，欧洲人来源 ) ； 0053 案例 2 中 3 具烧焦尸体，需识别其民族来源，以明确案件的侦查方向 ( 案件 2 中 3 名死者的身份已经确认，均来自新疆南部地区，维吾尔族人 ( 即欧 - 东亚混合人群来源 )。 0054 1、提取待检测个体的 DNA 作为模板 0055 案例 1 ： 1 份骨骼残片，使用有机法提取 DNA 溶液。 0056 案例 2 ： 3 份静脉血 (0.5ml)，使用 DNA blood midi 试剂盒 (QIAGEN,Hilden,Germany) 提。

35、取 DNA 溶液。 0057 2、对提取的 DNA 模板进行多重 PCR 扩增反应 0058 2.1、引物池配置 0059 扩增引物池的配置，其中所述扩增引物组中为所述 27 个 SNP 位点一一对应的 27 对扩增引物，每对扩增引物能扩增待检测 DNA 上包括其相应的 SNP 位点；本实施例中，优选的，所述 27 个 SNP 位点的扩增引物组为序列表中 SEQ ID No.1 至 SEQ ID No.54 的核苷酸序列；本发明提供的各种引物序列由上海生工生物工程技术服务有限公司合成。 0060 2.2、多重 PCR 反应 0061 本实施例使用具有 96 孔 PCR。

36、板的 AB 9700 型 DNA 扩增仪进行多重 PCR 反应。 0062 (1) 配置 PCR mix(27-plex PCR(5L 反应体系 ) 0063 试剂名称配置量 (L)浓度 PCR 引物池 (27-plex)0.135每条引物 0.05 dNTP(10mM)0.050.1mM 10PCR buffer( 缓冲液，含 15mM Mg2+)0.5Mg2+1.5mM MgCl2(25mM Mg2+)0.7Mg2+3.5mM Hotstar Taq plus(5U/L)0.10.1U ddH2O( 去离子水 )1.515 DNA22-10ng/L 总体积5(L) 0064 按上表中的。

37、比例分别配置 27 重 PCR mix，将扩增体系的 PCR mix 混匀后，取 5L 加入到 96 孔 PCR 板的反应孔中，再分别在上述反应孔的 3L 的 PCRmix 中加入 2L 待检测的 DNA 模板 (5L 反应体系 )。封膜后， 3000rcf 离心 1 分钟。 0065 (2) 扩增程序 0066 说明书 CN 104212886 A 12 10/14 页 13 0067 0068 2.3、 PCR 产物纯化 , 加入 3L 纯化试剂 0069 (1) 按照下表的体系，配制 Clean-up 试剂 0070 试剂名称配置量 (L)浓度 Exo (10U/L)0.2。

38、2U SAP(1U/L)11U 10SAP 缓冲液0.31 ddH2O1.5 总计3 0071 (2) 将 PCR 反应后的 96 孔 PCR 板 3000 rcf 离心 1 分钟，再加入配好的 Clean-up 试剂，每孔3L(每孔终体系为8L)。封膜后， 3000rcf离心1分钟，运行下表所示的程序。 0072 步骤温度时间 137 30min 296 10min 34 0073 注：纯化好的 PCR 产物可以在 -20条件下存放。 0074 3、对纯化后的 DNA 扩增产物进行 SNaPshot 延伸反应 0075 (1) 解冻纯化好的 96 孔 PCR 板 ( 含有步。

39、骤 2 扩增好的 DNA 产物作为延伸模板 ) 按照下表所示体系配制 27-plex 的引物延伸反应混合物。 0076 27-plex 延伸反应 (10L 反应体系 ) 说明书 CN 104212886 A 13 11/14 页 14 0077 0078 0079 (2) 将解冻后的 96 孔 PCR 板 3000 rcf 离心 1 分钟，向每个孔中加入 7L 配制好的 27-plex 引物延伸反应混合物 ( 每孔终体系为 15L)，封膜， 3000rcf 离心 1 分钟，运行下表所示的程序。 0080 0081 注：引物延伸反应结束后的 DNA 产物可以在 -20条件下存。

40、放。 0082 (3) 延伸产物纯化 ( 去除 ddNTPs) 0083 在延伸产物中加入 1U SAP(1U/L,1L)，进行以下的纯化反应程序： 0084 步骤温度时间 137 60min 275 15min 34 0085 (4) 毛细管电泳分型说明书 CN 104212886 A 14 12/14 页 15 0086 纯化后的延伸产物在 3500 XL 遗传分析仪 (Applied Biosystems) 上检测，使用 GeneMapper ID X 软件 (Applied Biosystems 公司 ) 分析数据。 0087 4、分型结果 0088 0089 将所述。

41、各特异性位点的基因型利用 STRUCTURE 软件获得群体遗传主成分分析结果。结果如图 2-5 所示。 0090 图 2 为案件 1 中样本非、欧、东亚群体遗传主成分构成图。由图 2 可以看出，非洲人成分占 0.2，欧洲人成分为 99.2，东亚人成分占 0.6 ；该群体遗传主成分分析结果支持 DNA 供者为欧洲人来源。 0091 图 3 为案件 2 中样本 1 非、欧、东亚群体遗传主成分构成图。由图 3 可以看出，非洲人成分占 0.4，欧洲人成分为 38.9，东亚人成分占 60.7；该群体遗传主成分分析结果支持 DNA 供者为欧 - 东亚混合人群来源。 009。

42、2 图 4 为案件 2 中样本 2 非、欧、东亚群体遗传主成分构成图。由图 4 可以看出，非洲人成分占 2.3，欧洲人成分为 51.1，东亚人成分占 46.6；该群体遗传主成分分析结说明书 CN 104212886 A 15 13/14 页 16 果支持 DNA 供者为欧 - 东亚混合人群来源。 0093 图5为样本3非、欧、东亚群体遗传主成分构成图。由图5可以看出，非洲人成分占 2.6，欧洲人成分为 43.0，东亚人成分占 54.4 ；该群体遗传主成分分析结果支持 DNA 供者为欧 - 东亚混合人群来源。 0094 由本实施例方法获得的上述检材的非、欧、。

43、东亚群体遗传主成分分析结果，分析结果与案例样本的已知群体来源一致，说明由本发明方法和系统获得的群体遗传主成分分析结果能为进行非、欧、东亚群体来源推断提供数据支持。 0095 实施例 2 0096 利用实施例 1 相同的方法和系统，采用相同的步骤对上述样本的对随机抽取的来自个非洲人，欧洲人，亚洲人的样本采用本发明方法和系统检测群体遗传主成分构成分析。 0097 抽取的样本为以下 5 份：图 6A 为非洲人样本 YRI330，图 6B 为欧洲人样本 CEU998，图 6C 为南亚人 ( 非、欧、东亚混合 ) 样本 GIH1179，图 6D 为东亚人样本 CHN87。

44、0，图 6E 为中亚人 ( 欧、东亚混合 ) 样本 CUX1066。结果如图 6 所示，饼图为个体的非、欧、东亚群体遗传主成分构成比例。按数值从大到小表示个体可能的人群来源，可以看出群体遗传主成分的分析结果与样本的已知群体来源一致。 0098 实施例 3 0099 利用本发明的方法和系统对 HapMap 数据库中挑选的已知来源的 422 份样本重新进行人种来源推断，来检验上述非、欧、东亚以及其混合人种推断系统的准确性，结果如表 4 所示： 0100 表 4 非、欧、东亚人种推断系统对挑选的 422 份样本推断结果 0101 0102 0103 其中， 422 。

45、份样本已知，非洲人样本 ( 样本量 84 人 )，欧洲人样本 ( 样本量 85 人 )，东亚人样本 ( 样本量 86 人 )，中亚人 ( 欧、东亚混合 ) 样本 ( 样本量 165 人 ) 0104 通过本发明的方法和系统对上述 422 份样本进行主成分分析，可以将非洲人样本全部推断为非洲人，欧洲人样本全部推断为欧洲人，东亚人样本全部推断为东亚人，中亚人的结果均为欧、东亚的混合成分，所有样本均符合其已知的人种来源。因此通过上述系统可说明书 CN 104212886 A 16 14/14 页 17 以为进行非、欧、东亚群体来源推断提供准确的数据支持。说明。

46、书 CN 104212886 A 17 1/20 页 18 0001 0002 序列表 CN 104212886 A 18 2/20 页 19 0003 序列表 CN 104212886 A 19 3/20 页 20 0004 序列表 CN 104212886 A 20 4/20 页 21 0005 序列表 CN 104212886 A 21 5/20 页 22 0006 序列表 CN 104212886 A 22 6/20 页 23 0007 序列表 CN 104212886 A 23 7/20 页 24 0008 序列表 CN 104212886 A 24 8。

47、/20 页 25 0009 序列表 CN 104212886 A 25 9/20 页 26 0010 序列表 CN 104212886 A 26 10/20 页 27 0011 序列表 CN 104212886 A 27 11/20 页 28 0012 序列表 CN 104212886 A 28 12/20 页 29 0013 序列表 CN 104212886 A 29 13/20 页 30 0014 序列表 CN 104212886 A 30 14/20 页 31 0015 序列表 CN 104212886 A 31 15/20 页 32 0016 序列表 C。

48、N 104212886 A 32 16/20 页 33 0017 序列表 CN 104212886 A 33 17/20 页 34 0018 序列表 CN 104212886 A 34 18/20 页 35 0019 序列表 CN 104212886 A 35 19/20 页 36 0020 序列表 CN 104212886 A 36 20/20 页 37 序列表 CN 104212886 A 37 1/3 页 38 图 1 图 2 图 3 说明书附图 CN 104212886 A 38 2/3 页 39 图 4 图 5 图 6A 图 6B 图 6C 图 6D 说明书附图 CN 104212886 A 39 3/3 页 40 图 6E 说明书附图 CN 104212886 A 40 。

展开阅读全文