用于野生生物鉴定的通用引物 【技术领域】
本发明涉及新型通用引物的鉴定,该引物可在聚合酶链反应(PCR)中扩增任何动物物种的细胞色素b基因片段并在物种和亚种水平揭示任何未知动物来源的生物学材料的特性。本发明也提供了在未知来源的生物学材料中鉴定线粒体细胞色素b基因片段的方法。
背景技术
进化生物学中大量的研究利用从线粒体细胞色素b基因获得的系统发育信息。该基因已鉴定为在分子分类学中区别不同谱系到科、属和种的系统发育深度的有效分子1-66。已在公共数据库如GenBank、NCBI(http://www.ncbi.nlm.nih.gov)等中积聚了大量关于不同动物物种的细胞色素b基因的序列数据库。我们已经利用了细胞色素b基因的这一能力来确定动物部分和产物的来源在科、属和种水平的特性。所发展的技术基于一对通用引物,该引物可从大范围的动物物种中扩增细胞色素b基因的一个小片段。
确定没收的动物部分和产物的特性对于执法机构是一个巨大的挑战,这是因为迄今为止没有可用的方法是足够有效以无合理的疑问地揭示动物遗体的特性。对某些物种描述的形态标记使得能够鉴定动物地完整标本67。然而,调查机构极少没收完整的标本,因此这些标记在野生生物法医学(forensics)中是不实用的。也已将生物化学性状如胆汁特征68、blood heam分析69,70等用于野生生物法医学中以鉴定单独的物种。这些标记的困难是这些标记数目有限,且很少以其天然形式被发现,而且它们最初以该天然形式描述为特定物种的特征。
分子方法如基于微卫星的鉴定71、对线粒体基因的限制性片段长度多态性分析或基于PCR的物种特异性STS标记需要物种的预先信息以确定其特性72,73。这些方法也需要显著量的DNA材料用于分析。我们在法医学中没有关于没收的动物部分和产物的物种来源的预先信息,因此这些方法在野生生物鉴定中实际上是没有用处且不实用的。由我们发明的技术是通用的,因此不需要任何背景信息以确定任何未知的没收的遗体在科、属和种水平的特性。作为基于PCR的程序,它可用痕量的任何生物学材料来应用。因为扩增子的长度是小的(472bp);因此它用毁伤的遗体也可极佳地扩增,该遗体通常由犯罪调查机构没收。它不需要大量的遗传材料即DNA以确定其特性,因此可探测血液产物中微量的掺杂。所描述的程序是简单且非常迅速的。由于该优点,由我们发明的程序最适合于野生生物的法医学鉴定。
发明目的
本发明的主要目的是鉴定线粒体细胞色素b基因上的一个片段,该片段能够显著地区别不同动物物种的各种进化谱系。
另一个目的是鉴定线粒体细胞色素b基因上的一个片段,该片段在侧面连接有在大范围的动物物种中高度保守的序列。
另外一个目的是探测线粒体细胞色素b基因上的一个片段,该片段在物种间是多样的,但在物种内是单态的。
另外一个目的是发展一种通用引物以用聚合酶链反应扩增线粒体细胞色素b基因上的一个片段。
另外一个目的是发展一种对于任何未知来源的DNA模板(即所有动物物种)都能通用地扩增的PCR规程。
另外一个目的是提供一种用公共数据库如GenBank、NCBI等来鉴定分析材料(即从未知来源的没收动物中分离的DNA)的物种的通用方法。
另外一个目的是提供一种动物鉴定的方法以无合理的疑问地确定罪犯的罪行。
另一个目的是提供一种通用方法以确定从动物偷猎者没收的生物学材料如皮肤、角等的特性,如果该材料是濒危物种的材料。
另外一个目的是为了在法院产生动物捕猎和相关犯罪的分子证据的目的,提供一种确定濒危动物物种的没收的动物部分和产物的特性的通用方法,从而人们对野生生物资源的侵害可得到控制。
另外一个目的是提供一种通用技术以基于偷猎的动物的单元型(由发明的通用引物鉴定的)来获知发生野生生物犯罪的地理位置。
另一个目的是提供一种动物鉴定的通用技术以由食品强化机构为了食品强化的目的而在素食食品产物中探测动物肉类/产物的掺杂。
另外一个目的是提供一种通用技术,该技术用于探测在涉及如谋杀、强奸等犯罪的犯罪现场收集的血液或血液玷污等的来源,在罪犯可能习惯地在犯罪现场撒动物血液以使犯罪调查机构和法医学家误认为是人血液时,用于确定在犯罪现场发现的血液的来源。
另一个目的是发明并鉴别一种通用技术,该技术可转变为基于(a)‘分子试剂盒’和(b)‘DNA芯片’的应用以满足上述目的的要求。
发明概述
因此,本发明提供了新型的通用引物,该引物可在聚合酶链反应(PCR)中扩增任何动物物种的细胞色素b基因片段并揭示任何未知动物来源的生物学材料的特性。
发明详述
考虑上述的目的,从公共数据库NCBI(http://www.ncbi.nlm.nih.gov)中获得了代表各个科的221个关系较远的动物物种(列于表1中)的细胞色素b基因的序列(1140bp)。将这些序列用软件Clustal X(1.8)(NCBI,USA)进行比对,并鉴定了一个基因的片段(472bp长,比对显示于表2中),该片段具有在上述亚标题‘发明目的’的1、2和3栏提及的所有特征。至于该片段的特性,我们认为它包括Antilope cervicapra和Felis catus中398~869的核苷酸;然而在智人(Homo sapiens)物种中为399~870。除了在少数位置(在表2中标记为星号(*)),该片段的核苷酸序列在动物物种中是高度可变的,从而产生其单一的分子特征。这些分子特征是其物种的特征,并形成了用我们发明的程序揭示未知动物来源的生物学材料的特性的基础。考虑Antilope cervicapra作为一种代表物种,因此提及了该片段的序列:
Antilope cervicapra的线粒体细胞色素b基因序列(398-869bp):
“taccatgaggacaaatatctttttgaggagcaacagtcatcaccaatctcctttcagcaatcccatacatcggtacaaacctagtaga
atgaatctgaggagggttctcagtagataaagcaacccttacccgatttttcgccttccactttatcctcccatttatcattgcagccctt
accatagtacacctactgtttctccacgaaacaggatccaacaaccccacaggaatctcatcagacgcagacaaaattccattccac
ccctactacactatcaaagatatcctaggagctctactattaattttaaccctcatgcttctagtcctattctcaccggacctgcttggag
acccagacaactatacaccagcaaacccacttaatacacccccacatatcaagcccgaatgatacttcctatttgcatacgcaatcct
ccgatcaattcctaacaaactaggagg”.
设计了一对通用引物以在聚合酶链反应(PCR)中扩增该片段。这些引物因为其扩增本发明的代表动物物种Antilope cervicapra的线粒体细胞色素b基因在核苷酸398~869之间的区域的性质而命名为‘mcb398’和‘mcb869’。我们之所以用该动物物种作为代表物种,是因为当发明者在印度Hyderabad的Centre for Cellular andMolecular Biology研究该动物的基因组时,他们想到要开发这样一种新型引物。这些引物由于其3’末端在大范围动物物种(在表2中显示)中是高度保守的,所以是通用的。如上所述,由这些引物靶向的DNA片段(其序列在上面显示)在物种间是高度多态的;然而它在相同物种的个体之间是单态的(分别为表6、7a、7b、7c、7d和8)。这些靶向的区域的独特特征使得这些引物能够生成单个物种的分子特征;因此,使得它们能够区别不同物种的动物(参见图1c)。由这些引物扩增的片段中的变化随两个动物的进化谱系的距离的增加而增加(表8)。由本申请人发明的通用引物‘mcb398’和‘mcb869’扩增的片段的独特特征实现了本发明的目的。
因而,由我们发明的引物可生成来自未知动物来源的生物学材料的分子特征,该特征实际是其科、属和(更精确地)种的特征。当将这些特征与已在公共数据库(即GenBank、NCBI数据库等)中可获得的特征用BLAST软件73进行in-silico比较时,显示了分析的材料的科、属或种的特征,这反过来通过与揭示的科、属或种的参考动物进行比较而在实际上得到证实,该比较是用引物“mcb398”和“mcb869”进行分析的。分析(单词‘分析’应理解为为了在亚标题‘发明目的’的1-13栏提及的目的而用逐步的程序来确定任何未知动物来源的生物学遗体的特性)包含的完整步骤分别在实施例5和6中简述,以及分别阐明于图1a、1b和1c中。
附图和表简述
图1a.分析中包含的逐步程序的阐明。未知的生物学材料(即‘adil.flesh’)指在实施例6中提及的没收的皮肤。箭头标记显示包含的逐步程序。图1a简述如下:
用标准程序对生物学材料即没收的皮肤‘adil.flesh’进行DNA分离74。将获得的DNA用引物‘mcb398’和‘mcb869’在PCR中进行扩增,在2%(w/v)的琼脂糖凝胶中分离,并用GelDocumentation System(Syngene,USA)在紫外光下进行显现和照相。在照片中显示的泳道‘M’代表分子量标记(Marker XIII,Boehringer mannheim)。泳道1表示用引物‘mcb398’和‘mcb869’从‘adil.flesh’获得的PCR扩增子(472bp)。将获得的扩增子用“ABI Prism 3700 DNA Analyzes,PE-AppliedBiosystems”在两链进行测序。层析谱表示从‘adil.flesh’获得的序列(约80bp长,即在序列(328bp)的150-230bp,从472bp长的PCR产物中得到)。
图1b.阐明包含于分析中的进一步的步骤。将从‘adil.flesh’中揭示的序列(328bp)在美国的国家生物学信息中心(National Centre for Biological Information)(NCBI)的nr(即非冗余的)数据库中进行同源性搜索。产生显著比对的序列与其字串值(bits score)和E值一起显示。它显示了在查询的序列(即来自adil.flesh的328bp的序列)和在NCBI的nr数据库中记录的序列中的同源性程度。BLAST分析揭示‘adil.flesh’的序列与豹(Panthera pardus)(gene bank记录号‘AY005809’)具有最高的同源性,从而显示adil.flesh为豹(Pantherapardus)来源的特性。图1b进一步阐明从参考动物(列于表5中)中获得的序列与从‘adil.flesh’获得的序列的多重比对。‘adil.flesh’的序列与‘gz1L’序列相似,进一步证实没收的遗体‘adil.flesh’的来源为豹来源的特性。
图1c.阐明了用CLUSTAL X(1.8)从由‘adil.flesh’和列于表5的参考动物中揭示的序列构建的NJ-树(邻接树)。属于相似物种的动物集在一起;然而不同物种的动物分组在不同的群中。在调查中没收的材料(即‘adil.flesh’)与‘gz1L’(即已知的正常豹Panthera pardus)集在一起,从而显示‘adil.flesh’物种为豹来源的特性。
图2表示显示PCR扩增子(472bp)的琼脂糖凝胶电泳图谱,该扩增子用通用引物‘mcb398’和‘mcb869’从列于表5中的猫科参考动物中获得。不同泳道描述如下:
泳道1-21:分别为列于表5中的动物1-21的PCR特征。
泳道22:从未知动物来源即‘adil.flesh’的没收的皮肤中分离的DNA的PCR特征。
泳道23:负对照(无DNA)
泳道M:分子量标记(Marker X III,Boehringer mannheim)
图3.表示从列于表9中的动物中获得的PCR扩增子。用于PCR的引物为‘AFF’和‘AFR’。所示的不同泳道描述如下:
泳道1-4:分别为列于表9中的动物1-4的PCR特征,显示354bp长的扩增子。
泳道M:分子量标记(Marker X III,Boehringer mannheim)
图4.表示从列于表12中的动物中获得的PCR扩增子。该实验证明我们的引物在大范围动物物种中的通用特性。所示的不同泳道描述如下:
泳道1-23:分别为列于表12中的动物1-23的PCR特征。472bp长的PCR产物是从所有分析的动物物种中普遍地扩增的。
泳道24:负对照(无DNA)
泳道M:分子量标记(Marker XIII,Boehringer mannheim)
表1.用于In-silico分析以设计通用引物‘mcb398’和‘mcb869’的221个动物物种的列表。该表也证明了‘mcb398’和‘mcb869’对于不同模板的‘P,S值’。用于该表的各种符号描述如下:
符号(#)指号码
符号(*)指动物物种,该物种为保护的物种(列于Wildlife(Protection)Act,1972(Central Act NO 53 of 1972)或为濒危/稀有的动物物种。
符号($P,S/F)指引物‘mcb398’与不同模板(即来自不同物种来源的细胞色素b基因)匹配的概率和匹配的稳定性。较高的P,S值指引物能以较高的概率对特定模板显著扩增。它是通过Amplify(1,2)软件计算的。
符号(ψP,S/R)指引物‘mcb869’与不同模板匹配的概率和匹配的稳定性。较高的P,S值指引物以较高的概率对特定模板显著扩增。它是通过Amplify(1,2)软件计算的。
表2.列于表1中的221个动物物种的线粒体细胞色素b基因的472bp长片段(由本发明者鉴定以满足在亚标题‘发明目的’提及的1、2和3栏的需要)多重序列比对。比对也显示通用引物‘mcb398’和‘mcb869’的结合位点。符号(*)指在列于表1中的221个动物物种中保守的核苷酸碱基。比对是用软件CLUSTAL X(1.8)进行的。未标记的核苷酸位置在分析的221个动物物种中是可变的。这些可变位点一起组成了单个物种的分子特征,从而奠定由我们的引物进行物种鉴定的基础。
表3.从‘adil.flesh’揭示的序列在NCBI的‘mito’数据库中blast分析的结果。该结果显示从没收的皮肤片‘adil.flesh’揭示的细胞色素b序列(328bp)与在NCBI数据库中记录的家猫(Felis catus)细胞色素b基因序列(genbank记录号NC_001700.1,字串值365,E值,e-101)具有最显著的比对(字串值365,E值,e-101)。这显示分析的材料的物种属于猫科。这也满足上述在亚标题‘发明目的’中6栏提及的要求。
表4.从‘adil.flesh’揭示的序列在NCBI的‘nr’数据库中blast分析的结果。该结果显示从没收的皮肤片‘adil.flesh’揭示的细胞色素b序列(328bp)与在NCBI数据库中记录的豹细胞色素b基因序列(genebank记录号AY005809,字串值603,E值,e-170)具有最显著的比对。这显示分析的材料的物种属于豹来源。这也满足上述在亚标题‘发明目的’中6栏提及的要求。
表5.属于猫科的参考动物,选择该参考动物以用于与‘adil.flesh’进行比较以证实分别在表3和表4中提及的BLAST分析结果。列于SN.1-21中的动物代表猫科的不同物种。SN.22和23是用作组外比较的灵长类物种。
表6.从‘adil.flesh’中和列于表5中的参考动物中揭示的细胞色素b序列(328bp)的多重序列比对。在研究中在所有动物物种中具有共同核苷酸的位置用(*)标记显示;然而在研究中在任何动物中有变化的位置不标记。这些位置的核苷酸组成了单个物种的分子特征,该特征对于其物种是独特的和高度特异性的。这些分子特征是用我们的引物‘mcb398’和‘mcb869’对单个动物物种进行鉴定的分子基础。
表7(表7a、7b、7c和7d)。与未知动物来源的没收的皮肤‘adil.flesh’一起研究的不同动物物种分子标记的比较。该表表明了从列于表5中的动物中揭示的328bp片段中的可变位置(即在表6中未用星号(*)符号标记的位置)。点(.)标记代表在该位置存在与列于泳道1中(即来自‘adil.flesh’的序列)相似的核苷酸。这表明每一个物种的特征是独特的且对于该物种是特定的。‘adil.flesh’的分子标记与‘gz1L’(即已知的豹‘Pantherapardus’来源)是可比较的(除了位置37具有从‘T’到‘C’的转换),从而显示没收的皮肤‘adil.flesh’为豹‘Pantherapardus’来源的特性。在已知的豹(即分别为gz1L、gz2L和gz3L)中位置153、198、223、264的核苷酸变异提示每一种动物的地理生境。多种涉及不同动物物种的分子进化的研究支持该假说75;然而,该假说可进一步通过从不同的地理区域获取参考动物并用我们的引物‘mcb398’和‘mcb869’进行分析而证实。如果我们可以生成动物物种的不同单元型(即生境特异性分子特征)的数据库,则也可能使得我们的引物能够揭示发生野生生物犯罪的地理位置。
表8.通过对比对的核苷酸序列成对地进行比较而计算的百分比相似矩阵(在表6中阐明)。从没收材料分离的DNA的细胞色素b基因序列与从已知的正常豹来源获得的序列具有最大的相似性(分别与动物‘gz2L’和‘gz3L’谱系为99.7%和98.2%),从而显示其为豹来源的特性。该相似矩阵已用软件PHYLIP(3.5)进行计算。
表9.选择用于确定最小P,S值的动物,从而用引物‘mcb398’和‘mcb869’对不同来源的细胞色素b基因进行有效扩增。显示了这些动物的引物‘AFF’和‘AFR’的P,S值。
表10.引物‘mcb398’在NCBI的nr数据库中的BLAST分析。该分析证明该引物的3’末端在大范围的动物物种中是高度保守的。在引物和模板(即不同动物物种的细胞色素b基因片段)中同样显示了显著的同源性,从而证实我们的引物的通用性。
表11.引物‘mcb869’在NCBI的nr数据库中的BLAST分析。该分析证明该引物的3’末端在大范围的动物物种中是高度保守的。在引物和模板(即不同动物物种的细胞色素b基因片段)中同样显示了显著的同源性,从而证实我们引物的通用性。
表12.其他属于关系较远的动物物种的动物,对该动物进行研究以证实引物‘mcb398’和‘mcb869’的通用性。表示来自这些动物的PCR扩增子的凝胶照片显示于图4中。
线粒体细胞色素b基因已极其广泛地应用于分子分类学研究中。它具有以科、属和种特异性的方式揭示动物的不同进化谱系的巨大能力。它也用于根据其人口统计分布(demographicdistribution)来对特定的物种群体进行分类75。不同动物物种的细胞色素b序列的大量数据库已在公共数据库如GenBank和NCBI中积聚1-65。我们已利用了细胞色素b基因的这些特征以用发明的一对新型引物‘mcb398’和‘mcb869’来确定任何未知动物的没收遗体的特性,该引物可以以通用的方式扩增大范围动物物种的细胞色素b基因的小片段(472bp)。这些引物因为其3’末端靶向于高度保守的区域而可通用。
鉴定的细胞色素b基因片段具有在亚标题‘发明目的’下所列的1、2和3栏中提及的所有特性。我们通过比对列于表1中的221个不同的动物物种的细胞色素b基因序列(1140bp)而鉴定了该片段。这些序列在NCBI DNA数据库中是公共可用的。这些序列是用软件CLUSTAL X(1.8)比对的。如前所述,由我们鉴定的并且具有在亚标题‘发明目的’下所列的1、2和3栏中提及的特性的细胞色素b基因的472bp片段包括Antilope cervicapra和家猫中398~869之间的核苷酸;然而在智人物种中为399~870。除了在少数位置(在表2中标记为星号(*)),该片段的核苷酸序列在动物物种中是高度可变的,从而用我们发明的程序揭示了属于未知动物来源的生物学材料的特性。至于该片段的特性,我们考虑Antilopecervicapra作为代表物种,因此在此处列出了Antilopecervicapra细胞色素b基因上述片段的序列:
Antilope cervicapra的线粒体细胞色素b基因序列(398-869bp):
“taccatgaggacaaatatctttttgaggagcaacagtcatcaccaatctcctttcagcaatcccatacatcggtacaaacctagtaga
atgaatctgaggagggttctcagtagataaagcaacccttacccgatttttcgccttccactttatcctcccatttatcattgcagccctt
accatagtacacctactgtttctccacgaaacaggatccaacaaccccacaggaatctcatcagacgcagacaaaattccattccac
ccctactacactatcaaagatatcctaggagctctactattaattttaaccctcatgcttctagtcctattctcaccggacctgcttggag
acccagacaactatacaccagcaaacccacttaatacacccccacatatcaagcccgaatgatacttcctatttgcatacgcaatcct
ccgatcaattcctaacaaactaggagg
表2表示221个动物物种细胞色素b基因的上述片段的比对。表2中的每一个物种已用单一的代码表示,该代码在表1中译解。我们选择这些物种以代表关系较远的目的大量动物科。在221个物种中,约65个是列于Wildlife(Protection)Act,1972(CentralAct NO 53 of 1972)的保护的/濒危的或稀有的物种。这些物种在表1中以符号(*)标记。NCBI访问号指其在NCBI数据库中的记录号,且上标中的数字代表引用的参考文献。基于221个不同的动物物种的细胞色素b序列的比对,引物设计如下:
引物名 序列(5’-3’)
‘mcb398’ “TACCATGAGGACAAATATCATTCTG”
‘mcb869’ “CCTCCTAGTTTGTTAGGGATTGATCG”
表2、10和11分别证明引物的3’末端在所有in-silico分析的动物物种中(分别为在表1中所列的总共221个动物物种和在表10和11中所列的约500个物种)是高度保守的。同样地,引物的5’末端在细胞色素b基因的保守区域选择以改善引物与其目标序列(即细胞色素b基因的上述472bp长的片段)匹配的概率和稳定性。用不同的软件即‘Amplify(1.2)’、‘Primer3 ’(http://www.genome.wi.mit.edu/cgi-bin/primer/primer3.cgi)以及手工地对引物的内部稳定性、环或二聚体形成进行了彻底的检查。我们用软件Amplify(1.2)对于每一个模板向引物赋予了P,S值(P=匹配的概率,S=匹配的稳定性)。如果所有其他的条件(该条件在‘实施例3’中提及)都是最适的,那么较高的P和S值确保了较好的扩增。‘mcb398’的最高值为98.63(即引物与模板良好匹配的状态);然而‘mcb869’的最高P,S对于引物和模板间的完全匹配记录为98,68。在物种鼹鼠(Talpa europaea)中对于‘mcb398’观察到的最低P,S值为81,50,而‘mcb869’对于该物种具有高的P,S值(92,57)。对于两个引物之一具有最低的P,S值的另外的物种是Eumeces egregious和Equus ainus。Eumeces egregious对于‘mcb398’和‘mcb869’分别具有P,S值86,55和73,51;然而Equus ainus对于‘mcb398’和‘mcb869’的P,S值分别计算为91,61和73,51。所有其他的动物都具有比上述物种高的P,S值。为了确保这些引物对于来自对一个引物具有最低的P,S值的动物的DNA模板能有效作用,我们设计了另外一个实验来证实足以在PCR中有效扩增的两个引物之一的下限。我们设计了在其退火位点(但不是在末端)具有更多的错配的另一个引物对(AFF=5’tagtagaatgaatctgaggagg3’和AFR=5’atgcaaataggaagtatcattc3’),该引物对因此具有较低的内部稳定性和对其模板较低的P,S值(列于表9中)。‘AFF’和‘AFR’对于Platanista gangetica和野猪(Sus scrofa)的P,S值计算为低达41和49。这些物种用引物‘AFF’和‘AFR’可有效扩增(结果表示于图3中)(使其他条件为标准的,即在‘实施例3’中提及的条件)。我们的引物‘mcb398’和‘mcb869’的最低的P,S值(对于物种Eumeces egregious为86,55和73,51)比‘AFF’和‘AFR’对物种野猪的组合P,S值的上述范围(87,52和87,41)高,该野猪物种可用‘AFF’和‘AFR’有效扩增。这显示引物‘mcb398’和‘mcb869’对于所有物种包括Eumecesegregious都可有效作用以得到PCR中预期的产物。该实验证实引物‘mcb398’和‘mcb869’能够以通用的方式扩增大多数动物的细胞色素b片段。
对于我们引物的进一步的证实,我们用BLAST软件将我们的引物对NCBI的mito和nr数据库进行了blast分析。这些分析的结果分别在表10和11中显示。
最后,引物的通用性是在我们实验室中用列于表12中的另一些动物物种进行检验的。这些引物有效地扩增了所有动物物种,得到了预期大小的条带(472bp)。该结果显示于图4中。该实验证实了P,S分析和其他in-silico分析的结果,从而显示引物‘mcb398’和‘mcb869’是通用引物。
用引物‘mcb398’和‘mcb869’确定未知动物来源的生物学材料的物种特性的流程图
未知动物来源的生物学材料
↓
DNA分离
↓
用引物‘mcb398’和‘mcb869’对分离的DNA进行PCR扩增
↓
在三份样品(triplicate)中对两条链进行测序(用任何标准的测序程序如用ABI Prism 3700,PE-Applied Bio-systems)
↓
揭示的序列在NCBI的mito数据库中的BLAST分析(http://www.ncbi.nlm.nih.gov/BLAST)(这通过产生查询序列与在数据库中记录的序列间最显著的比对而提示分析的材料的科的信
息)
↓
揭示的序列在NCBI的nr数据库中的BLAST分析(http://www.ncbi.nlm.nih.gov/BLAST)(这通过产生查询序列与在数据库中记录的序列间最显著的比对而提示分析的材料的属或更精
确的种的信息)
↓
选择属于由mito和nr BLAST搜索所揭示的科/属/和种的参考
动物
↓
从已知参考动物的血液中分离DNA;用引物‘mcb398’和‘mcb869’进行PCR扩增;用相同的引物对三份样品中的PCR产物
进行测序
↓
用软件如Autoassembler(/CLUSTAL X(1.8))对已知的参考动物和未知动物来源的生物学材料的已揭示的线粒体细胞色素b基因
序列进行多重比对
↓
从比对的序列中鉴定与从未知动物来源的生物学材料中获得的DNA的细胞色素b基因序列同源的(或显著相似的)序列
↓
该同源序列的物种就是被研究的生物学材料的物种
实施例
实施例1
鉴定满足在标题‘发明概述’中亚标题‘发明目的’中提及的1、2和3栏中的需要的细胞色素b基因片段的实施例
线粒体细胞色素b分子已极其广泛地应用于分子分类学研究中。作为慢速进化的基因,它在其核苷酸序列中具有区别动物的科、属和种来源的巨大信息1-65。不同动物物种的细胞色素b基因序列的大量数据库已在NCBI的nr和mito数据库中积聚。我们已利用了细胞色素b基因的这些性质以确定任何未知动物来源的没收遗体的科、属和种来源特性。为此目的,我们已鉴定了种间高度多态而在相同物种的个体中为单态的细胞色素b基因片段,因此它可将未知物种的个体与其所属的参考物种的个体聚合成组(group)。为了从任何未知来源分离的DNA中扩增该片段,必需的是它在侧面相接有在大范围的动物科中高度保守的序列。为了鉴定细胞色素b基因中这种独特的片段,我们用软件CLUSTAL X(1.8)对代表各个科的221个关系较远的动物物种(列于表1中)进行了比对。这些序列是从公共数据库NCBI(http://www.ncbi.nlm.nih.gov)中获得的。在比对的数据中,对包括于in-silico分析中的所有物种中的保守位点进行了仔细的检查。我们鉴定了满足上述的且同样在亚标题‘发明目的’下所列的1、2和3栏中提及的要求的细胞色素b基因片段(472bp)。
对于该片段的特性,我们愿意提及该片段包括Antilopecervicapra和家猫中398~869之间的核苷酸;然而在智人物种中为399~870。除了在表2中标记为星号(*)的少数位置,该片段的核苷酸序列在动物物种中是高度可变的,从而得到其独特的分子特征。这些分子特征是其物种的特征,并形成了由我们发明的程序揭示未知动物来源的生物学材料的特性的基础。考虑Antilope cervicapra作为一种代表物种,因此提及了该片段的序列:
Antilope cervicapra的线粒体细胞色素b基因序列(398-869bp):
“taccatgaggacaaatatctttttgaggagcaacagtcatcaccaatctcctttcagcaatcccatacatcggtacaaacctagtaga
atgaatctgaggagggttctcagtagataaagcaacccttacccgatttttcgccttccactttatcctcccatttatcattgcagccctt
accatagtacacctactgtttctccacgaaacaggatccaacaaccccacaggaatctcatcagacgcagacaaaattccattccac
ccctactacactatcaaagatatcctaggagctctactattaattttaaccctcatgcttctagtcctattctcaccggacctgcttggag
acccagacaactatacaccagcaaacccacttaatacacccccacatatcaagcccgaatgatacttcctatttgcatacgcaatcct
ccgatcaattcctaacaaactaggagg”
实施例2:
开发通用引物以扩增在‘实施例1’中提及的片段的实施例设计了一对具有下面特征的通用引物:
1.它靶向鉴定的片段(在‘实施例1’中提及的)并在聚合酶链反应(PCR)中对其进行扩增。
2.其3’和5’末端在大范围的动物物种中是高度保守的(在表2中标记为星号(*)),从而确保以通用方式对上述片段的扩增。用这些引物对扩增的片段的测序揭示分析材料的物种的分子特征,该分子特征与已知参考动物的序列对照揭示了被研究的未知生物学材料的物种特性。
3.两个引物的tm(熔解温度)几乎是相似的(约58摄氏度),从而确保两个引物与其模板的显著的退火,及因此在PCR中对靶向的区域的显著扩增。
4.在设计引物时确保引物的内部稳定性和P,S值是较高的。内部环形成、二聚体形成等的概率也通过唯一地选择其序列而排除。这确保引物是用于PCR以从未知动物来源扩增DNA的良好引物。
5.确保引物的3’末端具有‘G’或‘C’以增加在其3’末端强的结合的概率,这对于PCR中对模板的有效扩增是必需的。这也强化了引物的通用性。
6.确保引物的序列为唯一的,从而它在PCR中不引起导致混乱的非特异性和杂质产物。它改善了由我们发明的技术的效率和质量。
7.这些引物因为其扩增本发明的代表动物物种Antilopecervicapra的线粒体细胞色素b基因在核苷酸398~869之间的区域的性质而命名为‘mcb398’和‘mcb869’。我们之所以用该动物物种作为代表物种,是因为当发明者在印度Hyderabad的Centre forCellular and Molecular Biology研究该动物的基因组时,他们想到要开发这样一种新型引物。
8.发明的通用引物的序列如下:
引物名 序列(5’-3’)
‘mcb398’ ‘TACCATGAGGACAAATATCATTCTG”
‘mcb869’ “CCTCCTAGTTTGTTAGGGATTGATCG”
实施例3:
开发通用PCR条件以确保PCR中任何未知来源的模板的扩增并因此强化由我们发明的技术的通用性的实施例
开发的PCR条件具有下面的独特特征:
1.这些条件能够用在‘实施例2’中提及的通用引物以通用的方式扩增任何动物来源的DNA模板。
2.该条件是选择来用于确保对两个引物即‘mcb398’和‘mcb869’的可比较的退火温度的。
3.因此标准化的PCR条件是通用的;因此由于非标准条件而导致对未知来源的模板的PCR失败的概率得以排除。这确保了我们的技术在野生生物法医学中的的通用性。
4.上述的通用条件为:
扩增反应应该在20μl反应体积中进行,该体积中含有约20ng的模板DNA、100μm的每种dNTP、1.25pmol的每种引物、1.5mM的MgCl2、0.5单位的Ampli Taq Gold(Perkin-Elmer-Cetus,美国)DNA聚合酶和1×PCR缓冲液(10mM Tris-HCl,pH 8.3和50mM KCl)。后面的扩增特征应为:于95℃起始变性10分钟,随后进行35个循环,每个循环中于95℃变性45秒,于51℃退火1分钟并于72℃延伸2分钟。在第35个循环中的延伸步骤应保持10分钟。
实施例4:
确定我们引物的通用性和证明我们引物同源性的实验证据:
引物‘mcb398’和‘mcb869’的通用性是通过下面的措施来保证的:
(a)从221个关系较远物种的动物的比对的细胞色素b基因序列中选择引物:
细胞色素b基因序列(1140bp)是用软件CLUSTAL X(1.8)进行比对的。将在221个动物物种中最保守的细胞色素b基因的区域用来设计引物。
(b)在细胞色素b基因的高度保守位置选择引物的3’和5’末端:
确保引物的3’和5’末端与代表大范围动物科的221个动物物种的高度保守位置进行退火。这样做是为了确保PCR中所有物种的有效扩增。这些位置在表2中以星号(*)标记表示。
(c)确保在引物的3’末端为‘G’或‘C’:
确保引物在其3’末端有‘G’或‘C’,这是因为这些核苷酸由于在相互配对时有3个氢键而可确保在引物3’末端的强的结合。3’末端的强的结合有助于引物适当地与其模板退火,从而导致PCR中显著的扩增。
(d)选择引物序列以确保较高的内部稳定性、较高的P,S值并且没有引物二聚体及环形成:
选择引物序列以对大范围动物物种具有高的P,S值(显示于表1)。应注意排除可减少引物在PCR中的效率的形成环或引物二聚体的概率。
(e)选择具有可比较的熔解温度的引物序列:
选择具有可比较的熔解温度的引物序列,从而这些引物序列可一起在PCR中以相似的退火温度扩增DNA模板。两个引物的熔解温度为约58摄氏度,且用于PCR的退火温度为51摄氏度。
证明引物通用性的实验证据:
(1)来自In-silico分析的证据:
(a)在线粒体细胞色素b基因的最保守区域中选择引物
如上所述,将引物设计为在472bp长的线粒体细胞色素b基因片段的高度保守区域退火。表2表示代表大范围动物科的221个动物物种的上述细胞色素b基因片段的比对。核苷酸序列的保守位置在表2中以星号(*)标记表示。
表2也证明引物的3’末端在in-silico分析的所有动物物种中是高度保守的。在比对的序列中,保守的核苷酸以符号(*)标记。同样地,在细胞色素b基因的保守区域选择引物的5’末端以改善引物与其目标序列(即上述的细胞色素b基因的472bp长的片段)匹配的概率和稳定性。用不同的软件即‘Amplify(1.2)’、‘Primer3’(http://www.genome.wi.mit.edu/cgi-bin/primer/primer3.cgi)以及手工对该引物的内部稳定性、环或二聚体形成进行了彻底的检查。
(b)P,S值分析:
对于每一个模板,我们用软件Amplify(1.2)给引物赋予了P,S值(P=匹配的概率,S=匹配的稳定性)。如果所有其他的条件标准(在‘实施例3’中提及的)是最适的,那么较高的P和S值确保了良好的扩增。‘mcb398’的最高分数为98,63(即引物与模板良好匹配的状态);然而‘mcb869’的最高P,S对于引物和模板间的完全匹配为98,68。在物种鼹鼠(Talpa europaea)中对于‘mcb398’观察到的最低P,S值为81,50,而‘mcb869’对于该物种具有高的P,S值(92,57)。对于两个引物之一具有最低的P,S值的另外的物种是Eumeces egregious和Equus ainus。Eumeces egregious对于‘mcb398’和‘mcb869’分别具有P,S值86,55和73,51;然而Equus ainus对于‘mcb398’和‘mcb869’的P,S值分别计算为91,61和73,51。所有其他的动物都具有比上述物种高的P,S值。为了确保这些引物对于来自对引物中的一个具有最低的P,S值的动物的DNA模板能有效作用,我们设计了另外一个实验来证实足以在PCR中有效扩增的两个引物之一的下限。我们设计了在其退火位点(但不是在末端)具有更多的错配的另一个引物对(AFF=5’ctagtagaatgaatctgaggagg3’和AFR=5’tatgcaaataggaagtatcattc3’),该引物对因此具有较低的内部稳定性和对其模板较低的P,S值(列于表9中)。‘AFF’和‘AFR’对于Platanista gangetica和野猪(Sus scrofa)的P,S值计算为低达41和49。这些物种用引物‘AFF’和‘AFR’可有效扩增(结果表示于图3中)(使其他条件为标准的,即在‘实施例3’中提及的条件)。我们的引物‘mcb398’和‘mcb869’的最低的P,S值(对于物种Eumecesegregious为86,55和73,51)比‘AFF’和‘AFR’对物种野猪的组合P,S值的上述范围(87,52和87,41)高,该野猪物种可用‘AFF’和‘AFR’有效扩增。这显示引物‘mcb398’和‘mcb869’对于所有物种包括Eumeces egregious都可有效作用以产生预期的PCR产物。该实验证实引物‘mcb398’和‘mcb869’能够以通用的方式扩增大多数动物的细胞色素b片段。
(c)BLAST分析:
将引物的序列对NCBI的mito和nr数据库进行了blast分析以了解它与GenBank中记录的序列的显著比对。如所预期的,该序列最显著的比对发现于不同动物物种的细胞色素b基因区域(在‘实施例1’中提及的472bp长的片段)。该分析也显示引物的3’以及5’末端在大范围动物物种中是高度保守的,从而证明引物的通用性(分别为表10和11)。
(2)来自在实验室中进行的实验台工作(bench work)/实验的证据:
从属于关系较远的物种(在表12中提及)的不同动物中分离DNA并用我们发明的引物进行PCR扩增,即引物‘mcb398’和‘mcb869’。将扩增的PCR产物在琼脂糖凝胶中通过电泳分离并在紫外光下显现。从所有动物中获得了预期大小的PCR产物(472bp),从而证明我们引物的通用性。结果表示于图4中。
实施例5:
用引物‘mcb398’和‘mcb869’确定从未知动物来源没收的遗体的特性的实施例
确定来自未知动物来源的生物学材料的特性的逐步步骤讨论如下:
未知动物来源的生物学材料
DNA分离
↓
用引物‘mcb398’和‘mcb869’对分离的DNA进行PCR扩增
↓
在三份样品(triplicate)中对两条链进行测序(用任何标准的测序程序如用ABI Prism 3700,PE-Applied Bio-systems)
↓
揭示的序列在NCBI的mito数据库中的BLAST分析(http://www.ncbi.nlm.nih.gov/BLAST)(这通过产生查询序列与在数据库中记录的序列间最显著的比对而提示分析材料的科的信息)
↓
揭示的序列在NCBI的nr数据库中的BLAST分析(http://www.ncbi.nlm.nih.gov/BLAST)(这通过产生查询序列与在数据库中记录的序列间最显著的比对而提示分析材料的属或更精确
的种的信息)
↓
选择属于由mito和nr BLAST搜索所揭示的科/属/和种的参考
动物
↓
从已知参考动物的血液中分离DNA;用引物‘mcb398’和‘mcb869’进行PCR扩增;用相同的引物对在三份样品中的PCR产
物进行测序
↓
用软件如Autoassembler/CLUSTAL X(1.8)对已知的参考动物和未知动物来源的生物学材料的线粒体细胞色素b基因的序列进行多
重比对
↓
从比对的序列中鉴定与从未知动物来源的生物学材料中获得的DNA的细胞色素b基因序列同源的(或显著相似的)序列
↓
该同源序列的物种就是研究的生物学材料的物种
↓
应用上述信息以实现在标题‘发明概述’的亚标题‘发明目
的’的7-13栏提及的目的
实施例6:
发明的技术的实行
作为初次应用及为了证明本方法的简易和效用,我们研究了一个提交到我们实验室的法医学鉴定的案例,该案例寻找关于动物捕猎事实的科学意见。在该案例中,我们收到了未知动物的部分烧焦的遗体,该遗体由犯罪调查机构没收。用标准方法74从上述材料中分离了DNA并用上述的引物(即‘mcb398’和‘mcb869’)进行了PCR扩增。扩增反应在20μl反应体积中进行,该体积中含有约20ng的模板DNA、100μm的每种dNTP、1.25pmol的每种引物、1.5mM的MgCl2、0.5单位的Ampli Taq Gold(Perkin-Elmer-Cetus,美国)DNA聚合酶和1×PCR缓冲液(10mM Tris-HCl,pH 8.3和50mMKCl)。后面的扩增特征应为:于95℃起始变性10分钟,随后进行35个循环,每个循环中于95℃变性45秒,于51℃退火1分钟并于72℃延伸2分钟。在第35个循环中的延伸步骤应保持10分钟。
将获得的PCR产物在自动工作站(ABI Prism 3700,PE-Biosystems)上于三份样品中对两链进行测序,并将所得的序列(328bp,表示于图1a中)用BLAST程序对NCBI的mito数据库进行blast分析73。该序列最显著的比对(字串值365,E值e-101)是与家猫的细胞色素b基因序列产生的(表3),从而显示分析的材料的物种属于猫科。进一步地,将从没收的遗体揭示的上述序列用BLAST程序对NCBI的nr数据库进行blast分析。该序列最显著的比对(字串值603,E值e-170)是与豹的细胞色素b基因序列产生的(表4),从而显示分析的材料的特性为豹来源的。基于这些信息,我们选择了代表猫科不同种和亚种的列于表5中的参考动物。将从参考动物中分离的DNA用上述的引物对扩增并在三份样品中对两链进行测序。获得的一致序列用程序CLUSTAL X(1.8)进行比对(表6)。序列比较在所有分析的动物中总共鉴定了113个可变位点(表7)。对序列进行了成对的比较以找出研究的不同动物中的变异。所有研究的物种都由其独特的核苷酸序列来区别。将不同参考动物的分子特征与没收的皮肤‘adil.flesh’的分子特征进行了比较。表7证明adil.flesh与‘gz1L’即已知的豹(Panthera pardus)物种具有最大相似性,从而显示没收的皮肤adil.flesh的特性为豹来源的。我们也用PHYLIP软件计算了显示研究的动物物种中成对的相似性的相似性矩阵。该矩阵表示于表8中。它证明属于不同物种的动物具有更多的变异;然而,相同物种的动物在其细胞色素b序列中具有最大的相似性。从没收的材料中分离的DNA的细胞色素b基因序列与从已知的豹来源获得的序列具有最大的相似性(与‘gz1l’和‘gz2l’分别为99.7%和98.2%);从而确定了没收材料的来源为正常的豹(Panthera pardus)物种的特性。涉及上述分析的逐步步骤分别于图1a、1b和1c中阐明。
因而,由我们发明的引物可从未知动物来源的任何生物学材料中生成分子特征,这实际上是其科、属和更精确的种的特征。当用BLAST软件将这些特征与已在公共数据库(即GenBank、NCBI数据库等)中可用的特征进行比较时73,该特征即显示分析的材料的科、属或种特性,这反过来可通过与所揭示的科、属或种的参考动物进行比较而证实,该比较是通过将这些动物包括于用引物‘mcb398’和‘mcb869’的进一步的分析中而实现的。所揭示的信息的应用可满足在标题‘发明概述’的亚标题‘发明目的’的7-13栏中提及的目的。
本发明的方法可用于确定没收的动物部分和产物的特性,该特性是法医学野生生物鉴定中的关键要求之一。需要无合理疑问地确定罪犯的犯罪以避免人类对野生生物资源的破坏。对此目的已有各种形态生物化学和分子方法;然而,目前的方法无一是通用于探测未知来源的毁伤的动物遗体的。我们已鉴定了线粒体细胞色素b基因上的一个片段,该片段具有大量信息以将各种动物物种区别到科、属和种来源。我们也发现该片段在侧面相接有在大范围的动物物种中高度保守的序列。我们发明了一对通用引物,该引物可在聚合酶链反应(PCR)中从未知动物来源的生物学材料中分离的DNA中扩增该片段,从而揭示其物种和亚种来源特性。该新发明在改革野生生物法医学鉴定和犯罪调查的整体方案中具有巨大的潜力。
表1.in-silico分析研究中所包含的动物物种
SN.代码 名称 NCBI目录号 $P.S/F ψP.S/R
1 aep.mel Aepyceros melampus AF0362891 97.60 94.62
2 ore.ore Oreotragus oreotragus AF0362881 88.52 94.62
3 add.nas Addax nasomaculatus AF0347221 97.60 95.66
4 ory.dam Oryx damah AJ2226851 90.58 95.66
5 hip.cqu Hippotragus equinus AF0220603 98.63 85.55
6 alc.bus Alcelaphus buselaphus AJ2226811 97.60 98.68
7 sig.lic Sigmoceros lichtensteinii AF0349674 97.60 98.68
8 bca.hun Beatragus hunteri AF0349684 97.60 94.62
9 dam.lun Damaliscus lunatus AF0166353 97.60 77.55
10 con.tau Connochaetes taurinus AF0166383 82.56 93.62
11 bis.bon Bison bonasus YI50055 90.58 87.63
12 bos.gru Bas grunniens* AF0916314 90.58 94.62
13 bos.tra Bos tragocamelus* AJ2226791 90.58 95.66
14 buba.bub Bubalus bubalis* D346377 97.60 93.64
15 bub.min Bubalus mindorensis D828958 97.60 87.62
16 tra.ang Tragelaphus angasii AF0916336 97.60 87.63
17 tra.cur Tragelaphus eurycerus AF0362761 90.58 97.64
18 ncm.cau Nemorhaedus caudaius* UI78619 95.61 93.59
19 pse.nay Pseudois nayaur AF0347322 89.55 89.59
20 amm.ler Ammotragus lervia AF0347312 94.58 97.63
21 cap.fal Capra falconeri* D8420210 98.63 95.66
22 cap.ibe Capra ibex* AF0347352 98.63 89.58
23 hem.jem Hemitragus jemlahicus* AF0347332 95.61 90.61
24 rup.pyr Rupicapra pyrenaica AF0347262 95.61 89.59
25 rup.rup Rupicapra rupicapra AF0347252 95.61 94.64
26 pan.hod Pantholops hodgsoni AF0347242 98.63 95.66
27 bud.tax.tax Budorcas taxicolor taxicolor* UI78689 90.53 95.66
28 ovi.amm Ovis ammon* AF0347272 98.63 97.64
29 ovi.vig Ovis vignei* AF0347292 98.63 97.64
30 cap.cri Capcornis crispus* AJ30450211 98.63 94.63
31 ovi.mos Ovibos moschatus UI78629 98.63 92.61
32 ore.ame Oreamnos americanus AF19063212 98.63 94.62
33 cep.dor Cephalophus dorsalis AF091634 97.58 90.61
34 cep.max Cephalaphus marwellii AF09662913 97.60 88.53
35 alc.alc Alccs alces AJ00002614 95.61 93.59
36 hyd.ine Hydropotes inermis AJ00002814 97.60 90.63
37 mun.mun Muntiacus muntjak* AF04271813 90.58 93.64
38 cer.ele.kan Cervus elaphus kansuensis* AB02109814 98.63 82.59
39 cer.ele.kan Cervus elaphus kanthopysus* AB02109714 98.63 82.59
40 cer.ele.can Cervus elaphus canadcnsis* AB02109616 98.63 90.61
41 cer.nip.ce Cervus nippon ccmrralis AB02109414 98.63 90.61
42 cer.nip.ye Cervus nippon ycsocnsis AB02109514 98.63 90.61
43 cer.nip.ke Cervus nippon keramae AB02109114 98.63 90.61
44 cer.nip.pu Cervus nippon pulchellus AB02109014 98.63 90.61
45 cer.nip.ni Cervus nippon nippon AB02109314 98.63 90.61
46 cer.ela.sc Cervus elaphus scolicus AB02109916 98.63 90.61
47 cer.dam Cervus dama AJ00002214 98.63 88.53
48 ran.tar Rangifer tarandus AJ00002914 98.63 89.57
49 mos.fus Moschus fuscus* AF02688817 90.59 90.61
50 mos.leu Moschus leucogaster* AF02688917 90.59 90.61
51 mos.chr Moschus chrysogcster* AF02688717 90.59 90.61
52 mos.ber Moschus berctovskii* AF02688617 90.59 90.61
53 mos.mos Moschus moschiferus* AF02688317 90.59 92.61
54 kob.ell Kobus ellipsiprymnus AF0220593 91.61 95.66
55 kob.meg Kobus megaceros AJ2226861 91.61 83.56
56 red.aru Redunca arundinum AF09662813 91.61 94.62
57 red.ful Redunca fulvorufula AF0362841 89.57 94.62
58 neo.mos Neotragus moschctus AJ2226831 89.57 94.62
59 pel.cap Pelea copreolus AF0220553 91.61 90.61
60 ant.cer Antilope cervicapra* AF0220583 82.56 93.64
61 sai.cat Saiga tatarica AF06448718 91.61 92.61
62 gaz.dam Gacella dama AF0259543 91.61 92.61
63 our.our Ourebia ourebi AF0362881 82.56 82.59
64 gaz.gaz Gacela gacellc* AJ2226821 91.61 89.57
65 rap.mel Raphicerus melcnotis AF0220533 81.54 80.50
66 mad.kir Madoqua kirkii AF0220703 90.58 97.65
67 ant.ame Antilocapra americana AF0916296 98.63 98.68
68 tra.jav Tragulus javanicus* D3218919 86.57 86.59
69 tra.nap Tragulus napu* X5628820 81.52 93.58
70 bal.acu Balaenoptera acutorostrata X7575321 89.56 97.61
71 bal.bon Balaenoptera bonaerensis X7558121 89.56 93.59
72 bal.bor Balaenoptera borealis* X7558221 89.56 93.59
73 bal.edi Balaenoptera edeni X7558321 89.56 88.54
74 csc.rob Eschrichtius robustus* X7558521 97.61 86.57
75 bal.mus Balaenoptera musculus* NC_00160122 97.57 93.59
76 meg.nov Megaptera novaeangliae* X7558421 97.61 94.63
77 bal.phy Balaenoptera physalus* NC_00132121 97.57 94.63
78 cap.mar Caperea marginata X7558621 93.55 91.53
79 cep.com Cephalorhynchus commersanii AF08407324 85.51 88.55
80 cep.cut Cephalorhynchus eutropia* AF08407224 85.51 92.59
81 lag.obl Lagenorhynchus obliquidens AF08406724 94.59 92.59
82 cep.hca Cephalorhynchus hcavisidii AF08407024 89.56 97.63
83 cep.hec cephalorhynchus hectoi* AF08407124 89.56 92.59
84 log.aus Lagenorhynchus australis AF08406924 86.54 92.59
85 log.cru Lagenorhynchus cruciger AF08406824 86.54 92.59
86 log.obs Lagenorhynchus obscurus AF08406624 86.54 92.59
87 lis.bor Lissodclphis borcalis AF08406424 85.51 92.59
88 lis.per Lissodclphis peronii AF08406524 86.54 92.59
89 glo.mac Globiccphala macrorhynchus AF08405524 94.59 88.55
90 glo.mel Globiccphala mclas AF08405224 94.59 88.55
91 fer.att Feresa attenuata* AF08405224 94.59 92.59
92 pep.ele Peponoccphala clcctra* AF08405324 94.59 88.55
93 gra.gri Grampus griscus AF08405924 97.61 89.59
94 pse.cra Pscudorca crassidcns* AF08405724 94.59 92.59
95 lag.acu Lagenorhynchus acutus AF06407524 98.63 89.59
96 orci.bre Orcinus orca AF08406124 86.57 82.52
97 orca.bre Orcaella brcvirostris AF08406324 86.57 91.54
98 del.cop Delphinus capcnsis AF08408724 96.54 97.63
99 del.tro Delphinus tropicalis AF08408824 97.57 97.63
100 del.del Delphinus delphis AF08408524 97.57 97.63
101 sten.cly Stenella clymene AF08408324 97.57 97.63
102 sten.coe Stenella coeruleoclba AF08408224 97.57 97.66
103 tur.adu Tursiops aduncus AF08409224 97.57 97.63
104 sten.fro Stenella frontalis AF08409024 97.57 97.63
105 saus.chi Sousa chinensis AF08408024 97.57 88.59
106 sten.lon Stenella longirostris AF08410324 97.61 97.63
107 turs.tru Tursiops truncatus AF08409524 97.57 96.59
108 lage.alb Lagenorhynchus alborostris AF08407424 97.61 97.66
109 sten.bre Steno bredanensis AF08407724 97.61 94.64
110 sota.flu Sotalia fluviatilis AF30406725 97.61 97.63
111 del.leu Delphinapterus leucas U7203726 97.61 95.66
112 mono.mon Monodon monoceros U7203826 97.61 95.66
113 plat.gan Platanista gangetica* AF30407025 97.61 86.59
114 plat.min Platanista minor* X9254327 97.61 86.59
115 kogi.bre Kogia breviceps U7204026 97.59 90.63
116 kogi.sim Kogia simus AF30407223 96.55 92.63
117 phys.cat Physeter catodon AF30407325 97.57 80.58
118 lipo.vex Lipotes vexillifer* AF30407125 89.56 88.53
119 phoc.sin phocoena sinus AF08405124 87.49 92.62
120 bera.bai Berardius bairdii X9254127 96.55 90.59
121 ziph.car Ziphius cavirostris X9254027 97.61 89.57
122 meso.eur Mesoplodon europaeus X9253727 97.57 90.61
123 meso.bid Mesoplodon bidens X9253827 97.61 92.61
124 meso.den Mesoplodon densirostris X9253627 91.61 94.63
125 hype.amp Hyperoodon ampullatus* X9253927 97.61 90.65
126 meso.per Mesoplodon peruvianus AF30407429 97.61 86.58
127 pont.bla Pontoporic blainvillei AF30406925 92.59 88.55
128 hipp.amp Hippopotomus amphibius Y0881329 92.58 95.66
129 hex.lib Hexaprotodon libericnsis Y0881429 98.63 97.66
130 rhin.son Rhioceros sondaicus* AJ24572530 90.59 87.61
131 cera Ceratatherium simum NC_00180S32 90.59 90.63
132 dic.sum Dicerorhinus sumutrcnsis AJ24572330 90.59 86.57
133 equu Equus asinus NC_00178831 91.61 73.51
134 baby.bob Babyrousa babyrussa Z5010633 99.56 85.56
135 phac.afr Phacochocrus ofriconus Z5009011 90.59 87.54
136 sus.scr.cw Sus scrofa haplorypc εWBj* AF13654934 97.57 83.54
137 sus.bar Sus barbatus Z5010731 97.57 85.55
138 lama.gla Lama glama U0642931 89.55 85.53
139 lama.gua lama guanicoe Y0881224 88.54 86.57
140 vic.vic Vicugna vicugna U0643033 89.55 85.53
141 cam.boc Camelus bactrianus U0642733 94.58 86.58
142 arc.for Arctocephalus forsteri X8229334 97.60 87.64
144 cum.jub Eumatopics jubatus X8231134 97.57 86.57
145 zal.cal Zolophus californianus X8231034 89.55 86.57
146 odo.ros Odobenus rosmorus X8229936 91.61 81.52
147 pho.vit Phoca vitulina X8230636 90.58 87.64
148 pho.fascia Phoca fascicta X8230236 98.63 95.66
149 pho.gro Phoca groenlandica X8230336 92.59 90.61
150 cys.cri Cystophora cristata X8229436 89.56 87.64
151 hyd.lep Hydrurga leptonyx X8229736 89.55 82.54
152 lep.wed Leptonychotes weddelli X7200537 98.63 91.66
153 mir.leo Mirounga leonina X8229836 89.55 82.59
154 cri.bar Erignathus barbasus X8229536 89.56 87.63
155 mon.sch Monachus schauinslandi X7220937 91.61 87.60
156 hela.mal Helarcros malayanus* U1889938 84.54 90.63
157 sel.thi Selenarctos thibetanus* AB02091039 89.57 87.64
158 ail.ful Ailurus fulgen*s X9491940 93.55 87.64
159 fel Felis carus NC_00170041 85.56 90.63
160 can Canis familiaris NC_00200842 98.58 84.54
161 tal Talpa europaea NC_00239143 81.50 92.57
162 gla.sab Glaucomys sabrinus AF01173844 90.59 82.54
163 gla.vol Glaucomys volans AB03026145 90.59 87.60
164 hyl.pha Hylopetes phayrei* AB03025945 91.61 81.50
165 pet.set Petinomys setosus* AB03026045 91.61 81.50
166 bel.pea Belomys pearsonii* AB03026245 91.61 87.64
167 pte.mom Pteromys momonga* AB03026345 97.61 90.63
168 gala.demi Galagoides demidoff AF27141146 97.58 87.64
169 pero.pot Perodicticus potto AF27141346 97.60 87.63
170 gala.mat Galago matschiei AF27140946 97.60 90.61
171 gala.moh Galago monoli AF27141046 97.57 95.66
172 oto.gar Otolemur garnettii AF27141244 92.58 87.60
173 lor.tar Loris tardigradus* U5358147 97.60 93.59
174 nyc.cou Nycticebus caucang* U5358047 97.60 95.66
175 mus Mus musculus NC_00156948 97.60 86.59
176 gorr Gorilla gorilla NC_00164549 89.57 80.58
177 homo Homo sapiens sapiens NC_00180750 96.55 84.64
178 dug.dug Dugong dugong* U0756451 97.60 89.59
179 ele.max Elephas maximus* AB00241252 97.60 76.57
180 afr.con Afropavo congcnsis AF01376053 97.58 87.63
181 pavo.mui Pavo muticus* AF01376353 97.57 87.63
182 tra.bly Tragopan blythii* AF20072254 89.55 85.57
183 tra.sat Tragopan satyra* AF22983754 89.55 86.61
184 tra.cob Tragopan coboti AF20072354 89.55 86.61
185 tra.tcm Tragopon icmmunchii* AF02880255 89.55 81.56
186 arg.arg Argusianus argas AF01376155 89.55 87.63
187 cat.wal Catrcus wallichi* AF02879255 88.54 85.57
188 cro.cro Crossoptilon crossoptilon* AF02879453 89.55 85.57
189 sym.ree Syrmaticus reevesi* AF02880153 89.55 85.57
190 bam.tho Bambusicola thoracica* AF02879053 80.48 94.64
191 fra.fra Franeolinus francolinus AF01376253 97.58 86.61
192 ith.cru fthaginis cruentus* AF06819353 98.63 85.57
193 ant.par Anthropoides paradisca U2755756 85.56 82.58
194 ant.vir Anthropoides virgo U2754556 84.54 82.52
195 gru.ant.an Grus antigone antigone U1106057 90.53 87.63
196 gru.ant.gi Grus antigone gillae U1106457 90.58 87.63
197 gru.any.sh Grus antigone sharpei U1106157 90.58 87.63
198 gru.leu Grus leucogeranus* U2754956 90.58 87.63
199 gru.can.pr Grus canadensis pratensis U2755356 97.60 87.63
200 gru.can.ro Grus canadensis rowani U2755256 97.60 87.63
201 gru.can.ta Grus canadensis tabida U2755156 98.63 87.63
202 gru.can.ca Grus canadensis cancdensis U2755456 97.61 87.63
203 gru.ame Grus americana U2755556 90.58 87.63
204 gru.gru Grus grus U2754656 89.54 87.63
205 gru.mon Grus monacha* U2754856 90.58 87.63
206 gru.nig Grus nigricollis* U2754756 90.58 87.63
207 gru.jap Grus japonensis U2755056 81.54 87.63
208 cic.boy Ciconia boyciana* NC_00219658 94.58 79.60
209 rhe.ame Rhea americana AF09033959 93.63 79.60
210 ant.alb Anthracoceros albirostris* U8919060 97.61 86.59
211 fal.fam Falco femoralis U8331061 97.61 86.60
212 fal.ver Falca verpertinus U8331161 97.61 85.57
213 fal.par Falco peregrinus* U8330761 97.61 84.52
214 fal.spa Falco sparverius U8330661 92.59 80.51
215 ayt.ame Aythya americana NC_00087762 98.63 94.62
216 smi.sha Smithornis sharpei NC_00087959 97.58 90.61
217 vid.cha Vidua chalybeata NC_00088059 97.60 87.64
218 chry.pic Chrysemys picta NC_00207363 89.56 86.57
219 emy.orb.ku Emys orbicularis AJ13142564 90.59 94.63
220 che.mud Chelonia mydas* AB01210465 90.58 94.63
221 eum.egr Eumeces egregius AB01660665 86.55 73.51
表2.221个动物物种的线粒体细胞色素b基因的472bp片段的多重序列比对
比对
Database:Sequences from complete micochondrial genomes
Posted date:Jun 28,2000 10:56 AM
Number of letters in database:3,264,247
Number of sequences in database:129
Lambda K H
1.37 0.711 1.31
Gapped
Lambda K H
1.37 0.711 1.31
Matrix:blastn matrix:1 -3
Gap Penalties:Existence:5,Extension:2
Number of Hits to DS:766
Number of Sequences:129
Number of extensions:788
Number of successful exteasions:168
Number of sequences hetter than 10.0:77
length of query:328
length of database:3,164,247
effective HSP length:15
effective length of query:313
effective lengch of database:3,162,312
effective search space:989803656
effective search space used:989603656
T:0
A:30
X1:6(11.9 bits)
X2:15(29.7 bits)
S1:12(24.3 bits)
S2:14(28.2 bits)
表4
比对
Database:nt
Posted date:Mar 2,2001 12:20 AM
Number of letters in database:2,863,827,885
Number of sequences in database:807,597
Lambda K H
1.37 0.711 1.31
Gapped
Lambda K H
1.37 0.711 1.31
Matrix:blastn matrix:1 -3
Gap Penalties:Existence:5.Extension:2
Number of Hits to DB:460542
Number of Sequences:807597
Number of extensions:460542
Number of successful extensions:22671
Number of sequences better than 10.0:6487
length of query:328
length of database:2,863,827,885
effective HSP length:20
effective length of query:308
effective length of dacabase:2,847,675,945
effective search space:877084191060
effective search space used:877084191060
T:0
A:30
X1:6(11.9 bits)
X2:15(29.7 bits)
S1:12(24.3 bits)
S2:19(38.2 bits)
表5.研究中包含的参考动物和所分配的代码
SN.代码 动物名称 动物学名称
1 bhz25t Indian tiger Panthera tigris tigris
2 bhz26t Indian tiger Panthera tigris tigris
3 bhz30t Indian tiger Panthera tigris tigris
4 bhz45t Indian tiger Panthera tigris tigris
5 bhz56t Indian tiger Panthera tigris tigris
6 bhz63t Indian tiger Panthera tigris tigris
7 bhz20wt Indian white tiger Panrhera tigris bengalensis
8 bhz22wt Indian white tiger Panthera tigris bengalensis
9 bhz23wt Indian white tiger Panthera tigris bengalensis
10 bhz28wt Indian white tiger Panthera tigris bengalensis
11 gz11 Normal leopard Panthera pardus
12 gz21 Normal leopard Panthera pardus
13 gz31 Normal leopard Panthera pardus
14 gz21cl Clouded leopard Neofelis nebulosa
15 gz22cl Clouded lecpard Neofelis nebulosa
16 darz14sl Snow leopard Panthera unicia
17 darz15sl Snow leopard Panthera unicia
18 darz16sl Snow leopard Panthera unicia
19 sbz22al Asiatic lion Panthera leo persica
20 sbz38al Asiatic lion Panthera leo persica
21 sbz39al Asialic lion Panthera leo persica
22 humsk Human Homo sapiens sapiens
23 chimss Chimpanzee Pan sp.
表6.参考动物的细胞色素b序列与从没收的动物遗体获得的序列的多重序列比对
表7a
表7b
表7c
表7d
表8.来自“adil.flesh”和不同猫科动物的细胞色素b基因序列的成对比较而计算得到的相似性百分比矩阵
表10
表9.为证实在PCR中有效扩增DNA模板的最小P’S值而选择的
动物
SL. 名称 P.S/AFF P.S/AFR
1 Indian black buck(Antilope cervicapra) 97.58 96.54
2 Sheep(Ovis 87.53 96.54
3 Pig(Sus scrofa) 87.52 87.41
4 Fresh water dolphin(Platanista gangetica) 86.49 82.47
比对
Database:nt
Posted date:Mar 2,2001 12:20 AM
Number of letters in database:2,863,827,885
Number of sequences in database:807,597
Lambda K H
1.37 0.711 1.31
Gapped
Lambda K H
1.37 0.711 1.31
Matrix:blastn matrix:1 -3
Gap Penalties:Existence:5,Extension:2
Number of Hits to DB:39355
Number of Sequences:807597
Number of extensions:39355
Number of successful extensions:15066
Number of sequences better than 10.0:5706
length of query:25
length of database:2,863,827,885
effective HSP length:17
effective length of query:8
effective length of database:2,850,098,736
effective search space:22800789888
effective search space used:22800789888
T:0
A:30
X1:6(11.9 bits)
X2:15(29.7 bits)
S1:12(24.3 bits)
S2:16(32.2 bits)
表11.引物“mcb869”在NCBI的nr数据库中的BLAST分析。证明了该引物的3’末端在大范围的动物物种中是高度保守的。也显示了引物和模板(即不同动物物种的细胞色素b基因片段)的显著同源性,从而确证了我们的引物的通用性。
比对
Lambda K H
1.37 0.711 1.31
Gapped
Lambda K H
1.37 0.711 1.31
Matrix:blastn matriix:1 -3
Gap Penalties:Existence:5,Extension:2
Number of Hits to DB:19068
Number of Sequences:807597
Number of extensions:19068
Number of successful extensions:7580
Number of sequences better than 10.0:2441
length of query:26
length of database:2,863,827,885
effective HSP length:17
effective 1ength of query:9
effective 1ength of database:2,850,098,736
effective search space:25650888624
effeccive search space used:25650688624
T:0
A:30
X1:6(11.9 bits)
X2:15(29.7 bits)
S1:12(24.3 bits)
S2:16(32.2 bits)
表12.用我们的引物分析以证实其通用性的关系较远的其它动物
SN. 动物名称
1. Indian black buck no.1
2. Indian black buck no 2
3 sheep
4 pig
5 dog
6 chimpanzee(chimss)
7 human(humsk)
8 Hamster
9 crocodile nol
10 crocodile no2
11 turtle nol
12 turtle no2
13 mouse
14 varanus
15 Naga-aags snake
16 Indian elepbant
17 hen
18 dugong
19 lizard
20 weaver bird nol
21 weaver bird no2
22 buffalo no 1
23 buffalo no 2