技术领域
本发明属于分子遗传学领域,涉及以奶山羊的功能基因的单核苷酸多态 性(SNP)作为分子遗传标记,特别涉及一种奶山羊MFG-E8基因的单核苷 酸多态性及其检测方法。
背景技术
羊奶具有很高的营养价值,不含过敏原,营养成分均衡,易消化吸收, 与人乳蛋白质组成相似;羊奶的脂肪颗粒体积为牛奶的三分之一,羊奶中的 蛋白质、矿物质,尤其是钙、磷、维生素及微量元素的含量比牛奶略高,且 更利于人体吸收,在国际营养界被誉为“奶中之王”。羊奶由于有膻与味喝牛 奶相比,羊奶的人较少。随着高科技应用于生物制药、食品加工,脱膻技术 的应用给羊奶界蓬勃发展带来可能。虽然奶山羊是我国主要的奶畜之一,但 是我国羊奶的生产同发达国家相比差距巨大,主要是因为我国优秀奶山羊品 种种源不足和种群遗传品质较差。
传统的育种方法应用测试动物的表现型和其亲代、祖代及其它亲属在小 的动物模型中的遗传信息,设想性状受到许多基因遗传差异的影响,每个基 因对性状有相对较小的贡献,因此对性状的估计不可避免有些偏差。分子遗 传标记是近年来现代遗传学发展最快的领域之一,新的方法正在不断涌现, 已定位的标记基因数目与日俱增。这将为数量遗传学提供分子水平信息,家 畜育种也将跨入分子育种阶段。应用分子遗传标记的现代育种技术是加快良 种选育和提高种群遗传品质,从而增加奶山羊的产奶量和改善乳品质的先进 的有效的方法。
分子遗传标记辅助选择就是将现代生物技术与常规选择方法相结合,通 过对遗传标记的选择来间接选择控制某性状的数量性状位点(QTL),使之能 够同时利用标记位点信息和数量性状的表型信息,更准确估计动物个体的育 种值,提高选择效率,加快育种进展。标记辅助选择主要经历了三个阶段: 第一阶段是家畜各性状间的遗传分析;第二阶段是蛋白质(酶)标记对数量 性状的标记阶段;第三个阶段是分子遗传标记阶段。随着分子标记技术日渐 成熟与丰富,使覆盖整个基因组的标记成为可能,通过与QTL间的连锁分析, 实现分子标记辅助选择的目标。
单核苷酸多态性(single nucleotide polymorphism,SNP)作为新的遗传标记 已广泛应用于基因定位、克隆、遗传育种及多样性的研究。SNP是基因组中 存在的一种数量非常丰富的变异形式,占人类基因组中遗传多态性的90%以 上。SNP与罕见的变异不同,通常在种群中频率等于或小于1%的此种变异 被称为突变,而只有频率大于1%时才被称为单核苷酸多态性。
目前,主要采用几种不同的方法来发现SNPs:DNA序列测定方法、 PCR-SSCP与DNA测序结合法、AS-PCR方法、PCR-RFLP法、TaqMam技 术与分子信标(Molecular Beacons)等。在这些SNP检测技术中,(1)DNA序 列测定法是最为准确的SNP检测方法,但是,其检测费用极其昂贵,且需要 有DNA测序仪等大型仪器,同时,在测序过程中需要非常熟练的技术人员 和经验,所以,DNA序列测定法不是一种应用于生产实际的理想SNP检测 方法;(2)PCR-SSCP与DNA测序结合法检测SNP可以适当降低检测费用, 但是,PCR-SSCP的实验过程比较长,操作比较繁琐,且实验过程中存在假 阳性问题,所以,也并非理想的SNP检测手段;(3)AS-PCR方法作为一种 新型的SNP检测方法,在未来的应用领域中具有非常广阔的前景,但是,该 方法需要设计特别的引物,且只能针对特定的基因位点,同时,检测过程中 还存在误检的概率,因此,目前不具有普遍应用的特点;(4)TaqMam技术 与分子信标(Molecular Beacons)都是在荧光能量转移(Fluorescence Resornance Energ Transfer,FRET)基础上建立起来的,利用荧光标记及仪器达到检测目 的。焦磷酸测序(Pyrosequencing)则是利用测序过程中可释放的焦磷酸和酶类 产生荧光,是不依赖平板胶或毛细管电泳、不依赖DNA的荧光标记技术, 很可能成为未来的主流技术。(5)RFLP-PCR方法是一种检测SNP的有效技 术,在发现SNP位点后引入限制性内切酶进行切割,然后进行琼脂糖、聚丙 烯凝胶电泳分析,就能准确地鉴别SNP位点。RFLP-PCR方法不仅具有DNA 测序法的准确性,又克服了费用昂贵、繁琐操作、假阳性的缺点,而且所检 测的序列位点无特殊性要求。
MFG-E8作为一种糖蛋白是在乳中和哺乳动物上皮细胞中首次被发现, 是乳脂肪球膜的另一种主要蛋白成分。MFG-E8糖蛋白是凋亡细胞和活性 吞噬细胞之间的联系分子,在乳腺衰退过程中,MFG-E8在识别凋亡细胞, 激活吞噬细胞吞噬凋亡的上皮细胞方面起着重要作用。MFG-E8的缺失将会 延迟凋亡的乳腺上皮细胞及乳脂肪球的清除,损害乳腺的发育和分化,同时导 致衰退受阻和乳腺炎症的发生。在受精过程中该蛋白促使精卵的相互作用。 此外,MFG-E8在猪乳凝集素的成熟中和精子获能中发挥作用研究发现。 MFG-E8也是一种可以阻止肠道病原入侵和感染的重要的乳成分。
目前,对于MFG-E8基因的研究多集中在小鼠与人类的免疫方面。关于 动物MFG-E8基因遗传变异的研究国内外也多见于小鼠与人类,未见奶山羊 MFG-E8基因遗传变异或SNP研究的报道。目前中国奶山羊MFG-E8基因遗 传变异领域的研究匮乏,该基因位点的功能研究及其遗传变异与经济性状 (如:体高、体长、产奶量、奶成分等性状)关联的研究仍是空白。
发明内容
本发明解决的问题在于提供一种奶山羊MFG-E8基因的单核苷酸多态性 及其检测方法,利用RFLP-PCR方法针对其基因位点上的同义密码子突变可 能导致编码蛋白表达水平发生变化的单核苷酸多态性进行检测,提前淘汰掉 汰掉携带不良基因的个体,加快具有优质经济性状奶山羊种群的建立。
本发明是通过以下技术方案来实现:
奶山羊MFG-E8基因单核苷酸多态性的快速检测方法及其应用,其基因 单核苷酸多态性包括:
在奶山羊MFG-E8基因第12892bp为C或T的碱基多态性。
上述奶山羊MFG-E8基因的单核苷酸多态性的检测方法为:
以包含MFG-E8基因的待测奶山羊全基因组DNA为模板,以引物对P 为引物,PCR扩增奶山羊MFG-E8基因;用限制性内切酶EcoRV消化PCR 扩增产物之后,再对酶切后的扩增片段进行聚丙烯酰胺凝胶电泳;根据聚丙 烯酰胺凝胶电泳结果鉴定奶山羊MFG-E8基因第12892bp的单核苷酸多态 性;
所述的引物对P为:
上游引物:cctactacgc acgactggat at 22;
下游引物:acaaggctca aagaaactcc 20。
所述的PCR扩增反应程序为:
94℃预变性4min,;94℃变性30s,56℃退火30s,72℃延伸20s, 30~35个循环;72℃延伸10min。
所述的聚丙烯酰胺凝胶电泳为质量浓度为10%的聚丙烯酰胺凝胶电泳。
所述根据聚丙烯酰胺凝胶电泳结果鉴定奶山羊MFG-E8基因第12892位 的单核苷酸多态性为:TT基因型表现为195bp条带;TC基因型表现为195 bp、175bp和20bp条带;CC基因型表现为175bp和20bp条带;其中,单 核苷酸多态性CC基因型为同义密码子突变。
与现有技术相比,本发明具有以下有益的技术效果:
本发明公开了与奶山羊泌乳性相关的功能基因MFG-E8的核苷酸多态 性,该核苷酸多态性能够作为一个分子遗传标记;该多态性中包含的同义密 码子突变可能导致编码蛋白表达水平发生变化,提前淘汰掉携带不良基因的 个体,能够加快具有优质经济性状奶山羊种群的建立。
本发明利用RFLP-PCR方法对奶山羊MFG-E8基因第12892bp上的同义 密码子突变可能产生编码蛋白表达水平发生变化的单核苷酸多态性进行检 测,当第12892bp由T突变为C时,原有的编码Asp的密码子AAT发生突 变为AAC,导致在转录的mRNA在翻译过程由于携带该氨基酸的tRNA丰 度不同而影响翻译的效率,从而影响该蛋白的表达量。
本发明提供的奶山羊MFG-E8基因单核苷酸多态性检测方法,针对第 12892bp由T突变为C的转换突变,通过引物设计人为的在下游引物的3’ 端引入碱基错配,当由T变为C时,PCR扩增MFG-E8基因后在错配位置 形成限制性内切酶EcoRV识别位点,而突变没有发生时,PCR扩增MFG-E8 基因后不能形成EcoRV识别位点;通过电泳检测分型可以准确、快速、方便 的检测MFG-E8基因单核苷酸多态性:不包含195bp条带为CC基因型个体; 不包含175bp条带为TT基因型个体;同时包含195bp和175bp条带为TC 基因型个体;进而对种群的MFG-E8基因SNP的等位基因频率变化监控。
本发明对MFG-E8基因的EcoRV位点进行了基因分型和基因频率分析, 以及与莎能奶山羊各胎年泌乳量之间进行了性状关联分析;结果表明:EcoRV 位点对三个体尺性状(体高、体长和胸围)及四个胎次的产奶量(第一胎、 第二胎、第三胎和第四胎)影响差异不显著,但对西农萨能奶山羊的乳脂率 和总固形物有显著影响;乳成分MFG-E8基因的核苷酸多态位点能够成为分 子遗传辅助育种的标记。
附图说明
图1为奶山羊MFG-E8基因PCR扩增后产物的琼脂糖电泳检测结果图;
图2为奶山羊MFG-E8基因包含突变位点的195bp PCR产物经EcoRV 酶切后电泳结果;
图3为奶山羊MFG-E8基因SNP的不同基因型测序图。
具体实施方式
本发明利用RFLP-PCR方法对奶山羊MFG-E8基因第12892bp同义密码 子突变可能产生编码蛋白表达水平发生变化的单核苷酸多态性进行检测,下 面结合对本发明做进一步的详细说明,所述是对本发明的解释而不是限定。
a、奶山羊MFG-E8基因含第七外显子区域PCR引物的设计
本发明根据与奶山羊的同源动物牛的序列为参考,具体以NCBI所公布 的安格斯牛(NC 007319)的序列为参考;利用Primer 5.0设计能够扩增包含奶 山羊MFG-E8基因第七外显子的PCR引物,其引物序列如下:
上游引物:t cttttccct tcactgcctc 20;
下游引物:acaa ggctca aagaaactcc 20;
以上述引物对奶山羊基因组扩增,能够扩增包含奶山羊MFG-E8基因第 七外显子12671bp~13063bp的397bp的基因片段,扩增后片段的电泳检测 如图1所示,其中,泳道1~6为检测片段,泳道M为Marker(100bp,200 bp,300bp,400bp,500bp,600bp);测序结果如SEQ ID NO.1所示,对 扩增的片段进行测序鉴定后,发现当第12892bp(即MFG-E8基因CDS区 第930位,位于序列表的第225位)的T突变为C时,导致编码第310bp 的氨基酸密码子由AAT突变为AAC,从而形成同义突变;
由于在12892bp处(SNP位点)无自然酶切位点,不能通过直接酶切检 验,而如果在12891bp处人工设计PCR引物错配,由A错配为T;当12892 bp由T突变为C时,设计的引物扩增MFG-E8基因产物的第18bp~23bp 序列为GATATC,形成了限制性内切酶EcoRV的酶切位点,当在12892bp没 有突变时,设计的引物扩增MFG-E8基因产物的第18bp~23bp序列为 GATATT,限制性内切酶EcoRV不能识别;这样就可以对该位点SNP多态性 进行检测;因此设计PCR扩增引物P为:
上游引物:cctactacgc acgactggat at 22;
下游引物:acaaggctca aagaaactcc 20;
其中,引入的错配碱基为下游引物第22bp的T;引物P对应扩增的基 因片段是MFG-E8基因的12869bp~13063bp的195bp的片段,当用限制性 内切酶EcoRV对引物P对应扩增的基因片段酶切消化时,不能被切开或可以 被切成2段。
b、以引物P进行PCR扩增待测奶山羊的MFG-E8基因片段
1、奶山羊样本采集及基因组DNA提取
1)奶山羊样本的采集
本发明具体以2个中国地方奶山羊品种的种群的688头母羊作为检测对 象,具体采集样本见表1:西农萨能奶山羊(244),关中奶山羊(424);
表1奶山羊样本的采集
2)血样基因组DNA的分离、提取、纯化
1)冷冻血样(主要为血细胞)室温解冻,转移1.0mL至2.0mL Eppendorf 离心管,加入等体积PBS液,充分混匀,12000r/min离心10min(4℃), 弃去上清液,重复上述步骤至上清液透明、沉淀呈淡黄色;
2)在离心管中加入DNA抽提缓冲液500μL,摇动,使血细胞沉淀脱离 离心管管壁,37℃水浴1h;
3)加蛋白酶K至3μL(20mg/mL)并混匀,55℃过夜至澄清,尚未 澄清者,可补加1μL蛋白酶K混匀继续消化直至澄清;
4)将反应液冷却至室温,加Tris-饱和酚500μL,温和摇动离心管20min, 使其充分混匀;4℃,12000r/min离心10min,将上清液转入另一1.5mL离 心管中,重复一次;
5)加氯仿500μL,充分混匀20min,4℃,12000r/min离心10min, 将上清液转入另一1.5mL离心管中;
6)加氯仿、异戊醇混合液(24∶1)500μL,充分混匀20min,4℃, 12000r/min离心10min,将上清液转入另一1.5mL离心管中;
7)加0.1倍体积的NaAc缓冲液及2倍体积的冰冷的无水乙醇,混合转 动离心管,直至白色的絮状沉淀析出,-20℃保存30~60min;
8)4℃,12000r/min离心10min,弃去上清液,用70%冰冷乙醇漂洗 DNA沉淀2次;
9)4℃,12000r/min离心10min,弃去上清液,室温下使乙醇挥发干净;
10)干燥后的DNA溶于80~100μL的TE液,4℃保存直至DNA完全 溶解,0.8%琼脂糖凝胶电泳检测其质量,-80℃保存。
11)500μL的DNA溶液中加入10%SDS使其终浓度为0.1%,加入蛋 白酶K至终浓度达到50μg/mL;
12)5℃保温10h左右;
13)等体积苯酚、氯仿、异戊醇(25∶24∶1)和氯仿分别抽提一次;
14)12000r/min离心5min分相,吸取上层水相至另一离心管中;
15)加入1/10体积3mol/L醋酸钠和2倍体积冰冷无水乙醇沉淀DNA;
16)倒掉液体,70%乙醇洗涤后晾干,加入60μL灭菌超纯水溶解,4℃ 待检测。
3)PCR扩增
PCR反应体系采用混合加样法,即根据每一个反应体系所需的各种组分 的数量和1次反应所需的PCR反应的个数,算出各种反应组分的总量,加入 到1个1.5mL离心管中,充分混匀后瞬时离心,再分装到每个0.2mL Eppendorf PCR管中,然后加入模板DNA,再瞬时离心后进行PCR扩增;
PCR反应体系见表2:
表2PCR反应体系
PCR反应程序:
94℃预变性4min;
72℃延伸10min;
对2个奶山羊品种的688个样本的基因组DNA进行PCR扩增,获得688 个个体的奶山羊MFG-E8基因中包含该SNP位点的195bp的DNA片段。
c、EcoRV酶切消化PCR扩增的MFG-E8基因片段
1、EcoRV酶切反应消化体系(25~30μL):10~15μL PCR产物,10× 缓冲液(含BSA)2.5~3.0μL,EcoRV(10U/μL)为1.0~1.5μL,11.5~16.5μL 灭菌纯水(H2O);
2、酶切消化条件:37℃恒温培养箱中消化5~10h;
d、EcoRV消化PCR产物后聚丙烯酰胺凝胶电泳分析
1)制作10%的聚丙烯酰胺凝胶(PAGE),上样后200V电压电泳45min, 0.01%AgNO3,2%NaOH显色。
2)待分子量不同的DNA片段分离清晰时,在BIO-RAD Gel Doc 2000 凝胶成像系统成像;
3)根据聚丙烯酰胺凝胶电泳结果分析SNP多态性:
用BIO-RAD Gel Doc 2000凝胶成像系统照相分析,判断SNP的多态性:
MFG-E8基因的第12892bp由T突变为C时,由于引入了碱基错配,PCR 扩增的MFG-E8基因产物的第18bp~23bp序列为GATATC,限制性内切酶 EcoRV识别后在GAT^ATC对扩增片段酶切,切取20bp的上游引物片段,将 扩增片段切为2段;而MFG-E8基因的第12892bp没有发生突变,限制性内 切酶EcoRV不能识别碱基错配引入的酶切位点,扩增片段不被切开;
由于奶山羊为2倍体,所以奶山羊基因组的MFG-E8基因的第12892bp 的SNP的多态性的聚丙烯酰胺凝胶电泳结果为:
TT基因型表现为195bp一条带;TC基因型表现为195bp、170bp和 20bp三条带;CC基因型表现为175bp和20bp两条带;由于20bp较小, 故在聚丙烯酰胺电泳分析泳动位置超出成像视野,但通过195bp和175bp 条带还是能够准确的鉴别TT基因型、TC基因型和CC基因型:不包含195bp 条带为CC基因型个体;不包含175bp条带为TT基因型个体;同时包含195 bp和170bp条带为TC基因型个体;
如图2所示,其中,泳道1不包含175bp条带,其为TT基因型个体, 泳道2不包含195bp条带,为CC基因型个体,包含209bp和70bp条带, 泳道3,泳道4同时包含195bp和175bp条带,为杂合子TC基因型个体, 泳道M为Marker I(600bp,500bp,400bp,300bp,200bp,100bp)。
4)不同基因型个体PCR产物的测序验证
利用ABI 377和ABI 3730测序仪对不同基因型个体PCR产物分别进行 正反双向测序;同时,进行SNP位置分析,结果表明包含175bp和195bp 条带的杂合子TC基因型个体其12892bp的测序图的确表示为T或C,如图 3a所示,自左向右第4个峰为两个峰,而CC基因型、TT基因型分别为C、 T,如图3b、c所示。
e、奶山羊MFG-E8基因SNP位点的频率统计分析
1)基因和基因型频率
基因型频率是指一个群体中某一性状的某种基因型个体数占总个体数的 比率。PAA=NAA/N,其中PAA代表某一位点的AA基因型频率;NAA表示群 体中具有AA基因型的个体数;N为检测群体的总数量。
基因频率是指一个群体中某一基因数对其等位基因总数的相对比率。计 算的公式可以写成:PA=(2NAA+NAa1+NAa2+NAa3+NAa4+......+NAan)/2N
式中,PA表示等位基因A频率,NAA表示群体中具有AA基因型的个体 数量,NAai表示群体中具有Aai基因型个体数量,a1-an为等位基因A的n 个互不相同的复等位基因。
在不同奶山羊品种MFG-E8基因SNP中的T等位基因频率变化幅度在 54.1%~57.0%,C等位基因频率变化幅度在43.0%~45.9%之间,如表3所示。 该SNP位点的等位基因频率大于1.0%,符合动物育种中分子标记大于 5.0%~10%的要求,具备群体遗传多样性特征。
表3奶山羊MFG-E8基因第12892位SNP基因频率分布表
f、基因效应与性状的关联分析
基因型数据:EcoRV(TT、TC和CC)
生产数据:三个体尺数据(体高、体长和胸围),四个胎次的产奶数据(第 一胎、第二胎、第三胎和第四胎)和乳成分数据。
关联分析样本:有体尺记录的西农和萨能奶山羊共668只,有第一胎到 第四胎泌乳记录的萨能奶山羊170只,有乳成分记录的萨能奶山羊74只,所 有奶山羊均为母羊。
关联分析模型:
利用SPSS(13.0)软件分析基因位点、公畜、产羔季节、年龄和胎次因 素与泌乳性状的相关性。先对数据进行描述分析,确定是否存在离群值,再 利用最小二乘法分析对数据校正;根据数据特征,利用多元线性模型分析基 因型对性状的效应。
基因型对体尺性状的效应模型为:
Yij=μ+Ai+Gj+eij
其中:yij为个体表型记录;μ为总体均值;Ai为年龄的固定效应;Gj为 基因型的固定效应;eij为随机误差。
基因型对泌乳性状的效应模型为:
Yij=μ+YSi+Gj+(GYS)ij+eij.
其中:Yij为个体表型记录;μ为总体均值;Ysi为产羔的季节效应;(GYS)ij 为各种主效应二级和二级以上互作效应;eij为随机误差。
运用SPSS(16.0)软件对数据进行分析,并用最小二乘法拟合线性模型, 对各基因型间与产奶量指标进行差异显著性检验。
结果表明:在EcoRV可识别的SNP位点,三种基因型对体尺及第一胎 到第四胎的泌乳量影响均不显著(P>0.05),具体如表4所示;三种基因型 对乳脂率和总固形物的影响差异显著(P<0.05),具体如表5所示:CC型 优于CT型,CT型优于TT型。说明EcoRV位点可以成为一个提高奶山羊产 奶量的分子遗传标记。
表4.EcoRV识别的SNP位点和体尺及第一胎到第四胎的关联分析.
表5.EcoRV识别的SNP位点与乳成分的关联分析.
注:具有相同字母表示差异不显著(P>0.05),字母不同表示差异显著(P<0.05)。
核苷酸序列表
<110>西北农林科技大学
<120>奶山羊MFG-E8基因的单核苷酸多态性及其检测方法
<210>1
<211>397
<212>DNA
<213>奶山羊(Capra hircus)
<220>
<221>y
<222>(225)
<400>1
tcttttccct tcactgcctc gctctcacgc ccccacgcgt aggctgtgga tcccagatct 60
gggtgacagc cccccacccc cacctccttg ttggcaggat gcactgaacc cctaggcctg 120
aaggataata ccatccccaa caagcagatc acagcctcca gctactacaa aacctggggc 180
ctgagtgcct ttagctggtt tccctactac gcacgactgg ataaytgggg caagttcaac 240
gcctggaccg cccagaccaa cagtgcctct gagtggctgc aggtgagtca ggctcctctg 300
gggatgcagg gttggggttg ggtggggctg tgggaatcta tgaccctggc ccaaccctgg 360
cctctgcttg ccaagaggga gtttctttga gccttgt 397