《基因及其应用.pdf》由会员分享,可在线阅读,更多相关《基因及其应用.pdf(18页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 (43)申请公布日 (21)申请号 201610055464.1 (22)申请日 2016.01.27 C12N 15/12(2006.01) C07K 14/435(2006.01) C12N 15/63(2006.01) C12N 15/11(2006.01) C12Q 1/68(2006.01) (71)申请人 中国农业科学院蜜蜂研究所 地址 100093 北京市海淀区香山北沟一号 (72)发明人 刘之光 石巍 陈超 陈晓 郭海坤 王慧华 (74)专利代理机构 北京集佳知识产权代理有限 公司 11227 代理人 赵青朵 (54) 发明名称 基因及其应用 (57) 摘要。
2、 本发明涉及生物技术领域, 特别涉及基因及 其应用。本发明采用全基因组测序对西域黑蜂大 量个体进行全基因组重测序, 获得了西域黑蜂特 有的基因。所述基因在西域黑蜂与其它地区蜜蜂 的分化及西域对本地环境的适应性进化具有重要 作用。本发明提供的 FilI 基因或 Ds 基因能够用 于鉴定西域黑蜂与其他物种 ; 也能够用于研究蜂 的物种资源遗传多样性 ; 还能够用于研究抗逆基 因。这将填补我国科研人员在西域黑蜂领域的研 究空白。 (51)Int.Cl. (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书1页 说明书5页 序列表9页 附图2页 CN 105543235 A 2016。
3、.05.04 CN 105543235 A 1.基因, 其特征在于, 具有: ()如SEQIDNo.1或SEQIDNo.2所示的核苷酸序列; 或 ()如SEQIDNo.1或SEQIDNo.2所示的核苷酸序列的互补序列; 或 ()与()或()的核苷酸序列编码相同蛋白质, 但因遗传密码的简并性而与()或 ()的核苷酸序列不同的序列; 或 ()具有SEQIDNO:1或SEQIDNo.2所示的核苷酸序列经取代、 缺失或添加一个或多 个核苷酸序列获得的核苷酸序列, 且与SEQIDNO:1或SEQIDNo.2所示的核苷酸序列功能 相同或相似的核苷酸序列。 2.根据权利要求1所述的基因, 其特征在于, 所述。
4、多个核苷酸序列为2个、 3个、 4个、 5个、 6个、 7个、 8个、 9个、 10个、 11个、 12个、 13个、 14个、 15个、 16个、 17个、 18个、 19个、 20个、 21个或 22个。 3.一种含有根据权利要求1或2所述基因的重组DNA。 4.一种表达载体, 其特征在于, 插入了根据权利要求3所述的重组DNA, 并以微生物、 动 物细胞或植物细胞作为宿主细胞。 5.一种有根据权利要求4所述的百搭载体转化的转化子。 6.根据权利要求1或2所述基因在物种鉴定中的应用; 所述物种包括西域黑蜂。 7.根据权利要求1或2所述基因在物种资源遗传多样性中的应用。 8.根据权利要求1或。
5、2所述基因在抗逆中的应用。 9.一种鉴定西域黑蜂的引物组, 包括能够扩增如权利要求1或2所述基因的引物。 10.一种鉴定西域黑蜂的试剂盒, 包括如权利要求9所述的引物组。 11.一种鉴定西域黑蜂的方法, 其特征在于, 包括如下步骤: 步骤1: 获得待测物种的DNA; 步骤2: 通过基因比对, 如果含有如权利要求1或2所述基因, 则所述待测物种为西域黑 蜂; 反之, 如果不含有如权利要求1或2所述基因, 则所述待测物种不为西域黑蜂。 权利要求书 1/1 页 2 CN 105543235 A 2 基因及其应用 技术领域 0001 本发明涉及生物技术领域, 特别涉及基因及其应用。 背景技术 0002。
6、 我国蜜蜂饲养历史悠久, 蜜蜂种质资源丰富, 但是长久以来, 我国境内仅发现存在 东方蜜蜂, 并无原生的西方蜜蜂。 东方蜜蜂采集能力稍次于西方蜜蜂, 伴随着西方蜜蜂的引 进, 我国养蜂者越累越多的开始饲养西方蜜蜂, 我国原生蜂种质资源受到威胁。 引进的资源 对我国本地群体造成了威胁; 同时引进资源也存在一定程度的不适应本地环境的问题。 如 果能够在我国境内找到原生的西方蜜蜂对我国蜜蜂种质资源有着重要意义。 中国蜜蜂种质 资源委员会主任石巍老师与新疆自治区蜂业管理站工作人员一直从事加强对新疆原有伊 犁黑蜂保护的工作, 经过多年的努力, 首次在中国新疆伊犁境内发现欧洲黑蜂自然种群, 并 且与目前国。
7、际上已知的西方蜜蜂亚种至少存在9万年的分化, 证明中国也是西方蜜蜂的原 产地, 结束了我国没有西方蜜蜂自然种群分布的历史, 这在畜禽资源研究方面具有很大的 突破性意义。 中国的西域黑蜂个体较大、 越冬性能好、 抗逆性强、 抗病能力十分突出, 而且蜂 王产卵力强, 能维持强群和蜂群极大的采集能力, 既可作为推广普及的新品种, 也可以作为 育种素材, 作进一步的深入育种研究, 具有很好的发展前景。 0003 中国发现原生的西方蜜蜂, 在国内外产生了较大的影响, 为了更加深入的保护西 域黑蜂, 有效的利用西域黑蜂为我国蜜蜂育种工作服务, 在 “蜂产业技术体系”“物种资源保 护” 等课题的资助下, 我。
8、们对西域黑蜂的研究工作取得突破性进展, 利用全基因组重测序技 术鉴定了西域黑蜂特有的一百万个以上的SNP位点, 鉴定出了一些西域黑蜂特有的基因序 列。 0004 全基因组测序, 即对一种生物的基因组中的全部基因进行测序, 测定其DNA的碱基 序列。 全基因组测序覆盖面广, 能检测个体基因组中的全部遗传信息, 准确性高。 每个个体 从受精卵开始就继承了父母的DNA遗传信息, 并且携带一生, 不易改变。 全基因组测序就是 通过运用新一代高通量DNA测序仪, 进行10-20倍覆盖率的个体全基因组测序, 然后与该物 种基因组精确图谱比较, 得到完整的个体全基因组序列, 破译个体全部的遗传信息的过程。 。
9、全基因组重测序的个体, 通过序列比对, 可以找到特定物种(品种)特有的大量的单核苷酸 多态性(SNP)位点。 0005 目前尚没有对西域黑蜂特有基因的探索。 发明内容 0006 有鉴于此, 本发明提供了西域黑蜂的基因及其应用。 本发明采用全基因组测序对 中国黑蜂大量个体进行全基因组重测序, 获得了西域黑蜂特有的SNP位点和基因。 0007 为了实现上述发明目的, 本发明提供以下技术方案: 0008 本发明提供了基因, 具有: 0009 ()如SEQIDNo.1(FilI基因)或SEQIDNo.2(Ds基因)所示的核苷酸序列; 或 说明书 1/5 页 3 CN 105543235 A 3 001。
10、0 ()如SEQIDNo.1或SEQIDNo.2所示的核苷酸序列的互补序列; 或 0011 ()与()或()的核苷酸序列编码相同蛋白质, 但因遗传密码的简并性而与() 或()的核苷酸序列不同的序列; 或 0012 ()具有SEQIDNO:1或SEQIDNo.2所示的核苷酸序列经取代、 缺失或添加一个 或多个核苷酸序列获得的核苷酸序列, 且与SEQIDNO:1或SEQIDNo.2所示的核苷酸序列 功能相同或相似的核苷酸序列 0013 在本发明的一些具体实施方案中, 所述多个核苷酸序列为2个、 3个、 4个、 5个、 6个、 7个、 8个、 9个、 10个、 11个、 12个、 13个、 14个、。
11、 15个、 16个、 17个、 18个、 19个、 20个、 21个或22 个。 0014 本发明还提供了一种含有所述基因(FilI基因或Ds基因)的重组DNA。 0015 本发明还提供了一种表达载体, 插入所述重组DNA, 并以微生物、 动物细胞或植物 细胞作为宿主细胞。 0016 本发明还提供了一种由所述表达载体转化的转化子。 0017 本发明还提供了所述基因(FilI基因或Ds基因)在物种鉴定中的应用; 所述物种包 括西域黑蜂。 0018 此外, 本发明还提供了所述基因(FilI基因或Ds基因)在物种资源遗传多样性中的 应用。 0019 本发明还提供了所述基因(FilI基因或Ds基因)在。
12、抗逆中的应用。 0020 本发明还提供了一种鉴定西域黑蜂的引物组, 包括能够扩增所述基因(FilI基因 或Ds基因)的引物。 0021 本发明还提供了一种鉴定西域黑蜂的试剂盒, 包括所述引物组。 0022 本发明还提供了一种鉴定西域黑蜂的方法, 包括如下步骤: 0023 步骤1: 获得待测物种的DNA; 0024 步骤2: 通过基因比对, 如果含有所述基因(FilI基因或Ds基因), 则所述待测物种 为西域黑蜂; 反之, 如果不含有所述基因(FilI基因或Ds基因), 则所述待测物种不为西域黑 蜂。 0025 本发明提供了西域黑蜂特有的基因序列。 全基因组测序, 即对一种生物的基因组 中的全部。
13、基因进行测序, 测定其DNA的碱基序列。 全基因组测序覆盖面广, 能检测个体基因 组中的全部遗传信息, 准确性高。 每个个体从受精卵开始就继承了父母的DNA遗传信息, 并 且携带一生, 不易改变。 全基因组测序就是通过运用新一代高通量DNA测序仪, 进行10-20倍 覆盖率的个体全基因组测序, 然后与该物种基因组精确图谱比较, 得到完整的个体全基因 组序列, 破译个体全部的遗传信息的过程。 全基因组重测序的个体, 通过序列比对, 可以找 到特定物种(品种)特有的大量的单核苷酸多态性(SNP)位点。 本发明首次鉴定出了西域适 应寒冷气候的关键基因。 包括2个基因: FilI、 Ds。 这些基因在。
14、西域黑蜂与其它地区蜜蜂的分 化及西域对本地环境的适应性进化具有重要作用。 0026 本发明提供的FilI基因或Ds基因能够用于鉴定西域黑蜂与其他物种; 也能够用于 研究蜂的物种资源遗传多样性; 还能够用于研究抗逆基因。 这将填补我国科研人员在西域 黑蜂领域的研究空白。 说明书 2/5 页 4 CN 105543235 A 4 附图说明 0027 为了更清楚地说明本发明实施例或现有技术中的技术方案, 下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍。 0028 图1示基因组DNA提取结果图; 所有样品均获得高质量的大片段DNA, 所有样品中未 出现明显降解; 图中 “标” 为标准品上。
15、样5ul(10ng/ul); M-1为Trans2kplusDNA分子量标 准, 上样2ul; M-2为Trans15kplusDNA分子量标准, 上样2ul; 其余为样品DNA; 0029 图2示本发明提供的两个基因具有特殊的DNA序列; 基因区的SNP位点与其它亚种 相比有明显基因型差异; 0030 图3(A)示利用FST、 Tajima sD和 几个统计量对FilI基因进行扫描, 检测出明显 的受选择信号, 表示该基因在西域黑蜂中受到了特定的自然选择; 图3(B)示Ds基因在西域 黑蜂(A.m.sinisxinyuan)和其它代表性群体包括欧洲黑蜂(A.m.mellifera)和非洲蜜蜂。
16、 (A.m.scutellata)中的基因树, 基因树中所有西域黑蜂的Ds基因单独聚成一簇, 显示其在 西域黑蜂中具有特殊的序列; 图3(C)示FilI基因在西域黑蜂(A.m.sinisxinyuan)和其它代 表性群体包括欧洲黑蜂(A.m.mellifera)和非洲蜜蜂(A.m.scutellata)中的基因树, FilI 基因在西域黑蜂中, 与环境条件不同的非洲群体相比(A.m.scutellata), 存在明显的分化, 具有独特的亚型。 具体实施方式 0031 本发明公开了西域黑蜂的基因及其应用, 本领域技术人员可以借鉴本文内容, 适 当改进工艺参数实现。 特别需要指出的是, 所有类似的。
17、替换和改动对本领域技术人员来说 是显而易见的, 它们都被视为包括在本发明。 本发明的方法及应用已经通过较佳实施例进 行了描述, 相关人员明显能在不脱离本发明内容、 精神和范围内对本文所述的方法和应用 进行改动或适当变更与组合, 来实现和应用本发明技术。 0032 1.样品采集。 采集活体蜜蜂样品, 并尽快放入90酒精中保存。 0033 2.提取样品高质量DNA(脱氧核糖核酸)。 0034 3.将DNA样品进行Illumina高通量测序, 获得DNA序列原始数据。 0035 4.过滤掉低质量序列。 过滤规则包括: 1)末端 “N” 的个数应小于等于序列长度的 10; 2)测序质量低于5的碱基数应。
18、不超过序列长度的50。 0036 5.以西方蜜蜂(Apismellifera)在NCBI公共数据库上的基因组为参考基因组 (apiMel4.5), 利用BWA软件进行序列比对, 比对参数为 “-t-k32-M-R” 。 0037 6.利用SAMtools mpileup程序获得群体的SNP基因型, 将获得的基因型进行过滤, 获得最后的结果。 过滤的规则有: 1)质量值应不小于20; 2)在序列间隔处5个碱基以内的SNP 应过滤掉; 3)测序深度应当大于等于4, 小于等于1000; 4)去掉有三个或更多基因型的SNP位 点。 0038 本发明提供的西域黑蜂的基因及其应用中所用原料及试剂均可由市场。
19、购得。 0039 下面结合实施例, 进一步阐述本发明: 0040 实施例1 0041 (1)采集蜜蜂样本, 提取DNA, DNAOD值在1.8-2.0, 含量大于1.5微克的样品认为是 说明书 3/5 页 5 CN 105543235 A 5 合格的; 0042 (2)合格的DNA样品构建文库: 检验合格的DNA样品通过Covaris破碎机随机打断成 长度为350bp的片段。 采用TruSeqLibraryConstructionKit进行建库, 严格使用说明书 推荐的试剂和耗材。 DNA片段经末端修复、 加尾、 加测序接头、 纯化、 PCR扩增等步骤完成整个 文库制备。 构建好的文库通过il。
20、luminaHiSeq进行测序。 0043 (3)库检: 文库构建完成后, 先使用Qubit2.0进行初步定量, 稀释文库至1ng/ l, 随 后使用Agilent2100对文库的insertsize进行检测, insertsize符合预期后, 使用Q-PCR 方法对文库的有效浓度进行准确定量(文库有效浓度2nM), 以保证文库质量。 0044 (4)上机测序: 库检合格, 根据文库的有效浓度及数据产出需求进行illumina HiSeq测序。 0045 (5)质控: 测序得到的原始测序序列(SequencedReads)或者rawreads, 里面含有 带接头的、 低质量的reads。 为了。
21、保证信息分析质量, 必须对rawreads过滤, 得到clean reads, 后续分析都基于cleanreads。 数据处理的步骤如下: 0046 a.去除带接头(adapter)的paired-endreads; 0047 b.当单端测序read中含有的N的含量超过该条read长度比例的10时, 需要去除 此对paired-endreads; 0048 c.当单端测序read中含有的低质量(Q5)碱基数超过该条read长度比例的50 时, 需要去除此对paired-endreads。 0049 通过对10个西域黑蜂个体进行重测序, 我们共获得了1.79亿个高质量的双末端测 序序列(读长10。
22、0bp), 总数据量为17.9G。 0050 (6)序列比对 0051 使用BWA软件进行序列(cleanreads)比对, 除 “-t-k32-M-R” 外, 其它参数选择默 认值。 以Amel4.5(来源NCBI)为参考基因组, 比对获得的bam文件利用SAMtools软件进行排 序, 并移除重复的序列。 0052 序列比对后, 我们获得了8的测序深度, 基因组覆盖率为90。 0053 (7)SNP检测: 得到bam文件后, 我们进行SNP的检测。 SNP(单核苷酸多态性)主要是 指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性, 包括单个碱基的转换、 颠 换等。 我们采用SAM。
23、TOOLS(mpileup-m2-F0.002-d1000)进行个体SNP的检测。 为了降低 SNP检测的错误率, 选用如下标准进行过滤: 0054 a.SNP的reads支持数不低于4; 0055 b.SNP的质量值(MQ)不低于20; 0056 对比参考基因组, 共从西域黑蜂中检测到SNP位点1,409,113个。 0057 (8)SNP注释: ANNOVA是一种高效的软件工具, 它能利用最新的信息, 对由多个基因 组检测出的基因变异进行功能注释。 只要给出变异所在的染色体、 起始位点、 终止位点、 参 考核苷酸和变异核苷酸, ANNOVAR就能进行Gene-basedannotation。
24、、 Region-based annotations、 Filter-basedannotation和Otherfunctionalities。 鉴于ANNOVAR强大的 注释功能和国际的认可性, 我们利用它对SNP检测结果进行注释。 0058 注释结果显示, 在1,409,113个SNP中, 有28,067个位于基因上游区(1Kb内), 24, 778个位于基因下游区(1Kb内), 62,289个位于外显子区, 657,772个位于内含子区, 110个位 说明书 4/5 页 6 CN 105543235 A 6 于剪切位点, 633,186个位于其余非基因区。 0059 (9)对应基因序列可。
25、以用GATK工具包, 利用参考基因组序列和检测到的SNP序列来 提取。 0060 以上所述仅是本发明的优选实施方式, 应当指出, 对于本技术领域的普通技术人 员来说, 在不脱离本发明原理的前提下, 还可以做出若干改进和润饰, 这些改进和润饰也应 视为本发明的保护范围。 说明书 5/5 页 7 CN 105543235 A 7 0001 0002 序列表 1/9 页 8 CN 105543235 A 8 0003 序列表 2/9 页 9 CN 105543235 A 9 0004 序列表 3/9 页 10 CN 105543235 A 10 序列表 4/9 页 11 CN 105543235 A 11 0005 序列表 5/9 页 12 CN 105543235 A 12 0006 序列表 6/9 页 13 CN 105543235 A 13 0007 序列表 7/9 页 14 CN 105543235 A 14 0008 0009 序列表 8/9 页 15 CN 105543235 A 15 序列表 9/9 页 16 CN 105543235 A 16 图1 图2 说明书附图 1/2 页 17 CN 105543235 A 17 图3 说明书附图 2/2 页 18 CN 105543235 A 18 。