《基于双酶切的大黄鱼全基因组SNP和InDel分子标记方法.pdf》由会员分享,可在线阅读,更多相关《基于双酶切的大黄鱼全基因组SNP和InDel分子标记方法.pdf(8页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 (43)申请公布日 (21)申请号 201510871364.1 (22)申请日 2015.12.02 C12Q 1/68(2006.01) C12N 15/11(2006.01) (71)申请人 集美大学 地址 361000 福建省厦门市集美区银江路 185 号 (72)发明人 肖世俊 王志勇 陈俊蔚 (74)专利代理机构 北京科亿知识产权代理事务 所 ( 普通合伙 ) 11350 代理人 汤东凤 (54) 发明名称 基于双酶切的大黄鱼全基因组 SNP 和 InDel 分子标记方法 (57) 摘要 本发明公开了一种基于双酶切的大黄鱼全基 因组 SNP 和 InDel 分子。
2、标记方法, 包括以下步骤 : 1) 接头序列设计 ; 2) 基因组 DNA 酶切 ; 3) 接头序 列连接 ; 4) 样品混合与 PCR 扩增 ; 5) 高通量测序 ; 6) 测序数据分析挖掘 SNP 位点 ; 本发明是结合了 现代分子生物学和先进的高通量测序技术, 通过 利用 EcoRII 和 NlaIII 双酶切组合的方法, 对全 基因组的DNA分子进行酶切, 获取特定长度的DNA 片段进行建库测序和 SNP 分子标记挖掘, 进而获 得全基因组均匀分布的 SNP 位点信息 ; 本发明的 方法大大降低了全基因组标记分析的工作量和成 本, 同样也适合于其他的物种全基因组标记分析 ; 利用本发明。
3、挖掘的 SNP 标记可用于动植物品种鉴 定、 品种遗传系谱分析、 种质资源遗传多样性分析 和遗传育种等研究领域。 (51)Int.Cl. (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书1页 说明书4页 附图2页 CN 105349675 A 2016.02.24 CN 105349675 A 1/1 页 2 1.一种基于双酶切的大黄鱼全基因组 SNP 和 InDel 分子标记方法, 其特征在于 : 利用 EcoRI 和 NlaIII 组合对基因组进行双酶切, 达到简化基因组建库和测序的目的, 所述方法 包括以下步骤 : 1) 接头序列设计 : 接头序列的设计与 EcoR。
4、I 和 NlaIII 的双酶末端和后续的 Illumina Hiseq 测序平台要求的引物序列一致, 接头序列由测序平台接头序列和样本标签序列二部 分组成 ; 样本标签设计按照以下原则 : a. 每个样本标签序列间最少有二个差异碱基 ; b. 样本标签序列不含有连续的二个相同的碱基 ; c. 样本标签不包含且不与接头序列形成酶切位点特异序列 ; 2) 基因组 DNA 酶切 : 200ng 的基因组 DNA 在 20 ul 的反应体系中同时进行二个酶切反 应 ; 3) 接头序列连接 : 接头序列连接在基因组 DNA 酶切同一个试管中进行, 将设计的接头 序列通过连接酶连接到 DNA 片段的酶切末。
5、端上 ; 4) 样品混合与PCR扩增建库 : 将不同样本个体连接接头序列的DNA片段进行等量混合, 保证各个样本 DNA 片段数目的均衡性, 加入 PCR 引物序列和 DNA 合成酶进行 PCR 反应, 扩增 连接产物 ; 5) 高通量测序 : 将步骤 4 中的扩增产物利用 Illumina Hiseq2000 测序平台进行测序 ; 6) 测序数据分析挖掘 SNP 位点 : 测序原始数据首先通过样本特异标签序列进行分选, 得到每个样本的测序读段序列, 将每个样本的读段序列利用短序列比对软件 BWA 比对到大 黄鱼的参考基因组上, 并使用 GATK 进行 SNP 挖掘。 2.根据权利 1 所述的。
6、基于双酶切的大黄鱼全基因组 SNP 和 InDel 分子标记方法, 其特 征在于, 利用二种 DNA 内切酶 EcoRI 和 NlaIII 组合, 对所有个体基因组进行酶切, 获取合适 长度的 DNA 片段, 进行建库测序。 3.根据权利 1 所述的基于双酶切的大黄鱼全基因组 SNP 和 InDel 分子标记方法, 其特 征在于, 针对二种 DNA 内切酶 EcoRI 和 NlaIII 的酶切末端和测序平台的要求, 设计接头序 列和样本标签序列。 4.根据权利 1 所述的基于双酶切的大黄鱼全基因组 SNP 和 InDel 分子标记方法, 其特 征在于, 使用 EcoRI 和 NlaIII 的基。
7、因组酶切产物进行高通量测序建库和测序, 并进行全基 因组 SNP 挖掘。 权 利 要 求 书 CN 105349675 A 2 1/4 页 3 基于双酶切的大黄鱼全基因组 SNP和 InDel分子标记方法 技术领域 0001 本发明涉及大黄鱼全基因组分子标记开发技术领域, 具体是一种基于双酶切的大 黄鱼全基因组 SNP 和 InDel 分子标记方法。 背景技术 0002 分子标记指能反映生物个体间或种群间基因组中某种差异特征的 DNA 片段或则 碱基, 它直接反映基因组 DNA 间的差异, 因而, 分子标记是基因水平上的标记, 是生 物遗传 分子的一种重要工具 ; 主要包括 RFLP (Res。
8、triction Fragment Length Polymorphism)、 RAPD (Random Amplified Polymorphic DNA)、 AFLP (Amplified Fragment Length Polymorphism)、 SSR (Simple Sequence Repeat)、 SNP (Single Nucleotide Polymorphisms)和InDel (small Insert and Deletion)等 ; 目前, 随着基因分型技术的发展, 除SSR、 SNP和InDel标 记在广泛使用外, 其他类型的标记已用得越来越少, 虽然 SSR 具。
9、有检测方便, 多态性高等特 点, 但是在高通量测序和分析技术不断进步的今天, SNP 和 InDel 成为了越来越重要的分子 标记, 其相对于SSR而言具有以下特点 : 第一, 分布广泛 : SNP和InDel分布于基因组广泛的 区域, 包括编码区和非编码区 ; 第二, 位点特异 : SNP和InDel标记可以明确指出产生多态性 的原因, 但是SSR的多态性还需要进一步测序验证 ; 第三, 高通量 : SNP和InDel标记可以利 用大规模测序的方法进行高通量的开发, 一般开发的分子标记的数目可以到几万到几千万 个 ; 随着高通量测序方法的进步和成本的进一步快速下降, SNP 和 InDel 。
10、标记现在已经成为 了分子标记和基因型鉴定的主要标记类型, 目前, SNP 和 InDel 标记已经成功并广泛的应用 于重要经济物种的遗传图谱构建, 重要性状 QTL 定位和全基因组关联分析中 ; 大黄鱼是一 种主要分布于中国和东亚的重要的鱼类, 是我国产量和育苗量最大的海洋经济鱼类, 大黄 鱼重要经济性状的研究, 比如生长速度等, 需要大量的全基因组 SNP 和 InDel 分子标记 ; 现 有技术中, 大黄鱼的 SNP 和 InDel 分子标记的开发主要依赖全基因组和转录组高通量测序 的方法 ; 转录组虽然可以快速获得大量基因表达区的SNP和InDel位点, 但是表达区仅仅占 全基因组的 2。
11、% 左右, 无法获得全基因的标记 ; 全基因组测序虽然能在全基因水平进行 SNP 和 InDel 开发, 但是由于其高成本, 高数据分析强度限制了其在大黄鱼 SNP 和 InDel 标记的 广泛应用 ; 基于上述原因, 需要对现有技术的大黄鱼分子标记方法进行改进。 发明内容 0003 本发明的目的在于提供一种能克服 现有的转录组和全基因组重测序技术在大黄 鱼分子标记标记挖掘上分布不均和成本过高的问题、 能以较低的成本在全基因组范围内进 行高通量的 SNP 标记挖掘基于 EcoRI 和 NlaIII 的双酶切的大黄鱼全基因组 SNP 和 InDel 分子标记方法, 以解决上述背景技术中提出的问题。
12、。 0004 为实现上述目的, 本发明提供如下技术方案 : 一种基于双酶切的大黄鱼全基因组 SNP 和 InDel 分子标记方法, 包括以下步骤 : 说 明 书 CN 105349675 A 3 2/4 页 4 1) 接头序列设计 ; 2) 基因组 DNA 酶切 ; 3) 接头序列连接 ; 4) 样品混合与 PCR 扩增 ; 5) 高通量测序 ; 6) 测序数据分析挖掘 SNP 位点。 0005 作为本发明进一步的方案 : 所述的基于双酶切的大黄鱼全基因组 SNP 和 InDel 分 子标记方法, 具体包括以下步骤 : 1) 接头序列设计 : 接头序列的设计与 EcoRI 和 NlaIII 的。
13、双酶末端和后续的 Illumina Hiseq 测序平台要求的引物序列一致, 接头序列由测序平台接头序列和样本标签序列二部 分组成 ; 样本标签设计按照以下原则 : a. 每个样本标签序列间必须最少有二个差异碱基 ; b. 样本标签序列不能含有连续的二个相同的碱基 ; c. 样本标签不能包含且不能与接头序列形成酶切位点特异序列 ; 2) 基因组 DNA 酶切 : 200ng 的基因组 DNA 在 20 ul 的反应体系中同时进行二个酶切反 应 ; 3) 接头序列连接 : 接头序列连接在基因组 DNA 酶切同一个试管中进行, 将设计的接头 序列通过连接酶连接到 DNA 片段的酶切末端上 ; 4)。
14、 样品混合与PCR扩增建库 : 将不同样本个体连接接头序列的DNA片段进行等量混合, 保证各个样本 DNA 片段数目的均衡性, 加入 PCR 引物序列和 DNA 合成酶进行 PCR 反应, 扩增 连接产物 ; 5) 高通量测序 : 将步骤 4 中的扩增产物利用 Illumina Hiseq2000 测序平台进行测序 ; 6) 测序数据分析挖掘 SNP 位点 : 测序原始数据首先通过样本特异标签序列进行分选, 得到每个样本的测序读段序列, 将每个样本的读段序列利用短序列比对软件 BWA 比对到大 黄鱼的参考基因组上, 并使用 GATK 进行 SNP 挖掘。 0006 与现有技术相比, 本发明的有。
15、益效果是 : 本发明采用基于双酶切的大黄鱼全基因 组 SNP 和 InDel 分子标记方法, 可以在大黄鱼全基因组水平进行 SNP 标记挖掘, 包含了基因 编码和非编码区域 ; 并且由于使用酶切和特定 DNA 片段回收的方法, 大大降低了序列进行 测序的范围, 从而有效地控制了标记开发成本 ; 本发明采用了 EcoRI 和 NlaIII 酶切组合的 方法, 能特异的扩增大黄鱼全基因组内含有二种酶切位点的 DNA 片段, 从而达到简化基因 组建库和测序的目的 ; 本发明大大降低了大黄鱼全基因组 SNP 挖掘中高通量建库, 测序和 SNP 开发的复杂度和工作量, 缩短了利用全基因组范围 SNP 进。
16、行的品种鉴定、 品种遗传系谱 分析、 种质资源遗传多样性分析和遗传育种等研究领域的工作周期, 可以以较低的成本在 大黄鱼全基因组上进行 SNP 挖掘, 为大黄鱼品种鉴定、 品种遗传系谱分析和种质资源遗传 多样性分析, 遗传育种等研究领域提供有效的分子标记方法。 附图说明 0007 图 1 为本发明的分子标记流程图。 0008 图 2 为本发明应用实例中进行双酶切建库的片段长度分布图。 说 明 书 CN 105349675 A 4 3/4 页 5 0009 图 3 为本发明应用实例中利用挖掘的全基因组 SNP 标记进行群体聚类分析。 具体实施方式 0010 下面结合具体实施方式对本专利的技术方案。
17、作进一步详细地说明。 0011 实施例 1 请参阅图 1-3, 一种基于双酶切的大黄鱼全基因组 SNP 和 InDel 分子标记方法, 包括以 下步骤 : 1) 选取实验材料 本实验取同一时期 1 年龄养殖大黄鱼随机群体 96 尾, 体重范围及体长范围相似 ; 所有 大黄鱼个体记录基本的性状指标后, 留鳍条, 用体积分数为70%的酒精保存, 放入-20C下 保存备用。 0012 2) 大黄鱼基因组 DNA 提取与保存 a.将冷冻的鱼鳍在液氮中用研钵研磨成粉末, 取规格为1.5ml的离心管, 加入1ml消化 缓冲液, 缓缓地将粉末加入 1ml 消化缓冲液中, 使粉末在消化缓冲液的表面均匀浸湿, 。
18、然后 摇动使样品浸没, 并在 37下消化 5h, 每半小时振摇一下 ; b. 待溶液冷却至室温, 分装成两管, 每管吸取 0.5ml 平衡苯酚轻轻混合, 直到形成乳 状, 在 3000-5000g 条件下离心 10min, 用大孔吸管移出水相 ; c. 用 0.5ml(相同体积) 苯酚 : 氯仿 : 异戊醇 (25 : 24 : 1) 再次提取两次, 将水相转移到 洁净的管中, 加入 NaCl 至浓度 0.3M(3M NaCl 加 50ul) , 轻轻沿管壁注入 2.5 倍体积的乙 醇, 轻轻摇动管子, 直至溶液完全混合, 可以很清楚的看见 DNA 快速沉淀下来, 3000g 条件 下离心 1。
19、0min 后, 用适量 70乙醇漂洗两次, 离心, 弃上清液, 晾干 ; d. 样本在 0.5ml TE 中再悬浮, 加入 NaCl 至终浓度 100mM(3M NaCl 加 16.7ul) , 加入 (DNAse free)RNAse A 至浓度 100ug/ml (10mg/ml RNAse A 加 5ul) , 在 37下保持 3h 后, 加入 SDS 至最终浓度 0.2(10%SDS 加 10ul) , 并用相同体积苯酚 : 氯仿 : 异戊醇 (25 : 24 : 1) 提取两次, 将水相转移到洁净的管中, 加入 NaCl 至浓度 0.3M(3M NaCl 加 50ul) , 轻轻 沿。
20、管壁注入 2.5 倍体积的乙醇 , 轻轻摇动管子, 直至溶液完全混合, 可以很清楚的看见 DNA 快速沉淀下来, 将 DNA 放在 0.5ml 10mM TE 中再悬浮, 最后样本在 260nm 下测定 OD 值用以 确定浓度, 提取的 DNA 样本置于 -20 C 下保存备用。 0013 3) 接头序列设计与合成 请参阅附图 2, 本实施例设计并合成了附图 2 的接头序列进行高通量测序建库。 0014 4) 基因组 DNA 酶切 大黄鱼基因组 DNA(约 200ng) 加入到 20 ul 的反应体系中进行酶切, 该反应体系包括 NEB4 号缓冲液 (NEB Buffer 4) , 8U 的 。
21、PstI 内切酶和 8U 的 MspI 内切酶, 整个酶切过程在 37 C 下持续 2h, 之后反应体系置于 65 C 下 20min 变性 PstI 和 MspI 的活性, 抑制酶切 反应。 0015 5) 基因组 DNA 酶切产物与接头序列连接 接头序列连接反应在基因组DNA酶切反应同一个试管中进行, 同样先加入NEB4号缓冲 液 (NEB Buffer 4) 和 ATP, 试管中加入 0.1 pmol 的相应顺向接头和 15 pmol 的逆向 Y 型 接头序列 ; 之后, 向各个样本的反应体系中加入 NEB4 号缓冲液、 ATP 和 200U 的 T4 连接酶, 说 明 书 CN 105。
22、349675 A 5 4/4 页 6 整个反应体系保持在 22 C 下持续 2h, 之后反应体系置于 65 C 下 20min。 0016 6) 混样与文库扩增 连接产物通过 Qbit 准确定量后, 样本间等量混合到一个 PCR 试管中, 混合样本通过 18 轮的 PCR 扩增反应 (95 C、 30s ; 62 C、 30s ; 68 C、 30s) , 对混合样本进行等量扩增, 得到 待测序文库。 0017 7) 高通量测序与全基因组 SNP 开发 步骤 6 中的扩增产物按照 Illumina 建库和测序流程使用 Hiseq 平台进行高通量测序, 测序采用双端 2X100bp 模式, 平均。
23、每个个体测序 500M, 共得到测序数据约 50G。 0018 得到的原始测序读段根据样本特异标签的序列进行分类, 分别得到 96 个个体的 原始读段数据 ; 对每个读段序列删除其样本特异标签以后, 使用 BWA 比对到大黄鱼参考基 因组序列上, 得到序列比对bam文件 ; 使用GATK对所得的bam文件进行分析, 对每个碱基水 平的多态性进行判断, 得到大黄鱼全基因组的 SNP 标记。 0019 本实施例按照上述流程共得到 30194 个 SNP 多态性标记, 其中 12983 个为 128 条 大黄鱼个体所共有 ; 为了获取这128个个体的遗传系谱信息, 利用上述获得的全基因SNP标 记基因型, 对这 128 条鱼进行了遗传距离进行分析, 结果发现其中一些个体之间有明显的 聚类, 显示这些个体可能是同一个家系的后代, 如附图 3 所示。 0020 上面对本专利的较佳实施方式作了详细说明, 但是本专利并不限于上述实施方 式, 在本领域的普通技术人员所具备的知识范围内, 还可以在不脱离本专利宗旨的前提下 做出各种变化。 说 明 书 CN 105349675 A 6 1/2 页 7 图 1 图 2 说 明 书 附 图 CN 105349675 A 7 2/2 页 8 图 3 说 明 书 附 图 CN 105349675 A 8 。