使用RNA引导的内切核酸酶在非常规酵母中基因靶向.pdf

上传人:磨** 文档编号:8812588 上传时间:2021-01-05 格式:PDF 页数:270 大小:5.27MB
返回 下载 相关 举报
摘要
申请专利号:

CN201580056204.X

申请日:

20150721

公开号:

CN107002020A

公开日:

20170801

当前法律状态:

有效性:

审查中

法律详情:

IPC分类号:

C12N1/19,C12N15/10,C12N15/55,C12N15/113,C12N15/90

主分类号:

C12N1/19,C12N15/10,C12N15/55,C12N15/113,C12N15/90

申请人:

纳幕尔杜邦公司

发明人:

R.弗里施,X.范,S-P.洪

地址:

美国特拉华州

优先权:

62/036652

专利代理机构:

中国专利代理(香港)有限公司

代理人:

唐华东;黄希贵

PDF下载: PDF下载
内容摘要

本文公开了非常规酵母,其包含至少一种RNA引导的内切核酸酶(RGEN),所述RNA引导的内切核酸酶包含至少一种不具有5’端的RNA组分。该未封端的RNA组分包含与酵母中的染色体或附加体中的靶位点序列互补的序列。RGEN可结合到,并任选地切割靶位点序列处的一个或两个DNA链。本文的RGEN的示例是Cas9蛋白质与向导RNA的复合物。在某些实施方案中使用核酶以提供缺乏5’端的RNA组分。本文还公开了在非常规酵母中基因靶向的方法。

权利要求书

1.一种非常规酵母,其包含至少一种RNA引导的内切核酸酶(RGEN),所述RNA引导的内切核酸酶包含至少一种不具有5’-端的RNA组分,其中所述RNA组分包含与所述酵母中的染色体或附加体上的靶位点序列互补的序列,其中所述RGEN能够结合到所述靶位点序列。 2.根据权利要求1所述的非常规酵母,其中所述RGEN能够结合到并切割所述靶位点序列。 3.根据权利要求1所述的非常规酵母,其中所述酵母为选自下列的属的成员:耶氏酵母属、毕赤酵母属、许旺氏酵母属、克鲁维酵母属、Arxula属、丝孢酵母属、假丝酵母属、黑粉菌属、球拟酵母属、接合酵母属、三角酵母属、隐球酵母属、红酵母属、法夫酵母属、掷孢酵母属和管囊酵母属。 4.根据权利要求1所述的非常规酵母,其中所述RGEN包含CRISPR(聚集状规则间隔的短回文重复序列)-缔合的(Cas)蛋白质-9(Cas9)氨基酸序列。 5.一种非常规酵母,其包含Cas内切核酸酶和多核苷酸序列,所述多核苷酸序列包含可操作地连接至至少一个核苷酸序列的启动子,其中所述核苷酸序列包含编码在编码RNA组分的DNA序列上游的核酶的DNA序列,其中所述RNA组分包含与所述酵母中的染色体或附加体上的靶位点序列互补的可变靶向结构域,其中所述RNA组分和所述Cas内切核酸酶能够形成RNA-引导的内切核酸酶(RGEN),其中所述RGEN能够结合到所述靶位点序列。 6.根据权利要求5所述的非常规酵母,其中所述RGEN能够结合到并切割所述靶位点序列。 7.根据权利要求5所述的非常规酵母,其中由所述核苷酸序列转录的所述RNA自催化地去除所述核酶以产生所述RNA组分,其中所述RNA组分不具有5’端。 8.根据权利要求7所述的非常规酵母,其中所述核酶为锤头核酶、丁型肝炎病毒核酶、I组内含子核酶、RnaseP核酶、或发夹型核酶。 9.根据权利要求5所述的非常规酵母,其中由所述核苷酸序列转录的所述RNA不自催化地去除所述核酶以产生不具有5’端的核酶-RNA组分融合分子。 10.一种用于修饰非常规酵母中的染色体或附加体上的靶位点的方法,所述方法包括向非常规酵母提供第一重组DNA构建体,所述第一重组DNA构建体包含编码Cas内切核酸酶的DNA序列,和第二重组DNA构建体,所述第二重组DNA构建体包含编码RNA组分上游的核酶的DNA序列,其中由所述第二重组DNA构建体转录的所述RNA自催化地去除所述核酶以产生所述RNA组分,其中所述Cas9内切核酸酶在所述靶位点处引入单链或双链断裂。 11.一种用于修饰非常规酵母中的染色体或附加体上的靶位点的方法,所述方法包括向非常规酵母提供第一重组DNA构建体,所述第一重组DNA构建体包含编码Cas内切核酸酶的DNA序列,和第二重组DNA构建体,所述第二重组DNA构建体包含编码核酶-RNA组分融合分子的DNA序列,其中所述核酶-RNA组分融合分子和Cas9内切核酸酶能够形成RGEN,所述RGEN在所述靶位点处引入单链或双链断裂。 12.根据权利要求10-11中任一项所述的方法,所述方法还包括鉴定在所述靶标处具有修饰的至少一种非常规酵母细胞,其中所述修饰包括所述靶位点中的一个或多个核苷酸的至少一个缺失、添加或替换。 13.根据权利要求10-11中任一项所述的方法,所述方法还包括向所述酵母提供供体DNA,其中所述供体DNA包含目的多核苷酸。 14.根据权利要求13所述的方法,所述方法还包括鉴定在其染色体或附加体中包含整合在所述靶位点处的所述目的多核苷酸的至少一种酵母细胞。 15.一种用于编辑非常规酵母中的染色体或附加体上的核苷酸序列的方法,所述方法包括向非常规酵母提供多核苷酸修饰模板DNA,第一重组DNA构建体,所述第一重组DNA构建体包含编码Cas内切核酸酶的DNA序列,和第二重组DNA构建体,所述第二重组DNA构建体包含编码RNA组分上游的核酶的DNA序列,其中由所述第二重组DNA构建体转录的所述RNA自催化地去除所述核酶以产生所述RNA组分,其中所述Cas9内切核酸酶在所述酵母的所述染色体或附加体中的靶位点处引入单链或双链断裂,其中所述多核苷酸修饰模板DNA包含所述核苷酸序列的至少一个核苷酸修饰。 16.一种用于使非常规酵母中的染色体或附加体上的核苷酸序列沉默的方法,所述方法包括向非常规酵母提供至少第一重组DNA构建体,所述第一重组DNA构建体包含编码失活的Cas9内切核酸酶的DNA序列,和至少第二重组DNA构建体,所述第二重组DNA构建体包含可操作地连接至至少一个多核苷酸的启动子,其中所述至少一个多核苷酸编码核酶-RNA组分融合分子,其中所述核酶-RNA组分融合分子和所述失活的Cas9内切核酸酶能够形成RGEN,所述RGEN结合到所述酵母的所述染色体或附加体中的所述核苷酸序列,从而阻断所述核苷酸序列的转录。 17.一种用于生产非常规酵母中的基因修饰用多重向导RNA的高通量方法,所述方法包括:a)提供重组DNA构建体,所述重组DNA构建体包含以5’至3’的顺序可操作地连接至下列的启动子:编码核酶的第一DNA序列、编码反向选择剂的第二DNA序列、编码向导RNA的CER结构域的第三DNA序列和终止子序列;b)向(a)的所述重组DNA构建体提供至少一个寡核苷酸双链体,其中所述寡核苷酸双链体源自包含能够编码向导RNA靶序列的可变靶向结构域(VT)的DNA序列的第一单链寡核苷酸与包含编码所述可变靶向结构域的所述DNA序列的互补序列的第二单链寡核苷酸的组合;c)将(a)的所述反向选择剂与(b)的所述至少一个寡双链体交换,从而形成重组DNA构建体库,其各自包含能够编码向导RNA的可变靶向结构域的DNA序列;以及,d)转录(c)的所述重组DNA构建体库,从而形成核酶-向导RNA分子库。 18.根据权利要求17所述的方法,所述方法还包括诱导所述核酶-向导RNA分子库使得所述分子自催化地去除所述核酶和所述核酶上游的任何RNA序列,以产生不包含5’端的向导RNA分子库。 19.根据权利要求17所述的方法,所述方法还包括诱导所述核酶-向导RNA分子库使得所述分子切割所述核酶上游的任何RNA序列,以产生不包含5’端的核酶-gRNA融合分子。 20.一种重组DNA序列,其包含(i)聚合酶II启动子,所述聚合酶II启动子可操作地连接至(ii)编码核酶和向导RNA的核苷酸序列,其中所述核酶在所述向导RNA的上游,其中由(ii)的所述核苷酸序列转录的RNA自催化地去除所述核酶以产生所述向导RNA,并且其中所述向导RNA能够形成RGEN,所述RGEN能够识别、结合到和任选地切割非常规酵母的基因组中的靶位点。

说明书

本申请要求2014年8月13日提交的美国临时申请62/036652的权益,该文献全文以引用方式并入本文。

技术领域

本发明涉及分子生物学领域。具体地,本发明涉及使用RNA引导的内切核酸酶(RGEN)在非常规酵母中基因靶向。

以电子方式递交的序列表的引用

通过EFS-Web以电子方式将序列表的正式文本作为ASCII格式的序列表递交,该文件名称为“20150721_CL6272WOPCT_SequenceListing_ST25.txt”,创建日期为2015年7月21日,文件大小为411千字节,并且该文件与本说明书同时提交。在这一ASCII格式的文件中包含的序列表为所述说明书的一部分并且全文以引用方式并入本文。

背景技术

理解基因在生物体内的功能的有效方法是抑制其表达。基因表达的抑制可例如通过中断或删除基因的DNA序列,产生基因的“敲除”来实现(Austin等人,Nat.Genetics 36:921-924)。基因敲除主要通过同源重组(HR)(适用于从细菌到哺乳动物的大量生物体的技术)来进行。用于研究基因功能的另一种工具可通过基因“敲入”,其也通常由HR来进行。用于基因靶向目的的HR(敲除或敲入)可利用外源提供的DNA的存在,所述DNA具有与靶位点的同源性。

虽然由HR靶向基因是有效的工具,但其可能是复杂的劳动密集型程序。使用HR的大部分研究通常已经限为敲除路径中的单个基因而不是多个基因,因为HR通常难以以高性价比方式放大。该困难在其中HR不是有效的生物体中加剧。此类低效率通常迫使实践者依赖可选的表型或外源性标记物来帮助鉴定发生期望的HR事件的细胞。

已经示出用于基因靶向的HR在靶向DNA位点包含双链断裂时增强(Rudin等人,Genetics 122:519-534;Smih等人,Nucl.Acids Res.23:5012-5019)。用于引入双链断裂的策略因此有利于开发HR介导的DNA靶向。例如,已将锌指核酸酶工程化来切割特异性DNA位点,从而导致当供体DNA存在时在该位点处增强的HR水平(Bibikova等人,Science300:764;Bibikova等人,Mol.Cell.Biol21:289-297)。类似地,还已经开发了人造大范围核酸酶(归位内切核酸酶)和转录激活因子样效应物(TALE)核酸酶用于HR介导的DNA靶向(Epinat等人,Nucleic Acids Res.31:2952-2962;Miller等人,Nat.Biotech.29:143-148)。

编码CRISPR(聚集状规则间隔的短回文重复序列)DNA切割体系的基因座唯一地存在于约40%细菌基因组和大多数古细菌基因组中(Horvath和Barrangou,Science 327:167-170;Karginov和Hannon,Mol.Cell 37:7-19)。具体地讲,已经开发了II型CRIPSR体系的CRISPR缔合的(Cas)RNA引导的内切核酸酶(RGEN),Cas9,作为引入位点特异性DNA链断裂的方式((2015年3月19日公布的国专利申请US 2015-0082478 A1和2015年2月26日公布的US2015-0059010A1,两者均全文以引用方式并入本文)。可设计Cas9的RNA组分的序列使得Cas9识别并切割包含下列的DNA:(i)与RNA组分的一部分互补的序列和(ii)前间区序列邻近基序(PAM)序列。

天然Cas9/RNA复合物包含两个RNA序列,CRISPR RNA(crRNA)和反式激活CRISPR RNA(tracrRNA)。crRNA包含,在5’-至-3’方向上,与DNA靶位点互补的独特序列和由CRISPR基因座(crRNA源自所述基因座)的重复区编码的序列的一部分。tracrRNA包含,在5’-至-3’方向上,与crRNA的重复区退火的序列和包含茎环的部分。目前的工作已经导致了向导RNA(gRNA)的开发,所述向导RNA为嵌合序列,其包含在5’-至-3’方向上连接至tracrRNA的crRNA(美国临时专利申请61/868,706,提交于2013年8月22日)。

在真核细胞中表达RNA组分,诸如gRNA以进行Cas9介导的DNA靶向的方法已经使用RNA聚合酶III(Pol III)启动子,其允许具有预先限定的未修饰的5’-端和3’-端的RNA的转录(DiCarlo等人,Nucleic Acids Res.41:4336-4343;Ma等人,Mol.Ther.Nucleic Acids 3:e161)。该策略已经成功应用于多种不同物种的细胞,包括玉米和大豆(美国临时专利申请61/868,706,2013年8月22日提交),以及人类、小鼠、斑马鱼、木霉属和酿酒酵母。

然而,如现在在本专利申请中所公开的,使用Pol III启动子-转录gRNA在非常规酵母诸如解脂耶氏酵母中进行Cas9-介导的DNA靶向已被证明是困难的。因此,用于产生Cas9的RNA组分的其它方式对于在非常规酵母中提供Cas9介导的DNA靶向是有意义的。

发明内容

在一个实施方案中,本公开涉及一种非常规酵母,其包含至少一种RNA引导的内切核酸酶(RGEN),所述RNA引导的内切核酸酶包含至少一种不具有5’-端的RNA组分,其中所述RNA组分包含与酵母中的染色体或附加体上的靶位点序列互补的序列,其中所述RGEN可结合到靶位点序列。RGEN还可结合到并切割靶位点。

在一个实施方案中,非常规酵母为选自下列属的成员:耶氏酵母属、毕赤酵母属、许旺氏酵母属、克鲁维酵母属、Arxula属、丝孢酵母属、假丝酵母属、黑粉菌属、球拟酵母属、接合酵母属、三角酵母属、隐球酵母属、红酵母属、法夫酵母属、掷孢酵母属和管囊酵母属。

在一个实施方案中,所述RGEN包含CRISPR(聚集状规则间隔的短回文重复序列)-缔合的(Cas)蛋白质-9(Cas9)氨基酸序列。Cas9蛋白质可以为链球菌Cas9蛋白质,然而RNA组分可包含向导RNA(gRNA),所述向导RNA包含可操作地连接至反式激活CRISPR RNA(tracrRNA)的CRISPR RNA(crRNA)。PAM(前间区序列邻近基序)序列可邻近靶位点序列。RGEN还可结合到并切割靶位点。由核苷酸序列转录的RNA可自催化地去除核酶以产生所述RNA组分,其中所述RNA组分不具有5’端。所述核酶可包括锤头核酶、丁型肝炎病毒核酶、I组内含子核酶、RnaseP核酶、或发夹型核酶。由核苷酸序列转录的RNA可以为不自催化地去除核酶从而产生不具有5’端的核酶-RNA组分融合分子的RNA分子。

在一个实施方案中,本公开涉及一种非常规酵母,其包含Cas内切核酸酶和多核苷酸序列,所述多核苷酸序列包含可操作地连接至至少一个核苷酸序列的启动子,其中所述核苷酸序列包含编码在编码RNA组分的DNA序列上游的核酶的DNA序列,其中所述RNA组分包含与酵母中染色体或附加体上的靶位点序列互补的可变靶向结构域,其中所述RNA组分可与Cas内切核酸酶形成RNA-引导的内切核酸酶(RGEN),其中所述RGEN可结合到靶位点序列。

在一个实施方案中,本文所述的方法包括一种用于修饰非常规酵母中的染色体或附加体上的靶位点的方法,所述方法包括向非常规酵母提供第一重组DNA构建体,所述第一重组DNA构建体包含编码Cas内切核酸酶的DNA序列,和第二重组DNA构建体,所述第二重组DNA构建体包含编码RNA组分上游的核酶的DNA序列,其中由第二重组DNA构建体转录的RNA自催化地去除核酶以产生所述RNA组分,其中所述Cas9内切核酸酶在所述靶位点处引入单链或双链断裂。

在一个实施方案中,本文所述的方法包括一种用于修饰非常规酵母中的染色体或附加体上的靶位点的方法,所述方法包括向非常规酵母提供第一重组DNA构建体,所述第一重组DNA构建体包含编码Cas内切核酸酶的DNA序列,和第二重组DNA构建体,所述第二重组DNA构建体包含编码核酶-RNA组分融合分子的DNA序列,其中所述核酶-RNA组分融合分子和Cas9内切核酸酶可形成RGEN,所述RGEN在所述靶位点处引入单链或双链断裂。

所述方法还可包括鉴定在所述靶位点处具有修饰的至少一种非常规酵母细胞,其中所述修饰包括所述靶位点中的一个或多个核苷酸的至少一个缺失或替换。所述方法还可包括向所述酵母提供供体DNA,其中所述供体DNA包含目的多核苷酸。

在一个实施方案中,本文所述的方法包括一种用于编辑非常规酵母中的染色体或附加体上的核苷酸序列的方法,所述方法包括向非常规酵母提供多核苷酸修饰模板DNA,包含编码Cas内切核酸酶的DNA序列的第一重组DNA构建体,和包含编码RNA组分上游的核酶的DNA序列的第二重组DNA构建体,其中由第二重组DNA构建体转录的RNA自催化地去除核酶以产生所述RNA组分,其中所述Cas9内切核酸酶在所述酵母的染色体或附加体中的所述靶位点处引入单链或双链断裂,其中所述多核苷酸修饰模板DNA包含所述核苷酸序列的至少一个核苷酸修饰。

在一个实施方案中,本文所述的方法包括一种用于使非常规酵母中的染色体或附加体上的核苷酸序列沉默的方法,所述方法包括向非常规酵母提供至少第一重组DNA构建体,所述第一重组DNA构建体包含编码失活的Cas9内切核酸酶的DNA序列,和至少第二重组DNA构建体,所述第二重组DNA构建体包含可操作地连接至至少一个多核苷酸的启动子,其中所述至少一个多核苷酸编码核酶-RNA组分融合分子,其中所述核酶-RNA组分融合分子和失活的Cas9内切核酸酶可形成RGEN,所述RGEN结合到所述酵母的染色体或附加体中的所述核苷酸序列,从而阻断所述核苷酸序列的转录。

在一个实施方案中,本文所述的方法包括用于产生非常规酵母中基因修饰用多重向导RNA的高通量方法,所述方法包括:a)提供重组DNA构建体,所述重组DNA构建体包含以5’至3’的顺序可操作地连接至下列的启动子:编码核酶的第一DNA序列、编码反向选择剂的第二DNA序列、编码向导RNA的CER结构域的第三DNA序列和终止子序列;b)向(a)的重组DNA构建体提供至少一个寡核苷酸双链体,其中所述寡核苷酸双链体源自包含能够编码向导RNA靶序列的可变靶向结构域(VT)的DNA序列的第一单链寡核苷酸与包含编码可变靶向结构域的DNA序列的互补序列的第二单链寡核苷酸的组合;c)将(a)的反向选择剂与(b)的至少一个寡双链体交换,从而形成重组DNA构建体库,其各自包含能够编码向导RNA的可变靶向结构域的DNA序列;以及,

d)转录(c)的重组DNA构建体库,从而形成核酶-向导RNA库。

附图和序列简述

图1:单向导多核苷酸诸如单向导RNA(sgRNA)的结构模型。可变靶向(VT)结构域示为灰色。Cas9内切核酸酶识别(CER)结构域示为黑色。

图2A:经耶氏酵母密码子优化的Cas9表达盒。FBA1启动子示为黑色,并且编码具有C末端SV40核定位信号(NLS)的Cas9的开放阅读框示为浅灰色。

图2B:经耶氏酵母优化的pre-sgRNA RGR表达盒(RGR,核酶-sgRNA-核酶)。FBA1启动子示为黑色,锤头(HH)核酶示为深灰色,单向导RNA(sgRNA)示为浅灰色,并且HDV核酶以竖条纹形式示出。

图2C:经耶氏酵母优化的pre-sgRNA RG表达盒(RG,核酶-sgRNA)。FBA1启动子示为黑色,锤头(HH)核酶示为深灰色,单向导RNA(sgRNA)示为浅灰色,并且Sup4终止子以竖条纹形式示出。

图3A:pZUFCas9(SEQ ID NO:14)质粒包含图2A中所示的经耶氏酵母密码子优化的Cas9表达盒。复制起点(ARS 18,f1 ori,ColE1)以交叉影线示出,并且可选标记物(Ura3,Amp)呈灰色。

图3B:pZUFCas9/PolIII-sgRNA质粒包含图2A中所示的经耶氏酵母密码子优化的Cas9表达盒,和用于在耶氏酵母中靶向Leu2-3的Yl Snr52(Pol III启动子,表示为“Yl52”)-sgRNA表达盒。尽管未示出,但sgRNA盒还包含酿酒酵母Sup4基因转录终止子序列。复制起点(ARS 18,f1 ori,ColE1)以交叉影线示出,并且可选标记物(Ura3,Amp)呈灰色。

图3C:pRF38质粒(SEQ ID NO:19)包含用于靶向解脂耶氏酵母中CAN1基因的序列SEQ ID NO:18的经耶氏酵母优化的pre-sgRNA表达盒(FBA1启动子以白色示出,RGR pre-sgRNA以斜条纹示出)。复制起点(ARS 18,f1 ori,ColE1)以交叉影线示出,并且可选标记物(Ura3,Amp)呈灰色。

图4B:利用(i)仅pZUFCas9(SEQ ID NO:14)或者(ii)pZUFCas9和包含SEQ ID NO:18的经耶氏酵母优化的pre-sgRNA表达盒的线性DNA转化的解脂耶氏酵母细胞中的瞬时靶向效率(参见实施例3)。y轴指示利用pZUFCas9转化的细胞的频率(即,Ura+细胞),所述细胞也是刀豆氨酸抗性的(CanR)。误差线表示标准偏差。

图5:利用pZUFCas9(SEQ ID NO:14)和包含SEQ ID NO:18的经耶氏酵母优化的pre-sgRNA表达盒的线性DNA转化的解脂耶氏酵母细胞的CAN1编码区中的Cas9/sgRNA切割位点的序列图(参见实施例3)。参见野生型(WT)CAN1序列,Can1-1靶位点序列以粗体示出,PAM序列加下划线。预测切割位点紧接PAM上游的第三核苷酸的5′。插入的核苷酸以斜体表示。每一类突变体(1-18)的数目和频率在右侧表示。该图中示出的序列以SEQ ID NO:71-89包括在序列表中,如图中所编号的。

图6:利用(i)仅pZUFCas9(SEQ ID NO:14),(ii)pZUFCas9和包含SEQ ID NO:18的经耶氏酵母优化的pre-sgRNA表达盒(RGR)的线性DNA,或(iii)pZUFCas9和包含SEQ ID NO:25的经耶氏酵母优化的pre-sgRNA表达盒(RG)的线性DNA转化的解脂耶氏酵母细胞中的瞬时靶向效率(参见实施例4)。y轴指示利用pZUFCas9转化的细胞的频率(即,Ura+细胞),所述细胞也是刀豆氨酸抗性的(CanR)。误差线表示标准偏差。

图7:比较通过HR和NHEJ DNA修复路径的突变频率。测定在转化中提供多核苷酸修饰模板DNA序列时,由HR(深灰)和NHEJ(浅灰)进行的Cas9/sgRNA-介导的DNA双链断裂修复的总频率(参见实施例5)。误差线表示标准偏差。

图8:由于多核苷酸修饰模板DNA序列的类型,在Cas9/sgRNA-介导的DNA双链断裂位点处的HR频率。示出使用点突变模板DNA(深灰)、移码模板DNA(浅灰)、和大缺失模板DNA(白色)的HR频率(参见实施例5)。误差线表示标准偏差。

图9:耶氏酵母中在CAN1基因座处的突变频率(在被Cas9/sgRNA切割的Can1-1位点处修复)不受多核苷酸修饰模板DNA存在的影响。由不包括多核苷酸修饰模板DNA(深灰色,无模板DNA)或包括多核苷酸修饰模板DNA(浅灰色,具有模板DNA)(两个转化组均包括pZUFCas9(SEQ ID NO:14)和RGR表达盒[SEQ ID NO:18])的转化产生的细胞的刀豆氨酸抗性频率(参见实施例5)。y轴指示利用pZUFCas9转化的细胞的频率(即,Ura+细胞),所述细胞也是刀豆氨酸抗性的(CanR)。误差线表示标准偏差。

图10A:pRF84质粒(SEQ ID NO:41)包含图2A中所示的经耶氏酵母密码子优化的Cas9表达盒和SEQ ID NO:18的经耶氏酵母优化的RGR pre-sgRNA盒(RGR pre-sgRNA编码区[“Can1 RGR”]由斜线示出)。复制起点(ARS 18,f1 ori,ColE1)以交叉影线示出,并且可选标记物(Ura3,Amp)呈灰色。

图10B:pRF85质粒(SEQ ID NO:42)包含图2A中所示的经耶氏酵母密码子优化的Cas9表达盒和SEQ ID NO:25的经耶氏酵母优化的RG pre-sgRNA盒(RG pre-sgRNA编码区[“Can1 RG”]由斜线示出)。复制起点(ARS 18,f1 ori,ColE1)以交叉影线示出,并且可选标记物(Ura3,Amp)呈灰色。

图11:通过仅表达Cas9(pZUFCas9,SEQ ID NO:14),或表达(i)Cas9和(ii)RGR pre-sgRNA(pRF84)或RG sgRNA(pRF85),在耶氏酵母中在CAN1基因座处的突变频率(参见实施例6)。y轴指示利用每种相应载体转化的细胞的频率(即,Ura+细胞),所述细胞也是刀豆氨酸抗性的(CanR)。误差线表示标准偏差。

图12A-12B:构建HDV-sgRNA融合表达盒的高通量克隆盒的示例。图12-A以黑色框示出启动子序列,以灰色框示出编码HDV核酶的DNA序列,以水平阴影框示出的是侧接有II型限制性位点的克隆菌株的反向可选择标记物,以黑色虚线框示出的是与Cas9相互作用的sgRNA的CER结构域,并且以斜线阴影框示出的是转录终止子。当包含编码可变靶向结构域的DNA序列和II型限制性位点的适当突出物的DNA双链体(竖直阴影线框VT)与质粒,DNA连接酶和II型酶混合时,编码可变靶向结构域(VT)的DNA序列将置换反向可选择标记物,从而形成HDV-sgRNA表达盒(启动子-HDV-VT-CER-终止子)。当转录HDV-sgRNA表达盒时,其产生RNA转录物(HDV-VT-CER转录物),其中HDV核酶切割任何5’序列。图12-B示出双链DNA分子(SEQ ID NO:99和SEQ ID NO:100的寡聚双链)的一个示例,其包含编码Can1-1靶位点的DNA序列和克隆入质粒pRF291中的适当突出物。

图13A-13B:构建HH-sgRNA表达盒的高通量克隆盒的示例。图13-以黑色框示出启动子序列;以水平阴影框示出侧接有II型限制性位点的克隆菌株的反向可选择标记物;以黑色虚线框示出的是与Cas9相互作用的sgRNA的CER结构域,以斜线阴影框示出的是转录终止子。当包含编码DNA的靶位点特异性锤头核酶的DNA双链体(竖直阴影框HH、靶向序列和II型位点的适当突出物(虚线框TS))与质粒、DNA连接酶和II型酶混合时,HH--靶位点双链体置换反向可选择标记物,从而形成HH-sgRNA表达盒。当转录表达盒时,其产生转录体并且HH核酶切除其本身和任何5’序列。图13B示出双链DNA分子(SEQ ID NO:162和SEQ ID NO:163)的示例,其包含用于靶向ds-temp-1靶位点的可变靶向结构域(VT)和编码DNA(HH)的序列特异性HH核酶,以及克隆入质粒pRF291中的适当突出物。

图14:来自由pRF303(SEQ ID NO:103)和Can1短编辑模板(SEQ ID NO:157)转化的细胞的Can1基因座的凝胶电泳的示例。标记MW的泳道是分子量标记物。泳道1-16表示来自划线纯化的转化体的单独菌落。较高MW带是WT Can1基因座(SEQ ID NO:160)或具有小插入缺失(indel)突变的Can1基因座的正确尺寸。较小分子量带是由短Can1编辑模板(SEQ ID NO:157)编辑的Can1基因座(SEQ ID NO:161)的正确尺寸。

图15示出来自菌落PCR的质粒和基因组URA3基因的代表性测序结果及其比对。虚线和粗体分别示出缺失和插入。PAM序列加下划线。

图16-A示出耶氏酵母URA3基因内RGR-URA3.1、RGR-URA3.2和RGR-URA3.3的靶向序列的相对位置。

图16-B示出在包含5-FOA的SC培养基上生长的pYRH222转化体的菌落PCR的测序结果和序列比对。粗体表示插入。PAM序列加下划线。“N”表示混合序列。图16-C示出在包含5-FOA的SC培养基上生长的pYRH282转化体的菌落PCR的测序结果和序列比对。虚线表示缺失。PAM序列加下划线。“N”表示混合序列。图16-D示出在包含5-FOA的SC培养基上生长的pYRH283转化体的菌落PCR的测序结果和序列比对。虚线表示缺失。PAM序列加下划线。“N”表示混合序列。

图17示出来自pYRH282(菌落号23和24)和pYRH283(菌落号27和36)转化体的PCR产物的不同迁移。来自梯状物的DNA尺寸在右侧示出。

图18示出Can1靶序列的代表性测序结果。虚线分别指示缺失。PAM序列以粗体示出。

表1

核酸和蛋白质序列号概述

具体实施方式

本文引用的所有专利和非专利文献的公开全文以引用方式并入本文。

如本文所用,术语“发明”或“所公开的本发明”不旨在限制但一般适用于权利要求中所限定的或本文所述的任何发明。这些术语在本文中可互换使用。

本文的术语“非常规酵母”是指不是酵母属(Saccharomyces)(例如,酿酒酵母(S.cerevisiae))或裂殖(Schizosaccharomyces)酵母物种的任何酵母。非常规酵母描述于以下文献中:Non-Conventional Yeasts in Genetics,Biochemistry and Biotechnology:Practical Protocols(K.Wolf、K.D.Breunig、G.Barth编辑,Springer-Verlag,Berlin,Germany,2003),其以引用方式并入本文。在某些实施方案中,非常规酵母可另外(或另选地)为比由同源重组(HR)介导的修复过程更偏好非同源末端接合(NHEJ)DNA修复过程的酵母。沿这些线索(比HR优选NHEJ)定义非常规酵母-还由Chen等人(PLoS ONE 8:e57952)公开,其以引用方式并入本文。本文优选的非常规酵母为耶氏酵母属(例如,解脂耶氏酵母)的那些。本文的术语“酵母”是指主要以单细胞形式存在的真菌物种。酵母可另选地在本文中被称为“酵母细胞”。

本文中,术语“RNA引导的内切核酸酶”(RGEN)是指包含至少一个CRISPR(聚集状规则间隔的短回文重复序列)缔合(Cas)蛋白质和至少一种RNA组分的复合物。简单地讲,RGEN的RNA组分包含与靶位点序列中的DNA序列互补的序列。基于该互补性,RGEN可特异性识别并切割特定DNA靶位点序列。本文的RGEN可包含四种已知的CRISPR体系(Horvath和Barrangou,Science 327:167-170)诸如I型、II型或III型CRISPR体系中任一种的一种或多种Cas蛋白质和一种或多种合适的RNA组分。在优选的实施方案中,RGEN包含Cas9内切核酸酶(CRISPR II体系)和至少一种RNA组分(例如,crRNA和tracrRNA,或gRNA)。

术语“CRISPR”(聚集状规则间隔的短回文重复序列)是指I类、II类或III类DNA切割体系的某些遗传基因座编码因子,其例如由细菌或古细菌细胞使用以破坏外来DNA(Horvath和Barrangou,Science 327:167-170)。本文利用CRISPR体系的组分用于非常规酵母细胞中的DNA靶向。

本文术语“II型CRISPR体系”和“II型CRISPR-Cas体系”互换使用并且是指利用与至少一种RNA组分复合的Cas9内切核酸酶的DNA切割体系。例如,Cas9可与CRISPR RNA(crRNA)和反式激活CRISPR RNA(tracrRNA)复合。在另一个示例中,Cas9可与向导RNA复合。因此,crRNA、tracrRNA和向导RNA是本文中RNA组分的非限制性示例。

本文的术语CRISPR缔合的(“Cas”)内切核酸酶是指由Cas基因编码的Cas蛋白质。在某些实施方案中,当与合适RNA组分复合时,Cas内切核酸酶能够切割全部或部分特定DNA靶序列。例如,其能够在特定DNA靶序列中引入单链或双链断裂;其可另选地被表征为能够切割特定DNA靶序列的一个或两条链。Cas内切核酸酶在靶序列处使DNA双链体解旋并且切割至少一个DNA链,如通过由与Cas复合的crRNA或向导RNA识别靶序列介导的。此类通过Cas内切核酸酶识别并切割靶序列通常在正确的前间区序列邻近基序(PAM)位于或邻近DNA靶序列的3′端时进行。另选地,本文的Cas蛋白质可缺乏DNA切割或切口活性,但当与合适的RNA组分复合时,仍然能够特异性结合到DNA靶序列。本文的优选的Cas蛋白质为Cas9。

本文的“Cas9”(以前称为Cas5、Csn1或Csxl2)是指为了特异性识别和切割全部或部分DNA靶序列,与crRNA和tracrRNA,或与向导RNA形成复合物的II型CRISPR体系的Cas内切核酸酶。Cas9蛋白质包含RuvC核酸酶结构域和HNH(H-N-H)核酸酶结构域,其各自在靶序列处切割单DNA链(两个结构域的协同作用导致DNA双链切割,然而一个结构域的活性导致切口)。一般来讲,RuvC结构域包含亚结构域I、II和III,其中结构域I位于Cas9的N末端附近,并且亚结构域II和III位于蛋白质的中间,HNH结构域的旁侧(Hsu等人,Cell 157:1262-1278)。“Apo-Cas9”是指不与RNA组分复合的Cas9。Apo-Cas9可结合DNA,但以非特异性方式进行该结合,并且不能切割DNA(Stemberg等人,Nature 507:62-67)。

在一些实施方案中,Cas内切核酸酶可包含Cas9多肽的改性形式。Cas9多肽的改性形式可包括降低Cas9蛋白质的天然存在的核酸酶活性的氨基酸变化(例如,缺失、插入或替换)。例如,在一些情况下,Cas9蛋白质的改性形式具有小于50%、小于40%、小于30%、小于20%、小于10%、小于5%、或小于1%的对应野生型Cas9多肽的核酸酶活性(2014年3月6日公布的美国专利申请US20140068797 A1)。在一些情况下,Cas9多肽的改性形式不具有显著的核酸酶活性并且被称为催化上“失活的Cas9”或“灭活的cas9(dCas9)。”无催化活性的Cas9变体包括在HNH和RuvC核酸酶结构域中包含突变的Cas9变体。这些无催化活性的Cas9变体能够与sgRNA相互作用并且结合到体内的靶位点但不能切割靶DNA的任一条链。该作用模式,结合但不使DNA断裂可用于瞬时减少染色体中特异性基因座的表达,但不导致永久性基因改变。

无催化活性的Cas9可融合至异源序列(2014年3月6日公布的美国专利申请US20140068797 A1)。合适的融合对象包括但不限于多肽,所述多肽提供通过直接作用于靶DNA或与靶DNA缔合的多肽(例如,组蛋白或其它DNA结合蛋白)而间接增加转录的活性。另外合适的融合对象包括但不限于,提供以下活性的多肽:甲基转移酶活性、脱甲基酶活性、乙酰转移酶活性、脱乙酰酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、去泛素化活性、腺苷酰化活性、去腺苷酰化活性、SUMO化活性、去SUMO化活性、核糖基化活性、去核糖基化活性、豆蔻酰化活性、或去豆蔻酰化活性。其它合适的融合对象包括但不限于直接提供靶核酸的增加的转录的多肽(例如,转录激活因子或其片段,募集转录激活因子的蛋白质或其片段,小分子/药物应答转录调控因子等)。无催化活性的Cas9也可融合至FokI核酸酶以产生双链断裂(Guilinger等人,Nature biotechnology,第32卷,第6号,2014年6月)。

本文的术语“RNA组分”是指包含与DNA靶序列的链互补的核糖核酸序列的RGEN的RNA组分。该互补序列在本文中被称为“向导序列”或“可变靶向结构域”序列。本文的合适的RNA组分的示例包括crRNA和向导RNA。另外,本文的RNA组分不具有5’-端。

本文的术语“CRISPR RNA”(crRNA)是指可与一种或多种Cas蛋白质(例如,Cas9)形成复合物并且向所述复合物提供DNA结合特异性的RNA序列。crRNA提供DNA结合特异性,因为其包含与DNA靶序列的链互补的“向导序列”(“可变靶向结构域”[VT])。crRNA还包含由crRNA源自其中的CRISPR基因座的重复区编码的“重复序列”(“tracr RNA匹配序列”)。crRNA的重复序列可与tracrRNA的5’端处的序列退火。天然CRISPR体系中的crRNA源自由CRISPR基因座转录的“pre-crRNA”。pre-crRNA包含间隔区和重复区;间隔区包含与DNA靶位点序列互补的独特序列。天然体系中的Pre-crRNA被加工成多个不同的crRNA,其各自具有向导序列连同重复序列的一部分。CRISPR体系利用crRNA,例如用于DNA靶向特异性。

本文的术语“反式激活CRISPR RNA”(tracrRNA)是指用于II型CRISPR体系的非编码RNA,并且在5’-至-3’方向上,包含:(i)与CRISPR II型crRNA的重复区退火的序列,和(ii)包含茎环的部分(Deltcheva等人,Nature 471:602-607)。

术语“向导RNA”(gRNA)和“单向导RNA”(sgRNA)在本文中可互换使用。本文的gRNA可指包含可操作地连接至tracrRNA的crRNA的嵌合序列。另选地,gRNA可指例如crRNA和tracrRNA的合成融合体。Jinek等人(Science 337:816-821)公开了一些gRNA特征。gRNA还可根据以下特征来表征:具有向导序列(可变靶向结构域),之后是Cas内切核酸酶识别(CER)结构域[2015年2月26日公布的WO2015026883,2015年3月19日公布的美国专利申请US 2015-0082478 A1,和2015年2月26日公布的US 2015-0059010 A1,其全部以引用方式全文并入本文]。CER结构域包含tracrRNA配对序列,之后是tracrRNA序列。

术语“靶位点序列”、“靶位点”、“靶序列”、“靶DNA”、“DNA靶序列”、“靶基因座”、“基因组靶位点”、“基因组靶序列”、“基因组靶基因座”和“前间区序列”在本文中可互换使用。靶位点序列是指在非常规酵母的基因组中的染色体、附加体、或任何其它DNA分子上的多核苷酸序列,本文的RGEN可对其识别、结合并任选地切口或切割。靶位点可以为:(i)酵母中的内源性/天然位点,(ii)对酵母异源的,并且因此不是天然存在于基因组中的,或(iii)与其天然存在之处相比,存在于异源基因组位置中。

本文的靶位点序列的长度为至少13个核苷酸并具有链,所述链具有与(crRNA或gRNA)的向导序列的足够互补性从而能够与向导序列杂交并引导Cas蛋白质或Cas蛋白质复合物与靶序列的序列-特异性结合(在某些实施方案中,在合适的PAM邻近靶序列时)。切割/切口位点(适用于内切核酸Cas或切口Cas)可在靶序列内(,例如使用Cas9)或者切割/切口位点可在靶序列外(例如,使用融合至异源内切核酸酶结构域的Cas9,诸如源自FokI酶的Cas9)。

本文的“人工靶位点”或“人工靶序列”是指已被引入非常规酵母的基因组中的靶序列。在一些实施方案中,人工靶序列可以为在序列上与酵母的基因组中的天然靶序列相同,但位于基因组中的不同位置(异源位置)处,或者如果位于酵母的基因组中的相同位置处,则其可不同于天然靶序列。

本文的“附加体”是指除了酵母细胞的染色体之外,可自主存在于酵母细胞中的DNA分子(可复制和传递到子细胞)。附加DNA可以是天然的或与酵母细胞异源的。本文的天然附加体的示例包括线粒体DNA(mtDNA)。本文的异源附加体的示例包括质粒和酵母人工染色体(YAC)。

本文的“前间区序列邻近基序(PAM)”是指通过本文的RGEN识别的短序列。本文的PAM的序列和长度可根据所用的Cas蛋白质或Cas蛋白质复合物而不同,但通常例如为2、3、4、5、6、7或8个核苷酸长。

术语“5’-端”和“7-甲基鸟苷酸(m7G)端”在本文中可互换使用。7-甲基鸟苷酸残基位于真核生物中信使RNA(mRNA)的5′末端。RNA聚合酶II(Pol II)转录真核生物中的mRNA。信使RNA封端通常如下进行:通过RNA末端磷酸酶去除mRNA转录物的最末端5’磷酸酯基团,保留两个末端磷酸酯。通过鸟苷酰转移酶将鸟苷一磷酸酯(GMP)添加到转录物的末端磷酸酯,从而在转录物末端处保留5′-5′三磷酸酯连接的鸟嘌呤。最终,该末端胍基的7-氮被甲基转移酶甲基化。

本文的术语“不具有5’-端”用来指具有例如5’-羟基基团,而不是5’-端的RNA。此类RNA可被称为例如“未封端的RNA”。未封端的RNA可以在转录后在核中更好的积聚,因为5′-封端的RNA经受核输出。本文的一种或多种RNA组分未封端。

术语“核酶”和“核糖核酸酶”在本文中可互换使用。核酶是指形成次级、三级和/或四级结构的一个或多个RNA序列,其可在特定位点处切割RNA。核酶包括能够在相对于核酶序列的顺式位点处切割RNA(即,自催化,或自切割)的“自切割核酶”。已经描述了核酶裂解活性的一般性质(例如,Lilley,Biochem.Soc.Trans.39:641-646)。本文的“锤头核酶”(HHR)可包含由三个碱基配对的茎和催化时涉及的高度保守的非互补核苷酸的芯组成的小催化RNA基序。Pley等人(Nature 372:68-74)和Hammann等人(RNA 18:871-885)(所述文献以引用方式并入本文)公开了锤头核酶结构和活性。本文的锤头核酶可包含“最小锤头”序列,如例如由Scott等人所公开的(Cell 81:991-1002,以引用方式并入本文)。

在本公开的一个实施方案中,所述方法包括将RNA引导的内切核酸酶(RGEN)靶向到非常规酵母中的染色体或附加体上的靶位点序列的方法,所述方法包括向所述酵母提供第一重组DNA构建体,所述第一重组DNA构建体包含编码Cas内切核酸酶的DNA序列,和至少第二重组DNA构建体,所述第二重组DNA构建体包含编码RNA组分上游的核酶的DNA序列,其中由第二重组DNA构建体转录的RNA自催化地去除核酶以产生所述RNA组分,其中RNA组分和Cas9内切核酸酶可形成RGEN,所述RGEN可结合到全部或部分靶位点序列。

在本公开的一个实施方案中,非常规酵母包含多核苷酸序列,所述多核苷酸序列包含可操作地连接至至少一个核苷酸序列的启动子,其中所述核苷酸序列包含编码在编码RNA组分的DNA序列上游的核酶的DNA序列,其中所述RNA组分包含与酵母中染色体或附加体上的靶位点序列互补的可变靶向结构域,其中所述RNA组分可形成RNA-引导的内切核酸酶(RGEN),其中所述RGEN可结合到全部或部分靶位点序列,其中由核苷酸序列转录的RNA自催化地去除核酶以产生所述RNA组分,其中所述RNA组分不具有5’端。

核酶还包括切割其自身序列的5’,去除任何前述转录物但保留完整核酶序列的核酶。

在本公开的一个实施方案中,非常规酵母包含多核苷酸序列,所述多核苷酸序列包含可操作地连接至至少一个核苷酸序列的启动子,其中所述核苷酸序列包含编码在编码RNA组分的DNA序列上游的核酶的DNA序列,其中所述RNA组分包含与酵母中染色体或附加体上的靶位点序列互补的可变靶向结构域,其中所述RNA组分可形成RNA-引导的内切核酸酶(RGEN),其中所述RGEN可结合到全部或部分靶位点序列,其中由核苷酸序列转录的RNA自催化地去除核酶以产生所述RNA组分,其中由核苷酸序列转录的RNA不自催化地去除核酶,从而产生不具有5’端的核酶-RNA组分融合分子。

术语“靶向”、“基因靶向”、“DNA靶向”、“编辑”、“基因编辑”和“DNA编辑”在本文中可互换使用。本文的DNA靶向可以为在特定DNA序列处,诸如在非常规酵母的染色体或附加体中,特异性引入插入缺失(indel)、敲除或敲入。一般来讲,DNA靶向在本文中可通过利用与合适的RNA组分缔合的Cas蛋白质在非常规酵母中的特定DNA序列处切割一个或两条链来进行。此类DNA切割,如果是双链断裂(DSB),则可促进NHEJ过程,这可导致靶位点处插入缺失(indel)形成。另外,不考虑切割是单链断裂(SSB)或DSB,在DNA缺口或切割位点处提供合适的供体DNA多核苷酸时,可促进HR过程。取决于供体DNA多核苷酸的序列,此类HR方法可用于在靶位点处引入敲除或敲入。

另选地,本文的DNA靶向可指本文的Cas/RNA组分复合物与靶DNA序列的特异性缔合,其中Cas蛋白质切割或不切割DNA链(取决于Cas蛋白质的内切核酸酶结构域的状态)。

本文的术语“插入缺失(indel)”是指在染色体或附加体的靶DNA序列中的核苷酸碱基的插入或缺失。此类插入或缺失可具有例如1、2、3、4、5、6、7、8、9、10或更多个碱基。在某些实施方案中,插入缺失可甚至更大,至少约20、30、40、50、60、70p、80、90或100个碱基,如果在基因的开放阅读框(ORF)内引入插入缺失时,则有时插入缺失通过形成移码突变来破坏由ORF编码的蛋白质的野生型表达。

术语“敲除”、“基因敲除”和“基因组敲除”在本文中可互换使用。敲除表示通过利用Cas蛋白质靶向而使本文的非常规酵母的DNA序列部分或完全不起作用;此类DNA序列在敲除之前例如可编码氨基酸序列,或可具有调控功能(例如,启动子)。可通过插入缺失(通过NHEJ)或通过特异性去除序列产生敲除,其减少或完全破坏靶位点处或附近的序列功能。本文的敲除DNA多核苷酸序列可另选地表征为例如部分或完全破坏或减量调节。

在一个实施方案中,本公开涉及一种非常规酵母,其包含Cas9内切核酸酶和多核苷酸序列,所述多核苷酸序列包含可操作地连接至至少一个核苷酸序列的启动子,其中所述核苷酸序列包含编码在编码RNA组分的DNA序列上游的核酶的DNA序列,其中所述RNA组分包含与酵母中染色体或附加体上的靶位点序列互补的可变靶向结构域,其中所述RNA组分可与Cas内切核酸酶形成RNA-引导的内切核酸酶(RGEN),其中所述RGEN可结合到靶位点序列。Cas9内切核酸酶可作为蛋白质引入酵母中或可经由重组DNA构建体引入。Cas9内切核酸酶可通过本领域已知的任何方法以稳定或瞬时方式表达。

术语“敲入”、“基因敲入”和“基因组敲入”在本文中可互换使用。敲入表示通过利用Cas蛋白质靶向置换或插入非常规酵母中的特定DNA序列处的DNA序列。敲入的示例为在基因的编码区中特异性插入异源氨基酸编码序列,或在遗传基因座中特异性插入转录调控元件。

术语“供体多核苷酸”、“供体DNA”、“靶向多核苷酸”和“靶向DNA”在本文中可互换使用。供体多核苷酸是指包含与位于或靠近DNA靶位点处的序列同源的至少一个序列的DNA序列(例如,由本文的Cas蛋白质特异性靶向的序列)。包括多核苷酸(在与待编辑的核苷酸序列相比时,包含至少一个核苷酸修饰)的供体DNA多核苷酸也称为“多核苷酸修饰模板”、“多核苷酸修饰模板DNA”或“模板DNA”。核苷酸修饰可为至少一个核苷酸的替换、添加或缺失。任选地,多核苷酸修饰模板还可包含至少一种核苷酸修饰旁侧的同源核苷酸序列,其中旁侧同源核苷酸序列向待编辑的所需核苷酸序列提供充分的同源性。

本文的供体多核苷酸内的“同源序列”可包含或由至少约25个核苷酸的序列组成,所述序列与位于或靠近靶位点处的序列具有100%同一性,或与位于或靠近靶位点处的序列具有至少约95%、96%、97%、98%或99%同一性。

在某些实施方案中,供体DNA多核苷酸可具有由与靶位点处的序列异源的序列隔开的两个同源序列。此类供体多核苷酸的这两个同源序列可被称为“同源臂”,其侧接异源序列。靶位点与具有两个同源臂的供体多核苷酸之间的HR通常导致靶位点处的序列被供体多核苷酸的异源序列置换(位于与供体多核苷酸的同源臂同源的DNA序列之间的靶位点序列由供体多核苷酸的异源序列置换)。在具有两个同源臂的供体多核苷酸中,所述臂可由1个或多个核苷酸隔开(即,供体多核苷酸中的异源序列的长度可以为至少1个核苷酸)。可在本文的非常规酵母中进行的各种HR程序公开于例如,DNA Recombination:Methods and Protocols:第1版(H.Tsubouchi编辑,Springer-Verlag,New York,2011)中,其以引用方式并入本文。

在一个实施方案中,供体DNA构建体包含待插入Cas内切核酸酶的靶位点中的目的多核苷酸,其中供体DNA构建体还包括侧接目的多核苷酸的第一同源性区域和第二同源性区域。供体DNA的第一同源性区域和第二同源性区域分别与存在于植物基因组的靶位点中或旁侧的第一基因组区域和第二基因组区域共享同源性。

术语“以体积计的百分比”、“体积百分比”、“体积%”和“v/v%”在本文中可互换使用。溶液中溶质的体积百分比可使用下式确定:[(溶质体积)/(溶液体积)]×100%。

术语“以重量计的百分比”、“重量百分比(重量%)”以及“重量-重量百分比(重量/重量%)”在本文中可互换使用。重量%是指物质在其被包含于组合物、混合物或溶液中时以质量计的百分比。

术语“多核苷酸”、“多核苷酸序列”和“核酸序列”在本文中可互换使用。这些术语涵盖核苷酸序列等。多核苷酸可为DNA或RNA的聚合物,所述DNA或RNA可为单链或双链,任选地包含合成的、非天然的或改变的核苷酸碱基。多核苷酸可由cDNA、基因组DNA、合成DNA、或它们的混合物的一个或多个片段构成。核苷酸(核糖核苷酸或脱氧核糖核苷酸)可以用如下单字母名称来表示:“A”表示腺苷酸或脱氧腺苷酸(分别针对RNA或DNA),“C”表示胞苷酸或脱氧胞苷酸(分别针对RNA或DNA),“G”表示鸟苷酸或脱氧鸟苷酸(分别针对RNA或DNA),“U”表示尿苷酸(针对RNA),“T”表示脱氧胸苷酸(针对DNA),“R”表示嘌呤(A或G),“Y”表示嘧啶(C或T),“K”表示G或T,“H”表示A或C或T,“I”表示肌苷,“W”表示A或T,并且“N”表示任意核苷酸(例如,如果涉及DNA序列,N可以为A、C、T或G;如果涉及RNA序列,N可以为A、C、U或G)。本文所公开的任何RNA序列(例如,crRNA、tracrRNA、gRNA)可通过合适的DNA序列编码。

如本文所用,术语“分离的”是指已经从其天然来源全部或部分纯化的多核苷酸或多肽分子。在一些情况下,分离的多核苷酸或多肽分子是较大组合物、缓冲体系或试剂混合物的一部分。例如,分离的多核苷酸或多肽分子可以异源方式包含在细胞或生物体内。

如本文所用,术语“基因”是指由编码区表达RNA(RNA由DNA多核苷酸序列转录)的DNA多核苷酸序列,所述RNA可以为信使RNA(编码蛋白质)或非蛋白质编码RNA(例如,本文的crRNA、tracrRNA或gRNA)。基因可指单独的编码区,或可包括在编码区上游和/或下游的调控序列(例如,启动子、5’-非翻译区、3’-翻译终止子区)。编码蛋白质的编码区可另选地在本文中被称为“开放阅读框”[ORF]。“天然的”或“内源性的”基因是指天然存在的具有其自身调控序列的基因;此类基因位于其在宿主细胞的基因组中的天然位置处。“嵌合基因”是指不是天然基因的任何基因,包含在天然情况下不是一起存在的调控序列和编码序列(即,调控区和编码区彼此异源)。因此,嵌合基因可包括源于不同来源的调控序列和编码序列,或者包括源于同一来源但以不同于天然存在的方式排列的调控序列和编码序列。“外来”或“异源”基因是指通过基因转移引入宿主生物体中的基因。外来基因可包括插入非天然生物体内的天然基因、引入天然宿主内的新位置中的天然基因、或嵌合基因。本文所公开的某些实施方案中的多核苷酸序列为异源的。“转基因”是已通过转化方法被引入基因组中的基因。“密码子优化的”开放阅读框具有经设计用以模仿宿主细胞优选的密码子使用频率的其密码子使用频率。

天然氨基酸序列或多核苷酸序列是天然存在的,而非天然氨基酸序列或多核苷酸序列在自然界中不存在。

如本文所用的“调控序列”是指位于基因的转录起始位点上游(例如启动子)、5′非翻译区和3′非编码区的核苷酸序列,并且其可影响由基因转录的RNA的转录、加工或稳定性,或者翻译。本文的调控序列可包括启动子、增强子、沉默子、5′非翻译前导序列、内含子、多腺苷酸化识别序列、RNA加工位点、效应子结合位点、茎-环结构以及参与基因表达调控的其它元件。本文的一个或多个调控元件可以是与本文的编码区异源的。

如本文所用,“启动子”是指能够控制由基因转录RNA的DNA序列。一般来讲,启动子序列在基因的转录起始位点的上游。启动子可整个源于原生基因,或者由源于天然存在的不同启动子的不同元件构成,或者甚至包含合成的DNA片段。造成基因在大多数时间在大多数细胞类型中表达的启动子通常称为“组成型启动子”。本文的一个或多个启动子可以是与本文的编码区异源的。

如本文所用,“强启动子”是指每单位时间可引导相对大量的生产性启动的启动子,和/或为驱动比酵母中基因的平均转录水平更高基因转录水平的启动子。

如本文所用,术语“3′非编码序列”、“转录终止子”和“终止子”是指位于编码序列下游的DNA序列。这包括多腺苷酸化识别序列和编码能够影响mRNA加工或基因表达的调控信号的其它序列。

如本文所用,术语“盒”是指可操作地连接至编码蛋白质的序列或非蛋白质编码RNA的启动子。盒可任选地可操作地连接至3’非编码序列。

如本文所用,与多核苷酸相关的术语“上游”和“下游”分别是指“5’的”和“3’的”。

如本文所用,术语“表达”是指(i)由编码区转录RNA(例如,mRNA或非蛋白质编码RNA,诸如crRNA、tracrRNA或gRNA),或(ii)由mRNA翻译多核苷酸。

当用于描述基因或多核苷酸序列的表达时,术语“减量调节”、“破坏”、“抑制”、“失活”和“沉默”在本文中可互换使用,是指多核苷酸序列的转录减少或消除的情况。这导致减少或消除来自多核苷酸序列的RNA转录物,从而导致减少或消除源自多核苷酸序列的蛋白质表达(在基因包含ORF时)。另选地,减量调节可指其中来自由多核苷酸序列产生的转录物的蛋白质翻译减少或消除的情况。另选地,减量调节可指其中由多核苷酸序列表达的蛋白质活性下降的情况。细胞中上述过程中任一种(转录、翻译、蛋白质活性)的减少可以为相对于合适的对照细胞的转录、翻译或蛋白质活性减少约40%、50%、60%、70%、80%、90%、95%或100%。减量调节可以为如本文所公开的靶向事件的结果(例如,插入缺失、敲除)。

术语“对照细胞”和“合适的对照细胞”在本文中互换使用并且可指其中已经进行了特定修饰的细胞(例如过表达的多核苷酸、减量调节的多核苷酸)(即,“实验细胞”)。对照细胞可为不具有或不表达实验细胞的特定修饰的任何细胞。因此,对照细胞可为未转化的野生型细胞或可为经基因转化但不表达基因转化的细胞。例如,对照细胞可为实验细胞的直系亲本,该直系亲本细胞不具有实验细胞中的特定修饰。作为另外一种选择,对照细胞可为通过一代或多代去除的实验细胞的亲本。作为另外一种选择,对照细胞可为实验细胞的同胞细胞,该同胞细胞不包含存在于实验细胞中的特定修饰。

如本文所用,术语“增加”可指增加的数量或活性与相比较的数量或活性相比,数量或活性高至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%或20%。术语“增加的”、“大于”、和“提高的”本文互换使用。术语“增加的”可用于表征编码蛋白质的多核苷酸的表达,例如,其中“提高的表达”也可意指“过表达”。

如本文所用,术语“可操作地连接”是指两个或更多个核酸序列缔合使得一个核酸序列的功能受另一个核酸序列影响。例如,当启动子能够影响编码序列的表达时,它可操作地与编码序列连接。即,编码序列处于启动子的转录控制下。编码序列可例如可操作地连接至调控序列。另外,例如,crRNA可以可操作地连接(融合至)本文的tracrRNA,使得crRNA的tracrRNA配对序列与tracrRNA的5’序列退火。此类可操作的连接可包含合适的成环序列,诸如GAAA(SEQ ID NO:43)、CAAA(SEQ ID NO:44)、或AAAG(SEQ ID NO:45)。

如本文所用,术语“重组”是指例如通过化学合成或通过用基因工程技术操纵分离的核酸片段而实现的两个原本分离的序列片段的人工组合。术语“重组的”、“转基因的”、“转化的”、“工程化的”或“修饰用于外源基因表达的”在本文中可互换使用。

用于制备本文的重组构建体/载体(例如,编码本文的核酶-RNA组分盒的DNA多核苷酸,或编码本文的Cas蛋白质的DNA多核苷酸)的方法可按照标准重组DNA和分子克隆技术,如由J.Sambrook和D.Russell(Molecular Cloning:A Laboratory Manual,第3版,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY,2001);T.J.Silhavy等人(Experiments with Gene Fusions,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY,1984);和F.M.Ausubel等人(Short Protocolsin Molecular Biology,第5版,Current Protocols,John Wiley and Sons,Inc.,NY,2002)所述的。

如本文所用,术语“转化”指将核酸分子转移至宿主生物体或宿主细胞中。例如,核酸分子可以为在细胞中自主复制,或整合到宿主生物体/细胞的基因组中,或在细胞中瞬时存在但不复制或整合的核酸分子。适用于转化的核酸分子的非限制性示例在本文中公开,诸如质粒和线性DNA分子。包含转化的核酸片段的宿主生物体/细胞(例如本文的非常规酵母)可被称为“转基因”、“重组”、“转化”或“转化体”。

如本文所用,相对于多核苷酸或多肽序列的术语“序列同一性”或“同一性”是指在指定的比较窗口上为获得最大对应而比对时两个序列中相同的核酸残基或氨基酸残基。因此,“序列同一性百分比”或“同一性百分比”指通过在比较窗口上比较两个最佳对齐的序列而测得的值,其中在与参考序列(其不包含添加或缺失)进行比较时,比较窗口中的多核苷酸或多肽序列的部分可包含添加或缺失(即空位)以实现两个序列的最佳比对。通过以下方式计算这种百分比:确定在两个序列中出现相同核酸碱基或氨基酸残基的位置的数目以得到匹配的位置的数目,将匹配的位置的数目除以比较窗口中位置的总数目,然后将结果乘以100以得到序列同一性百分比。应当理解,当计算DNA序列和RNA序列之间的序列同一性时,将DNA序列的T残基与RNA的U残基比对,并且可认为与RNA序列的U残基“相同”。出于测定第一核苷酸和第二核苷酸的互补度百分比的目的,可通过测定下列来获得该百分比:(i)例如,第一多核苷酸和第二多核苷酸的互补序列之间的同一性百分比(或反之亦然),和/或(ii)可形成标准Watson和Crick碱基对的第一多核苷酸和第二多核苷酸之间的碱基的百分比。

在National Center for Biotechnology Information(NCBI)网站在线可用的Basic Local Alignment Search Tool(BLAST)算法可用于例如测量本文所公开的两个或更多个多核苷酸序列(BLASTN算法)或多肽序列(BLASTP算法)之间的同一性百分比。另选地,序列间的同一性百分比可使用Clustal算法(例如ClustalW或ClustalV)进行计算。对于使用Clustal比对方法的多重比对,默认值可对应于空位罚分=10、以及空位长度罚分=10。用Clustal方法进行成对比对和蛋白质序列的同一性百分比计算的默认参数可为KTUPLE=1、空位罚分=3、窗口=5、以及保留对角线=5。对于核酸,这些参数可为KTUPLE=2,空位罚分=5,窗口=4、以及保留对角线=4。另选地,序列间的同一性百分比可以利用EMBOSS算法(例如,needle)进行,其中参数诸如空位开放=10、空位延伸=0.5、END GAP PENALTY=false、END GAP OPEN=10、END GAP EXTEND=0.5,利用BLOSUM矩阵(例如,BLOSUM62)。

本文中,与第二序列“互补”的第一序列可另选地被称为与第二序列呈“反义”取向。

本文公开了多种多肽氨基酸序列和多核苷酸序列作为所公开发明的某些实施方案的特征。可使用这些序列的与本文公开的序列至少约70%-85%、85%-90%或90%-95%相同的变体。或者,变体氨基酸序列或多核苷酸序列可与本文公开的序列具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。变体氨基酸序列或多核苷酸序列可具有与公开序列相同的功能/活性,或者具有公开序列的功能/活性的至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。

例举了在本文的Cas9蛋白质的每个氨基酸位置处的本文所公开的所有氨基酸残基。鉴于某些氨基酸彼此共享类似的结构和/或电荷特征(即保守的),在Cas9中的每个位置处的氨基酸可以公开的序列提供或用保守的氨基酸残基替换(“保守氨基酸替换”),如下:

1.下列小的脂族、非极性或微极性残基可以相互替换:Ala(A)、Ser(S)、Thr(T)、Pro(P)、Gly(G);

2.下列极性、带负电的残基和它们的酰胺可相互替换:Asp(D)、Asn(N)、Glu(E)、Gln(Q);

3.下列极性、带正电的残基可相互替换:His(H)、Arg(R)、Lys(K);

4.下列脂族、非极性的残基可相互替换:Ala(A)、Leu(L)、Ile(I)、Val(V)、Cys(C)、Met(M);并且

5.下列大的芳族残基可相互替换:Phe(F)、Tyr(Y)、Trp(W)。

如下文实施例1中所示,使用Pol III启动子-转录gRNA在非常规酵母诸如解脂耶氏酵母中进行Cas9-介导的DNA靶向已被证明是困难的。因此,用于产生Cas9的RNA组分的其它方式对于在非常规酵母中提供Cas9介导的DNA靶向是有意义的。

所公开发明的实施方案涉及非常规酵母,其包含至少一种RNA引导的内切核酸酶(RGEN),所述RNA引导的内切核酸酶包含至少一种不具有5’端的RNA组分。该未封端的RNA组分包含与酵母中染色体或附加体中的靶位点序列互补的序列。RGEN可结合到,并任选地切割全部或部分靶位点序列。

显著地,RGEN介导的DNA靶向在这些非常规酵母中进行,如通过在RGEN靶位点序列和外源提供的供体DNA序列之间的插入缺失形成或增加的同源重组(HR)水平所表现的。在本公开之前,非常规酵母通常难以通过HR基因靶向,通常依赖于靶位点处的随机的不频繁DNA断裂来促进其利用供体DNA进行HR。这是由于非常规酵母具有低HR活性并且反而有利于非同源端部接合(NHEJ)活性。因此,在非常规酵母中通过HR进行基因靶向现在可如在与NHEJ过程相比偏好HR的常规酵母诸如酿酒酵母中一样可行。虽然不受任何理论的束缚,但据信在非常规酵母细胞中提供至少一种不具有5’端的RNA组分导致RNA组分在所述RNA可参与RGEN介导的DNA靶向的核中更好的积聚。

已经描述了RNA处理工具,诸如基于Csy4(Cas6)的RNA处理工具(Nissim等人,2014,Molecular Cell 54:698-710)。Csy4结合pre-crRNA茎环重复序列并特异性切割其同源底物以产生包含侧接有重复序列的片段的间隔序列的成熟crRNA(Sternberg等人,2012.RNA,18(4):661-72)。本文公开了(实施例12)使用Csy4以处理向导RNA,使得其产生不具有5’端的RNA组分(向导RNA),其中RNA组分可形成RGEN,所述RGEN可结合到并切割非常规酵母的基因组中的靶位点。

本文的非常规酵母不是“常规”(“模型”)酵母,诸如酵母属(例如酿酒酵母,也称为芽殖酵母、面包酵母、和/或啤酒酵母)或裂殖酵母(例如,粟酒裂殖酵母(S.pombe),其也称为裂殖酵母)物种。在某些实施方案中,常规酵母是与由NHEJ介导的修复过程相比偏好HR DNA修复过程的酵母。

在某些实施方案中,非常规酵母可以是与由HR介导的修复过程相比偏好NHEJ DNA修复过程的酵母。常规酵母诸如酿酒酵母和粟酒裂殖酵母通常表现出供体DNA与短旁侧同源臂(30-50bp)以超过70%的常规效率特异性整合,然而非常规酵母如巴斯德毕赤酵母、多形汉逊酵母、解脂耶氏酵母、树干毕赤酵母和乳酸克鲁维酵母通常示出与相似结构化供体DNA以小于1%的效率特异性整合(Chen等人,PLoS ONE 8:e57952)。因此,可以例如通过利用合适的供体DNA转化酵母并确定其与预测由供体DNA靶向的基因组位点特异性重组的程度来判定对HR过程的偏好。例如,如果此类测定在酵母基因组中产生供体DNA的高度随机整合,则可表现出对NHEJ的偏好(或对HR的低偏好)。用于确定酵母中DNA的特异性(HR-介导的)和/或随机(NHEJ-介导的)整合率的测定是本领域已知的(例如,Ferreira和Cooper,Genes Dev.18:2249-2254;Corrigan等人,PLoS ONE 8:e69628;Weaver等人,Proc.Natl.Acad.Sci.U.S.A.78:6354-6358;Keeney和Boeke,Genetics 136:849-856)。

鉴于其低水平的HR活性,本文的非常规酵母可(i)表现出例如小于约1%、2%、3%、4%、5%、6%、7%或8%的由具有30-50bp旁侧同源臂的适宜供体DNA进行的特异性靶向率,和/或(ii)表现出例如大于约65%、66%、67%、68%、69%、70%、71%、72%、73%、74%或75%的前述供体DNA的随机整合率。适宜供体DNA的这些(i)特异性靶向率和/或(ii)随机整合率可在非常规酵母被提供如本文所公开的RGEN之前存在时来表征所述非常规酵母。在某些实施方案中,对非常规酵母提供RGEM的目的是形成位点特异性DNA单链断裂(SSB)或双链断裂(DSB),用于使酵母在特定位点处偏向HR。因此,包含本文的适宜RGEN的非常规酵母通常应表现出利用特定供体DNA的增加的HR率。此类增加的比率可以比合适的对照(例如,利用相同供体DNA,但缺乏合适RGEN转化的相同非常规酵母)中的HR率高至少约2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍或10倍。

在本文的某些方面,非常规酵母可以是无性繁殖(无性型)或有性繁殖(有性型)的非常规酵母。虽然本文的非常规酵母通常以单细胞形式存在,但这些酵母的某些类型可任选地能够形成假菌丝(连接的芽殖细胞串)。在其它方面,非常规酵母可以为单倍体或二倍体,和/或可以具有以这些倍数性形式中的任一种存在的能力。

本文的非常规酵母可以本领域中已知的任何方式培养,诸如Non-Conventional Yeasts in Genetics,Biochemistry and Biotechnology:PracticalProtocols(K.Wolf、K.D.Breunig、G.Barth编辑,Springer-Verlag,Berlin,Germany,2003),Yeasts in Natural and Artificial Habitats(J.F.T.Spencer、D.M.Spencer编辑,Springer-Verlag,Berlin,Germany,1997),和/或Yeast Biotechnology:Diversity and Applications(T.Satyanarayana、G.Kunze编辑,Springer,2009)中所述的,其全部均以引用方式全文并入本文。

本文的非常规酵母的非限制性示例包括以下属的酵母:耶氏酵母属、毕赤酵母属、许旺氏酵母属、克鲁维酵母属、Arxula属、丝孢酵母属、假丝酵母属、黑粉菌属、球拟酵母属、接合酵母属、三角酵母属、隐球酵母属、红酵母属、法夫酵母属、掷孢酵母属和管囊酵母属。耶氏酵母属物种的合适的示例为解脂耶氏酵母。毕赤酵母属物种的适宜示例包括:巴斯德毕赤酵母、甲醇毕赤酵母、木糖发酵酵母、异常毕赤酵母和安格斯毕赤酵母。许旺氏酵母属(Schwanniomyces)物种的合适示例包括卡斯坦氏许旺酵母(S.castellii)、河岸许旺酵母(S.alluvius)、人许旺酵母(S.hominis)、西方许旺酵母(S.occidentalis)、S.capriottii、埃切许旺酵母(S.etchellsii)、多形许旺酵母(S.polymorphus)、拟多形许旺酵母(S.pseudopolymorphus)、范丽德许旺酵母(S.vanrijiae)和山田许旺酵母(S.yamadae)。克鲁维酵母属(Kluyveromyces)物种的合适示例包括乳酸克鲁维酵母(K.lactis)、马克斯克鲁维酵母(K.marxianus)、脆壁克鲁维酵母(K.fragilis)、果蝇克鲁维酵母(K.drosophilarum)、耐热克鲁维酵母(K.thermotolerans)、K.phaseolosporus、范式克鲁维酵母(K.vanudenii)、克鲁雄酵母(K.waltii)、非洲克鲁维酵母(K.africanus)和多孢克鲁维酵母(K.polysporus)。Arxula物种的合适示例包括A.adeninivorans和A.terrestre。丝孢酵母属(Trichosporon)物种的合适示例包括皮状丝孢酵母(T.cutaneum)、头状丝孢酵母(T.capttatum)、皮瘤丝孢酵母(T.inkin)和T.beemeri。假丝酵母属(Candida)物种的合适示例包括白假丝酵母(C.albicans)、C.ascalaphidarum、C.amphixiae、南极假丝酵母(C.antarctica)、C.argentea、大西洋假丝酵母(C.atlantica)、C.atmosphaerica、蟑螂假丝酵母(C.blattae)、C.bromeliacearum、果生假丝酵母(C.carpophila)、C.carvajalis、C.cerambycidarum、C.chauliodes、延胡索假丝酵母(C.corydali)、C.dosseyi、都柏林假丝酵母(C.dubliniensis)、C.ergatensis、C.fructus、光滑假丝酵母(C.glabrata)、发酵假丝酵母(C.fermentati)、吉利蒙假丝酵母(C.guilliermondii)、黑马朗假丝酵母(C.haemulonii)、C.insectamens、昆虫假丝酵母(C.insectorum)、中型假丝酵母(C.intermedia)、C.jeffresii、乳酒假丝酵母(C.kefyr)、C.keroseneae、克鲁斯假丝酵母(C.krusei)、葡萄牙假丝酵母(C.lusitaniae)、C.lyxosophila、麦芽糖假丝酵母(C.maltosa)、C.marina、璞膜假丝酵母(C.membranlfaciens)、梅林假丝酵母(C.milleri)、莫格假丝酵母(C.mogii)、嗜油假丝酵母(C.oleophila)、俄勒同假丝酵母(C.oregonensis)、近平滑假丝酵母(C.parapsilosis)、桔假丝酵母(C.quercitrusa)、皱褶假丝酵母(C.rugosa)、清酒假丝酵母(C.sake)、休哈塔假丝酵母(C.shehatea)、C.temnochilae、纤细假丝酵母(C.tenuis)、C.theae、C.tolerans、热带假丝酵母(C.tropicalis)、C.tsuchiyae、C.sinolaborantium、酱油假丝酵母(C.sojae)、C.subhashii、维斯假丝酵母(C.viswanathii)、产朊假丝酵母(C.utilis)、C.ubatubensis和酵母类假丝酵母(C.zemplinina)。黑粉菌属(Ustilago)物种的合适示例包括燕麦散黑粉菌(U.avenae)、菰黑粉菌(U.esculenta)、大麦坚黑粉菌(U.hordei)、玉米黑粉菌(U.maydis)、大麦散黑粉菌(U.nuda)和小麦散黑粉菌(U.tritici)。球拟酵母属(Torulopsis)物种的合适示例包括T.Geochares、T.azyma、光滑球拟酵母(T.glabrata)和白球拟酵母(T.candida)。接合酵母属(Zygosaccharomyces)物种的合适示例包括拜耳接合酵母(Z.bailii)、二孢接合酵母(Z.bisporus)、产香接合酵母(Z.cidri)、发酵接合酵母(Z.fermentati)、佛罗伦萨接合酵母(Z.florentinus)、Z.kombuchaensis、缓慢接合酵母(Z.lentus)、蜂蜜接合酵母(Z.mellis)、小椭圆接合酵母(Z.microellipsoides)、Z.mrakii、假鲁氏接合酵母(Z.pseudorouxii)和鲁氏接合酵母(Z.rouxii)。三角酵母属(Trigonopsis)物种的合适示例包括变异三角酵母(T.variabilis)。隐球酵母属(Cryptococcus)物种的合适示例包括罗伦隐球酵母(C.laurentii)、浅白隐球酵母(C.albidus)、新型隐球酵母(C.neoformans)、格特隐球酵母(C.gattii)、指甲隐球酵母(C.uniguttulatus)、C.adeliensis、浅黄隐球酵母(C.aerius)、C.albidosimilis、南极隐球酵母(C.antarcticus)、水生隐球酵母(C.aquaticus)、黑隐球酵母(C.ater)、C.bhutanensis、C.consortionis、弯曲隐球酵母(C.curvatus)、C.phenolicuS、斯金纳隐球酵母(C.skinneri)、地生隐球酵母(C.terreus)和C.Vishniacci。红酵母属(Rhodotorula)物种的合适示例包括瘦果红酵母(R.acheniorum)、R.tula、R.acuta、美洲红酵母(R.americana)、南美杉红酵母(R.araucariae)、北极红酵母(R.arctica)、R.armeniaca、橙黄红酵母(R.aurantiaca)、黑木耳红酵母(R.auriculariae)、R.bacarum、海洋红酵母(R.benthica)、R.biourgei、茂物红酵母(R.bogoriensis)、R.bronchialis、巴方氏红酵母(R.buffonii)、巨白蛤红酵母(R.calyptogenae)、R.chungnamensis、R.cladiensis、珊瑚红酵母(R.corallina)、R.cresolica、R.crocea、R.cycloclastica、R.dairenensis、流散红酵母(Rdiffluens)、R.evergladiensis、R.ferulica、R.foliorum、草莓红酵母(R.fragaria)、粪球红酵母(R.fujisanensis)、R.futronensis、R.gelatinosa、R.glacialis、胶粘红酵母(R.glutinis)、瘦弱红酵母(R.gracilis)、禾本红酵母(R.graminis)、R.grinbergsii、R.himalayensis、R.hinnulea、R.histolytica、R.hylophila、R.incarnata、牧草红酵母(R.mgeniosa)、爪哇红酵母(R.javanica)、小石川氏红酵母(R.koishikawensis)、乳糖红酵母(R.lactosa)、瓣鳃红酵母(R.lamellibrachiae)、R.laryngis、木生红酵母(Rlignophila)、亚麻红酵母(R.lini)、R.longissima、路德氏红酵母(R.ludwigii)、R.lysinophila、海滨红酵母(R.marina)、R.martyniae-fragantis、R.matritensis、R.meli、小红酵母(R.minuta)、胶红酵母(R.mucilaginosa)、R.nitens、R.nothofagi、R.oryzae、太平洋红酵母(R.pacifica)、浅红红酵母(R.pallida)、对虾红酵母(R.peneaus)、R.philyla、R.phylloplana、皮拉特红酵母(R.pilatii)、果蝇红酵母(R.pilimanae)、松树红酵母(R.pinicola)、R.plicata、多形红酵母(R.polymorpha)、R.psychrophenolica、R.psychrophila、R.pustula、R.retinophila、R.rosacea、R.rosulata、R.rubefaciens、R.rubella、R.rubescens、深红酵母(R.rubra)、R.rubrorugosa、R.rufula、R.rutila、R.sanguinea、R.sanniei、R.sartoryi、R.silvestris、单纯红酵母(R.simplex)、中国红酵母(R.sinensis)、斯鲁菲亚红酵母(R.slooffiae)、R.sonckii、R.straminea、R.subericola、R.suganii、台湾红酵母(R.taiwanensis)、R.taiwaniana、R.terpenoidalis、R.terrea、R.texensis、R.tokyoensis、R.ulzamae、R.vanillica、R.vuilleminii、亚罗红酵母(R.yarrowii)、云南红酵母(R.yunnanensis)和R.Zsoltii。法夫酵母属(Phaffia)物种的合适示例包括红法夫酵母(P.rhodozyma)。掷孢酵母属(Sporobolomyces)物种的合适示例包括浅红掷孢酵母(S.alborubescens)、版纳掷孢酵母(S.bannaensis)、北京掷孢酵母(S.beijingensis)、秋枫掷孢酵母(S.bischofiae)、棒状掷孢酵母(S.clavatus)、S.coprosmae、S.coprosmicola、S.corallinus、S.dimmenae、S.dracophylli、长形掷孢酵母(S.elongatus)、纤细掷孢酵母(S.gracilis)、肌醇掷孢酵母(S.inositophilus)、约氏掷孢酵母(S.johnsonii)、S.koalae、S.magnisporus、S.novozealandicus、香气掷孢酵母(S.odorus)、S.patagonicus、S.productus、玫红掷孢酵母(S.roseus)、S.sasicola、S.shibatanus、独特掷孢酵母(S.singularis)、S.subbrunneus、对称掷孢酵母(S.symmetricus)、S.syzygii、S.taupoensis、铁杉布勒掷抱酵母(S.tsugae)、S.Xanthus和云南掷孢酵母(S.yunnanensis)。管囊酵母属(Pachysolen)物种的合适示例包括嗜鞣管囊酵母(P.tannophilus)。

在本文所公开的某些实施方案中,优选解脂耶氏酵母。合适的解脂耶氏酵母的示例包括以下得自美国典型培养物保藏中心(ATCC,Manassas,VA)的分离物:菌株名称:ATCC#20362、#8862、#8661、#8662、#9773、#15586、#16617、#16618、#18942、#18943、#18944、#18945、#20114、#20177、#20182、#20225、#20226、#20228、#20327、#20255、#20287、#20297、#20315、#20320、#20324、#20336、#20341、#20346、#20348、#20363、#20364、#20372、#20373、#20383、#20390、#20400、#20460、#20461、#20462、#20496、#20510、#20628、#20688、#20774、#20775、#20776、#20777、#20778、#20779、#20780、#20781、#20794、#20795、#20875、#20241、#20422、#20423、#32338、#32339、#32340、#32341、#34342、#32343、#32935、#34017、#34018、#34088、#34922、#34922、#38295、#42281、#44601、#46025、#46026、#46027、#46028、#46067、#46068、#46069、#46070、#46330、#46482、#46483、#46484、#46436、#60594、#62385、#64042、#74234、#76598、#76861、#76862、#76982、#90716、#90811、#90812、#90813、#90814、#90903、#90904、#90905、#96028、#201241、#201242、#201243、#201244、#201245、#201246、#201247、#201249、和/或#201847。

解脂耶氏酵母以及本文的任何其它非常规酵母可以是产油的(例如,产生其干细胞重量的至少25%的油)和/或产生一种或多种多不饱和脂肪酸(例如ω-6或ω-3)。此类油性可以是由于将酵母遗传工程化以产生与其野生型形式相比升高的脂质的量。产油解脂耶氏酵母菌株的示例公开与美国专利申请公布2009/0093543、2010/0317072、2012/0052537和2014/0186906中,所述文献均以引用方式并入本文。

本文所公开的非常规酵母的实施方案还可应用于其它微生物,诸如真菌。在某些实施方案中,真菌可以是相比于由HR介导的修复过程偏好NHEJ DNA修复过程的真菌。本文的真菌可以为担子菌、接合菌、壶菌纲或子囊菌真菌。本文所述的丝状真菌的示例包括以下属的那些:木霉属、金孢子菌属、梭孢壳菌属、脉孢菌(例如,粗糙脉孢菌、好食链孢霉)、栗疫属(例如,栗疫病菌)、短梗霉属(例如,出芽短梗霉菌)、Filibasidium、Piromyces、隐球菌、支顶孢属、Tolypocladium、小柱孢属、裂褶菌、侧孢霉属、青霉属(例如,比莱青霉、沙门柏干酪青霉菌、石斛青霉、产黄青霉、扩展青霉、绳状青霉菌、灰绿青霉、马尔尼菲青霉、娄地青霉、纯绿青霉、鲜绿青霉)、赤霉属(例如,G.acuminata、燕麦赤霉、桑生浆果赤霉、G.circinata、G.cyanogena、藤仓赤霉、错综赤霉、G.pulicaris、束梗镰孢赤霉、G.tricincta、玉米赤霉)、毁丝霉属、毛霉属(例如,鲁西氏毛霉菌、卷枝毛霉菌)、曲霉属(例如黑曲霉、米曲霉、构巢曲霉、黄曲霉、浅曲霉、土曲霉、棒曲霉、烟曲霉)、镰孢属(例如禾谷镰刀菌、尖孢镰刀菌、F.bubigenum、茄腐镰孢菌、尖孢镰刀菌、轮枝样镰刀菌、层生镰刀菌、F.venenatum)、和腐质霉属、以及其无性型和有性型。如果需要,可通过如Barnett和Hunter(Illustrated Genera of Imperfect Fungi,第3版,Burgess Publishing Company,1972)中所公开的形态来限定本文真菌的属和物种。真菌可以任选地被表征为有害生物/病原体,诸如动物(例如,人类)的有害生物/病原体。

在本文的某些方面,木霉属(Trichoderma)物种包括侵占木霉(T.aggresslvum)、T.amazonlcum、棘孢木霉(T.asperellum)、深绿木霉(T.atroviride)、黄绿木霉(T.aureoviride)、澳洲康宁木霉(T.austrokoningii)、短蜜木霉(T.brevicompactum)、雪白木霉(T.candidum)、加勒比木霉(T.caribbaeum)、低头木霉(T.catoptron)、奶油木霉(T.cremeum)、陶瓷木霉(T.ceramicum)、蜡素木霉(T.cerinum)、绿孢木霉(T.chlorosporum)、色精木霉(T.chromospermum)、肉桂色木霉(T.cinnamomeum)、橘绿木霉(T.citrinoviride)、厚木霉(T.crassum)、奶油木霉(T.cremeum)、丁莉亚木霉(T.dingleyeae)、多罗西木霉(T.dorotheae)、平展木霉(T.effusum)、猬木霉(T.erinaceum)、爱莎尼亚木霉(T.estonicum)、可育木霉(T.fertile)、明胶木霉(T.gelatinosus)、加纳木霉(T.ghanense)、钩状木霉(T.hamatum)、哈茨木霉(T.harzianum)、旋状木霉(T.helicum)、交织木霉(T.intricatum)、长枝康宁木霉(T.konilangbra)、康宁木霉(T.koningii)、拟康宁木霉(T.koningiopsis)、长枝木霉(T.longibrachiatum)、长毛木霉(T.longipile)、微孢木霉(T.minutisporum)、矩孢木霉(T.oblongisporum)、卵孢木霉(T.ovalisporum)、彼得森木霉(T.petersenii)、竹生木霉(T.phyllostahydis)、洋大戟草木霉(T.piluliferum)、侧耳木霉(T.pleuroticola)、平菇木霉(T.pleurotum)、多孢木霉(T.polysporum)、假康宁木霉(T.pseudokoningii)、软毛木霉(T.pubescens)、里氏木霉(T.reesei)、罗杰氏木霉(T.rogersonii)、俄罗斯木霉(T.rossicum)、土星孢木霉(T.saturnisporum)、中国木霉(T.sinensis)、弯梗木霉(T.Sinuosum)、螺旋木霉(T.spirale)、草黄木霉(T.stramineum)、硬毛木霉(T.strigosum)、子座木霉(T.stromaticum)、球座木霉(T.surrotundum)、台湾木霉(T.taiwanense)、泰国木霉(T.thailandicum)、革菌木霉(T.thelephoricolum)、可可木霉(T.theobromicola)、绒毛木霉(T.tomentosum)、毛簇木霉(T.velutinum)、绿木霉(T.virens)、绿色木霉(T.viride)和渐绿木霉(T.viridescens)。本文的木霉属物种可例如,如Trichoderma:Biology andApplications(P.K.Mukherjee等人编辑,CABI,Oxfordshire,UK,2013)中所述培养和/或操纵,所述文献以引用方式并入本文。

在某些实施方案中,微生物细胞为藻类细胞。例如,藻类细胞可以来自下列中任一种:绿藻类(绿藻类(green algae))、红藻类(红藻类(red algae))、褐藻类(褐藻类(brown algae))、硅藻类(硅藻类(diatoms))和鞭毛藻类(鞭毛藻类(dinoflagellates))。在其它方面,藻类细胞可以是微藻类(例如浮游植物、微球藻或浮游藻类)或大型藻类(海带、海藻)。又如,本文的藻类细胞可以为紫菜属(紫菜)、红皮藻属如掌状红皮藻(掌状红皮藻(dulse))、节旋属如钝顶节旋藻(钝顶节旋藻(spirulina))、小球藻(例如,海水小球藻(C.protothecoides)、角叉菜属诸如角叉菜(爱尔兰藓(Irish moss))、丝囊藻属、马尾藻属、Cochayuyo、葡萄藻属(例如布朗葡萄藻)、杜氏藻属(例如,杜氏盐藻)、Gracilaria、颗石藻属(例如,颗石藻)、针形纤维藻、小环藻属、汉坦草属、Nannochloris、微拟球藻、菱形藻属、褐指藻属(例如,三角褐指藻)、栅藻属、Stichococcus、扁藻属(例如,肩突四鞭藻)、海链藻属(例如,伪矮海链藻)、隐甲藻属(例如,隐甲藻)、Neochloris(例如,N.oleoabundans)、或裂壶藻。本文的藻类物种可例如,如Thompson(Algal Cell Culture.Encyclopedia of Life Support System(EOLSS)Biotechnology,第1卷中所述培养和/或操纵,可在eolss.net/sample-chapters互联网网站获得),其以引用方式并入本文。

本文的包含至少一种RGEN的非常规酵母不存在于自然界中,所述RGEN包含至少一种不具有5’端的RNA组分。不受任何特定理论的束缚,据信此类酵母不天然存在,因为已经发现本文的RGEN仅在例如原核生物中出现。另外,据信酵母的某些实施方案由于包含具有含gRNA的RNA组分的RGEN,所以不天然存在,所述gRNA表示crRNA与tracrRNA的异源连接。

本文的RGEN是指包含至少一种Cas蛋白质和至少一种RNA组分的复合物。合适的Cas蛋白质的示例包括I型、II型或III型CRISPR体系的一种或多种Cas内切核酸酶(Bhaya等人,Annu.Rev.Genet.45:273-297,其以引用方式并入本文)。I型CRISPR Cas蛋白质可以为,例如Cas3或Cas4蛋白质。II型CRISPR Cas蛋白质可以为,例如Cas9蛋白质。III型CRISPR Cas蛋白质可以为,例如Cas10蛋白质。在优选的实施方案中,使用Cas9蛋白质。在某些实施方案中,Cas蛋白质可以为细菌或古细菌蛋白质。本文的I-III型CRISPR Cas蛋白质通常来源于原核生物;I型和III型Cas蛋白质可源自细菌或古细菌物种,然而II型Cas蛋白质(即,Cas9)可源自例如细菌物种。在其它实施方案中,合适的Cas蛋白质包括下列中的一种或多种:Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、其同源物、或其修饰型式。

在所公开发明的其它方面,本文的Cas蛋白质可以为以下属中的任一种:Aeropyrum、Pyrobaculum、硫化裂片菌(Sulfolobus)、古球状菌属(Archaeoglobus)、嗜盐小盒菌属(Haloarcula)、甲烷杆菌属(Methanobacteriumn)、产甲烷球菌属(Methanococcus)、甲烷八叠球菌属(Methanosarcina)、Methanopyrus、火球菌属(Pyrococcus)、灼热嗜酸古菌(Picrophilus)、Thernioplasnia、棒状杆菌(Corynebacterium)、分支杆菌(Mycobacterium)、链霉菌(Streptomyces)、产液菌属(Aquifrx)、卟啉单胞菌属(Porphvromonas)、绿菌属(Chlorobium)、栖热菌属(Thermus)、杆菌(Bacillus)、利斯特菌(Listeria)、葡萄球菌(Staphylococcus)、梭菌属(Clostridium)、热厌氧杆菌属(Thermoanaerobacter)、支原体属(Mycoplasma)、梭杆菌属(Fusobacterium)、蓝细菌属(Azarcus)、色杆菌属(Chromobacterium)、奈瑟菌属(Neisseria)、亚硝化单胞菌属(Nitrosomonas)、脱硫弧菌(Desulfovibrio)、地杆菌(Geobacter)、Myrococcus、弯曲杆菌(Campylobacter)、Wolinella、不动细菌属(Acinetobacter)、欧文氏菌(Erwinia)、埃希氏菌属(Escherichia)、军团杆菌(Legionella)、甲基球菌属(Methylococcus)、巴斯德氏菌属(Pasteurella)、光杆菌属(Photobacterium)、沙门氏菌属(Salmonella)、黄单胞菌属(Xanthomonas)、耶尔森菌属(Yersinia)、链球菌属(Streptococcus)、密螺旋体属(Treponema)、氟朗西斯氏菌属(Francisella)或栖热袍菌属(Thermotoga)。另选地,本文的Cas蛋白质可例如通过SEQ ID NO:462-465、467-472、474-477、479-487、489-492、494-497、499-503、505-508、510-516或517-521中任一个编码,如美国专利申请公布2010/0093617中所公开的,该文献以引用的方式并入本文。

在某些实施方案中,RGEN包含Cas9氨基酸序列。本文的Cas9蛋白质的氨基酸序列,以及本文的某些其它Cas蛋白质可源自例如链球菌(例如,化脓链球菌、肺炎链球菌、嗜热链球菌、无乳链球菌、副溶血链球菌、口腔链球菌、唾液链球菌、猕猴链球菌、停乳链球菌、咽峡炎链球菌、星座链球菌、S.pseudoporcinus、变形链球菌)、李斯特菌(例如无害利斯特氏菌)、螺原体属(例如,蜂螺旋原体、S.syrphidicola)、消化链球菌、Atopobium、卟啉单胞菌属(例如P.catoniae)、普雷沃菌属(例如中间普雷沃菌)、韦荣球菌属、密螺旋体(例如,T.socranskii、齿垢密螺旋体)、噬二氧化碳菌、大芬戈尔德菌(例如,大芬戈尔德菌)、Coriobacteriaceae(例如,C.bacterium)、Olsenella(例如,O.profusa)、嗜血杆菌属(例如,唾液嗜血杆菌、H.pittmamae)、巴斯德菌属(例如,贝氏巴斯德菌)、Olivibacter(例如,O.sitiensis)、Epilithonimonas(例如,E.tenax)、Mesonia(例如,M.mobilis)、乳酸菌属(例如,胚牙乳杆菌)、杆菌属(例如,蜡样芽胞杆菌)、Aquimarina(例如,A.muelleri)、金黄杆菌属(例如,C.palustre)、多形杆状菌(例如,B.graminisolvens)、奈瑟氏菌属(例如,脑膜炎奈瑟氏菌)、弗朗西斯氏菌属(例如,F.novicida)、或者黄杆菌属(例如,黄杆菌属、土壤杆菌)物种。在本文的某些方面,优选化脓链球菌Cas9。又如,Cas9蛋白质可以为Chylinski等人(RNA Biology 10:726-737)中所公开的Cas9蛋白质中任一种,所述文献以引用方式并入本文。

因此,本文的Cas9蛋白质的序列可包含例如以如下GenBank登录号所公开的Cas9氨基酸序列中任一种:G3ECR1(嗜热链球菌)、WP_026709422、WP_027202655、WP_027318179、WP_027347504、WP_027376815、WP_027414302、WP_027821588、WP_027886314、WP_027963583、WP_028123848、WP_028298935、Q03JI6(嗜热链球菌)、EGP66723、EGS38969、EGV05092、EHI65578(S.pseudoporcinus)、EIC75614(口腔链球菌)、EID22027(星座链球菌)、EIJ69711,EJP22331(口腔链球菌)、EJP26004(咽峡炎链球菌)、EJP30321、EPZ44001(化脓链球菌)、EPZ46028(化脓链球菌)、EQL78043(化脓链球菌)、EQL78548(化脓链球菌)、ERL10511、ERL12345、ERL19088(化脓链球菌)、ESA57807(化脓链球菌)、ESA59254(化脓链球菌)、ESU85303(化脓链球菌)、ETS96804、UC75522、EGR87316(停乳链球菌)、EGS33732、EGV01468(口腔链球菌)、EHJ52063(猕猴链球菌)、EID26207(口腔链球菌)、EID33364、EIG27013(副溶血链球菌)、EJF37476、EJO19166(链球菌属BS35b)、EJU16049、EJU32481、YP_006298249、ERF61304、ERK04546、ETJ95568(无乳链球菌)、TS89875、ETS90967(链球菌属SR4)、ETS92439、EUB27844(链球菌属BS21)、AFJ08616、EUC82735(链球菌属CM6)、EWC92088、EWC94390、EJP25691、YP_008027038、YP_008868573、AGM26527、AHK22391、AHB36273、Q927P4、G3ECR1或Q99ZW2(化脓链球菌),其以引用方式并入。可使用这些Cas9蛋白质序列中任一种的变体,但当与本文的RNA组分缔合时,应具有针对DNA的特异性结合活性,和任选的内切核酸酶活性。此类变体可包含与参考Cas9的氨基酸序列至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列。

另选地,本文的Cas9蛋白质可由例如以下SEQ ID NO中的任一个编码:462(嗜热链球菌)、474(嗜热链球菌)、489(无乳链球菌)、494(无乳链球菌)、499(变形链球菌)、505(化脓链球菌)或518(化脓链球菌),如美国专利申请公布2010/0093617所述(以引用方式并入本文)。另选地,本文的Cas9蛋白质可包含,例如SEQ ID NO:11的氨基酸序列,或SEQ ID NO:11的残基1-1368。另选地,Cas9蛋白质可包含例如与前述氨基酸序列中的任一个至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列。当与本文的RNA组分缔合时,此类变体Cas9蛋白质应具有针对DNA的特异性结合活性,和任选地切割或切口活性。

本文所用的Cas蛋白质(例如Cas9)的起源可来自RNA组分源自其中的相同物种,或其可来自不同物种。例如,包含源自链球菌物种(例如,化脓链球菌或嗜热链球菌)的Cas9蛋白质的RGEN可与具有源自相同链球菌物种的序列(例如crRNA重复序列、tracrRNA序列)的至少一种RNA组分复合。另选地,本文所用的Cas蛋白质(例如Cas9)的起源可来自RNA组分源自其中的不同物种(Cas蛋白质和RNA组分可彼此异源);此类异源Cas/RNA组分RGEN应具有DNA靶向活性。

可以通过本领域已知的任何合适的测定法来评估确定本文的Cas蛋白质针对特异性靶DNA序列的结合活性和/或内切核酸酶活性,例如美国专利号8697359中所公开的,其以引用方式在本文中公开。可例如通过以下方法来进行测定:在非常规酵母中表达Cas蛋白质和合适的RNA组分,并且然后检查预测的DNA靶位点的插入缺失存在(该特定测定法中的Cas蛋白质可具有完整的内切核酸酶活性[双链切割活性])。可例如经由DNA测序方法或通过测定靶序列的功能丧失来推测插入缺失形成来进行对于预测的靶位点处插入缺失的存在的检查。在另一个示例中,可通过在非常规酵母中表达Cas蛋白质和合适的RNA组分来测定Cas蛋白质活性,已向所述非常规酵母提供供体DNA,所述供体DNA包含与靶位点处或附近的序列同源的序列。在靶位点处的供体DNA序列的存在(诸如可通过供体和靶序列之间的成功HR所预测的)可指示靶向存在。

本文的Cas蛋白质诸如Cas9通常还包含异源核定位序列(NLS)。例如,本文的异源NLS氨基酸序列可具有足够的强度以驱动Cas蛋白质以可检测的量在本文酵母细胞的核中积累。NLS可包含碱基的一个(单倍体)或多个(例如,二倍体)短序列(例如,2至20个残基)、带正电的残基(例如,赖氨酸和/或精氨酸),并且可位于Cas氨基酸序列的任何位置处但使得其暴露于蛋白质表面上。例如,NLS可以可操作地连接至本文Cas蛋白质的N末端或C末端。例如,两个或更多个NLS序列可连接至Cas蛋白质,诸如在Cas蛋白质的N末端和C末端两者上。本文的适宜NLS序列的非限制性示例包括在美国专利6660830和7309576中公开的那些(例如,其中的表1),上述文献均以引用方式并入本文。可用于本文的NLS的另一个示例包括SEQ ID NO:11的氨基酸残基1373-1379。

在某些实施方案中,Cas蛋白质及其通过Cas蛋白质引导DNA特异性靶向的相应RNA组分(例如crRNA)与本发明所公开的非常规酵母异源。这些RGEN组分的异源性质是由于以下事实:Cas蛋白质及其相应RNA组分仅已知存在于原核生物(细菌和古细菌)中。

本文的Cas蛋白质可任选地使用其经密码子优化以在酵母细胞中表达的开放阅读框(ORF)在非常规酵母细胞中表达。本文的“经密码子优化的”序列是其密码子使用频率经设计用以模仿宿主细胞优选的密码子使用频率的ORF。在其中解脂耶氏酵母为非常规酵母细胞的方面,ORF的密码子优化可按照如美国专利7125672中提供的解脂耶氏酵母密码子使用特征图来进行,所述专利文献以引用方式并入本文。

在一些实施方案中,Cas蛋白质为包含一个或多个异源蛋白质结构域(例如,除了Cas蛋白质之外,1个、2个、3个或更多个结构域)的融合蛋白的部分。此类融合蛋白可包含任何附加的蛋白质序列,和任选地在任何两个结构域之间,诸如在Cas和第一异源结构域之间的接头序列。可融合至本文的Cas蛋白质的蛋白质结构域的示例包括但不限于表位标签(例如组氨酸[His]、V5、FLAG、流感血凝素[HA]、myc、VSV-G、硫氧还蛋白[Trx]),报告分子(例如谷胱甘肽-5-转移酶[GST]、辣根过氧化物酶[HR]、氯霉素乙酰转移酶[CAT]、β-半乳糖苷酶、β-葡糖醛酸糖苷酶[GUS]、荧光素酶、绿色荧光蛋白[GFP]、HcRed、DsRed、青色荧光蛋白[CFP]、黄色荧光蛋白[YFP]、蓝色荧光蛋白[BFP]),以及具有以下活性中一个或多个活性的结构域:甲基化酶活性、脱甲基酶活性、转录激活活性(例如,VP16或VP64)、转录抑制活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性和核酸结合活性。在其它实施方案中,Cas蛋白质可与结合DNA分子或其它分子的蛋白质,诸如麦芽糖结合蛋白(MBP)、S-tag、Lex A DNA结合结构域(DBD)、GAL4A DNA结合结构域、和单纯疱疹病毒(HSV)VP16融合。可以为包含本文的Cas蛋白质的融合蛋白质的部分的附加结构域公开于美国专利申请公布2011/0059502中,该文献以引用的方式并入本文。在其中Cas蛋白质融合至异源蛋白质(例如转录因子)的某些实施方案中,Cas蛋白质具有DNA识别和结合活性(当与本文的合适的RNA组分复合时),但不具有DNA切口活性或切割活性。

本文的RGEN可结合到,并且任选地切割DNA靶序列处的DNA链。在某些实施方案中,RGEN可切割DNA靶序列的一个或两条链。例如,RGEN可切割DNA靶序列的两条链。

本文可切割DNA靶序列的两条链的RGEN通常包含其全部内切核酸酶结构域处于功能态的Cas蛋白质(例如,保留每个内切核酸酶结构域中的一些或全部活性的野生型内切核酸酶结构域或其变体)。因此,保留Cas蛋白质的每个内切核酸酶结构域中的一些或全部活性的野生型Cas蛋白质(例如,本文所公开的Cas9蛋白质)或其变体是可切割DNA靶序列的两条链的RGEN的适宜示例。包含功能性RuvC和HNH核酸酶结构域的Cas9蛋白质是可切割DNA靶序列的两条链的Cas蛋白质的示例。本文可切割DNA靶序列的两条链的RGEN通常在相同位置处切割两条链,使得在切割位点处形成平端(即,无核苷酸突出物)。

本文可切割DNA靶序列的一条链的RGEN可在本文中表征为具有切口酶活性(例如,部分切割能力)。本文的Cas切口酶(例如,Cas9切口酶)通常包含使得Cas仅切割DNA靶序列的一条链(即,形成切口)的一个功能性内切核酸酶结构域。例如,Cas9切口酶可包含(i)突变的、功能失调的RuvC结构域和(ii)功能性HNH结构域(例如野生型HNH结构域)。又如,Cas9切口酶可包含(i)功能性RuvC结构域(例如,野生型RuvC结构域)和(ii)突变的、功能失调的HNH结构域。

适用于本文的Cas9切口酶的非限制性示例由Gasiunas等人(Proc.Natl.Acad.Sci.U.S.A.109:E2579-E2586),Jinek等人(Science 337:816-821),Sapranauskas等人(Nucleic Acids Res.39:9275-9282)和美国专利申请公布2014/0189896中所描述的,这些申请以引用的方式并入本文。例如,本文的Cas9切口酶可包含嗜热链球菌Cas9,其具有Asp-31替换(例如,Asp-31-Ala)(突变的RuvC结构域的示例)、或His-865替换(例如,His-865-Ala)、Asn-882替换(例如,Asn-882-Ala)、或Asn-891替换(例如,Asn-891-Ala)(突变的HNH结构域的示例)。另外,例如,本文的Cas9切口酶可包含化脓链球菌Cas9,其具有Asp-10替换(例如,Asp-10-Ala)、Glu-762替换(例如Glu-762-Ala)、或Asp-986替换(例如,Asp-986-Ala)(突变的RuvC结构域的示例)、或His-840替换(例如,His-840-Ala)、Asn-854替换(例如,Asn-854-Ala)、或Asn-863替换(例如,Asn-863-Ala)(突变的HNH结构域的示例)。关于化脓链球菌Cas9,三个RuvC亚结构域一般分别位于氨基酸残基1-59、718-769和909-1098处,并且HNH结构域位于氨基酸残基775-908处(Nishimasu等人,Cell 156:935-949)。

本文的Cas9切口酶可出于各种目的用于所公开发明的非常规酵母中。例如,Cas9切口酶可用于利用合适的供体多核苷酸在DNA靶位点序列处或附近刺激HR。因为经切口的DNA不是NHEJ过程的底物,但通过HR过程识别,所以在特定靶位点处将DNA切口应当使所述位点更易接受利用合适的供体多核苷酸进行HR。

又如,一对Cas9切口酶可用于增加DNA靶向的特异性。一般来讲,这可通过提供两个Cas9切口酶来进行,由于与具有不同向导序列的RNA组分缔合,所以两个Cas9切口酶在期望靶向的区域中的相对链上的DNA序列附近靶向和切口。这种每个DNA链附近的切割形成DSB(即,具有单链突出物的DSB),这然后被识别为NHEJ的底物(导致插入缺失形成)或HR的底物(则导致与合适的供体多核苷酸(如果提供)重组)。在这些实施方案中,每个切口可以为例如彼此分开的至少约5个、10个、15个、20个、30个、40个、50个、60个、70个、80个、90个或100个(或介于5和100之间的任何整数)碱基。本文的一个或两个Cas9切口酶蛋白质可用于如上所述的Cas9切口酶对。例如,可使用具有突变RuvC结构域,但功能性HNH结构域的Cas9切口酶(即,Cas9HNH+/RuvC-)(例如,化脓链球菌Cas9HNH+/RuvC-)。可通过使用具有将每个切口酶靶向到每个特异性DNA位点的向导RNA序列的本文的适宜RNA组分,将每个Cas9切口酶(例如,Cas9HNH+/RuvC-)引导至彼此附近的特异性DNA位点(至多间隔100个碱基对)。

在某些实施方案中,RGEN可结合到DNA靶位点序列,但不切割靶位点序列处的任何链。此类RGEN可包含Cas蛋白质,其中其核酸酶结构域全部均是突变的、功能失调的。例如,本文可结合到DNA靶位点序列,但不切割靶位点序列处的任何链的Cas9蛋白质可包含突变的功能失调的RuvC结构域和突变的功能失调的HNH结构域两者。此类Cas9蛋白质的非限制性示例包含上文所公开的RuvC和HNH核酸酶结构域突变体中任一个(例如,具有Asp-10替换(诸如Asp-10-Ala)和His-840替换(诸如His-840-Ala)的化脓链球菌Cas9)。本文结合但不切割靶DNA序列的Cas蛋白质可用于调节基因表达,例如,在这种情况下,Cas蛋白质可以与转录因子(或其部分)(例如,阻遏物或激活子,例如本文所公开的那些中的任一种)融合。例如,包含具有Asp-10替换(例如Asp-10-Ala)和His-840替换(例如His-840-Ala)的化脓链球菌Cas9的Cas9可融合至VP16或VP64转录激活结构域。用于此类RGEN的RNA组分中的向导序列可例如与基因启动子或其它调控元件(例如,内含子)中的DNA序列互补。

在某些方面,酵母可包含(i)可切割DNA靶序列的一个或两个DNA链的RGEN,和(ii)包含与DNA靶位点序列处或附近的序列同源的至少一个序列的供体多核苷酸(通过本文的Cas蛋白质特异性靶向的序列)。如果靶位点包含SSB或DSB(诸如可使用本文Cas蛋白质引入),则合适的供体多核苷酸能够经历由DNA靶位点处或附近的序列进行的HR。本文的供体多核苷酸内的“同源序列”可包含或由至少约25、50、75、100、150、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000或10000个核苷酸,或约50-500、50-550、50-600、50-650或50-700个核苷酸的序列组成,所述序列与靶位点序列处或附近的序列具有100%的同一性,或与靶位点序列处或附近的序列具有例如至少约95%、96%、97%、98%或99%同一性。

本文的供体多核苷酸可具有两个同源序列(同源臂),所述同源序列例如由与靶位点序列处或附近的序列异源的序列隔开。此类供体多核苷酸和靶位点序列之间的HR通常导致靶位点处的序列被供体多核苷酸的异源序列置换(位于与供体多核苷酸的同源臂同源的靶位点序列之间的靶位点序列被供体多核苷酸的异源序列置换)。在具有两个同源臂的供体多核苷酸中,所述臂可由例如,至少约1、2、3、4、5、10、20、30、40、50、75、100、250、500、1000、2500、5000、10000、15000、20000、25000或30000个核苷酸隔开(即,供体多核苷酸中的异源序列的长度为至少约1、2、3、4、5、10、20、30、40、50、75、100、250、500、1000、2500、5000、10000、15000、20000、25000或30000个核苷酸)。每个同源臂的长度(例如上文所公开的同源序列的长度中的任一个)可以相同或不同。每个臂与靶位点处或附近的相应同源序列的同一性百分比(例如,上文所公开的同原序列的同一性%中任一个)可以相同或不同。

与供体多核苷酸的对应同源序列同源的在靶位点序列处或附近(另选地,本地或附近)的DNA序列可以距靶序列中预测Cas蛋白质切割位点(DSB或切口)例如在约1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、250、300、450、500、750、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000或60000(或介于1和60000之间的任何整数)个核苷酸内(例如,约1-1000、100-1000、500-1000、1-500或100-500个核苷酸)。这些核苷酸距离可以沿切割位点的上游或下游方向,从切割位点到同源序列的第一个核苷酸标记。例如,与供体多核苷酸中的对应序列同源的靶序列附近的序列可在靶序列的预测Cas蛋白质切割位点下游的500个核苷酸碱基对处起始。例如,在本文采用具有两个同源臂(例如,由异源序列分开的第一同源臂和第二同源臂)的供体多核苷酸的实施方案中,同源序列(对应于与供体的第一同源臂的同源性)可在预测的Cas切割位点的上游,并且同源序列(对应于与供体的第二同源臂的同源性)可在预测的Cas切割位点的下游。例如,这些上游和下游的同源序列中每一个距预测切割位点的核苷酸距离可以相同或不同,并且可以为上文所公开的核苷酸距离中的任一个。例如,同源序列的3’端(对应于与供体的第一同源臂的同源性)可位于预测Cas切割位点上游600个核苷酸碱基对处,并且同源序列的5’端(对应于与供体的第二同源臂的同源性)可位于预测Cas切割位点下游400个核苷酸碱基对处。

本文的RGEN可结合到,并任选地切割非常规酵母的基因组中染色体、附加体或任何其它DNA分子中的靶位点序列处的DNA链。鉴于RGEN的RNA组分包含与靶序列的链互补的序列(向导序列),靶序列的这种识别和结合是特异性的。在某些实施方案中,靶位点可以是独特的(即,在目标基因组中存在靶位点序列的单次出现)。

本文的靶序列的长度可以为例如,至少13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸;介于13-30个核苷酸之间;介于17-25个核苷酸之间,或介于17-20个核苷酸之间。该长度可包括或排除PAM序列。另外,本文靶序列的链具有与(crRNA或gRNA的)向导序列的足够互补性从而与向导序列杂交并引导Cas蛋白质或Cas蛋白质复合物与靶序列的序列-特异性结合(在合适的PAM邻近靶序列时,参见下文)。向导序列及其对应DNA靶序列的链之间的互补度为例如,至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。本文的靶位点可位于例如编码基因产品(例如蛋白质或RNA)的序列或非编码序列(例如,调控序列或“垃圾”序列)中。

PAM(前间区序列邻近基序)序列可邻近靶位点序列。PAM序列是由本文的RGEN识别的短DNA序列。DNA靶序列的缔合PAM和前11个核苷酸对于Cas9/gRNA靶向和切割可能是重要的(Jiang等人,Nat.Biotech.31:233-239)。本文的PAM序列的长度可根据所用的Cas蛋白质或Cas蛋白质复合物而不同,但通常例如为2、3、4、5、6、7或8个核苷酸的长度。例如,PAM序列紧接靶位点序列的下游、或在靶位点序列下游的2个或3个核苷酸内,所述靶位点序列与靶位点中的链互补,所述靶位点中的链继而与RNA组分向导序列互补。在本文的实施方案中,其中RGEN为与RNA组分复合的内切核酸酶活性Cas9蛋白质,Cas9按照RNA组分引导而结合到靶序列,并切割紧邻PAM序列上游的第三核苷酸位置的5’的两条链。考虑靶位点:PAM序列的以下示例:

5’-NNNNNNNNNNNNNNNNNNNXGG-3’(SEQ ID NO:46)。

在该示例性序列中,N可以为A、C、T或G,并且X可以为A、C、T或G(X也可被称为NPAM)。该示例中的PAM序列为XGG(加下划线)。合适的Cas9/RNA组分复合物可切割紧接双下划线N的5’的该靶。SEQ ID NO:46中N的串表示靶序列,所述靶序列与本文RNA组分的向导序列为例如至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同(其中,DNA靶序列的任何T可与RNA向导序列的任何U比对)。在该靶序列(其代表本文的靶位点)处识别和结合时,Cas9复合物的RNA组分的向导序列可与N的串的互补序列退火;向导序列和靶位点互补序列之间的互补度百分比为例如至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。如果Cas9切口酶用于靶向基因组中的SEQ ID NO:46,则切口酶可紧邻双下划线N的5’或在互补链的相同位置处切口,这取决于切口酶中哪个内切核酸酶结构域是功能失调的。如果不具有溶核活性的Cas9(RuvC和HNH结构域两者均功能失调)用于靶向基因组中的SEQ ID NO:46,在其可识别并结合靶序列,但不对所述序列进行任何切割。

本文的PAM通常根据所用RGEN的类型来选择。例如,本文的PAM序列可以为通过RGEN识别的PAM序列,所述RGEN包含Cas,诸如Cas9,其源自Cas可源自其中的本文所公开的物种中的任一种。在某些实施方案中,PAM序列可以为由RGEN识别的PAM序列,所述RGEN包含源自化脓链球菌、嗜热链球菌、无乳链球菌、脑膜炎奈瑟菌、牙质齿菌或新凶手弗氏杆菌的Cas9。例如,源自化脓链球菌的适宜Cas9可用于靶向具有NGG的PAM序列的基因组序列(SEQ ID NO:47;N可以为A、C、T或G)。又如,当靶向具有以下PAM序列的DNA序列时,合适的Cas9可源自以下物种中的任一种:嗜热链球菌(NNAGAA[SEQ ID NO:48])、无乳链球菌(NGG[SEQ ID NO:47])、NNAGAAW[SEQ ID NO:49,W为A或T]、NGGNG[SEQ ID NO:50])、脑膜炎奈瑟菌(NNNNGATT[SEQ ID NO:51])、牙质齿菌(NAAAAC[SEQ ID NO:52])、或新凶手弗氏杆菌(NG[SEQ ID NO:53])(其中所有这些特定PAM序列中的N为A、C、T或G)。可用于本文的Cas9/PAM的其它示例包括在Shah等人(RNA Biology 10:891-899)和Esvelt等人(Nature Methods 10:1116-1121)中公开的那些,所述文献以引用方式并入本文。本文的靶序列的示例遵循SEQ ID NO:46,但其中‘XGG’PAM由前述PAM中任一个置换。

在本文实施方案中,至少一种不具有5’端的RNA组分包含于RGEN中。该未封端的RNA组分包含与非常规酵母中的染色体或附加体的靶位点序列互补的序列。基于该序列互补度,RGEN特异性结合到并任选地切割该靶位点处的DNA链。因此,在本发明所公开的实施方案中,RNA组分的互补序列还可被称为向导序列或可变靶向结构域。

本文的RNA组分的向导序列(例如,crRNA或gRNA)的长度可以为至少13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核糖核苷酸,介于13-30个核糖核苷酸的长度之间;介于17-25个核糖核苷酸的长度之间;或介于17-20个核糖核苷酸的长度之间。一般来讲,本文的向导序列具有与靶DNA序列的链足够的互补性从而与靶序列杂交并引导Cas蛋白质或Cas蛋白质复合物与靶序列的序列-特异性结合(在合适的PAM邻近靶序列时)。向导序列及其对应DNA靶序列之间的互补度为例如,至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。可相应地将向导序列工程化以将RGEN靶向到酵母细胞中的DNA靶序列。

本文的RNA组分可包含例如crRNA,其包含向导序列和重复(tracrRNA配对)序列。向导序列通常位于crRNA的5’端处或附近(在1、2、3、4、5、6、7、8、9、10或更多个碱基内)。crRNA的向导序列的下游是“重复”或“tracrRNA配对”序列,其与tracrRNA的5’端处的序列互补并与所述序列杂交。向导序列和tracrRNA配对序列可紧邻,或通过例如1、2、3、4或更多个碱基隔开。tracrRNA配对序列具有例如与tracrRNA的5’端的至少50%、60%、70%、80%、90%、95%、96%、97%、98%或99%序列互补度。一般来讲,互补度可参考tracrRNA配对序列与tracrRNA序列的最佳比对,连同两个序列中较短者的长度。本文的tracrRNA配对序列的长度可以为,例如至少8、9、10、11、12、13、14、15、16、17或18个核糖核苷酸,并且与tracrRNA的5’端处的相同或相似长度的序列杂交(例如,加上或减去1、2、3、4或5个碱基)。本文的tracrRNA配对序列的适宜示例包含SEQ ID NO:54(guuuuuguacucucaagauuua)、SEQ ID NO:55(guuuuuguacucuca)、SEQ ID NO:56(guuuuagagcua,参见实施例)、或SEQ ID NO:57(guuuuagagcuag),或其变体,其(i)具有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性,并且(ii)可与tracrRNA的5’端序列退火。本文的crRNA的长度可以为例如至少约18、20、22、24、26、28、30、32、34、36、38、40、42、44、46或48个核糖核苷酸;或约18-48个核糖核苷酸;或约25-50个核糖核苷酸。

tracrRNA应当连同crRNA一起包含于实施方案中,在该实施方案中II型CRISPR体系的Cas9蛋白质包含于RGEN中。本文的tracrRNA包含,在5’-至-3’方向上,(i)与crRNA的重复区(tracrRNA配对序列)退火的序列和(ii)包含茎环的部分。(i)的序列长度可以例如与上文所公开的tracrRNA配对序列长度中的任一个相同或相似(例如,加上或减去1、2、3、4、或5个碱基)。本文的tracrRNA的总长度(即,序列组分[i]和[ii])可为例如至少约30、35、40、45、50、55、60、65、70、75、80、85或90(或者介于30和90之间的任何整数)个核糖核苷酸。tracrRNA还可包括3′端处的1、2、3、4、5或更多个尿嘧啶残基,其可借助于利用转录终止子序列表达tracrRNA而存在。

例如,本文的tracrRNA可源自上文所列的菌种中任一种,Cas9序列可源自所述菌种。合适的tracrRNA序列的示例包括美国专利8697359和Chylinski等人(RNA Biology 10:726-737)中所公开的那些,所述文献以引用方式并入本文。本文的优选tracrRNA可源自链球菌属物种tracrRNA(例如,化脓链球菌、嗜热链球菌)。本文的tracrRNA的其它合适的示例可包括:

SEQ ID NO:58:

uagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc(参见实施例),

SEQ ID NO:59:

uagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaagug,或

SEQ ID NO:60:

uagcaaguuaaaauaaggcuaguccguuauca,

其可源自化脓链球菌tracrRNA。本文的tracrRNA的其它合适的示例可包括:

SEQ ID NO:61:

uaaaucuugcagaagcuacaaagauaaggcuucaugccgaaaucaacacccugucauuuuauggcaggguguuuucguuauuuaa,

SEQ ID NO:62:

ugcagaagcuacaaagauaaggcuucaugccgaaaucaacacccugucauuuuauggcaggguguuuucguuauuua、或

SEQ ID NO:63:

ugcagaagcuacaaagauaaggcuucaugccgaaaucaacacccugucauuuuauggcagggugu,

其可源自嗜热链球菌tracrRNA。

本文的tracrRNA的其它示例为这些tracrRNA SEQ ID NO的变体,其(i)与其具有至少约80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性,和(ii)可用作tracrRNA(例如,5’端序列可与crRNA的tracrRNA配对序列退火,5’端序列下游的序列可形成一个或多个发夹状物,变体tracrRNA可与Cas9蛋白质形成复合物)。

本文所公开的RGEN的RNA组分可包含例如,向导RNA(gRNA),其包含可操作地连接至,或融合至tracrRNA的crRNA。在某些优选的实施方案中,gRNA的crRNA组分在tracrRNA组分的上游(即,此类gRNA包含在5’-至-3’方向上,可操作地连接tracrRNA的crRNA)。如本文(例如,上述实施方案)所公开的任何crRNA和/或tracrRNA(和/或其部分,诸如crRNA重复序列、tracrRNA配对序列、或tracrRNA 5’端序列)可例如包含在gRNA中。

本文gRNA的crRNA组分的tracrRNA配对序列应当能够与tracrRNA组分的5’端退火,从而形成发夹状结构。例如,关于(crRNA组分的)tracrRNA配对序列和(tracrRNA组分的)5’端序列的长度和两者之间互补度百分比的上文公开内容中的任一个可表征gRNA的crRNA和tracrRNA组分。为有利于该退火,crRNA和tracrRNA组分的可操作连接或融合优选包含合适的成环核糖核苷酸序列(即,成环序列可将crRNA和tracrRNA组分连接在一起,从而形成gRNA)。RNA成环序列的合适的示例包括GAAA(SEQ ID NO:43,参见实施例)、CAAA(SEQ ID NO:44)和AAAG(SEQ ID NO:45)。然而,可使用较长或较短的环序列,如可交替环序列。环序列优选包含核糖核苷酸三联体(例如,AAA)和在所述三联体的任一端处的附加核糖核苷酸(例如,C或G)。

本文的gRNA形成发夹状物(“第一发夹状物),其中其(crRNA组分的)tracrRNA配对序列和tracrRNA 5’端序列部分退火。一个或多个(例如、1、2、3或4个)附加发夹状结构可在该第一发夹状物下游形成,这取决于gRNA的tracrRNA组分的序列。因此,gRNA可具有例如至多五个发夹状结构。例如,gRNA还可包括在gRNA序列末端之后的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个残基,其可借助于利用转录终止子序列表达gRNA而存在。这些附加残基可以全部为U残基,或例如至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%为U残基,其取决于终止序列的选择。

可用于所公开发明中的适宜gRNA的非限制性示例可包括:

SEQ ID NO:64:

NNNNNNNNNNNNNNNNNNNNguuuuuguacucucaagauuuaGAAAuaaggcuucaugccgaaaucaacacccugucauuuuauggcaggguguuuucguuauuuaa、

SEQ ID NO:65:

NNNNNNNNNNNNNNNNNNNNguuuuuguacucucaGAAAuaaggcuucaugccgaaaucaacacccugucauuuuauggcaggguguuuucguuauuuaa、

SEQ ID NO:66:

NNNNNNNNNNNNNNNNNNNNguuuuuguacucucaGAAAuaaggcuucaugccgaaaucaacacccugucauuuuauggcagggugu,

SEQ ID NO:67:

NNNNNNNNNNNNNNNNNNNNguuuuuguacucucaGAAAaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc、

SEQ ID NO:68:

NNNNNNNNNNNNNNNNNNNNguuuuagagcuaGAAAaaaggcuaguccguuaucaacuugaaaaagug、

SEQ ID NO:69:

NNNNNNNNNNNNNNNNNNNNguuuuagagcuaGAAAuaaggcuaguccguuauca、或

SEQ ID NO:70:

NNNNNNNNNNNNNNNNNNNNguuuuagagcuaGAAAuaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu(参见实施例)。

在SEQ ID NO:64-70的每一个中,加单下划线的序列表示gRNA的crRNA部分。每个“N”表示合适向导序列的核糖核苷酸碱基(A、U、G或C)。第一块小写字母表示tracrRNA配对序列。第二块小写字母表示gRNA的tracrRNA部分。双下划线序列近似与tracrRNA配对序列退火以形成第一发夹状物的tracrRNA序列的部分。环序列(GAAA,SEQ ID NO:43)以大写字母示出,其可操作地连接每个gRNA的crRNA和tracrRNA部分。本文gRNA的其它示例包括前述gRNA的变体,所述变体(i)与这些序列具有至少约80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性(在该计算中排除向导序列),并且(ii)可用作gRNA,其特异性靶向Cas9蛋白质以与靶DNA序列结合并任选地切口或切割靶DNA序列。

本文的gRNA还可根据具有向导序列(VT结构域),之后是Cas内切核酸酶识别(CER)结构域来表征。CER结构域包含tracrRNA配对序列,之后是tracrRNA序列。可用于本文的CER结构域的示例包括上述SEQ ID NO:64-70中所包含的那些(每个中的CER结构域是VT结构域的N之后的序列)。CER结构域的另一合适示例是SEQ ID NO:1(参见实施例),其在5’-至-3’方向上包含SEQ ID NO:56的tracrRNA配对序列、SEQ ID NO:43的成环序列(GAAA)、以及SEQ ID NO:58的tracrRNA序列。

本发明所公开的RGEN的RNA组分不具有5’端(7-甲基鸟苷酸[m7G]端)。因此,本文的RNA组分不具有在其5’末端处的7-甲基鸟苷酸[m7G]端。本文的RNA组分可具有,例如5′-羟基基团而不是5′-端。另选地,本文的RNA组分可具有,例如5′-磷酸酯而不是5′-端。据信RNA组分可在转录之后在核中更好的积聚,因为5’-封端的RNA(例如,具有5’m7G端的RNA)经受核输出。本文未封端的RNA组分的优选示例包括合适的gRNA、crRNA、和/或tracrRNA。在某些实施方案中,本文的RNA组分缺乏5’端,并且任选地具有替代的5’-羟基基团,这是由于RNA由RNA组分前体的5’端处的核酶序列进行自加工(即,在RNA组分的上游包含核酶序列的前体RNA,诸如gRNA经历核酶介导的自加工以去除核酶序列,从而保留不具有5’端的下游RNA组分)。在某些其它实施方案中,本文的RNA组分不通过由RNA聚合酶III(Pol III)启动子转录来产生。

在某些实施方案中,酵母还包含DNA多核苷酸序列,所述DNA多核苷酸序列包含(i)可操作地连接至(ii)编码RNA组分的核苷酸序列的启动子。该多核苷酸序列由酵母使用以表达与Cas蛋白质复合从而形成RGEN的RNA组分。此类多核苷酸序列可以呈下列形式:例如,质粒、酵母人工染色体(YAC)、粘粒、噬菌粒、细菌人工染色体(BAC)、病毒或线性DNA(例如线性PCR产物)、或可用于将多核苷酸序列转移到非常规酵母细胞中的任何其它类型的载体或构建体。该多核苷酸序列可瞬时(即,不整合到基因组中)或稳定(即,整合到基因组中)存在于本文的酵母细胞中。另外,该多核苷酸序列可包括或缺乏一种或多种合适的标记物序列(例如,选择或表型标记物)。

适用于表达本文RNA组分的包含于多核苷酸序列中的启动子可在非常规酵母细胞中操作,并且可以是例如组成型或诱导型的。在某些方面,启动子可包含强启动子,其是每单位时间可引导相对大量的生产性启动的启动子,和/或驱动比包含酵母的酵母中基因的平均转录水平更高转录水平的启动子。

可用于本文的强启动子的示例包括在公开于以下专利申请公布中的那些:2012/0252079(DGAT2)、2012/0252093(EL1)、2013/0089910(ALK2)、2013/0089911(SPS19)、2006/0019297(GPD和GPM)、201I/0059496(GPD和GPM)、2005/0130280(FBA、FBAIN、FBAINm)、2006/0057690(GPAT)和2010/0068789(YAT1),所述专利文献以引用方式并入本文。合适的强启动子的其它示例包括列于表2中的那些。

表2:强启动子

a该表中的每个参考序列以引用方式并入本文。

尽管上文所列的强启动子来自解脂耶氏酵母,但据信例如来自本文所公开的任何非常规酵母的其相应启动子(例如,同源物)均可以用作强启动子。因此,强启动子可包含例如XPR2、TEF、GPD、GPM、GPDIN、FBA、FBAIN、FBAINm、GPAT、YAT1、EXP1、DGAT2、EL1、ALK2或SPS19启动子。另选地,强启动子诸如对应于前述启动子中任一种的任一种可来自其它类型的酵母(例如,酿酒酵母、粟酒裂殖酵母)(例如,在美国专利申请公布2010/0150871中所公开的强启动子中的任一种,该文献以引用的方式并入本文)。可用于本文的强启动子的其它示例包括PGK1、ADH1、TDH3、TEF1、PHO5、LEU2和GAL1启动子,以及在Velculescu等人(Cell 88:243-251)中所公开的强酵母启动子,其以引用方式并入本文。可用于本文的强启动子的另一个示例可包含SEQ ID NO:12(耶氏酵母FBA1启动子序列)。

在某些实施方案中,本文的启动子可包含RNA聚合酶II(Pol II)启动子。据信,所有上文所列的强启动子均为合适的Pol II启动子的示例。例如,由Pol II启动子转录可涉及至少约12个蛋白质(例如,RPB1-RPN12个蛋白质)的RNA聚合酶II复合物的形成。由本文的Pol II启动子转录的RNA通常为5’-封端的(例如,在5’端处包含m7G基团)。因为本文RNA组分不具有5’端,因此如果其由本文的Pol II启动子表达,则应当采用从RNA组分去除5’端的方式。适用于从本文Pol II-转录的RNA组分有效去除5’端的方式包括适当使用一种或多种核酶(参见下文),例如,组1自剪接内含子和组2自剪接内含子。

例如,编码RNA组分的本文的核苷酸序列还可编码在编码RNA组分的序列上游的核酶。因此,在某些实施方案中,酵母还包含DNA多核苷酸序列,所述DNA多核苷酸序列包含(i)启动子,其可操作地连接至(ii)在5’-至-3’方向上编码核酶和RNA组分的核苷酸序列。由此类多核苷酸序列表达的转录物自催化地去除核酶序列以产生RNA,所述RNA不具有5’端但包含RNA组分序列。这种“自加工”RNA可以包含例如crRNA或gRNA,并且可与Cas蛋白质如Cas9复合,从而形成RGEN。

本文核酶可以为例如锤头(HH)核酶、丁型肝炎病毒(HDV)核酶、I组内含子核酶、RnaseP核酶、或发夹型核酶。本文核酶的其它非限制性示例包括Varkud卫星(VS)核酶、葡糖胺-6-磷酸激活核酶(glmS)、和CPEB3核酶。Lilley(Biochem.Soc.Trans.39:641-646)公开了涉及核酶结构和活性的信息。应当适用于本文的核酶的示例包括公开于EP0707638和美国专利6063566、5580967、5616459和5688670中的核酶,其以引用方式并入本文。

在某些优选的实施方案中,使用锤头核酶。该类型的核酶可以为I型、II型或III型锤头核酶,例如,如Hammann等人(RNA 18:871-885)中所公开的,其以引用方式并入本文。鉴定编码锤头核酶的DNA的多种方式公开于Hammann等人中,其可相应地用于本文。本文的锤头核酶可源自例如病毒、类病毒、植物病毒卫星RNA、原核生物(例如古细菌、蓝藻细菌、酸杆菌)或真核生物诸如植物(例如拟南芥、康乃馨)、原生生物(例如变形虫、眼虫)、真菌(例如曲霉属、解脂耶氏酵母)、两栖动物(例如蝾螈、青蛙)、血吸虫、昆虫(例如蟋蟀)、软体动物、哺乳动物(例如小鼠、人类)、或线虫。

本文的锤头核酶通常包含三个碱基配对的螺旋体,其各自分别被称为螺旋体I、螺旋体II和螺旋体III,由保守序列的短接头分开。锤头核酶(I-III)的三种类型通常基于核酶的5’和3’端包含于哪个螺旋体中。例如,如果锤头核酶序列的5′和3′端有助于茎I,则其可以被称为I型锤头核酶。在三种可能形貌类型中,I型可存在于原核生物、真核生物和RNA植物病原体的基因组中,然而II型锤头核酶仅描述于原核生物中,并且III型锤头核酶大多数存在于植物、植物病原体和原核生物中。在某些实施方案中,锤头核酶为I型锤头核酶。

在某些实施方案中,编码锤头核酶的序列可包含至少约40、50、60、70、80、90、100、110、120、130、140或150个(或者介于40和150之间的任何整数)核苷酸,40-100个核苷酸,或40-60个核苷酸。

编码锤头核酶的序列在编码RNA组分的序列的上游。编码本文的锤头核酶的序列可以为例如紧接编码RNA组分的向导序列(例如,向导序列可以为crRNA或gRNA的向导序列)的序列的5’,或在5’的至少2、3、4、5、6、7、8、9或10个核苷酸处。锤头核酶的前5、6、7、8、9、10、11、12、13、14或15个核糖核苷酸应当分别与紧邻锤头核酶序列下游的序列的第一相同编号的核糖核苷酸互补。例如,如果本文的多核苷酸序列编码包含紧邻RNA组分的向导序列上游的锤头核酶序列的RNA,则核酶的例如前6个核糖核苷酸可与向导序列的前6个核糖核苷酸互补。在该示例中,锤头核酶可切割紧邻向导序列的第一位置上游的RNA转录物(或以另一方式来说,锤头核酶可切割紧邻核酶序列下游的RNA转录物)。该逻辑同样适用于其它前述示例性实施方案。例如,如果本文的多核苷酸序列编码包含为RNA组分的向导序列上游的8个残基的锤头核酶序列的RNA(例如,存在8个残基间隔序列),则核酶的例如前6个核糖核苷酸可与紧接核酶序列的3’的6个核糖核苷酸互补。在该示例中,锤头核酶可切割紧邻核酶序列下游的RNA转录物。又如,如果本文的多核苷酸序列编码包含紧邻RNA组分的向导序列上游的锤头核酶序列的RNA,则核酶的例如前10个核糖核苷酸可与向导序列的前10个核糖核苷酸互补。在该示例中,锤头核酶可切割紧邻向导序列的第一位置上游的RNA转录物(或以另一方式来说,锤头核酶可切割紧邻核酶序列下游的RNA转录物)。

锤头核酶序列的示例如下表示:

NNNNNNcugaugaguccgugaggacgaauaagc(SEQ ID NO:15,N可以为A、U、C或G;参见实施例)。SEQ ID NO:15的前6个残基可被设计成与紧接由本文DNA多核苷酸表达的RNA转录物中的SEQ ID NO:15之后的(例如,本文所公开的crRNA或gRNA向导序列的)前6个残基互补(退火)。核酶可切割紧接SEQ ID NO:15之后的转录物。虽然SEQ ID NO:15示出具有用于与紧接SEQ ID NO:15之后的序列残基退火的6个残基(“N”),但出于该目的,在该核酶的开始处可具有5至15个“N”残基。应注意,在RNA转录物包含SEQ ID NO:15的情况下,(i)锤头核酶的螺旋体I可通过N残基与紧接转录物中SEQ ID NO:15之后的前6个残基退火而形成,(ii)螺旋体II可通过由单下划线指示的互补序列的退火形成,并且(iii)螺旋体III可通过由双下划线指示的互补序列退火形成。因此,在某些实施方案中,锤头核酶可以为SEQ ID NO:15的变体,其具有(i)与SEQ ID NO:15至少约80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性(在计算中排除“N”序列);以及(ii)与彼此退火以形成螺旋体II和III的SEQ ID NO:15的单下划线和双下划线区对齐的区域(螺旋体I由适当选择“N”残基形成)。

可连接至SEQ ID NO:15的序列的示例及其各种实施方案(上述)包括包含SEQ ID NO:64-70中一个的gRNA。

本文编码包含连接至RNA组分的5’锤头核酶的RNA序列的DNA多核苷酸(本文的“核酶-RNA组分盒”)可被设计成驱动5’-端紧接锤头核酶序列起始的转录物的转录(即核酶序列在转录起始位点处起始)。另选地,DNA多核苷酸可被设计成驱动具有核酶-RNA组分盒上游的非核酶序列的转录物的转录。例如,此类5’非核酶转录物序列可短至几个核苷酸(1-10个)长,最多长达5000-20000个核苷酸(当核酶从RNA组分切割自身时,从RNA组分去除核酶的该5’序列)。

在某些实施方案中,包含核酶-RNA组分盒的DNA多核苷酸可包含RNA组分序列下游的合适的转录终止序列。可用于本文中的转录终止序列的示例公开于美国专利申请公布2014/0186906中,该专利以引用方式并入本文。例如,可使用酿酒酵母Sup4基因转录终止序列(例如,SEQ ID NO:8)。此类实施方案通常不包含位于核酶-RNA组分盒下游的核酶序列。另外,取决于终止序列的选择,此类实施方案通常包含在RNA组分序列的端部之后的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个残基。这些附加残基可以全部为U残基,或例如至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%为U残基,其取决于终止序列的选择。另选地,核酶序列(例如,锤头核酶或HDV核酶)可以为RNA组分序列的3’(例如,1、2、3、4、5、6、7、8、9、10或更多个核苷酸);此类实施方案中的RNA组分序列可侧接有上游和下游核酶。3’核酶序列可相应地定位成使得其从RNA组分序列切割自身;此类切割可使得转录物正好在RNA组分序列的端部处终止,或具有在RNA组分序列的端部之后例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或更多个残基。

在某些实施方案中,DNA多核苷酸可包含(i)启动子,所述启动子可操作地连接至(ii)包含多于一个核酶-RNA组分盒(即,串联盒)的序列。由此类DNA多核苷酸表达的转录物可具有例如2、3、4、5、6、7、8、9、10或更多个核酶-RNA组分盒。在每个RNA组分序列之后可任选地包含3’核酶序列(例如,如上所述)以允许从下游转录物序列切割和分离RNA组分。此类实施方案中的每个RNA组分通常被设计成将本文RGEN引导至独特的DNA靶位点。因此,此类DNA多核苷酸可相应地用于非常规酵母中以同时靶向例如多个不同的靶位点;此类使用可任选地表征为多路方法。连接至RNA组分(其连接至3’核酶)的5’锤头核酶可在本文中被称为“核酶-RNA组分-核酶盒”。可设计本文用于表达包含串联核酶-RNA组分-核酶盒的转录物的DNA多核苷酸,使得在每个盒之间存在约10、20、30、40、50、60、70、80、90、100或更多个核苷酸(例如,非编码间隔序列)。每个盒之间的距离可以相同或不同。

虽然上述实施方案中某些已经根据锤头核酶序列来进行描述,但此类实施方案还可相应地根据本文任何其它核酶序列(例如,HDV核酶),而不是锤头核酶序列来表征。本领域普通技术人员应当理解如何定位此类其它核酶序列以在特定位点处切割。

在某些实施方案中,酵母还包含DNA多核苷酸序列,所述DNA多核苷酸序列包含(i)启动子,所述启动子可操作地连接至(ii)编码Cas蛋白质(例如Cas9)的核苷酸序列。该多核苷酸序列由酵母使用以表达与RNA组分复合从而形成RGEN的Cas蛋白质。此类多核苷酸序列可以呈下列形式:质粒、YAC、粘粒、噬菌粒、BAC、病毒或线性DNA(例如线性PCR产物)、或可用于将多核苷酸序列转移到非常规酵母细胞中的任何其它类型的载体或构建体。例如,可使用本文所公开的任何Pol II启动子。上文关于用于表达RNA组分的DNA多核苷酸序列所公开的任何特征因此可应用于用于表达Cas蛋白质的DNA多核苷酸序列。该多核苷酸序列可瞬时(即,不整合到基因组中)或稳定(即,整合到基因组中)存在于本文的酵母细胞中。在其它方面,除了用于表达Cas蛋白质的DNA多核苷酸之外,酵母还可具有用于表达RNA组分的DNA多核苷酸(例如,如上所述的)。这些DNA多核苷酸均可以对酵母是稳定或瞬时的;另选地,用于表达Cas蛋白质的DNA多核苷酸可以是稳定的,并且用于表达RNA组分的DNA多核苷酸可以是瞬时的(或反之亦然)。

DNA多核苷酸序列可另选地为用于表达Cas蛋白质和适用于在酵母细胞中提供RGEN的RNA组分两者的DNA多核苷酸序列。此类DNA多核苷酸可包含,例如,(i)可操作地连接至编码(RGEN的)RNA组分的核苷酸序列的启动子(RNA组分盒),和(ii)可操作地连接至编码Cas蛋白质(例如,Cas9)的核苷酸序列的启动子(Cas盒)。关于用于表达Cas蛋白质或RNA组分的DNA多核苷酸的上述特征中的任一个可例如应用于用于在非常规酵母细胞中表达Cas蛋白质和合适的RNA组分两者的DNA多核苷酸序列。另外,本文所公开的Cas蛋白质和RNA组分(例如,crRNA或gRNA)中的任一个可由该DNA多核苷酸序列表达。在某些实施方案中,一种或多种RNA组分和/或Cas盒可包含在DNA多核苷酸序列内。在其它方面,一个或多个RNA组分可如上所述串联表达。用于Cas盒和RNA盒的启动子可以相同或不同。设想此类DNA多核苷酸序列可用于在非常规酵母和常规酵母两者中表达RGEN。

公开的发明还涉及将RNA引导的内切核酸酶(RGEN)靶向到非常规酵母中的染色体或附加体中的靶位点序列的方法。该方法包括向酵母的核提供RGEN,所述RGEN包含至少一种不具有5’端的RNA组分,其中所述RNA组分包含与靶位点序列互补的序列,并且其中RGEN结合到,并任选地切割全部或部分靶位点序列。

例如,可使用关于方法特征中每一个(例如,酵母类型、RGEN、RNA组分等)的上文所公开的实施方案或下文实施例中的任一个来进行该靶向方法。因此,上文或实施例中所公开的特征中的任一个,或这些特征的任何组合可适当用于表征本文靶向方法的实施方案。以下靶向方法特征是示例。

在本文靶向方法的某些实施方案中,非常规酵母可以为以下属中任一个的成员:耶氏酵母属、毕赤酵母属、许旺氏酵母属、克鲁维酵母属、Arxula属、丝孢酵母属、假丝酵母属、黑粉菌属、球拟酵母属、接合酵母属、三角酵母属、隐球酵母属、红酵母属、法夫酵母属、掷孢酵母属和管囊酵母属。解脂耶氏酵母是本文的合适的耶氏酵母。可用于靶向方法的非常规酵母的其它非限制性示例公开于本文中。

适用于本文靶向方法的RGEN可包含I型、II型或III型CRISPR体系的Cas蛋白质。Cas9蛋白质可用于某些实施方案中,诸如链球菌Cas9。适用于靶向方法中的链球菌Cas9蛋白质的示例包括包含源自下列的氨基酸序列的Cas9蛋白质:化脓链球菌、嗜热链球菌、肺炎链球菌、无乳链球菌、副溶血链球菌、口腔链球菌、唾液链球菌、猕猴链球菌、停乳链球菌、咽峡炎链球菌、星座链球菌、S.pseudoporcinus或变形链球菌Cas9蛋白质。可用于本文靶向方法的RGEN和Cas9蛋白质的其它非限制性示例公开于本文中。例如,可使用可切割DNA靶序列处的一个或两条链的RGEN。

用于本文靶向方法的RGEN的RNA组分可包含例如,gRNA,其包含可操作地连接至,或融合至tracrRNA的crRNA。如本文所公开的任何crRNA和/或tracrRNA(和/或其部分,诸如crRNA配对序列、或tracrRNA5’端序列)可例如包含在gRNA中。另外,例如,本文所公开的任何gRNA可用于靶向方法。

例如,PAM(前间区序列邻近基序)序列可邻近靶位点序列。在本文靶向方法的某些实施方案中,PAM序列紧接靶位点序列的下游、或在靶位点序列的下游的2个或3个核苷酸内,所述靶位点序列与靶位点中的链互补,所述靶位点中的链继而与RNA组分向导序列互补。在本文的实施方案中,其中RGEN为与RNA组分复合的内切核酸酶活性Cas9蛋白质,Cas9按照RNA组分引导而结合到靶序列,并切割紧邻PAM序列上游的第三核苷酸位置的5’的两条链。合适的PAM序列的示例包括化脓链球菌(NGG[SEQ ID NO:47])和嗜热链球菌(NNAGAA[SEQ ID NO:48])PAM序列,其可分别用于利用源自每个物种的Cas9蛋白质靶向。另外,例如,如本文所公开的任何PAM序列可用于靶向方法。

在本文的靶向方法的某些实施方案中,酵母还包含DNA多核苷酸序列,所述DNA多核苷酸序列包含(i)启动子,所述启动子可操作地连接至(ii)编码RNA组分的核苷酸序列。利用此类DNA多核苷酸可向酵母的核提供RGEN的RNA组分,因为RNA组分由DNA多核苷酸转录。适用于在酵母核中表达(RGEN)的RNA组分的DNA多核苷酸序列的示例在本文中公开。如本文所公开的启动子中任一种可用于此类DNA多核苷酸序列中,例如,强启动子和/或包含Pol II启动子序列的启动子。在某些实施方案中,编码RNA组分的DNA多核苷酸可用于在酵母中提供RNA组分,所述RNA组分已被工程化来表达Cas蛋白质(例如,稳定的Cas表达)。

例如,编码RNA组分的本文的核苷酸序列还可编码在编码RNA组分的序列上游的核酶。因此,在本文靶向方法的某些实施方案中,酵母可包含DNA多核苷酸序列,所述DNA多核苷酸序列包含(i)启动子,所述启动子可操作地连接至(ii)在5’-至-3’方向上编码核酶和RNA组分的核苷酸序列。利用此类DNA多核苷酸可向酵母的核提供RGEN的RNA组分,因为RNA组分由DNA多核苷酸转录。本文核酶可以为例如锤头核酶、丁型肝炎病毒(HDV)核酶、I组内含子核酶、RnaseP核酶、或发夹型核酶。例如,如本文所公开的任何核酶,以及如本文所公开的编码连接至RNA组分的核酶的任何多核苷酸序列可用于靶向方法。

在本文靶向方法的某些实施方案中,酵母还包含DNA多核苷酸序列,所述DNA多核苷酸序列包含(i)启动子,所述启动子可操作地连接至(ii)编码Cas蛋白质(例如Cas9)的核苷酸序列。利用此类DNA多核苷酸,可在酵母中提供RGEN的Cas蛋白质组分。适用于在酵母中表达(RGEN的)Cas蛋白质组分的DNA多核苷酸序列的示例在本文中公开。如本文所公开的启动子中任一种可用于此类DNA多核苷酸序列中,例如,强启动子。

在靶向方法的某些实施方案中,还可向酵母提供包含与DNA靶位点序列处或附近的序列同源的至少一个序列的供体多核苷酸(连同提供在靶位点序列处切口或切割的RGEN)。合适的示例包括具有同源臂的供体多核苷酸。例如,如本文所公开的任何供体多核苷酸可用于靶向方法中。该方法的此类实施方案通常涉及供体多核苷酸和靶序列之间的HR(在靶序列的RGEN介导的切口或切割之后);因此,这些方法还可任选地被称为在非常规酵母中进行HR的方法。本文公开了可通过该方法进行的HR策略的示例。用于在酵母细胞中靶向的供体DHA多核苷酸的合适量可以为至少约300、400、500、600、700或800分子的供体DNA/酵母细胞。

包含本文所述用于表达RGEN组分的DNA多核苷酸的任何构建体或载体可通过任何标准技术引入非常规酵母细胞中。这些技术包括例如转化(例如,乙酸锂转化(Methods in Enzymology,194:186-187)、基因枪轰击、电穿孔和显微注射。例如,美国专利4880741和5071764,和Chen等人(Appl.Microbiol.Biotechnol.48:232-235),上述文献以引用方式并入本文,描述了用于解脂耶氏酵母的DNA转化技术。

可进行本文靶向方法,以用于在非常规酵母中形成插入缺失的目的。此类方法可如上文所公开的进行,但不另外提供可在靶DNA位点处或附近经历HR的供体DNA多核苷酸(即,在该方法中诱导NHEJ)。可形成的插入缺失的示例在本文中公开。插入缺失的尺寸可以为例如1、2、3、4、5、6、7、8、9、10或更多个碱基。在某些实施方案中,插入缺失可以甚至更大,诸如至少约20、30、40、50、60、70、80、90、100、110、120、130、140或150个碱基。在其它实施方案中,插入或缺失可以为至少约500、750、1000或1500个碱基。在某些实施方案中,当试图形成插入缺失时,单碱基替换可替代地在靶位点序列中形成。因此,可进行本文的靶向方法以例如用于形成单碱基替换的目的。

在目的在于插入缺失形成的本文靶向方法的某些实施方案中,非常规酵母(例如,解脂耶氏酵母)中的插入缺失形成频率显著高于可在常规酵母诸如酿酒酵母中使用相同或相似靶向策略观察到的。例如,虽然常规酵母中的插入缺失形成频率可以为约0.0001至0.001(DiCarlo等人,Nucleic Acids Res.41:4336-4343),但本文非常规酵母中的频率可以为至少约0.05、0.10、0.15、0.20、0.25、0.30、0.35、0.40、0.45、0.50、0.55、0.60、0.65、0.70、0.75或0.80。因此,在本文非常规剂酵母中的插入缺失形成频率可以比可在常规酵母中使用相同或相似Cas介导的靶向策略观察到的高例如至少约50、100、250、500、750、1000、2000、4000或8000倍。这些实施方案的某些方面可关于不包括供体DNA,和/或其中RGEN组分(Cas和合适的RNA组分)由相同载体/构建体表达的靶向方法。

本文的靶向方法可例如以在所述方法中靶向2个或更多个DNA靶位点的方式来进行。此类方法可包括向酵母提供DNA多核苷酸,其表达包含如本文所公开的串联核酶-RNA组成盒(例如,串联核酶-RNA组分-核酶盒)的转录物。该方法可靶向非常接近相同序列的DNA位点(例如,启动子或开放阅读框,和/或彼此间隔的位点(例如,在不同基因和/或染色体中))。取决于期望的靶向结果,此类方法可在具有(对于HR)或不具有(对于导致插入缺失和/或碱基替换的NHEJ)合适的供体DNA多核苷酸的情况下进行。

在某些实施方案中,可进行靶向方法以破坏编码蛋白质和非编码RNA的一个或多个DNA多核苷酸序列。可被靶向用于破坏的此类序列的示例为编码标记物的序列(例如,标记基因)。本文标记物的非限制性示例包括可筛选标记物和可选择标记物。本文的可筛选标记物可以为在合适条件下使酵母在视觉上不同的标记物。可筛选标记物的示例包括编码β-葡糖醛酸糖苷酶(GUS)、β-半乳糖苷酶(lacZ)和荧光蛋白(例如GFP、RFP、YFP、BFP)的多核苷酸。本文的可选择标记物可以为使得酵母对选择性试剂或选择性环境具有抗性的标记物。可选择标记物的示例为营养缺陷型标记物,诸如HIS3、LEU2、TRP1、MET15或URA3,其使得酵母在不存在外源提供的组氨酸、亮氨酸、色氨酸、甲硫氨酸或尿嘧啶的情况下存活。可选择标记物的其它示例是抗生素(抗真菌)-抗性标记物,诸如对潮霉素B、诺尔丝菌素、腐草霉素、嘌呤霉素或新霉素(例如G418)具有酵母抗性的那些。

在某些实施方案中,破坏标记物的至少一个目的可以是用于标记物再循环。标记物再循环是一种方法,例如,包括(i)用标记物和异源DNA序列转化酵母,(ii)选择包含标记物和异源DNA序列的经转化酵母(其中标记物可选择酵母通常具有包含异源DNA序列的更高机会),(iii)破坏标记物,并且然后根据需要重复步骤(i)-(iii)多次(使用相同的标记物,但每次循环使用不同的异源DNA序列)以利用多个异源DNA序列转化酵母。在该过程中,一个或多个异源序列可包含呈供体多核苷酸形式的标记物本身(例如,侧接有用于靶向特定基因座的同源臂的标记物)。本文的标记物再循环方法的示例包括使用URA3作为非常规酵母诸如解脂耶氏酵母中的标记物的那些。

本文所公开的组合物和方法的非限制性示例如下:

1.一种非常规酵母,其包含至少一种RNA引导的内切核酸酶(RGEN),所述RNA引导的内切核酸酶包含至少一种不具有5’-端的RNA组分,其中所述RNA组分包含与酵母中的染色体或附加体上的靶位点序列互补的序列,其中所述RGEN可结合到全部或部分靶位点序列。

2.根据实施方案1所述的非常规酵母,其中所述RGEN可结合到并切割全部或部分靶位点序列。

3.根据实施方案1所述的酵母,其中所述酵母为选自下列属的成员:耶氏酵母属,毕赤酵母属、许旺氏酵母属、克鲁维酵母属、Arxula属、丝孢酵母属、假丝酵母属、黑粉菌属、球拟酵母属、接合酵母属、三角酵母属、隐球酵母属、红酵母属性、法夫酵母属、掷孢酵母属和管囊酵母属。

4.根据实施方案1所述的酵母,其中所述RGEN包含CRISPR(聚集状规则间隔的短回文重复序列)-缔合的(Cas)蛋白质-9(Cas9)氨基酸序列。

5.根据实施方案4所述的酵母,其中所述Cas9蛋白质为链球菌Cas9蛋白质。

6.根据实施方案4所述的酵母,其中所述RNA组分包含向导RNA(gRNA),所述向导RNA包含可操作地连接至反式激活CRISPR RNA(tracrRNA)的CRISPR RNA(crRNA)。

7.根据实施方案4所述的酵母,其中PAM(前间区序列邻近基序)序列邻近靶位点序列。

8.一种非常规酵母,其包含多核苷酸序列,所述多核苷酸序列包含可操作地连接至至少一个核苷酸序列的启动子,其中所述核苷酸序列包含编码在编码RNA组分的DNA序列上游的核酶的DNA序列,其中所述RNA组分包含与酵母中染色体或附加体上的靶位点序列互补的可变靶向结构域,其中所述RNA组分可形成RNA-引导的内切核酸酶(RGEN),其中所述RGEN可结合到全部或部分靶位点序列。

9.根据实施方案8所述的非常规酵母,其中所述RGEN可结合到并切割全部或部分靶位点序列。

10.根据实施方案8所述的非常规酵母,其中由核苷酸序列转录的RNA自催化地去除核酶以产生所述RNA组分,其中所述RNA组分不具有5’端。

11.根据实施方案10所述的非常规酵母,其中所述核酶为锤头核酶、丁型肝炎病毒核酶、I组内含子核酶、RnaseP核酶、或发夹型核酶。

12.根据实施方案8所述的非常规酵母,其中由核苷酸序列转录的RNA不自催化地去除核酶以产生不具有5’端的核酶-RNA组分融合分子。

13.根据实施方案12所述的非常规酵母,其中所述核酶为HDV核酶。

14.根据实施方案8所述的非常规酵母,其中所述启动子为强启动子。

15.根据实施方案8所述的非常规酵母,其中所述启动子包含Poi II启动子序列。

16.一种将RNA引导的内切核酸酶(RGEN)靶向到非常规酵母中的染色体或附加体上的靶位点序列的方法,所述方法包括向所述酵母提供RGEN,所述RGEN包含至少一种不具有5’端的RNA组分,其中所述RNA组分包含与靶位点序列互补的序列,其中所述RGEN结合到全部或部分靶位点序列。

17.根据实施方案16所述的方法,其中所述RGEN可结合到并切割全部或部分靶位点序列。

18.一种将RNA引导的内切核酸酶(RGEN)靶向到非常规酵母中的染色体或附加体上的靶位点序列的方法,所述方法包括向所述酵母提供RGEN,所述RGEN包含至少一个核酶-RNA组分融合分子,其中所述RNA组分包含与靶位点序列互补的序列,其中所述RGEN结合到全部或部分靶位点序列。

19.根据实施方案18所述的方法,其中所述RGEN可结合到并切割全部或部分靶位点序列。

20.一种将RNA引导的内切核酸酶(RGEN)靶向到非常规酵母中的染色体或附加体上的靶位点序列的方法,所述方法包括向所述酵母提供第一重组DNA构建体,所述第一重组DNA构建体包含编码Cas内切核酸酶的DNA序列,和至少第二重组DNA构建体,所述第二重组DNA构建体包含编码RNA组分上游的核酶的DNA序列,其中由所述第二重组DNA构建体转录的RNA自催化地去除核酶以产生所述RNA组分,其中所述RNA组分和Cas9内切核酸酶可形成RGEN,所述RGEN可结合到全部或部分靶位点序列。

21.根据实施方案20所述的方法,其中所述RGEN可结合到并切割全部或部分靶位点序列。

22.一种将RNA引导的内切核酸酶(RGEN)靶向到非常规酵母中的染色体或附加体上的靶位点序列的方法,所述方法包括向所述酵母提供第一重组DNA构建体,所述第一重组DNA构建体包含编码Cas内切核酸酶的DNA序列,和至少第二重组DNA构建体,所述第二重组DNA构建体包含编码核酶-RNA组分融合分子的DNA序列,其中所述核酶-RNA组分融合分子和Cas9内切核酸酶可形成RGEN,所述RGEN可结合到并任选地切割全部或部分靶位点序列。

23.根据实施方案22所述的方法,其中所述RGEN可结合到并切割全部或部分靶位点序列。

24.一种用于修饰非常规酵母中的染色体或附加体上的靶位点的方法,所述方法包括向非常规酵母提供第一重组DNA构建体,所述第一重组DNA构建体包含编码Cas内切核酸酶的DNA序列,和第二重组DNA构建体,所述第二重组DNA构建体包含编码RNA组分上游的核酶的DNA序列,其中由所述第二重组DNA构建体转录的RNA自催化地去除核酶以产生不具有5’端的所述RNA组分,其中所述Cas9内切核酸酶在所述靶位点处引入单链或双链断裂。

25.一种用于修饰非常规酵母中的染色体或附加体上的靶位点的方法,所述方法包括向非常规酵母提供第一重组DNA构建体,所述第一重组DNA构建体包含编码Cas内切核酸酶的DNA序列,和第二重组DNA构建体,所述第二重组DNA构建体包含编码不具有5’端的核酶-RNA组分融合分子的DNA序列,其中所述核酶-RNA组分融合分子和Cas9内切核酸酶可形成RGEN,所述RGEN在所述靶位点处引入单链或双链断裂。

26.一种用于修饰非常规酵母中的染色体或附加体上的多个靶位点的方法,所述方法包括向非常规酵母提供至少第一重组DNA构建体,所述第一重组DNA构建体包含编码Cas内切核酸酶的DNA序列,和至少第二重组DNA构建体,所述第二重组DNA构建体包含可操作地连接至至少一个多核苷酸的启动子,其中所述至少一个多核苷酸编码包含RNA组分上游的核酶的RNA分子,其中所述RNA分子自催化地去除核酶以产生所述RNA组分,其中Cas9内切核酸酶在所述靶位点处引入单链或双链断裂。

27.一种用于修饰非常规酵母中的染色体或附加体上的多个靶位点的方法,所述方法包括向非常规酵母提供至少第一重组DNA构建体,所述第一重组DNA构建体包含编码Cas内切核酸酶的DNA序列,和至少第二重组DNA构建体,所述第二重组DNA构建体包含可操作地连接至至少一个多核苷酸的启动子,其中所述至少一个多核苷酸编码核酶-RNA组分融合分子,其中所述核酶-RNA组分融合分子和Cas9内切核酸酶可形成RGEN,所述RGEN在所述靶位点处引入单链或双链断裂。

28.根据实施方案22-25中任一项所述的方法,所述方法还包括鉴定在所述靶位点处具有修饰的至少一种非常规酵母细胞,其中所述修饰包括所述靶位点中的一个或多个核苷酸的至少一个缺失、添加或替换。

29.根据实施方案24-28中任一项所述的方法,所述方法还包括向所述酵母提供供体DNA,其中所述供体DNA包含目的多核苷酸。

30.根据实施方案29所述的方法,所述方法还包括鉴定在其染色体或附加体中包含整合在所述靶位点处的目的多核苷酸的至少一种酵母细胞。

31.一种用于编辑非常规酵母中的染色体或附加体上的核苷酸序列的方法,所述方法包括向非常规酵母提供多核苷酸修饰模板DNA,第一重组DNA构建体,所述第一重组DNA构建体包含编码Cas内切核酸酶的DNA序列,和第二重组DNA构建体,所述第二重组DNA构建体包含编码RNA组分上游的核酶的DNA序列,其中由第二重组DNA构建体转录的RNA自催化地去除核酶以产生不具有5’端的所述RNA组分,其中所述Cas9内切核酸酶在所述酵母的染色体或附加体中的靶位点处引入单链或双链断裂,其中所述多核苷酸修饰模板DNA包含所述核苷酸序列的至少一个核苷酸修饰。

32.一种用于编辑非常规酵母中的染色体或附加体上的核苷酸序列的方法,所述方法包括向非常规酵母提供多核苷酸修饰模板DNA,第一重组DNA构建体,所述第一重组DNA构建体包含编码Cas内切核酸酶的DNA序列,和第二重组DNA构建体,所述第二重组DNA构建体包含编码不具有5’端的核酶-RNA组分融合分子的DNA序列,其中所述核酶-RNA组分融合分子和Cas9内切核酸酶可形成RGEN,所述RGEN在所述酵母的染色体或附加体中的靶位点处引入单链或双链断裂,其中所述多核苷酸修饰模板DNA包含所述核苷酸序列的至少一个核苷酸修饰。

33.一种用于编辑非常规酵母中的染色体或附加体上的核苷酸序列的方法,所述方法包括向非常规酵母提供至少一种多核苷酸修饰模板DNA、至少第一重组DNA构建体,所述第一重组DNA构建体包含编码Cas内切核酸酶的DNA序列,和至少第二重组DNA构建体,所述第二重组DNA构建体包含可操作地连接至至少一个多核苷酸的启动子,其中所述至少一个多核苷酸编码包含RNA组分上游的核酶的RNA分子,其中所述RNA分子自催化地去除核酶以产生不具有5’端的所述RNA组分,其中所述Cas9内切核酸酶在所述酵母的染色体或附加体中的靶位点处引入单链或双链断裂,其中所述多核苷酸修饰模板DNA包含所述核苷酸序列的至少一个核苷酸修饰。

34.一种用于编辑非常规酵母中的染色体或附加体上的核苷酸序列的方法,所述方法包括向非常规酵母提供至少一个多核苷酸修饰模板DNA、至少第一重组DNA构建体,所述第一重组DNA构建体包含编码Cas内切核酸酶的DNA序列的,和至少第二重组DNA构建体,所述第二重组DNA构建体包含可操作地连接至至少一个多核苷酸的启动子,其中所述至少一个多核苷酸编码不具有5’端的核酶-RNA组分融合分子,其中所述核酶-RNA组分融合分子和Cas9内切核酸酶可形成RGEN,所述RGEN在所述酵母的染色体或附加体中的靶位点处引入单链或双链断裂,其中所述多核苷酸修饰模板DNA包含所述核苷酸序列的至少一个核苷酸修饰。

35.根据实施方案24-34中任一项所述的方法,其中所述第一重组DNA和第二重组DNA位于相同质粒上。

36.根据实施方案24-34中任一项所述的方法,其中所述第一重组DNA和第二重组DNA位于独立的质粒上。

37.一种用于使非常规酵母中的染色体或附加体上的核苷酸序列沉默的方法,所述方法包括向非常规酵母提供至少第一重组DNA构建体,所述第一重组DNA构建体包含编码失活的Cas内切核酸酶的DNA序列,和至少第二重组DNA构建体,所述第二重组DNA构建体包含可操作地连接至至少一个多核苷酸的启动子,其中至少一个多核苷酸编码不具有5’端的核酶-RNA组分融合分子,其中所述核酶-RNA组分融合分子和失活的Cas9内切核酸酶可形成RGEN,所述RGEN结合到所述酵母的染色体或附加体中的所述核苷酸序列,从而阻断所述核苷酸序列的转录。

38.一种用于生产非常规酵母中的基因修饰用多重向导RNA的高通量方法,所述方法包括:

a)提供重组DNA构建体,其包含以5’至3’的顺序可操作地连接至下列的启动子:编码核酶的第一DNA序列、编码反向选择剂的第二DNA序列、编码向导RNA的CER结构域的第三DNA序列和终止序列;

b)向(a)的重组DNA构建体提供至少一个寡核苷酸双链体,其中所述寡核苷酸双链体源自包含能够编码向导RNA靶序列的可变靶向结构域(VT)的DNA序列的第一单链寡核苷酸与包含编码可变靶向结构域的DNA序列的互补序列的第二单链寡核苷酸的组合;

c)将(a)的反向选择剂与(b)的至少一个寡双链体交换,从而形成重组DNA构建体库,其各自包含能够编码向导RNA的可变靶向结构域的DNA序列;以及,

d)转录(c)的重组DNA构建体库,从而形成核酶-向导RNA分子库。

39.根据实施方案38所述的方法,所述方法还包括诱导核酶-向导RNA分子库使得所述分子自催化地去除核酶和核酶上游的任何RNA序列,以产生不包含5’端的向导RNA分子库。

40.根据实施方案38所述的方法,所述方法还包括诱导核酶-向导RNA分子库使得所述分子切割核酶上游的任何RNA序列,以产生不包含5’端的核酶-gRNA融合分子。

41.一种重组DNA序列,其包含(i)聚合酶II启动子,所述聚合酶II启动子可操作地连接至(ii)编码核酶和向导RNA的核苷酸序列,其中所述核酶在所述向导RNA上游,其中由(ii)的核苷酸序列转录的RNA自催化地去除核酶以产生所述向导RNA,并且其中所述向导RNA可形成RGEN,所述RGEN可识别、结合到、和任选地切割非常规酵母的基因组中的靶位点。

42.一种重组RNA序列,其包含核酶和向导RNA,其中所述核酶在所述向导RNA的上游,其中所述核酶可被自催化地去除以产生所述向导RNA,并且其中所述向导RNA可形成RGEN,所述RGEN可识别、结合到和任选地切割非常规酵母的基因组中的靶位点。

43.一种重组DNA序列,其包含(i)聚合酶II启动子,所述聚合酶II启动子可操作地连接至(ii)编码核酶和向导RNA的核苷酸序列,其中所述核酶在所述向导RNA的上游,其中由(ii)的核苷酸序列转录的RNA产生核酶-向导RNA融合分子,并且其中所述核酶-向导融合分子可形成RGEN,所述RGEN可识别、结合到和任选地切割非常规酵母的基因组中的靶位点。

44.一种重组RNA序列,其包含核酶-向导RNA融合分子,其中所述核酶-向导RNA融合分子可形成RGEN,所述RGEN可识别、结合到和任选地切割非常规酵母的基因组中的靶位点。

实施例

所公开的本发明将在以下的实施例中进一步阐述。应该理解,尽管这些实施例说明了本发明的某些优选方面,但仅是以例证的方式给出的。通过上述论述和这些实施例,本领域的技术人员可确定本发明的必要特征,并且在不脱离本发明的实质和范围内的前提下,可对本发明进行各种变化和修改以适应多种用途和条件。

实施例1

由耶氏酵母中的Pol III启动子表达的sgRNA不将Cas9引导至靶位点并介导DNA切 割

该示例公开了被设计用于表达靶向Leu2基因座的解脂耶氏酵母中的sgRNA和Cas9蛋白质的载体和盒。如果该酵母中产生的sgRNA和Cas9可与靶位点相互作用、找到并切割靶位点,则突变应当经由靶位点处的易错非同源末端接合(NHEJ)产生。

图1示出了sgRNA分子,其为单个RNA分子,所述RNA分子包含两个区域,可变靶向结构域(VT)(向导序列)和Cas内切核酸酶识别结构域(CER)。VT区可以为具有与靶核酸分子同一性的RNA多核苷酸的20聚体。VT结构域指定了用于在位于PAM基序(例如NGG,SEQ ID NO:47)的5’的靶位点中切割的靶位点。CER结构域与Cas9蛋白质相互作用并使得VT结构域相互作用并引导Cas9蛋白质切割(Jinek等人,Science 337:816-821)。VT结构域和CER结构域两者都是sgRNA的功能所需要的

编码将Cas9靶向到耶氏酵母的LEU2基因座的编码区中的三个独立靶位点(Leu2-1、Leu2-2、Leu2-3)的VT结构域的DNA序列列于表3中。表3还列出了编码靶向耶氏酵母CAN1基因座的编码区的VT结构域的DNA序列。

表3

编码用于利用Cas9靶向耶氏酵母中的LEU2或CAN1基因座的sgRNAVT结构域的DNA 序列

Leu2-1a(SEQ ID NO:2) TCCAAGAAGATTGTTCTTCT Leu2-2a(SEQ ID NO:3) CTCCGTCATCCCCGGTTCTC Leu2-3a(SEQ ID NO:4) CGGCGACTTCTGTGGCCCCG Can1-1b(SEQ ID NO:17) TCAAACGATTACCCACCCTC

a由Leu2-1、Leu2-2和Leu2-3靶向的LEU2基因位点分别具有CGG、TGG或AGG作为PAM位点。

b由Can1-1靶向的CAN1基因位点具有CGG作为PAM位点。

表3中LEU2靶向DNA序列中的每一个独立地融合至编码CER结构域(SEQ ID NO:1)的DNA序列,所述CER结构域与化脓链球菌Cas9蛋白质相互作用,从而形成编码具有CER结构域和VT结构域两者的完整sgRNA的DNA序列(注意,SEQ ID NO:1在5’-至-3’方向上包含SEQ ID NO:56的tracrRNA配对序列、SEQ ID NO:43成环序列(GAAA)、和SEQ ID NO:58的tracrRNA序列)。为了在细胞核中表达这些sgRNA,并且回避核输出和5’修饰体系,将编码sgRNA的DNA序列置于对来自酿酒酵母(Snr52[SEQ ID NO:5]或Rpr1[SEQ ID NO:6])或解脂耶氏酵母(Snr52[SEQ ID NO:7])的RNA Pol III启动子的控制下。具体地讲,将Sc Snr52融合至Leu2-1,将Sc Rprl融合至Leu2-2,并且将Yl Snr52融合至Leu2-3。将编码每种sgRNA的DNA序列的3’端融合至来自酿酒酵母的Sup4基因的强终止子(SEQ ID NO:8)。因此,制备三种不同的Pol III-驱动的sgRNA盒。

按照标准技术,将来自化脓链球菌M1 GAS(SF370)的Cas9基因的开放阅读框经密码子优化以在耶氏酵母中表达,产生SEQ ID NO:9。在SEQ ID NO:9的最后有义密码子之后掺入编码猿猴病毒40(SV40)单倍体核定位信号(NLS)加上短接头(4个氨基酸)的DNA序列以得到SEQ ID NO:10。SEQ ID NO:10编码以SEQ ID NO:11示出的氨基酸序列。SEQ ID NO:11的最后七个氨基酸编码附加的NLS,然而在SEQ ID NO:11的位置1369-1372处的残基编码附加的接头。通过标准分子生物学技术,将经耶氏酵母密码子优化的Cas9-NLS序列(SEQ ID NO:10)融合至耶氏酵母组成型启动子,FBA1(SEQ ID NO:12)。经耶氏酵母密码子优化的Cas9表达盒(SEQ ID NO:13)的示例示于图2A中,其包含组成型FBA1启动子、经耶氏酵母密码子优化的Cas9和SV40NLS。将该Cas9表达盒(SEQ ID NO:13)克隆到质粒pZUF中,得到构建体pZUFCas9(图3A,SEQ ID NO:14)。

将sgRNA表达盒(上述)中的每个独立地克隆到pZUFCas9(SEQ ID NO:14)的PacI/ClaI位点中,以获得pZUFCas9/sgRNA构建体,所述构建体可用于利用经耶氏酵母密码子优化的Cas9表达盒和Pol III驱动的sgRNA表达盒共转化酵母细胞。此类构建体的示例为pZUFCas9/PolIII-sgRNA(图3B),其包含用于在耶氏酵母中靶向Leu2-3的Yl Snr52-sgRNA表达盒。

利用200ng质粒pZUFCas9(SEQ ID NO:14)或特定的pZUFCas9/sgRNA(例如pZUFCas9/PolIII-sgRNA,图3B)转化尿嘧啶营养缺陷型解脂耶氏酵母细胞,并在缺乏尿嘧啶的完整最小板(CM-ura)上选择尿嘧啶原养型。在缺乏亮氨酸的完整最小板(CM-leu)上对在CM-ura板上产生的群落筛选亮氨酸营养缺陷型。尿嘧啶原养型转化体均不显示出亮氨酸营养缺陷型。这些结果表示经耶氏酵母密码子优化的Cas9和Pol III启动子驱动的sgRNA不被表达、不产生、不相互作用、不靶向DNA、和/或不切割DNA。如果该实验产生了亮氨酸营养缺陷型,则该结果可能指示Cas9/sgRNA复合物靶向并切割Leu2编码区,导致易错NHEJ和随后的插入缺失形成,从而形成移码突变。

因此,其显示sgRNA的Pol III驱动表达不可用于在耶氏酵母中提供功能性Cas9-sgRNA复合物。

实施例2

包含由DNA聚合酶II启动子驱动的5’-和3’-核酶的经耶氏酵母优化的sgRNA表达 盒

该实施例公开了经优化用于在耶氏酵母中表达和Cas9-介导的靶向的sgRNA。用于此类表达的每个盒包含Pol II启动子,其用于驱动融合至5’-核酶和3’-核酶的sgRNA(核酶-sgRNA-核酶,或RGR)的转录。提供5’和3’核酶以从sgRNA去除Pol II启动子相关的转录修饰物,诸如5’端结构,仅保留sgRNA序列。这些表达盒允许用于sgRNA表达的更宽的启动子选择。另外,由这些盒转录的sgRNA不经受核输出,因为其缺乏5’-端结构。这些特征允许sgRNA在耶氏酵母细胞中的稳健表达,因此它们可以将Cas9内切核酸酶引导到体内基因组的靶区域。

将5’-锤头(HH)核酶和3’-丁型肝炎病毒(HDV)核酶加入sgRNA序列中使得sgRNA由任何启动子表达但不考虑在由一些RNA聚合酶(例如Pol II)转录的启动子处发生的后转录修饰并绕过了当前对用于sgRNA表达的启动子的有限选择。当表达此类sgRNA时,核酶在pre-sgRNA转录自切割时存在,从而与转录物分离,留下未修饰的sgRNA。

对于每个测试的sgRNA,编码sgRNA的DNA序列(i)在其5’端处融合至编码5’HH核酶的序列(SEQ ID NO:15)并且(ii)在其3’端处融合至编码3’HDV核酶的序列(SEQ ID NO:16)。HH核酶的5′-连接是使得HH核酶的前6个核苷酸为sgRNA的VT区(向导序列)的前6个核苷酸的反向互补序列这样的连接。使用标准分子生物学技术将每个核酶侧接的pre-sgRNA(RGR)融合至FBA1启动子(SEQ ID NO:12)以产生经耶氏酵母优化的sgRNA表达盒(最终的盒描述于图2B中)。此类盒的示例性序列以SEQ ID NO:18示出,其包含可操作地连接至编码RGR(HH-sgRNA-HDV)的序列的FBA1启动子(SEQ ID NO:12),其中sgRNA包含由SEQ ID NO:17(Can1-1)编码的VT结构域和SEQ ID NO:1作为其CER结构域(注意,SEQ ID NO:18的CER结构域-编码区、pRF38(SEQ ID NO:19)和pRF84(SEQ ID NO:41)中的每个具有附加的“TGG”,其中此类“TGG”介于对应于SEQ ID NO:1(CER结构域)的位置73-74的残基位置之间)。该VT结构域靶向耶氏酵母CAN1基因开放阅读框(GenBank登录号NC_006068,YALI0B19338g,染色体B的~bp 2557513-2559231)的编码区中的位点。编码的HH核酶的前6个残基与sgRNA的前6个残基(即,VT结构域的前6个残基)互补。注意,在SEQ ID NO:18中存在紧接SEQ ID NO:12(FBA1启动子)之后的三个残基(ATG),据信其不影响pre-sgRNA的表达和核酶介导的自催化。将SEQ ID NO:18克隆到称为pRF38的构建体中(图3C,SEQ ID NO:19)。

因此,制备用于表达不具有5’和3’pol II启动子相关转录修饰的sgRNA的DNA盒。这些类型的盒用于实施例3中用于耶氏酵母中的Cas9基因靶向。

实施例3

经耶氏酵母优化的sgRNA可用于sgRNA/Cas9内切核酸酶体系中以切割染色体DNA

该实施例公开了使用如实施例2中所述的经耶氏酵母优化的sgRNA表达盒以表达sgRNA,所述sgRNA可与Cas9一起用于识别和切割耶氏酵母中的染色体DNA。此类切割通过预测的DNA切割位点的区域中突变的出现来表现,这是由于切割位点处的易错NHEJ DNA修复。

靶向解脂耶氏酵母的CAN1基因用于切割。分别通过表型(刀豆氨酸抗性)和对突变频率和频谱的测序来检查耶氏酵母转化体中CAN1的成功靶向。

Ura-解脂耶氏酵母细胞(菌株Y2224,直接源自菌株ATCC 20362的尿嘧啶营养缺陷型,公开于美国专利申请公布2010/0062502中,其以引用方式并入本文)通过利用pZUFCas9(图3A,SEQ ID NO:14)和由包含用于靶向CAN1基因座的经耶氏酵母优化的RGR pre-sgRNA盒(包含于SEQ ID NO:18)的pRF38(图3C,SEQ ID NO:19)扩增的线性PCR产物,通过锂离子介导的转化(Ito等人,J.Bacteriology 153:163-168)来共转化。用于该PCR扩增的引物为SEQ ID NO:20(正向)和SEQ ID NO:21(反向)。仅利用pZUFCas9(SEQ ID NO:14)转化的Ura-解脂耶氏酵母细胞(Y2224)用作阴性对照。在CM-ura培养基上选择利用pZUFCas9(SEQ ID NO:14)和RGR pre-sgRNA表达盒转化的细胞作为尿嘧啶原养型。通过将CM-ura板平板复制到缺乏尿嘧啶、缺乏精氨酸并补充有60μg/ml有毒精氨酸类似物,刀豆氨酸的完整最小培养基(CM+can)上,筛选在CAN1基因中包含功能丧失突变的细胞。具有功能性CAN1基因的细胞可将刀豆氨酸传输到细胞中导致细胞死亡。在CAN1基因中具有功能丧失等位基因的细胞不传输刀豆氨酸并且能够在CM+can板上生长。

对于仅利用Cas9转化的细胞,通过刀豆氨酸抗性的表型筛选回收的功能丧失突变体的频率为零(图4)。然而,当利用RGR pre-sgRNA表达盒共转化Cas9时,刀豆氨酸抗性转化体的频率增加至10%(图4)。

使用正向(SEQ ID NO:22)和反向(SEQ ID NO:23)PCR引物扩增刀豆氨酸抗性菌落的CAN1基因座。使用ZymocleanTM和浓缩柱(Zymo Research,Irvine,CA)纯化PCR产物。使用测序引物SEQ ID NO:24对PCR产物进行测序(Sanger法)。将序列与包含靶位点的野生型(WT)耶氏酵母CAN1编码序列进行比对(图5)。在表达Cas9和sgRNA两者的细胞中的CAN1基因座处的主要功能丧失突变(测序分离物的73%)为Cas9切割位点处的-1移码突变(图5)。少量其它缺失和插入组成CAN1基因座处的剩余突变。总之,90%的突变为小缺失和插入(图5)。很少发生其它事件,诸如插入少量来自另一染色体的序列(4%),在切割位点处插入经耶氏酵母优化的sgRNA表达盒(1.5%),或较大缺失(1%)。3.5%经筛选的刀豆氨酸抗性菌落在CAN1基因座处具有复杂的重组,其不通过测序确定。总之,在CAN1靶位点处观察到的突变指示易错NHEJ用于细胞中以修复由Cas9/sgRNA复合物形成的切割。

(i)在转化以表达CAN1-特异性Cas9内切核酸酶的细胞中刀豆氨酸抗性菌落的频率增加,和(ii)指示刀豆氨酸抗性突变是由于预测Cas9切割位点处的易错NHEJ事件的测序数据两者均确认实施例2中所述的经耶氏酵母优化的Cas9和RGR pre-sgRNA表达盒切割耶氏酵母染色体DNA并形成突变。

因此,表达不具有5’端的RGEN(例如Cas9)的RNA组分(例如,sgRNA),其中RNA组分的5’端通过核酶自催化地去除,允许在非常规酵母中对DNA序列进行RGEN-介导的靶向。

实施例4

由5’核酶但不由3’核酶表达的经耶氏酵母优化的sgRNA可用于sgRNA/Cas9内切核 酸酶体系中用于切割染色体DNA

在该实施例中,评价由经耶氏酵母优化的盒(其仅包含5’HH核酶,但不具有3’核酶)产生的sgRNA的功能性,以确定sgRNA是否可与Cas9相互作用、识别DNA靶序列、通过Cas9诱导DNA切割、并由易错NHEJ导致突变。

由Pol II启动子转录的RNA在其5′和3′端两者处被重加工和修饰,表明为了由Pol II启动子产生功能性sgRNA,必须切除5′和3′端。先前已经示出,在体外由旁侧区产生的sgRNA:(i)如果存在5′-旁侧区则是非功能性的,和(ii)如果存在3′旁侧区则是显著功能缺陷的(Gao等人,J.Integr.Plant Biol.56:343-349)。如果包含5′核酶和3′旁侧区的pre-sgRNA连同Cas9一起表达酿酒酵母,则sgRNA不用于将Cas9引导至靶位点用于切割(Gao等人,同上)。

为测试5′核酶-侧接的sgRNA(缺乏3′-定位的核酶)是否可在非常规酵母中起作用,构建经耶氏酵母优化的sgRNA表达盒(SEQ ID NO:25),其包含在5’-至-3’方向上的FBA1启动子(SEQ ID NO:12),所述启动子融合至HH核酶(SEQ ID NO:15),所述核酶融合至编码靶向Can1-1靶位点(SEQ ID NO:17)的sgRNA(示例为SEQ ID NO:70)的序列,所述Can1-1靶位点融合至来自酿酒酵母Sup4基因(SEQ ID NO:8)的强转录终止子(该盒可以表征为表达RG[核酶-sgRNA]RNA)。在RG表达盒中编码的sgRNA包含对应于SEQ ID NO:17的VT结构域,其连接至CER结构域(SEQ ID NO:1)。编码的HH核酶的前6个残基与sgRNA的前6个残基(即,VT结构域的前6个残基)互补。注意,在SEQ ID NO:25中存在紧接SEQ ID NO:12(FBA1启动子)之后的三个残基(ATG),据信其不影响pre-sgRNA的表达和核酶介导的自催化。该经耶氏酵母优化的RG表达盒(SEQ ID NO:25)示于图2C中。

为测试经耶氏酵母优化的RG盒表达sgRNA的能力,所述sgRNA可与Cas9相互作用,将Cas9引导到DNA靶序列用于由Cas9切割,包含RG构建体(SEQ ID NO:25)或RGR构建体(SEQ ID NO:18,实施例2)的PCR产物利用pZUFCas9(SEQ ID NO:14)通过锂离子介导的转化共转化到Ura-解脂耶氏酵母细胞(Y2224)中(Ito等人,同上)。将Ura+转化体平板复制到CM+can板上以筛选刀豆氨酸抗性细胞(如实施例3中所示),其中由RG或RGR pre-sgRNA产生的sgRNA用于引导Cas9以切割CAN1靶序列,从而导致通过NHEJ进行易错修复。经耶氏酵母优化的RG或RGR盒引导对靶位点的Cas9介导的切割的频率相同(图6)指示与使用酿酒酵母的Gao等人(J.Integr.Plant Biol.56:343-349)的结果相反,3’核酶不是耶氏酵母中有效Cas9/sgRNA靶切割和突变所必需的。

该实施例展示,在非常规酵母诸如耶氏酵母中,当使用核酶策略时,仅5’-侧接核酶看起来是由Pol II启动子产生功能性sgRNA所必需的。该结果与酿酒酵母(常规酵母)中所观察的相反,其中5’和3’核酶两者均是由Cas9进行靶序列的有效切割和突变所要求的(Gao等人,同上)。

因此,该实施例还展示表达不具有5’端的RGEN(例如Cas9)的RNA组分(例如,sgRNA),其中RNA组分的5’端通过核酶自催化地去除,允许在非常规酵母中对DNA序列进行RGEN-介导的靶向。

实施例5

使用线性多核苷酸修饰模板以促进Cas9/sgRNA-诱导的DNA双链断裂的同源重组 (HR)修复

该示例公开了测试HR机制在耶氏酵母中使用线性多核苷酸修饰模板DNA序列修复由表达经耶氏酵母优化的Cas9和pre-sgRNA表达盒产生的双链断裂(DSB)的能力。制备三种不同的线性模板序列,其各自具有与染色体DNA中的Cas9/sgRNA靶向位点外的区域同源的5’臂序列和3’臂序列。

由互补的合成寡核苷酸产生前两种类型的多核苷酸修饰模板序列。将互补寡核苷酸退火,并且然后通过乙醇沉淀纯化。

使用互补寡核苷酸(SEQ ID NO:28和29)产生第一多核苷酸修饰模板并且其被设计成删除20-核苷酸Can1-1靶位点(SEQ ID NO:17)、3-核苷酸PAM结构域和紧接Can1-1靶位点上游的两个核苷酸,从而删除8个密码子和1个碱基对,从而在CAN1基因中产生-1bp移码。第一多核苷酸修饰模板通过退火SEQ ID NO:28和其反向互补序列SEQ ID NO:29来组装。第一供体DNA的同源臂(各自约50-bp)彼此直接靠近;在它们之间不具有异源序列。

第二多核苷酸修饰模板使用互补寡核苷酸(SEQ ID NO:30和31)产生,并且被设计成在CAN1开放阅读框中产生两个框内翻译终止密码子(即,无义突变)。其还被设计成破坏Can1-1靶位点下游的PAM序列(利用ATG置换CGG)和种子序列的第一个核苷酸(即,SEQ ID NO:17的Can1-1靶序列的最后残基)(用G置换C)。该多核苷酸修饰模板通过退火SEQ ID NO:30和其反向互补序列SEQ ID NO:31来形成。如可由上文搜集的,第二供体DNA的同源臂(各自约50-bp)由异源序列的一些碱基对分隔开。

第三多核苷酸修饰模板通过产生两个PCR产物部分地形成。在使用引物SEQ ID NO:33[正向]和SEQ ID NO:34[反向]由解脂耶氏酵母ATCC 20362基因组DNA扩增的一个PCR产物(SEQ ID NO:32)中,SEQ ID NO:32的位置638对应于CAN1开放阅读框起始密码子上游3bp的核苷酸。反向引物(SEQ ID NO:34)添加与位于CAN1开放阅读框下游37bp的序列互补的17个核苷酸。第二PCR产物(SEQ ID NO:35,使用引物SEQ ID NO:36[正向]和SEQ ID NO:37[反向]由解脂耶氏酵母ATCC 20362基因组DNA扩增),包含在CAN1开放阅读框的终止密码子下游14个碱基对处起始的637个碱基对。正向引物(SEQ ID NO:36)添加与在CAN1开放阅读框上游2个碱基对终止的区域互补的20个核苷酸。上游(SEQ ID NO:32)和下游PCR产物(SEQ ID NO:35)两者均使用ZymocleanTM和浓缩柱纯化。这些PCR产物(各自10ng)在新的PCR反应中混合。上游产物的3′-最多37个核苷酸与下游产物的5′-最多37个核苷酸相同。上游和下游片段用于彼此引发,从而通过由包含上游序列和下游序列两者的重叠末端合成来产生单一产物(SEQ ID NO:38)(由Horton等人在Biotechniques 54:129-133中描述的技术)。SEQ ID NO:38供体DNA的同源臂(各自约600-bp)彼此直接靠近;在它们之间不具有异源序列。该多核苷酸修饰模板可获得大缺失,所述缺失包括在Can1-1靶位点处的Cas9/sgRNA介导的双链断裂区中的整个CAN1开放阅读框。

利用以下物质使用上述锂离子转化方法转化Ura-解脂耶氏酵母细胞(Y2224):(i)pZUFCas9(SEQ ID NO:14),(ii)1μg的经耶氏酵母优化的RGR pre-sgRNA表达盒(SEQ ID NO:18),和(iii)1nmol的“移码模板”DNA(SEQ ID NO:28)、1nmol的“点突变模板”DNA(SEQ ID NO:30)、或1μg的“大缺失模板”DNA(SEQ ID NO:38)。转化细胞作为CM-ura板上尿嘧啶的原养型回收。通过平板复制到CM+can鉴定具有CAN1突变的刀豆氨酸抗性细胞来筛选原养型菌落。来自每个转化的CanR菌落的CAN1基因座通过使用正向引物(SEQ ID NO:22)和反向引物(SEQ ID NO:23)的PCR扩增来筛选。每种PCR产物使用(Affymetrix,Santa Clara,CA)纯化,并且使用测序引物SEQ ID NO:24进行测序(Sanger方法)。CanR菌落总数之外的表现出预测的同源重组事件的菌落频率(根据在转化中使用了哪种特定模板DNA)为约15%(图7)。

三种不同多核苷酸修饰模板DNA序列具有略不同的HR修复效率(图8)。具体地讲,这些模板中每一个的HR频率大约在11%(大缺失和移码供体)和22%(点突变模板)之间(图8),这指示当提供多核苷酸修饰模板DNA时,使用HR路径以高确限度方式修复Can1-1靶位点处的一些Cas9/sgRNA产生的切割事件。

使用DNA修复的两种主要途径,NHEJ或HR,展示出在耶氏酵母中对NHEJ的明显偏好(图7),这不同于对常规酵母中Cas9/sgRNA-介导的切割事件的修复的研究时所观察到的。例如,DiCarlo等人(Nucleic Acids Res.41:4336-4343)示出在提供供体DNA以修复Cas9/sgRNA介导的DNA切割时获得的几乎所有酿酒酵母突变体均经由HR产生,然而当不提供供体DNA时频率下降4至5个数量级,指示对HR的明显偏好。相反,在Cas9/sgRNA(sgRNA由RCR盒表达)切割位点处在耶氏酵母中的总突变频率不在接受或不接受多核苷酸修饰模板DNA的转化体之间变化(图9,示出对两种转化体的~15%突变率),并且在提供供体DNA时,HR仅占产生的突变转化体的约15%(图7)。因此,如上文所观察的耶氏酵母中利用多核苷酸修饰模板DNA序列的HR的频率仅为约2.25%,这与在常规酵母中具有供体DNA的情况下观察到的几乎100%HR介导的突变率形成鲜明对比(DiCarlo等人,同上)。

因此,该示例还展示表达不具有5’端的RGEN(例如Cas9)的RNA组分(例如,sgRNA),其中RNA组分的5’端通过核酶自催化地去除,允许在非常规酵母中对DNA序列进行RGEN-介导的靶向。该实施例还展示如果提供合适的供体DNA(多核苷酸修饰模板),则可以通过HR以一定比率修复非常规酵母中的RGEN介导的切割。

实施例6

由单个稳定的载体表达Cas9和经耶氏酵母优化的RGR或RG Pre-sgRNA提供Cas9/ sgRNA-介导的靶DNA切割

在该实施例中,经耶氏酵母优化的RGR或RG Pre-sgRNA表达盒各自独立地移动到相同稳定表达质粒中作为经耶氏酵母优化的Cas9表达盒。具体地讲,SEQ ID NO:18(对于RGR表达)或SEQ ID NO:25(对于RG表达)各自独立地克隆到pZUFCas9中(图3A,SEQ ID NO:14)。这允许单组分转化以在细胞中表达Cas9内切核酸酶和RG或RGR pre-sgRNA,从而提供Cas9/sgRNA-介导的靶位点切割,之后进行易错NHEJ修复。

使用正向(SEQ ID NO:39)和反向(SEQ ID NO:40)引物通过PCR扩增经耶氏酵母优化的RGR(SEQ ID NO:18)或RG(SEQ ID NO:25)sgRNA表达盒。将每个产物独立地克隆到PacI/ClaI限制位点处的质粒pZUFCas9(SEQ ID NO:14)中以形成两个新质粒,所述新质粒各自携带相应的盒用于Cas9表达和表达优化的RGR pre-sgRNA(pRF84,SEQ ID NO:41,图10A)或优化的RG pre-sgRNA(pRF85,SEQ ID NO:42,图10B)。

为测试pRF84(SEQ ID NO:41)和pRF85(SEQ ID NO:42)质粒构建体各自有效地表达Cas9和sgRNA以提供Cas9/sgRNA介导的靶位点(Can1-1)切割的能力,使用上述锂离子转化方法利用200ng的pRF84(SEQ ID NO:41)、pRF85(SEQ ID NO:42)、或pZUFCas9(SEQ ID NO:14)转化Ura-解脂耶氏酵母细胞(Y2224)。选择由每种质粒转化的细胞作为CM-ura培养基上的尿嘧啶原养型。通过在CM+can上平板复制对于CAN1突变体筛选来自每个转化的尿嘧啶原养型。对于由pZUFCas9(仅表达Cas9)、pRF84(表达Cas9和RGR pre-sgRNA)、或pRF85(表达Cas9和RG pre-sgRNA)转化的细胞,将CM+can板上生长的菌落数用于产生CAN1突变频率(图11)。由pZUFCas9(SEQ ID NO:14)转化的耶氏酵母细胞具有CAN1基因座处的Cas9/sgRNA介导的突变的0频率,然而表达(i)Cas9和(ii)RGR pre-sgRNA(pRF84)或RG sgRNA(pRF85)的细胞具有如由刀豆氨酸抗性所指示的类似的CAN1突变频率(□69%)(图11)。

这些结果指示,由相同载体表达Cas9和pre-sgRNA导致显著更高的Cas9/sgRNA介导的切割率,从而因此导致显著更高的在预测切割位点处的NHEJ介导的突变率。虽然由编码Cas9和pre-sgRNA(RGR或RG pre-sgRNA)的单独序列转化的耶氏酵母细胞表现出约5%的靶向突变频率(实施例4,图6),在用于转化的相同载体上放置Cas9和sgRNA编码序列两者导致约69%的靶向突变频率(图11)。

因此,与使用独立的构建体表达RGEN蛋白质和RNA组分相比,由用于转化非常规酵母的相同构建体表达Cas蛋白质及其对应的RNA组分导致在酵母中Cas介导的DNA靶向的更高比率。

实施例7

在解脂耶氏酵母中使用HDV核酶-sgRNA融合体的高效基因靶向

该实施例讨论了使用单个向导RNA(由HDV核酶侧接于5’端上的sgRNA(核酶-单向导RNA融合体)。当表达时,HDB核酶切割其自身序列的5′,去除任何先前的转录物,但保留融合至sgRNA的5′端的HDV序列。

质粒pZuf-Cas9(SEQ ID NO:14)使用Agilent QuickChange和以下引物AarI-去除-1(AGAAGTATCCTACCATCTACcatctccGAAAGAAACTCGTCGATTCC,SEQ ID NO:90)和AarI-去除-2(GGAATCGACGAGTTTCTTTCggagatgGTAGATGGTAGGATACTTCT,SEQ ID NO:91)诱变以去除存在于pZuf-Cas9(SEQ ID NO:14)上的Cas9基因(SEQ ID NO:10)中的内切核酸酶AarI位点并产生pRF109(SEQ ID NO:92)。以来自pRF109的NcoI/NotI片段形式将修饰的Aarl-Cas9基因(SEQ ID NO:93)克隆到pZufCas9的NcoI/NotI位点中,从而利用Aar1-Cas9基因置换存在的Cas9基因(SEQ ID NO:10)以产生pRF141(SEQ ID NO:94)。

高通量克隆盒(图12A,SEQ ID NO:95)由y152启动子(SEQ ID NO:96)、HDV核酶(SEQ ID NO:16)、大肠杆菌反向选择盒rpsL(SEQ ID NO:97)、编码向导RNA CER结构域(SEQ ID NO:1)的DNA和酿酒酵母Sup4终止子(SEQ ID NO:8)构成。侧接高通量克隆盒(SEQ ID NO:95)端部的是PacI和ClaI限制性酶识别位点。将高通量克隆盒克隆到pRF141(SEQ ID NO:94)的PacI/ClaI位点中以生成pRF291(SEQ ID NO:98)。rpsL反向选择盒(SEQ ID NO:97)包含编码S12核糖体蛋白亚基的大肠杆菌基因rpsL的WT拷贝(Escherichia coli and Salmonella typhimurium:Cellular and Molecular Biology,1987,第一版,American Society of Microbiology,Washington,DC)。S12亚基中的一些突变导致对抗生素链霉素的抗性(Ozaki M,Mizushima S,Nomura M.,1969.Identification and functional characterization of the protein controlled by the streptomycin-resistant locus in E.coli.Nature 222:333-339),其以隐形方式进行(Lederberg J.1951.Streptomycin resistance;a genetically recessive mutation.Journal of bacteriology 61:549-550),使得如果rpsL基因的野生型拷贝存在,则菌株是对链霉素在表型上敏感的。常见克隆菌株诸如Top10(Life technologies)在其染色体上具有rpsL的突变拷贝,使得细胞对链霉素具有抗性。

将编码向导RNA的可变靶向结构域的DNA片段克隆到质粒(诸如pRF291)中,要求两个部分互补的寡核苷酸在退火时,包含编码可变靶向结构域的DNA片段,以及用于克隆到存在于高通量克隆盒中的两个AarI位点中的正确突出物。将两种寡核苷酸Can1-1F(AATGGGACtcaaacgattacccaccctcGTTT,SEQ ID NO:99)和Can1-1R(TCTAAAACgagggtgggtaatcgtttgaGTCC,SEQ ID NO:100)以100μM重新悬浮于双重缓冲液(30mM HEPES,pH 7.5,100mM乙酸钠)中。在单个试管中,以50μM的最终浓度将Can1-1F(SEQ ID NO:99)和Can1-1R(SEQ ID NO:100)混合,加热至95℃并持续5分钟,并且以0.1℃/min冷却至25℃,以使两个寡核苷酸退火以形成小双链体DNA分子(图12B),其包含编码能够靶向Can1-1靶位点的向导RNA的可变靶向结构域的DNA片段(示为SEQ ID NO:101,其包括PAM序列CGG)。形成单管消化/连接反应物,其包含50ng的pRF291,由Can1-1F和Can1-1R 1x T4连接酶缓冲液(50mM Tris-HCl,10mM MgCl2,1mM ATP,10mM DTT,pH 7.5)构成的2.5μM小双链体DNA,0.5μM AarI寡核苷酸,2单位AarI,40单位T4DNA连接酶,最终体积为20ul。还组装缺乏双重Can1-1F和Can1-1R双链体的第二对照反应物。反应物在37℃下温育30分钟。将10μl的每种反应物转化到Top10大肠杆菌细胞中,如前所述(Green MR,Sambrook J.,2012,Molecular Cloning:A Laboratory Manual,第四版,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY)。为了对pRF291(其中Can1-1F和Can1-1R的双链体已经置换侧接有AarI限制性位点的rpsL反向选择标记物物(图12))的存在进行选择,将细胞接种于溶原性液体培养基上,所述培养基由包含100μg/ml氨苄青霉素和50μg/ml链霉素的1.5%(w/v)Bacto琼脂固化。包含高通量克隆盒的pRF291的存在产生对抗生素氨苄青霉素具有表型抗性但对抗生素链霉素具有敏感性的菌落,这是由于质粒上存在反向选择盒。然而,在其中反向选择盒经由AarI酶去除并且Can1-1双链体DNA连接到位点中的情况下(去除AarI的识别序列),由质粒转化的细胞具有氨苄青霉素抗性、链霉素抗性表型(图12A)。包含编码Can1-1可变靶向结构域的DNA片段的pRF291靶向(置换反向选择盒)形成重组HDV-sgRNA表达盒(SEQ ID NO:102),所述表达盒包含融合至编码HDV核酶(SEQ ID NO:16)的DNA的yl52启动子,所述HDV核酶融合至编码Can1-1可变靶向结构域(SEQ ID NO:17)的DNA、所述Can1-1可变靶向结构域融合至编码向导CER结构域(SEQ ID NO:1)的DNA,所述向导CER结构域融合至sup4终止子(SEQ ID NO:8)。包含该构建体的质粒,pRF303(SEQ ID NO:103)用于编码HDV核酶-向导RNA(SEQ ID NO:104),其能够(当与Cas9内切核酸酶复合时)靶向解脂耶氏酵母的Can1基因(SEQ ID NO:21)用于诱变。

在以下情况下转化解脂耶氏酵母(如Richard M,Quijano RR,Bezzate S,Bordon-Pallier F,Gaillardin C.2001.Journal of bacteriology 183:3098-3107):不具有质粒,或者100ng的不携带sgRNA表达盒(pRF291,SEQ ID NO:98)的质粒,携带RGR表达盒(SEQ ID NO:41)的pRF84质粒,携带RG盒的pRF85质粒,其中5’核酶自身从sgRNA(SEQ ID NO:42)去除,或携带HDV-sgRNA融合表达盒(SEQ ID NO:102)的pRF303(SEQ ID NO:103),所述HDV-sgRNA融合表达盒靶向耶氏酵母中的Can1-1靶位点。选择尿嘧啶原养型的转化体,并通过对精氨酸类似物刀豆氨酸的表型抗性对Can1基因中的突变进行评级。表达HDV-sgRNA融合体的质粒以表达从核酶释放的任一个sgRNA的质粒的相同频率造成Can1基因中的功能丧失突变,这表明HDV核酶对靶向Can1-1的sgRNA的5’融合不影响sgRNA功能(表4)。

表4

经由不同sgRNA变体的Can1-1靶序列的突变频率。

使用如上所述和图12A中所示的相同策略,将编码靶向多个附加靶位点的可变靶向结构域的多个附加DNA片段(表5)克隆到pRF291(SEQ ID NO:98)质粒中。包括编码在Can1基因(SEQ ID NO:105)内靶向的可变靶向结构域的DNA片段,所述可变靶向结构域靶向第二靶位点、can1-2靶位点(SEQ ID NO:106)和其它靶位点,诸如sou2-1(SEQ ID NO:107)、Sou2-2(SEQ ID NO:108)、Tgl1-1(SEQ ID NO:112)、Acos10-1(SEQ ID NO:113)、Fatl-1(SEQ ID NO:114)和Ura3-1(SEQ ID NO:116)。

表5

编码利用Cas9靶向耶氏酵母中的不同基因座的sgRNA VT结构域的DNA序列

靶位点的突变频率指示所有HDV-sgRNA融合体均能够形成与Cas9内切核酸酶的复合物,其继而在相应靶位点处生成切割,这导致经由NHEJ的突变(表6)。

表6

使用HDV-sgRNA融合体在解脂耶氏酵母中的不同靶位点处的突变频率

实施例8

使用失活的Cas9和HDV-sgRNA融合体进行基因沉默。

包含HNH和RuvC核酸酶结构域(SEQ ID NO:117)中突变的无催化活性的Cas9变体能够与sgRNA相互作用并且结合到体内的靶位点但不能切割靶DNA的任一条链。该作用模式,结合但不使DNA断裂可用于瞬时减少染色体中特异性基因座的表达,但不导致永久性基因改变。

为了生成解脂耶氏酵母的无催化活性的Cas9表达盒,将D10A突变引入质粒pZufCas9(SEQ ID NO:14),其使用快变定点诱变(Stratagene)来进行,如由引物D10AF(GAAATACTCCATCGGCCTGGCCATTGGAACCAACTCTGTCG,SEQ ID NO:118)和D10AR(CGACAGAGTTGGTTCCAATGGCCAGGCCGATGGAGTATTTC,SEQ ID NO:119)描述。这利用使RuvC核酸酶(SEQ ID NO:120)失活的D10A突变和包含该构建体的相应质粒,pRF111(SEQ ID NO:121)产生经耶氏酵母密码子优化的Cas9基因。为了使第二核酸酶结构域(HNH)失活,使用以下物质进行另一轮的快变诱变(Stratagene):引物H840A1(TCAGCGACTACGATGTGGACGCCATTGTCCCTCAATCCTTTCT,SEQ ID NO:122)和H840A2(AGAAAGGATTGAGGGACAATGGCGTCCACATCGTAGTCGCTGA,SEQ ID NO:123),其将H840A突变引入经耶氏酵母密码子优化的D10A基因中从而形成经耶氏酵母密码子优化的Cas9失活基因(SEQ ID NO:124),以及携带用于在耶氏酵母中表达的基因的质粒,pRF143(SEQ ID NO:125)。

为了评估解脂耶氏酵母中的基因沉默,形成经耶氏酵母密码子优化的dsREDexpress开放阅读框(SEQ ID NO:126)作为具有5′NcoI限制性位点和3′NotI限制性位点的克隆片段(SEQ ID NO:127)。将克隆片段(SEQ ID NO:127)克隆到pZufCas9的NcoI/NotI位点中以形成FBA1启动子(SEQ ID NO:12),所述启动子融合至经耶氏酵母优化的dsREDexpress克隆片段(SEQ ID NO:127),从而形成FABl-dsRED融合盒(SEQ ID NO:128),所述融合盒被包含于质粒pRF165(SEQ ID NO:129)上。为了将FBA1-dsREDexpress盒(SEQ ID NO:128)整合到染色体中,将包含盒(SEQ ID NO:130)的PmeI-NotI片段连接到整合质粒p2P069(SEQ ID NO:131)的PmeI/NotI位点中以形成携带FBA1-dsREDexpress表达盒的整合载体,pRF201(SEQ ID NO:132)。通过使用标准技术选择亮氨酸原养型,将携带FBA1-dsREDexpress融合体的pRF201的SphI/AscI片段和Leu2基因(SEQ ID NO:133)的拷贝整合到耶氏酵母的染色体中(Richard M,Quijano RR,Bezzate S,Bordon-Pallier F,Gaillardin C,2001.Tagging morphogenetic genes by insertional mutagenesis in the yeast Yarrowia lipolytica.Journal of bacteriology 183:3098-3107)。使用标准PCR技术和引物HY026(GCGCGTTTAAACCATCATCTAAGGGCCTCAAAACTACC,SEQ ID NO:134)和HY027(GAGAGCGGCCGCTTAAAGAAACAGATGGTGTCTTCCCT,SEQ ID NO:135)确认耶氏酵母基因组中FBA1-dsREDexpress表达盒的存在。为进一步使用,选择包含FBA1-dsREDexpress盒(SEQ ID NO:128)的两个独立菌株,YRF41和YRF42。

为形成用于靶向经耶氏酵母优化的dsREDexpress表达盒(SEQ ID NO:128)的sgRNA,使用类似于实施例12的策略。质粒构建体,pRF169(SEQ ID NO:136)包含来自耶氏酵母的GPD启动子(SEQ ID NO:137)反向选择标记物、编码向导RNA CER结构域(SEQ ID NO:1)的DNA和Sup4终止子(SEQ ID NO:8)盒(SEQ ID NO:138),如图13A所示。将编码靶向耶氏酵母中靶位点的sgRNA的可变靶向结构域的DNA(连接至编码HH核酶的DNA片段)克隆到pRF169(SEQ ID NO:136)中,如实施例12所述,不同的是编码HH核酶的DNA片段为锤头核酶的前6个核苷酸是可变靶向结构域的前6个核苷酸的反向互补序列那样的DNA片段,如图13B所示。当具有正确突出物的双链寡核苷酸置换AarI位点之间的反向选择盒时,产生核酶-向导RNA(RG)表达盒(图13-A)。当转录时,HH核酶从核酶-向导RNA分子中去除5′转录物及自身,在细胞中保留完整的sgRNA。形成靶向dsREDexpress开放阅读框(SEQ ID NO:126)的三个向导RNA;两个靶向模板链,ds-temp-1(SEQ ID NO:139)、ds-temp-2(SEQ ID NO:140);并且一个靶向非模板链,ds-nontemp-1(SEQ ID NO:141)。

就每个靶位点而言,设计两种寡核苷酸,其包含编码靶特异性锤头核酶的DNA序列、可变靶向结构域(VTD)和用于克隆到pRF169的AarI位点中的正确重叠端。每个位点的寡核苷酸;ds-temp-1F(SEQ ID NO:144)、ds-temp-1R(SEQ ID NO:145)、ds-temp-2F(SEQ ID NO:146)、ds-temp-2R(SEQ ID NO:147)、ds-nontemp-1F(SEQ ID NO:148)、和ds-nontemp-1R(SEQ ID NO:149)双链化以形成具有正确突出物的双链DNA分子,所述突出物用于克隆到pRF169的高通量盒(图13A和13B)中保留的AarI突出物中,并且如实施例12对于克隆到pRF291中所述来进行。插入编码sgRNA的可变靶向结构域的DNA片段,置换反向选择盒,对于每个靶位点产生新质粒,所述质粒携带融合至锤头核酶-靶位点双链DNA的GPD启动子,所述锤头核酶-靶位点双链DNA融合至编码向导RNA CER结构域的DNA,所述向导RNA CER结构域融合至图13A的Sup4终止子。包含这些双链体的质粒为pRF296(ds-temp-1,SEQ ID NO:150)、pRF298(ds-temp-2,SEQ ID NO:151)、pRF300(ds-nontemp-1,SEQ ID NO:152)。

为了形成用于基因沉默的构建体,使用标准技术将来自pRF143(SEQ ID NO:125)的失活Cas9克隆到pRF296、pRF298和pRF300中作为NcoI/NotI片段并且置换位于那些质粒的NcoI/NotI位点中的功能性Cas9(SEQ ID NO:93)以分别形成质粒pRF339(SEQ ID NO:153)、pRF341(SEQ ID NO:154)和pRF342(SEQ ID NO:155)。

使用标准技术由pRF339、pRF341和pRF343将菌株YRF41和YRF42转化成尿嘧啶原养型(Richard M,Quijano RR,Bezzate S。Bordon-Pallier F,Gaillardin C.2001.Tagging morphogenetic genes by insertional mutagenesis in the yeast Yarrowia lipolytica.Journal of bacteriology 183:3098-3107)。对于每次转化,将12个转化体在缺乏尿嘧啶的板上进行划线纯化以保持质粒。每个分离物用于接种2ml的CM-ura液体培养基(Teknova),并在30℃,250RPM下生长过夜。将每个过夜物中的2-5μl稀释到200μl ddH2O中,并在Accuri流动细胞仪的dsREDexpress通道中分析,以评估每个细胞内的dsREDexpress蛋白质的量。从每个培养物分析7,151和10,000个之间的细胞。从分析的每种培养物的平均荧光中减去不具有dsREDexpress表达盒的耶氏酵母细胞的平均荧光,以获得每个菌株/质粒组合内的经校正的平均荧光,将其平均并测定标准偏差(表7)。与核酶-SgRBA(RG)组合的失活的Cas9通过靶向目的基因的表达载体来表达,使2至10个折叠之间的基因的表达沉默。折叠沉默根据靶位点的位置和成链度和/或侧接sgRNA的核酶在耶氏酵母细胞中以功能形式由DNA聚合酶启动子表达的能力而变化(表7)。

表7

通过两个FBA-dsREDexpress整合菌株中的三个靶位点进行的基因沉默

菌株 质粒 靶位点 平均荧光±SD 无靶的折叠 YRF41 无 无 540.6±2.9 1 YRF41 pRF339(SEQ ID NO:69) ds-temp-1 299.2±138.7 0.55±0.26 YRF41 pRF341(SEQ ID NO:70) ds-temp-2 257.9±139.3 0.48±0.26 YRF41 pRF343(SEQ ID NO:71) ds-nontemp-1 169.4±45.3 0.31±0.08 YRF42 无 无 871.2±36.9 1 YRF42 pRF339(SEQ ID NO:69) ds-temp-1 194.3±121.1 0.22±0.14 YRF42 pRF341(SEQ ID NO:70) ds-temp-2 168.7±191.6 0.19±0.22 YRF42 pRF343(SEQ ID NO:71) ds-nomemp-1 94.9±109.6 0.11±0.13

实施例9

使用由单一质粒表达的Cas9和HDV核酶-sgRNA融合体(RG)进行精确基因编辑

在该实施例中,展示出由相同稳定载体表达的Cas9和HDV-sgRNA融合体的稳定表达可在耶氏酵母的靶位点中形成DNA双链断裂,其可以为用于通过同源重组进行精确基因编辑的底物。

描述于实施例4中的Can1缺失多核苷酸修饰模板DNA(SEQ ID NO:38)由HinDIII消化并且使用标准技术克隆到pUC18的HinDIII位点中以形成pRF80(SEQ ID NO:156)。较短的Can1缺失编辑模板(SEQ ID NO:157)使用标准PCR技术和引物80F(AGCTTGCTACGTTAGGAGAA,SEQ ID NO:158)和80R(TATGAGCTTATCCTGTATCG,SEQ ID NO:159)由pRF80扩增以形成大量编辑模板。

使用标准技术转化Ura营养缺陷型耶氏酵母细胞(Richard M,Quijano RR,Bezzate S,Bordon-Pallier F,Gaillardin C.2001.Tagging morphogenetic genes by insertional mutagenesis in the yeast Yarrowia lipolytica.Journal of bacteriology 183:3098-3107),其利用100ng的携带Cas9基因的拷贝但不具有sgRNA的质粒pRF291和携带Cas9基因的拷贝和Can1-1靶位点HDV-sgRNA表达盒的pRF303,连同没有编辑模板DNA或1000ng的短Can1缺失编辑模板(SEQ ID NO:157)。在CM-ura培养基(Teknova)上选择转化体。对于每个转化体,将20个单独菌落在CM-ura培养基(Teknova)上进行划线纯化。对于每个划线纯化的菌落,将4个单独菌落(每次转化共计80个)贴片到包含60μg/ml的L-刀豆氨酸的CM-arg板上,以筛选在Can1基因中包含功能丧失等位基因的菌落。对展示刀豆氨酸抗性的贴片进行评级并且对基因失活的频率进行评级(表8)。为了确定哪些菌落由于同源重组而丧失Can1功能以及哪些菌落由于NHEJ而丧失Can1功能,Can1基因座(SEQ ID NO:160)使用Can1-PCRF(GGAAGGCACATATGGCAAGG,SEQ ID NO:22)和Can 1-PCRR(GTAAGAGTGGTTTGCTCCAGG,SEQ ID NO:23)来扩增。在如先前实施例中所述的具有小插入缺失的细胞中,PCR产物应当与包含缺失的菌株中的WT Can1基因座(SEQ ID NO:160)的尺寸(2125bp)非常相似,所述缺失是由于与Can1缺失编辑模板同源重组,具有Can1-PCRF(SEQ ID NO:22)和Can1-PCRR(SEQ ID NO:23)的PCR片段(SEQ ID NO:161)将更小(392bp)。通过电泳分辨2μl的PCR产物,并使用标准技术成像(图14)。使用在划线纯化时(具有对应于由编辑模板(SEQ ID NO:161)重组的短带)产生1或多个菌落的最初20个划线菌落的百分比来测定HR的频率(表8)。在接收pRF303(SEQ ID NO:103)的细胞中,无论细胞是否接收编辑模板,刀豆氨酸抗性菌落的频率是相似的(表8)。在总转化细胞群中,在接收pRF303(SEQ ID NO:103)和Can1短编辑模板(SEQ ID NO:157)两者的细胞中,约1/10包含由编辑模板(SEQ ID NO:157)对Can1基因座的精确编辑(表8)。

表8

刀豆氨酸抗性频率和精确编辑的频率

实施例10

耶氏酵母中的URA3基因失活

本实施例描述了分别或一起表达单向导RNA(sgRNA)和Cas9内切核酸酶的质粒的构建和其用于耶氏酵母中的URA3基因失活的用途。

pYRH235和pYRH236分别表达侧接靶向URA3.1靶序列(5’-ctgttcagagacagtttcct-3;SEQ ID NO:165)的pre-sgRNA(RGR-URA3.1;SEQ ID NO:164)的核酶和侧接靶向URA3.2靶序列(5’-taacatccagagaagcacac-3’;SEQ ID NO:167)的pre-sgRNA(RGR-URA3.2;SEQ ID NO:166)的核酶。将编码RGR-URA3.1的DNA片段的NcoI-NotI限制性消化片段和编码RGR-URA3.2的BspHI-NotI限制性消化片段融合至FBA1L启动子(SEQ ID NO:168)以分别产生pYRH235和pYRH236。pYRH235和pYRH236质粒包含天然乙酰羟酸合酶的标记物基因(AHAS或乙酰乳酸合酶;E.C.4.1.3.18;SEQ ID NO:169),其具有赋予磺酰脲抗性的单氨基酸变化(W497L)。

耶氏酵母菌株ATCC20362的Ura-负衍生物(Y2224)首先利用线性化的pZufCas9(SEQ ID NO:14)通过SphI-BsiWI限制性消化来转化,并且在缺乏尿嘧啶的完整最小(CM)板上选择转化体。将线性化Cas9表达盒随机整合到耶氏酵母基因组中,并且因此转化体包含URA3基因的至少两个拷贝。随后,将表达sgRNA的pYRH235或pYRH236转化到表达Cas9的耶氏酵母菌株中,并且在包含600mg/L磺酰脲的CM板上选择转化体。将50个转化体在CM-ura板和具有5-FOA的SC板上进行贴片,以发现通过URA3的Cas9和sgRNA进行URA3基因失活的频率。94%和100%的pYRH235和pYRH236转化体分别变成尿嘧啶营养缺陷型。

进行靶位点URA3.1或URA3.2处突变的测序确认。随机选择pZufCas9和pYRH235的20个转化体用于测序分析,并且对每个菌落分析质粒pZufCas9和来自天然基因组URA3的URA3基因的突变。为对来自质粒pZufCas9的URA3基因进行测序,将URA3的引物RHO705(SEQ ID NO:170)和FBA1启动子序列的RHO719(SEQ ID NO:171)用于区域的PCR扩增,并且将引物RHO733(SEQ ID NO:172)或RHO734(SEQ ID NO:173)用于利用PCR扩增产物作为模板的测序。为对天然基因组源的URA3基因进行测序,将引物RHO705(SEQ ID NO:170)和RHO707(SEQ ID NO:174)用于PCR扩增,并且将引物RHO733(SEQ ID NO:172)和RHO734(SEQ ID NO:173)用于利用PCR扩增产物作为模板的测序。所有20个菌落均包含在质粒和基因组来源的URA3基因两者处的突变(图15)。对于5个代表性菌落的质粒和基因组来源的URA3基因(菌落1、2、3、5和6;分别为SEQ ID NO:176、177、178、179和180和SEQ ID NO:181、182、183、184和185)与野生型URA3.1(SEQ ID NO:175)的测序结果的片段比对在图15中示出。这些结果示出由耶氏酵母中的sgRNA/Cas9内切核酸酶体系靶向并使相同细胞中基因的多个拷贝突变。

实施例11

耶氏酵母中URA3基因突变或缺失。

本实施例描述了构造并使用在相同载体体系上表达两种sgRNA和Cas9内切核酸酶的质粒,用于耶氏酵母中的URA3基因突变或缺失,以用于标记物再循环。

pYRH222在FBA1启动子(SEQ ID NO:12)和FBA1L启动子下表达Cas9内切核酸酶(SEQ ID NO:10),所述启动子驱动编码侧接靶向URA3.2靶序列(SEQ ID NO:167)的pre-sgRNA(RGR-URA3.2;SEQ ID NO:166)的核酶的DNA片段,其示于图16A中。pYRH222载体包含在TDH1(也称为GPD)启动子(SEQ ID NO:187)下表达的潮霉素抗生素抗性选择标记物(SEQ ID NO:186),以及适应质粒的染色体外复制的自主复制序列(ARS18;SEQ ID NO:208)(PNAS,Fournier,P.等人,1993,90:4912-4916)。当不存在选择压力时,ARS18的存在使得细胞损失质粒。

pYRH282源自pYRH222。融合至编码来自pYRH235的RGR-URA3.1(SEQ ID NO:164)的DNA片段的FBA1L启动子(SEQ ID NO:168)使用引物RHO804(SEQ ID NO:188)和RHO805(SEQ ID NO:189)进行PCR扩增。然后PCR产物利用BsiWI消化,并且克隆到pYRH222中。通过测序确认克隆基因的取向和序列同一性,并且将构建体命名为pYRH282。

pYRH283源自pYRH222。由融合至编码RGR-URA3.3(SEQ ID NO:191)的DNA的TDH1启动子(SEQ ID NO:187)构成的,侧接有BsiWI位点(SEQ ID NO:190)的合成DNA片段由IDT(Coralville,Iowa)合成并且在BsiWI位点处克隆到pYRH222中。通过测序确认克隆基因的取向和序列同一性,并且将构建体命名为pYRH283。

利用pYRH222、pYRH282和pYRH283转化耶氏酵母菌株ATCC20362的后代,并在包含300mg/L潮霉素的YPD板上选择转化体。在无DNA对照板上观察到相对高的背景生长(表9)。随机选择每种构建体的30个转化体,并且在具有5-FOA的SC板上划线以对尿嘧啶营养缺陷型进行反选择。在来自无DNA对照板的菌落的情况下,没有观察到生长。在pYRH222、pYRH282和pYRH283转化体的情况下,4至11个贴片示出生长。利用引物RHO610(SEQ ID NO:192)和RHO611(SEQ ID NO:193)进行菌落PCR以扩增包含sgRNA靶位点的DNA区,并且经PCR扩增的产物示出在琼脂糖凝胶上的不同迁移(图17)。利用PCR产物作为模板和测序引物RHO704(SEQ ID NO:194)进行测序。

在pYRH222转化体的情况下,11次测序中的6次成功进行,并且其全部在URA3.2靶位点处突变(图16B;SEQ ID NO:195-201)。在pYRH282的情况下,所有的成功测序示出在一个或多个靶位点处的突变,并且其中2个示出两个靶位点之间的缺失(图16C;SEQ ID NO:202-204)。就pYRH283而言,8次成功测序中的7次示出在一个或多个靶位点处的突变,并且其中2个示出两个靶位点之间的缺失(图16D;SEQ ID NO:205-207),从而形成URA3基因的几乎完全缺失。

该实施例示出在相同质粒上表达两个向导RNA,以使用耶氏酵母中的sgRNA/Cas9内切核酸酶体系,在两个靶位点之间形成靶向缺失,其中通过运行凝胶或通过测序进行鉴定。在没有选择压力时,在这些质粒上存在ARS18(SEQ ID NO:208)使细胞损失质粒,使得质粒可以重复地用于URA3标记物再循环。

表9:

pYRH222、pYRH282和pYRH283转化体的分析。记录不包括DNA对照在内的每个转化 板的转化体数。

实施例12

在耶氏酵母中使用Csy4(Cas6)用于基因失活

本发明实施例描述了使用Csy4(也称为Cas6)以形成不具有5′端的向导RNA,其能够在非常规酵母中形成可靶向DNA序列(诸如但不限于,CAN1)的RGEN复合物。

将编码Csy4(也称为Cas6)的基因与编码靶向侧接有28bp Csy4识别位点的sgRNA的CAN1的DNA一起引入Cas9表达质粒上,用于耶氏酵母中的CAN1基因失活。

pYRH290在FBA1启动子(SEQ ID NO:12)下表达Cas9内切核酸酶(SEQ ID NO:10)并且经解脂耶氏酵母密码子优化的基因用于在FBA1启动子(SEQ ID NO:210)下的Csy4表达(SEQ ID NO:209)。pYRH290还包含编码28bp Csy4内切核酸酶识别序列(SEQ ID:212)的DNA片段(TDH1:28bp-gCAN1-28bp;SEQ ID NO:211),所述内切核酸酶识别序列侧接靶向CAN1靶序列(SEQ ID NO:214)的pre-sgRNA(SEQ ID NO:213)。在由Csy4加工之后,所得的sgRNA(SEQ ID NO:222)包含8-核苷酸5’-旁侧序列(SEQ ID NO:223)和20-核苷酸3’-旁侧序列(SEQ ID NO:224)。

利用pYRH290转化耶氏酵母菌株ATCC20362的Ura-负衍生物(Y2224),并在缺乏尿嘧啶的CM板上选择转化体。将86个转化体平板复制到包含刀豆氨酸的CM板以选择can1突变体。86个转化体中40个在包含刀豆氨酸的CM板上赋予生长。对40个刀豆氨酸抗性菌落中的16个进行测序以确认在CAN1靶位点处(SEQ ID NO:214)的突变,并且确认14个菌落在CAN1靶位点处具有突变。图18示出包含CAN1靶位点(SEQ ID NO:215)的野生型CAN1基因的片段与菌落14、16、18、19、24和25中CAN1靶序列处的突变(分别为SEQ ID NO:216-221)的比对。

序列表

<110> E. I. du Pont de Nemours and Company

Fan, Xiaochun

Frisch, Ryan

Hong, Seung-Pyo

<120> 使用RNA引导的内切核酸酶在非常规酵母中基因靶向

<130> CL6272

<150> 62/036652

<151> 2014-08-13

<160> 224

<170> 专利版本3.5

<210> 1

<211> 80

<212> RNA

<213> 人工序列

<220>

<223> Cas9内切核酸酶识别(CER)结构域

<400> 1

guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60

ggcaccgagu cggugcuuuu 80

<210> 2

<211> 20

<212> DNA

<213> 解脂耶氏酵母

<400> 2

tccaagaaga ttgttcttct 20

<210> 3

<211> 20

<212> DNA

<213> 解脂耶氏酵母

<400> 3

ctccgtcatc cccggttctc 20

<210> 4

<211> 20

<212> DNA

<213> 解脂耶氏酵母

<400> 4

cggcgacttc tgtggccccg 20

<210> 5

<211> 300

<212> DNA

<213> 酿酒酵母

<400> 5

aacaattatc tcaaaattca cccactcttc atctttgaaa agataatgta tgattatgct 60

ttcactcata tttatacaga aacttgatgt tttctttcga gtatatacaa ggtgattaca 120

tgtacgtttg aagtacaact ctagattttg tagtgccctc ttgggctagc ggtaaaggtg 180

cgcatttttt cacaccctac aatgttctgt tcaaaagatt ttggtcaaac gctgtagaag 240

tgaaagttgg tgcgcatgtt tcggcgttcg aaacttctcc gcagtgaaag ataaatgatc 300

<210> 6

<211> 300

<212> DNA

<213> 酿酒酵母

<400> 6

taaaaatcaa tcaatcatcg tgtgttttat atgtctctta tctaagtata agaatatcca 60

tagttaatat tcacttacgc taccttttaa cctgtaatca ttgtcaacag gatatgttaa 120

cgacccacat tgataaacgc tagtatttct ttttcctctt cttattggcc ggctgtctct 180

atactcccct atagtctgtt tcttttcgtt tcgattgttt tacgtttgag gcctcgtggc 240

gcacatggta cgctgtggtg ctcgcggctg ggaacgaaac tctgggagct gcgattggca 300

<210> 7

<211> 300

<212> DNA

<213> 解脂耶氏酵母

<400> 7

attttttttg attttctttt ttgaccccgt cttcaattac acttcccaac tgggaacacc 60

cctctttatc gacccatttt aggtaattta ccctagccca ttgtctccat aaggaatatt 120

accctaaccc acagtccagg gtgcccaggt ccttctttgg ccaaatttta acttcggtcc 180

tatggcacag cggtagcgcg tgagattgca aatcttaagg tcccgagttc gaatctcggt 240

gggacctagt tatttttgat agataatttc gtgatgatta gaaacttaac gcaaaataat 300

<210> 8

<211> 20

<212> DNA

<213> 酿酒酵母

<400> 8

tttttttgtt ttttatgtct 20

<210> 9

<211> 4107

<212> DNA

<213> 人工序列

<220>

<223> 化脓链球菌Cas9

<400> 9

atggacaaga aatactccat cggcctggac attggaacca actctgtcgg ctgggctgtc 60

atcaccgacg agtacaaggt gccctccaag aaattcaagg tcctcggaaa caccgatcga 120

cactccatca agaaaaacct cattggtgcc ctgttgttcg attctggcga gactgccgaa 180

gctaccagac tcaagcgaac tgctcggcga cgttacaccc gacggaagaa ccgaatctgc 240

tacctgcagg agatcttttc caacgagatg gccaaggtgg acgattcgtt ctttcatcga 300

ctggaggaat ccttcctcgt cgaggaagac aagaaacacg agcgtcatcc catctttggc 360

aacattgtgg acgaggttgc ttaccacgag aagtatccta ccatctacca cctgcgaaag 420

aaactcgtcg attccaccga caaggcggat ctcagactta tctacctcgc tctggcacac 480

atgatcaagt ttcgaggtca tttcctcatc gagggcgatc tcaatcccga caacagcgat 540

gtggacaagc tgttcattca gctcgttcag acctacaacc agctgttcga ggaaaacccc 600

atcaatgcct ccggagtcga tgcaaaggcc atcttgtctg ctcgactctc gaagagcaga 660

cgactggaga acctcattgc ccaacttcct ggcgagaaaa agaacggact gtttggcaac 720

ctcattgccc tttctcttgg tctcacaccc aacttcaagt ccaacttcga tctggcggag 780

gacgccaagc tccagctgtc caaggacacc tacgacgatg acctcgacaa cctgcttgca 840

cagattggcg atcagtacgc cgacctgttt ctcgctgcca agaacctttc ggatgctatt 900

ctcttgtctg acattctgcg agtcaacacc gagatcacaa aggctcccct ttctgcctcc 960

atgatcaagc gatacgacga gcaccatcag gatctcacac tgctcaaggc tcttgtccga 1020

cagcaactgc ccgagaagta caaggagatc tttttcgatc agtcgaagaa cggctacgct 1080

ggatacatcg acggcggagc ctctcaggaa gagttctaca agttcatcaa gccaattctc 1140

gagaagatgg acggaaccga ggaactgctt gtcaagctca atcgagagga tctgcttcgg 1200

aagcaacgaa ccttcgacaa cggcagcatt cctcatcaga tccacctcgg tgagctgcac 1260

gccattcttc gacgtcagga agacttctac ccctttctca aggacaaccg agagaagatc 1320

gagaagattc ttacctttcg aatcccctac tatgttggtc ctcttgccag aggaaactct 1380

cgatttgctt ggatgactcg aaagtccgag gaaaccatca ctccctggaa cttcgaggaa 1440

gtcgtggaca agggtgcctc tgcacagtcc ttcatcgagc gaatgaccaa cttcgacaag 1500

aatctgccca acgagaaggt tcttcccaag cattcgctgc tctacgagta ctttacagtc 1560

tacaacgaac tcaccaaagt caagtacgtt accgagggaa tgcgaaagcc tgccttcttg 1620

tctggcgaac agaagaaagc cattgtcgat ctcctgttca agaccaaccg aaaggtcact 1680

gttaagcagc tcaaggagga ctacttcaag aaaatcgagt gtttcgacag cgtcgagatt 1740

tccggagttg aggaccgatt caacgcctct ttgggcacct atcacgatct gctcaagatt 1800

atcaaggaca aggattttct cgacaacgag gaaaacgagg acattctgga ggacatcgtg 1860

ctcactctta ccctgttcga agatcgggag atgatcgagg aacgactcaa gacatacgct 1920

cacctgttcg acgacaaggt catgaaacaa ctcaagcgac gtagatacac cggctgggga 1980

agactttcgc gaaagctcat caacggcatc agagacaagc agtccggaaa gaccattctg 2040

gactttctca agtccgatgg ctttgccaac cgaaacttca tgcagctcat tcacgacgat 2100

tctcttacct tcaaggagga catccagaag gcacaagtgt ccggtcaggg cgacagcttg 2160

cacgaacata ttgccaacct ggctggttcg ccagccatca agaaaggcat tctccagact 2220

gtcaaggttg tcgacgagct ggtgaaggtc atgggacgtc acaagcccga gaacattgtg 2280

atcgagatgg ccagagagaa ccagacaact caaaagggtc agaaaaactc gcgagagcgg 2340

atgaagcgaa tcgaggaagg catcaaggag ctgggatccc agattctcaa ggagcatccc 2400

gtcgagaaca ctcaactgca gaacgagaag ctgtatctct actatctgca gaatggtcga 2460

gacatgtacg tggatcagga actggacatc aatcgtctca gcgactacga tgtggaccac 2520

attgtccctc aatcctttct caaggacgat tctatcgaca acaaggtcct tacacgatcc 2580

gacaagaaca gaggcaagtc ggacaacgtt cccagcgaag aggtggtcaa aaagatgaag 2640

aactactggc gacagctgct caacgccaag ctcattaccc agcgaaagtt cgacaatctt 2700

accaaggccg agcgaggcgg tctgtccgag ctcgacaagg ctggcttcat caagcgtcaa 2760

ctcgtcgaga ccagacagat cacaaagcac gtcgcacaga ttctcgattc tcggatgaac 2820

accaagtacg acgagaacga caagctcatc cgagaggtca aggtgattac tctcaagtcc 2880

aaactggtct ccgatttccg aaaggacttt cagttctaca aggtgcgaga gatcaacaat 2940

taccaccatg cccacgatgc ttacctcaac gccgtcgttg gcactgcgct catcaagaaa 3000

taccccaagc tcgaaagcga gttcgtttac ggcgattaca aggtctacga cgttcgaaag 3060

atgattgcca agtccgaaca ggagattggc aaggctactg ccaagtactt cttttactcc 3120

aacatcatga actttttcaa gaccgagatc accttggcca acggagagat tcgaaagaga 3180

ccacttatcg agaccaacgg cgaaactgga gagatcgtgt gggacaaggg tcgagacttt 3240

gcaaccgtgc gaaaggttct gtcgatgcct caggtcaaca tcgtcaagaa aaccgaggtt 3300

cagactggcg gattctccaa ggagtcgatt ctgcccaagc gaaactccga caagctcatc 3360

gctcgaaaga aagactggga tcccaagaaa tacggtggct tcgattctcc taccgtcgcc 3420

tattccgtgc ttgtcgttgc gaaggtcgag aagggcaagt ccaaaaagct caagtccgtc 3480

aaggagctgc tcggaattac catcatggag cgatcgagct tcgagaagaa tcccatcgac 3540

ttcttggaag ccaagggtta caaggaggtc aagaaagacc tcattatcaa gctgcccaag 3600

tactctctgt tcgaactgga gaacggtcga aagcgtatgc tcgcctccgc tggcgagctg 3660

cagaagggaa acgagcttgc cttgccttcg aagtacgtca actttctcta tctggcttct 3720

cactacgaga agctcaaggg ttctcccgag gacaacgaac agaagcaact cttcgttgag 3780

cagcacaaac attacctcga cgagattatc gagcagattt ccgagttttc gaagcgagtc 3840

atcctggctg atgccaactt ggacaaggtg ctctctgcct acaacaagca tcgggacaaa 3900

cccattcgag aacaggcgga gaacatcatt cacctgttta ctcttaccaa cctgggtgct 3960

cctgcagctt tcaagtactt cgataccact atcgaccgaa agcggtacac atccaccaag 4020

gaggttctcg atgccaccct gattcaccag tccatcactg gcctgtacga gacccgaatc 4080

gacctgtctc agcttggtgg cgactaa 4107

<210> 10

<211> 4140

<212> DNA

<213> 人工序列

<220>

<223> 具有NLS的化脓链球菌Cas9

<400> 10

atggacaaga aatactccat cggcctggac attggaacca actctgtcgg ctgggctgtc 60

atcaccgacg agtacaaggt gccctccaag aaattcaagg tcctcggaaa caccgatcga 120

cactccatca agaaaaacct cattggtgcc ctgttgttcg attctggcga gactgccgaa 180

gctaccagac tcaagcgaac tgctcggcga cgttacaccc gacggaagaa ccgaatctgc 240

tacctgcagg agatcttttc caacgagatg gccaaggtgg acgattcgtt ctttcatcga 300

ctggaggaat ccttcctcgt cgaggaagac aagaaacacg agcgtcatcc catctttggc 360

aacattgtgg acgaggttgc ttaccacgag aagtatccta ccatctacca cctgcgaaag 420

aaactcgtcg attccaccga caaggcggat ctcagactta tctacctcgc tctggcacac 480

atgatcaagt ttcgaggtca tttcctcatc gagggcgatc tcaatcccga caacagcgat 540

gtggacaagc tgttcattca gctcgttcag acctacaacc agctgttcga ggaaaacccc 600

atcaatgcct ccggagtcga tgcaaaggcc atcttgtctg ctcgactctc gaagagcaga 660

cgactggaga acctcattgc ccaacttcct ggcgagaaaa agaacggact gtttggcaac 720

ctcattgccc tttctcttgg tctcacaccc aacttcaagt ccaacttcga tctggcggag 780

gacgccaagc tccagctgtc caaggacacc tacgacgatg acctcgacaa cctgcttgca 840

cagattggcg atcagtacgc cgacctgttt ctcgctgcca agaacctttc ggatgctatt 900

ctcttgtctg acattctgcg agtcaacacc gagatcacaa aggctcccct ttctgcctcc 960

atgatcaagc gatacgacga gcaccatcag gatctcacac tgctcaaggc tcttgtccga 1020

cagcaactgc ccgagaagta caaggagatc tttttcgatc agtcgaagaa cggctacgct 1080

ggatacatcg acggcggagc ctctcaggaa gagttctaca agttcatcaa gccaattctc 1140

gagaagatgg acggaaccga ggaactgctt gtcaagctca atcgagagga tctgcttcgg 1200

aagcaacgaa ccttcgacaa cggcagcatt cctcatcaga tccacctcgg tgagctgcac 1260

gccattcttc gacgtcagga agacttctac ccctttctca aggacaaccg agagaagatc 1320

gagaagattc ttacctttcg aatcccctac tatgttggtc ctcttgccag aggaaactct 1380

cgatttgctt ggatgactcg aaagtccgag gaaaccatca ctccctggaa cttcgaggaa 1440

gtcgtggaca agggtgcctc tgcacagtcc ttcatcgagc gaatgaccaa cttcgacaag 1500

aatctgccca acgagaaggt tcttcccaag cattcgctgc tctacgagta ctttacagtc 1560

tacaacgaac tcaccaaagt caagtacgtt accgagggaa tgcgaaagcc tgccttcttg 1620

tctggcgaac agaagaaagc cattgtcgat ctcctgttca agaccaaccg aaaggtcact 1680

gttaagcagc tcaaggagga ctacttcaag aaaatcgagt gtttcgacag cgtcgagatt 1740

tccggagttg aggaccgatt caacgcctct ttgggcacct atcacgatct gctcaagatt 1800

atcaaggaca aggattttct cgacaacgag gaaaacgagg acattctgga ggacatcgtg 1860

ctcactctta ccctgttcga agatcgggag atgatcgagg aacgactcaa gacatacgct 1920

cacctgttcg acgacaaggt catgaaacaa ctcaagcgac gtagatacac cggctgggga 1980

agactttcgc gaaagctcat caacggcatc agagacaagc agtccggaaa gaccattctg 2040

gactttctca agtccgatgg ctttgccaac cgaaacttca tgcagctcat tcacgacgat 2100

tctcttacct tcaaggagga catccagaag gcacaagtgt ccggtcaggg cgacagcttg 2160

cacgaacata ttgccaacct ggctggttcg ccagccatca agaaaggcat tctccagact 2220

gtcaaggttg tcgacgagct ggtgaaggtc atgggacgtc acaagcccga gaacattgtg 2280

atcgagatgg ccagagagaa ccagacaact caaaagggtc agaaaaactc gcgagagcgg 2340

atgaagcgaa tcgaggaagg catcaaggag ctgggatccc agattctcaa ggagcatccc 2400

gtcgagaaca ctcaactgca gaacgagaag ctgtatctct actatctgca gaatggtcga 2460

gacatgtacg tggatcagga actggacatc aatcgtctca gcgactacga tgtggaccac 2520

attgtccctc aatcctttct caaggacgat tctatcgaca acaaggtcct tacacgatcc 2580

gacaagaaca gaggcaagtc ggacaacgtt cccagcgaag aggtggtcaa aaagatgaag 2640

aactactggc gacagctgct caacgccaag ctcattaccc agcgaaagtt cgacaatctt 2700

accaaggccg agcgaggcgg tctgtccgag ctcgacaagg ctggcttcat caagcgtcaa 2760

ctcgtcgaga ccagacagat cacaaagcac gtcgcacaga ttctcgattc tcggatgaac 2820

accaagtacg acgagaacga caagctcatc cgagaggtca aggtgattac tctcaagtcc 2880

aaactggtct ccgatttccg aaaggacttt cagttctaca aggtgcgaga gatcaacaat 2940

taccaccatg cccacgatgc ttacctcaac gccgtcgttg gcactgcgct catcaagaaa 3000

taccccaagc tcgaaagcga gttcgtttac ggcgattaca aggtctacga cgttcgaaag 3060

atgattgcca agtccgaaca ggagattggc aaggctactg ccaagtactt cttttactcc 3120

aacatcatga actttttcaa gaccgagatc accttggcca acggagagat tcgaaagaga 3180

ccacttatcg agaccaacgg cgaaactgga gagatcgtgt gggacaaggg tcgagacttt 3240

gcaaccgtgc gaaaggttct gtcgatgcct caggtcaaca tcgtcaagaa aaccgaggtt 3300

cagactggcg gattctccaa ggagtcgatt ctgcccaagc gaaactccga caagctcatc 3360

gctcgaaaga aagactggga tcccaagaaa tacggtggct tcgattctcc taccgtcgcc 3420

tattccgtgc ttgtcgttgc gaaggtcgag aagggcaagt ccaaaaagct caagtccgtc 3480

aaggagctgc tcggaattac catcatggag cgatcgagct tcgagaagaa tcccatcgac 3540

ttcttggaag ccaagggtta caaggaggtc aagaaagacc tcattatcaa gctgcccaag 3600

tactctctgt tcgaactgga gaacggtcga aagcgtatgc tcgcctccgc tggcgagctg 3660

cagaagggaa acgagcttgc cttgccttcg aagtacgtca actttctcta tctggcttct 3720

cactacgaga agctcaaggg ttctcccgag gacaacgaac agaagcaact cttcgttgag 3780

cagcacaaac attacctcga cgagattatc gagcagattt ccgagttttc gaagcgagtc 3840

atcctggctg atgccaactt ggacaaggtg ctctctgcct acaacaagca tcgggacaaa 3900

cccattcgag aacaggcgga gaacatcatt cacctgttta ctcttaccaa cctgggtgct 3960

cctgcagctt tcaagtactt cgataccact atcgaccgaa agcggtacac atccaccaag 4020

gaggttctcg atgccaccct gattcaccag tccatcactg gcctgtacga gacccgaatc 4080

gacctgtctc agcttggtgg cgactccaga gccgatccca agaaaaagcg aaaggtctaa 4140

<210> 11

<211> 1379

<212> PRT

<213> 人工序列

<220>

<223> 具有NLS的化脓链球菌Cas9

<400> 11

Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe

20 25 30

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

115 120 125

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

130 135 140

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

180 185 190

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

195 200 205

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

225 230 235 240

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

260 265 270

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

340 345 350

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

355 360 365

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

420 425 430

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

625 630 635 640

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

645 650 655

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

705 710 715 720

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

755 760 765

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

770 775 780

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

785 790 795 800

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

805 810 815

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

820 825 830

Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys

835 840 845

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

850 855 860

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

865 870 875 880

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

885 890 895

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

900 905 910

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

930 935 940

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

945 950 955 960

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

965 970 975

Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

980 985 990

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe

995 1000 1005

Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala

1010 1015 1020

Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe

1025 1030 1035

Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala

1040 1045 1050

Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu

1055 1060 1065

Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val

1070 1075 1080

Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr

1085 1090 1095

Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys

1100 1105 1110

Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro

1115 1120 1125

Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val

1130 1135 1140

Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys

1145 1150 1155

Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser

1160 1165 1170

Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys

1175 1180 1185

Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu

1190 1195 1200

Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly

1205 1210 1215

Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val

1220 1225 1230

Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser

1235 1240 1245

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys

1250 1255 1260

His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys

1265 1270 1275

Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala

1280 1285 1290

Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn

1295 1300 1305

Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala

1310 1315 1320

Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser

1325 1330 1335

Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr

1340 1345 1350

Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp

1355 1360 1365

Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val

1370 1375

<210> 12

<211> 543

<212> DNA

<213> 解脂耶氏酵母

<400> 12

tcgacgttta aaccatcatc taagggcctc aaaactacct cggaactgct gcgctgatct 60

ggacaccaca gaggttccga gcactttagg ttgcaccaaa tgtcccacca ggtgcaggca 120

gaaaacgctg gaacagcgtg tacagtttgt cttaacaaaa agtgagggcg ctgaggtcga 180

gcagggtggt gtgacttgtt atagccttta gagctgcgaa agcgcgtatg gatttggctc 240

atcaggccag attgagggtc tgtggacaca tgtcatgtta gtgtacttca atcgccccct 300

ggatatagcc ccgacaatag gccgtggcct catttttttg ccttccgcac atttccattg 360

ctcggtaccc acaccttgct tctcctgcac ttgccaacct taatactggt ttacattgac 420

caacatctta caagcggggg gcttgtctag ggtatatata aacagtggct ctcccaatcg 480

gttgccagtc tcttttttcc tttctttccc cacagattcg aaatctaaac tacacatcac 540

acc 543

<210> 13

<211> 4683

<212> DNA

<213> 人工序列

<220>

<223> Cas9-NLS表达盒

<400> 13

tcgacgttta aaccatcatc taagggcctc aaaactacct cggaactgct gcgctgatct 60

ggacaccaca gaggttccga gcactttagg ttgcaccaaa tgtcccacca ggtgcaggca 120

gaaaacgctg gaacagcgtg tacagtttgt cttaacaaaa agtgagggcg ctgaggtcga 180

gcagggtggt gtgacttgtt atagccttta gagctgcgaa agcgcgtatg gatttggctc 240

atcaggccag attgagggtc tgtggacaca tgtcatgtta gtgtacttca atcgccccct 300

ggatatagcc ccgacaatag gccgtggcct catttttttg ccttccgcac atttccattg 360

ctcggtaccc acaccttgct tctcctgcac ttgccaacct taatactggt ttacattgac 420

caacatctta caagcggggg gcttgtctag ggtatatata aacagtggct ctcccaatcg 480

gttgccagtc tcttttttcc tttctttccc cacagattcg aaatctaaac tacacatcac 540

accatggaca agaaatactc catcggcctg gacattggaa ccaactctgt cggctgggct 600

gtcatcaccg acgagtacaa ggtgccctcc aagaaattca aggtcctcgg aaacaccgat 660

cgacactcca tcaagaaaaa cctcattggt gccctgttgt tcgattctgg cgagactgcc 720

gaagctacca gactcaagcg aactgctcgg cgacgttaca cccgacggaa gaaccgaatc 780

tgctacctgc aggagatctt ttccaacgag atggccaagg tggacgattc gttctttcat 840

cgactggagg aatccttcct cgtcgaggaa gacaagaaac acgagcgtca tcccatcttt 900

ggcaacattg tggacgaggt tgcttaccac gagaagtatc ctaccatcta ccacctgcga 960

aagaaactcg tcgattccac cgacaaggcg gatctcagac ttatctacct cgctctggca 1020

cacatgatca agtttcgagg tcatttcctc atcgagggcg atctcaatcc cgacaacagc 1080

gatgtggaca agctgttcat tcagctcgtt cagacctaca accagctgtt cgaggaaaac 1140

cccatcaatg cctccggagt cgatgcaaag gccatcttgt ctgctcgact ctcgaagagc 1200

agacgactgg agaacctcat tgcccaactt cctggcgaga aaaagaacgg actgtttggc 1260

aacctcattg ccctttctct tggtctcaca cccaacttca agtccaactt cgatctggcg 1320

gaggacgcca agctccagct gtccaaggac acctacgacg atgacctcga caacctgctt 1380

gcacagattg gcgatcagta cgccgacctg tttctcgctg ccaagaacct ttcggatgct 1440

attctcttgt ctgacattct gcgagtcaac accgagatca caaaggctcc cctttctgcc 1500

tccatgatca agcgatacga cgagcaccat caggatctca cactgctcaa ggctcttgtc 1560

cgacagcaac tgcccgagaa gtacaaggag atctttttcg atcagtcgaa gaacggctac 1620

gctggataca tcgacggcgg agcctctcag gaagagttct acaagttcat caagccaatt 1680

ctcgagaaga tggacggaac cgaggaactg cttgtcaagc tcaatcgaga ggatctgctt 1740

cggaagcaac gaaccttcga caacggcagc attcctcatc agatccacct cggtgagctg 1800

cacgccattc ttcgacgtca ggaagacttc tacccctttc tcaaggacaa ccgagagaag 1860

atcgagaaga ttcttacctt tcgaatcccc tactatgttg gtcctcttgc cagaggaaac 1920

tctcgatttg cttggatgac tcgaaagtcc gaggaaacca tcactccctg gaacttcgag 1980

gaagtcgtgg acaagggtgc ctctgcacag tccttcatcg agcgaatgac caacttcgac 2040

aagaatctgc ccaacgagaa ggttcttccc aagcattcgc tgctctacga gtactttaca 2100

gtctacaacg aactcaccaa agtcaagtac gttaccgagg gaatgcgaaa gcctgccttc 2160

ttgtctggcg aacagaagaa agccattgtc gatctcctgt tcaagaccaa ccgaaaggtc 2220

actgttaagc agctcaagga ggactacttc aagaaaatcg agtgtttcga cagcgtcgag 2280

atttccggag ttgaggaccg attcaacgcc tctttgggca cctatcacga tctgctcaag 2340

attatcaagg acaaggattt tctcgacaac gaggaaaacg aggacattct ggaggacatc 2400

gtgctcactc ttaccctgtt cgaagatcgg gagatgatcg aggaacgact caagacatac 2460

gctcacctgt tcgacgacaa ggtcatgaaa caactcaagc gacgtagata caccggctgg 2520

ggaagacttt cgcgaaagct catcaacggc atcagagaca agcagtccgg aaagaccatt 2580

ctggactttc tcaagtccga tggctttgcc aaccgaaact tcatgcagct cattcacgac 2640

gattctctta ccttcaagga ggacatccag aaggcacaag tgtccggtca gggcgacagc 2700

ttgcacgaac atattgccaa cctggctggt tcgccagcca tcaagaaagg cattctccag 2760

actgtcaagg ttgtcgacga gctggtgaag gtcatgggac gtcacaagcc cgagaacatt 2820

gtgatcgaga tggccagaga gaaccagaca actcaaaagg gtcagaaaaa ctcgcgagag 2880

cggatgaagc gaatcgagga aggcatcaag gagctgggat cccagattct caaggagcat 2940

cccgtcgaga acactcaact gcagaacgag aagctgtatc tctactatct gcagaatggt 3000

cgagacatgt acgtggatca ggaactggac atcaatcgtc tcagcgacta cgatgtggac 3060

cacattgtcc ctcaatcctt tctcaaggac gattctatcg acaacaaggt ccttacacga 3120

tccgacaaga acagaggcaa gtcggacaac gttcccagcg aagaggtggt caaaaagatg 3180

aagaactact ggcgacagct gctcaacgcc aagctcatta cccagcgaaa gttcgacaat 3240

cttaccaagg ccgagcgagg cggtctgtcc gagctcgaca aggctggctt catcaagcgt 3300

caactcgtcg agaccagaca gatcacaaag cacgtcgcac agattctcga ttctcggatg 3360

aacaccaagt acgacgagaa cgacaagctc atccgagagg tcaaggtgat tactctcaag 3420

tccaaactgg tctccgattt ccgaaaggac tttcagttct acaaggtgcg agagatcaac 3480

aattaccacc atgcccacga tgcttacctc aacgccgtcg ttggcactgc gctcatcaag 3540

aaatacccca agctcgaaag cgagttcgtt tacggcgatt acaaggtcta cgacgttcga 3600

aagatgattg ccaagtccga acaggagatt ggcaaggcta ctgccaagta cttcttttac 3660

tccaacatca tgaacttttt caagaccgag atcaccttgg ccaacggaga gattcgaaag 3720

agaccactta tcgagaccaa cggcgaaact ggagagatcg tgtgggacaa gggtcgagac 3780

tttgcaaccg tgcgaaaggt tctgtcgatg cctcaggtca acatcgtcaa gaaaaccgag 3840

gttcagactg gcggattctc caaggagtcg attctgccca agcgaaactc cgacaagctc 3900

atcgctcgaa agaaagactg ggatcccaag aaatacggtg gcttcgattc tcctaccgtc 3960

gcctattccg tgcttgtcgt tgcgaaggtc gagaagggca agtccaaaaa gctcaagtcc 4020

gtcaaggagc tgctcggaat taccatcatg gagcgatcga gcttcgagaa gaatcccatc 4080

gacttcttgg aagccaaggg ttacaaggag gtcaagaaag acctcattat caagctgccc 4140

aagtactctc tgttcgaact ggagaacggt cgaaagcgta tgctcgcctc cgctggcgag 4200

ctgcagaagg gaaacgagct tgccttgcct tcgaagtacg tcaactttct ctatctggct 4260

tctcactacg agaagctcaa gggttctccc gaggacaacg aacagaagca actcttcgtt 4320

gagcagcaca aacattacct cgacgagatt atcgagcaga tttccgagtt ttcgaagcga 4380

gtcatcctgg ctgatgccaa cttggacaag gtgctctctg cctacaacaa gcatcgggac 4440

aaacccattc gagaacaggc ggagaacatc attcacctgt ttactcttac caacctgggt 4500

gctcctgcag ctttcaagta cttcgatacc actatcgacc gaaagcggta cacatccacc 4560

aaggaggttc tcgatgccac cctgattcac cagtccatca ctggcctgta cgagacccga 4620

atcgacctgt ctcagcttgg tggcgactcc agagccgatc ccaagaaaaa gcgaaaggtc 4680

taa 4683

<210> 14

<211> 10706

<212> DNA

<213> 人工序列

<220>

<223> pZUFCas9质粒

<400> 14

catggacaag aaatactcca tcggcctgga cattggaacc aactctgtcg gctgggctgt 60

catcaccgac gagtacaagg tgccctccaa gaaattcaag gtcctcggaa acaccgatcg 120

acactccatc aagaaaaacc tcattggtgc cctgttgttc gattctggcg agactgccga 180

agctaccaga ctcaagcgaa ctgctcggcg acgttacacc cgacggaaga accgaatctg 240

ctacctgcag gagatctttt ccaacgagat ggccaaggtg gacgattcgt tctttcatcg 300

actggaggaa tccttcctcg tcgaggaaga caagaaacac gagcgtcatc ccatctttgg 360

caacattgtg gacgaggttg cttaccacga gaagtatcct accatctacc acctgcgaaa 420

gaaactcgtc gattccaccg acaaggcgga tctcagactt atctacctcg ctctggcaca 480

catgatcaag tttcgaggtc atttcctcat cgagggcgat ctcaatcccg acaacagcga 540

tgtggacaag ctgttcattc agctcgttca gacctacaac cagctgttcg aggaaaaccc 600

catcaatgcc tccggagtcg atgcaaaggc catcttgtct gctcgactct cgaagagcag 660

acgactggag aacctcattg cccaacttcc tggcgagaaa aagaacggac tgtttggcaa 720

cctcattgcc ctttctcttg gtctcacacc caacttcaag tccaacttcg atctggcgga 780

ggacgccaag ctccagctgt ccaaggacac ctacgacgat gacctcgaca acctgcttgc 840

acagattggc gatcagtacg ccgacctgtt tctcgctgcc aagaaccttt cggatgctat 900

tctcttgtct gacattctgc gagtcaacac cgagatcaca aaggctcccc tttctgcctc 960

catgatcaag cgatacgacg agcaccatca ggatctcaca ctgctcaagg ctcttgtccg 1020

acagcaactg cccgagaagt acaaggagat ctttttcgat cagtcgaaga acggctacgc 1080

tggatacatc gacggcggag cctctcagga agagttctac aagttcatca agccaattct 1140

cgagaagatg gacggaaccg aggaactgct tgtcaagctc aatcgagagg atctgcttcg 1200

gaagcaacga accttcgaca acggcagcat tcctcatcag atccacctcg gtgagctgca 1260

cgccattctt cgacgtcagg aagacttcta cccctttctc aaggacaacc gagagaagat 1320

cgagaagatt cttacctttc gaatccccta ctatgttggt cctcttgcca gaggaaactc 1380

tcgatttgct tggatgactc gaaagtccga ggaaaccatc actccctgga acttcgagga 1440

agtcgtggac aagggtgcct ctgcacagtc cttcatcgag cgaatgacca acttcgacaa 1500

gaatctgccc aacgagaagg ttcttcccaa gcattcgctg ctctacgagt actttacagt 1560

ctacaacgaa ctcaccaaag tcaagtacgt taccgaggga atgcgaaagc ctgccttctt 1620

gtctggcgaa cagaagaaag ccattgtcga tctcctgttc aagaccaacc gaaaggtcac 1680

tgttaagcag ctcaaggagg actacttcaa gaaaatcgag tgtttcgaca gcgtcgagat 1740

ttccggagtt gaggaccgat tcaacgcctc tttgggcacc tatcacgatc tgctcaagat 1800

tatcaaggac aaggattttc tcgacaacga ggaaaacgag gacattctgg aggacatcgt 1860

gctcactctt accctgttcg aagatcggga gatgatcgag gaacgactca agacatacgc 1920

tcacctgttc gacgacaagg tcatgaaaca actcaagcga cgtagataca ccggctgggg 1980

aagactttcg cgaaagctca tcaacggcat cagagacaag cagtccggaa agaccattct 2040

ggactttctc aagtccgatg gctttgccaa ccgaaacttc atgcagctca ttcacgacga 2100

ttctcttacc ttcaaggagg acatccagaa ggcacaagtg tccggtcagg gcgacagctt 2160

gcacgaacat attgccaacc tggctggttc gccagccatc aagaaaggca ttctccagac 2220

tgtcaaggtt gtcgacgagc tggtgaaggt catgggacgt cacaagcccg agaacattgt 2280

gatcgagatg gccagagaga accagacaac tcaaaagggt cagaaaaact cgcgagagcg 2340

gatgaagcga atcgaggaag gcatcaagga gctgggatcc cagattctca aggagcatcc 2400

cgtcgagaac actcaactgc agaacgagaa gctgtatctc tactatctgc agaatggtcg 2460

agacatgtac gtggatcagg aactggacat caatcgtctc agcgactacg atgtggacca 2520

cattgtccct caatcctttc tcaaggacga ttctatcgac aacaaggtcc ttacacgatc 2580

cgacaagaac agaggcaagt cggacaacgt tcccagcgaa gaggtggtca aaaagatgaa 2640

gaactactgg cgacagctgc tcaacgccaa gctcattacc cagcgaaagt tcgacaatct 2700

taccaaggcc gagcgaggcg gtctgtccga gctcgacaag gctggcttca tcaagcgtca 2760

actcgtcgag accagacaga tcacaaagca cgtcgcacag attctcgatt ctcggatgaa 2820

caccaagtac gacgagaacg acaagctcat ccgagaggtc aaggtgatta ctctcaagtc 2880

caaactggtc tccgatttcc gaaaggactt tcagttctac aaggtgcgag agatcaacaa 2940

ttaccaccat gcccacgatg cttacctcaa cgccgtcgtt ggcactgcgc tcatcaagaa 3000

ataccccaag ctcgaaagcg agttcgttta cggcgattac aaggtctacg acgttcgaaa 3060

gatgattgcc aagtccgaac aggagattgg caaggctact gccaagtact tcttttactc 3120

caacatcatg aactttttca agaccgagat caccttggcc aacggagaga ttcgaaagag 3180

accacttatc gagaccaacg gcgaaactgg agagatcgtg tgggacaagg gtcgagactt 3240

tgcaaccgtg cgaaaggttc tgtcgatgcc tcaggtcaac atcgtcaaga aaaccgaggt 3300

tcagactggc ggattctcca aggagtcgat tctgcccaag cgaaactccg acaagctcat 3360

cgctcgaaag aaagactggg atcccaagaa atacggtggc ttcgattctc ctaccgtcgc 3420

ctattccgtg cttgtcgttg cgaaggtcga gaagggcaag tccaaaaagc tcaagtccgt 3480

caaggagctg ctcggaatta ccatcatgga gcgatcgagc ttcgagaaga atcccatcga 3540

cttcttggaa gccaagggtt acaaggaggt caagaaagac ctcattatca agctgcccaa 3600

gtactctctg ttcgaactgg agaacggtcg aaagcgtatg ctcgcctccg ctggcgagct 3660

gcagaaggga aacgagcttg ccttgccttc gaagtacgtc aactttctct atctggcttc 3720

tcactacgag aagctcaagg gttctcccga ggacaacgaa cagaagcaac tcttcgttga 3780

gcagcacaaa cattacctcg acgagattat cgagcagatt tccgagtttt cgaagcgagt 3840

catcctggct gatgccaact tggacaaggt gctctctgcc tacaacaagc atcgggacaa 3900

acccattcga gaacaggcgg agaacatcat tcacctgttt actcttacca acctgggtgc 3960

tcctgcagct ttcaagtact tcgataccac tatcgaccga aagcggtaca catccaccaa 4020

ggaggttctc gatgccaccc tgattcacca gtccatcact ggcctgtacg agacccgaat 4080

cgacctgtct cagcttggtg gcgactccag agccgatccc aagaaaaagc gaaaggtcta 4140

agcggccgca agtgtggatg gggaagtgag tgcccggttc tgtgtgcaca attggcaatc 4200

caagatggat ggattcaaca cagggatata gcgagctacg tggtggtgcg aggatatagc 4260

aacggatatt tatgtttgac acttgagaat gtacgataca agcactgtcc aagtacaata 4320

ctaaacatac tgtacatact catactcgta cccgggcaac ggtttcactt gagtgcagtg 4380

gctagtgctc ttactcgtac agtgtgcaat actgcgtatc atagtctttg atgtatatcg 4440

tattcattca tgttagttgc gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4500

aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4560

acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4620

ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4680

gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4740

caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 4800

tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 4860

gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 4920

ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 4980

cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 5040

tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 5100

tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 5160

cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 5220

agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 5280

agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5340

gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5400

aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5460

ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5520

gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5580

taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5640

tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5700

tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 5760

gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 5820

gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 5880

ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 5940

cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 6000

tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 6060

cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 6120

agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 6180

cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 6240

aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6300

aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6360

gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6420

gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6480

tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6540

ttccccgaaa agtgccacct gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6600

tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 6660

tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6720

tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 6780

gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 6840

agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 6900

cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 6960

agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttcca 7020

ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7080

acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 7140

ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact cactataggg 7200

cgaattgggt accgggcccc ccctcgaggt cgatggtgtc gataagcttg atatcgaatt 7260

catgtcacac aaaccgatct tcgcctcaag gaaacctaat tctacatccg agagactgcc 7320

gagatccagt ctacactgat taattttcgg gccaataatt taaaaaaatc gtgttatata 7380

atattatatg tattatatat atacatcatg atgatactga cagtcatgtc ccattgctaa 7440

atagacagac tccatctgcc gcctccaact gatgttctca atatttaagg ggtcatctcg 7500

cattgtttaa taataaacag actccatcta ccgcctccaa atgatgttct caaaatatat 7560

tgtatgaact tatttttatt acttagtatt attagacaac ttacttgctt tatgaaaaac 7620

acttcctatt taggaaacaa tttataatgg cagttcgttc atttaacaat ttatgtagaa 7680

taaatgttat aaatgcgtat gggaaatctt aaatatggat agcataaatg atatctgcat 7740

tgcctaattc gaaatcaaca gcaacgaaaa aaatcccttg tacaacataa atagtcatcg 7800

agaaatatca actatcaaag aacagctatt cacacgttac tattgagatt attattggac 7860

gagaatcaca cactcaactg tctttctctc ttctagaaat acaggtacaa gtatgtacta 7920

ttctcattgt tcatacttct agtcatttca tcccacatat tccttggatt tctctccaat 7980

gaatgacatt ctatcttgca aattcaacaa ttataataag atataccaaa gtagcggtat 8040

agtggcaatc aaaaagcttc tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc 8100

attaaaggta tatatttatt tcttgttata taatcctttt gtttattaca tgggctggat 8160

acataaaggt attttgattt aattttttgc ttaaattcaa tcccccctcg ttcagtgtca 8220

actgtaatgg taggaaatta ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa 8280

aatcgtattt ccaggttaga cgttccgcag aatctagaat gcggtatgcg gtacattgtt 8340

cttcgaacgt aaaagttgcg ctccctgaga tattgtacat ttttgctttt acaagtacaa 8400

gtacatcgta caactatgta ctactgttga tgcatccaca acagtttgtt ttgttttttt 8460

ttgttttttt tttttctaat gattcattac cgctatgtat acctacttgt acttgtagta 8520

agccgggtta ttggcgttca attaatcata gacttatgaa tctgcacggt gtgcgctgcg 8580

agttactttt agcttatgca tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa 8640

cggatgctca atcgatttcg acagtaatta attaagtcat acacaagtca gctttcttcg 8700

agcctcatat aagtataagt agttcaacgt attagcactg tacccagcat ctccgtatcg 8760

agaaacacaa caacatgccc cattggacag atcatgcgga tacacaggtt gtgcagtatc 8820

atacatactc gatcagacag gtcgtctgac catcatacaa gctgaacaag cgctccatac 8880

ttgcacgctc tctatataca cagttaaatt acatatccat agtctaacct ctaacagtta 8940

atcttctggt aagcctccca gccagccttc tggtatcgct tggcctcctc aataggatct 9000

cggttctggc cgtacagacc tcggccgaca attatgatat ccgttccggt agacatgaca 9060

tcctcaacag ttcggtactg ctgtccgaga gcgtctccct tgtcgtcaag acccaccccg 9120

ggggtcagaa taagccagtc ctcagagtcg cccttaggtc ggttctgggc aatgaagcca 9180

accacaaact cggggtcgga tcgggcaagc tcaatggtct gcttggagta ctcgccagtg 9240

gccagagagc ccttgcaaga cagctcggcc agcatgagca gacctctggc cagcttctcg 9300

ttgggagagg ggactaggaa ctccttgtac tgggagttct cgtagtcaga gacgtcctcc 9360

ttcttctgtt cagagacagt ttcctcggca ccagctcgca ggccagcaat gattccggtt 9420

ccgggtacac cgtgggcgtt ggtgatatcg gaccactcgg cgattcggtg acaccggtac 9480

tggtgcttga cagtgttgcc aatatctgcg aactttctgt cctcgaacag gaagaaaccg 9540

tgcttaagag caagttcctt gagggggagc acagtgccgg cgtaggtgaa gtcgtcaatg 9600

atgtcgatat gggttttgat catgcacaca taaggtccga ccttatcggc aagctcaatg 9660

agctccttgg tggtggtaac atccagagaa gcacacaggt tggttttctt ggctgccacg 9720

agcttgagca ctcgagcggc aaaggcggac ttgtggacgt tagctcgagc ttcgtaggag 9780

ggcattttgg tggtgaagag gagactgaaa taaatttagt ctgcagaact ttttatcgga 9840

accttatctg gggcagtgaa gtatatgtta tggtaatagt tacgagttag ttgaacttat 9900

agatagactg gactatacgg ctatcggtcc aaattagaaa gaacgtcaat ggctctctgg 9960

gcgtcgcctt tgccgacaaa aatgtgatca tgatgaaagc cagcaatgac gttgcagctg 10020

atattgttgt cggccaaccg cgccgaaaac gcagctgtca gacccacagc ctccaacgaa 10080

gaatgtatcg tcaaagtgat ccaagcacac tcatagttgg agtcgtactc caaaggcggc 10140

aatgacgagt cagacagata ctcgtcgacg tttaaaccat catctaaggg cctcaaaact 10200

acctcggaac tgctgcgctg atctggacac cacagaggtt ccgagcactt taggttgcac 10260

caaatgtccc accaggtgca ggcagaaaac gctggaacag cgtgtacagt ttgtcttaac 10320

aaaaagtgag ggcgctgagg tcgagcaggg tggtgtgact tgttatagcc tttagagctg 10380

cgaaagcgcg tatggatttg gctcatcagg ccagattgag ggtctgtgga cacatgtcat 10440

gttagtgtac ttcaatcgcc ccctggatat agccccgaca ataggccgtg gcctcatttt 10500

tttgccttcc gcacatttcc attgctcggt acccacacct tgcttctcct gcacttgcca 10560

accttaatac tggtttacat tgaccaacat cttacaagcg gggggcttgt ctagggtata 10620

tataaacagt ggctctccca atcggttgcc agtctctttt ttcctttctt tccccacaga 10680

ttcgaaatct aaactacaca tcacac 10706

<210> 15

<211> 43

<212> RNA

<213> 人工序列

<220>

<223> 锤头(HH)核酶

<220>

<221> misc_feature

<222> (1)..(6)

<223> n = A、C、U或G

<400> 15

nnnnnncuga ugaguccgug aggacgaaac gaguaagcuc guc 43

<210> 16

<211> 68

<212> RNA

<213> 丁型肝炎病毒

<400> 16

ggccggcaug gucccagccu ccucgcuggc gccggcuggg caacaugcuu cggcauggcg 60

aaugggac 68

<210> 17

<211> 20

<212> DNA

<213> 解脂耶氏酵母

<400> 17

tcaaacgatt acccaccctc 20

<210> 18

<211> 760

<212> DNA

<213> 人工序列

<220>

<223> RGR表达盒

<400> 18

tcgacgttta aaccatcatc taagggcctc aaaactacct cggaactgct gcgctgatct 60

ggacaccaca gaggttccga gcactttagg ttgcaccaaa tgtcccacca ggtgcaggca 120

gaaaacgctg gaacagcgtg tacagtttgt cttaacaaaa agtgagggcg ctgaggtcga 180

gcagggtggt gtgacttgtt atagccttta gagctgcgaa agcgcgtatg gatttggctc 240

atcaggccag attgagggtc tgtggacaca tgtcatgtta gtgtacttca atcgccccct 300

ggatatagcc ccgacaatag gccgtggcct catttttttg ccttccgcac atttccattg 360

ctcggtaccc acaccttgct tctcctgcac ttgccaacct taatactggt ttacattgac 420

caacatctta caagcggggg gcttgtctag ggtatatata aacagtggct ctcccaatcg 480

gttgccagtc tcttttttcc tttctttccc cacagattcg aaatctaaac tacacatcac 540

accatggttt gactgatgag tccgtgagga cgaaacgagt aagctcgtct caaacgatta 600

cccaccctcg ttttagagct agaaatagca agttaaaata aggctagtcc gttatcaact 660

tgaaaaagtg gcaccgagtc ggtggtgctt ttggccggca tggtcccagc ctcctcgctg 720

gcgccggctg ggcaacatgc ttcggcatgg cgaatgggac 760

<210> 19

<211> 6793

<212> DNA

<213> 人工序列

<220>

<223> pRF38质粒

<400> 19

catggtttga ctgatgagtc cgtgaggacg aaacgagtaa gctcgtctca aacgattacc 60

caccctcgtt ttagagctag aaatagcaag ttaaaataag gctagtccgt tatcaacttg 120

aaaaagtggc accgagtcgg tggtgctttt ggccggcatg gtcccagcct cctcgctggc 180

gccggctggg caacatgctt cggcatggcg aatgggacaa gcttgggggc ggccgcaagt 240

gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa gatggatgga 300

ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac ggatatttat 360

gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta aacatactgt 420

acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct agtgctctta 480

ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat tcattcatgt 540

tagttgcgta cgagccggaa gcataaagtg taaagcctgg ggtgcctaat gagtgagcta 600

actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca 660

gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc 720

cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc 780

tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat 840

gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt 900

ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg 960

aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc 1020

tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt 1080

ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa 1140

gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta 1200

tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa 1260

caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa 1320

ctacggctac actagaagga cagtatttgg tatctgcgct ctgctgaagc cagttacctt 1380

cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt 1440

ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat 1500

cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat 1560

gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc 1620

aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc 1680

acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta 1740

gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga 1800

cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg 1860

cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc 1920

tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat 1980

cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag 2040

gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat 2100

cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa 2160

ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa 2220

gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga 2280

taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg 2340

gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc 2400

acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg 2460

aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact 2520

cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat 2580

atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt 2640

gccacctgac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag 2700

cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct tcccttcctt 2760

tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc ctttagggtt 2820

ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg atggttcacg 2880

tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt ccacgttctt 2940

taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg tctattcttt 3000

tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc tgatttaaca 3060

aaaatttaac gcgaatttta acaaaatatt aacgcttaca atttccattc gccattcagg 3120

ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg ccagctggcg 3180

aaagggggat gtgctgcaag gcgattaagt tgggtaacgc cagggttttc ccagtcacga 3240

cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga attgggtacc 3300

gggccccccc tcgaggtcga tggtgtcgat aagcttgata tcgaattcat gtcacacaaa 3360

ccgatcttcg cctcaaggaa acctaattct acatccgaga gactgccgag atccagtcta 3420

cactgattaa ttttcgggcc aataatttaa aaaaatcgtg ttatataata ttatatgtat 3480

tatatatata catcatgatg atactgacag tcatgtccca ttgctaaata gacagactcc 3540

atctgccgcc tccaactgat gttctcaata tttaaggggt catctcgcat tgtttaataa 3600

taaacagact ccatctaccg cctccaaatg atgttctcaa aatatattgt atgaacttat 3660

ttttattact tagtattatt agacaactta cttgctttat gaaaaacact tcctatttag 3720

gaaacaattt ataatggcag ttcgttcatt taacaattta tgtagaataa atgttataaa 3780

tgcgtatggg aaatcttaaa tatggatagc ataaatgata tctgcattgc ctaattcgaa 3840

atcaacagca acgaaaaaaa tcccttgtac aacataaata gtcatcgaga aatatcaact 3900

atcaaagaac agctattcac acgttactat tgagattatt attggacgag aatcacacac 3960

tcaactgtct ttctctcttc tagaaataca ggtacaagta tgtactattc tcattgttca 4020

tacttctagt catttcatcc cacatattcc ttggatttct ctccaatgaa tgacattcta 4080

tcttgcaaat tcaacaatta taataagata taccaaagta gcggtatagt ggcaatcaaa 4140

aagcttctct ggtgtgcttc tcgtatttat ttttattcta atgatccatt aaaggtatat 4200

atttatttct tgttatataa tccttttgtt tattacatgg gctggataca taaaggtatt 4260

ttgatttaat tttttgctta aattcaatcc cccctcgttc agtgtcaact gtaatggtag 4320

gaaattacca tacttttgaa gaagcaaaaa aaatgaaaga aaaaaaaaat cgtatttcca 4380

ggttagacgt tccgcagaat ctagaatgcg gtatgcggta cattgttctt cgaacgtaaa 4440

agttgcgctc cctgagatat tgtacatttt tgcttttaca agtacaagta catcgtacaa 4500

ctatgtacta ctgttgatgc atccacaaca gtttgttttg tttttttttg tttttttttt 4560

ttctaatgat tcattaccgc tatgtatacc tacttgtact tgtagtaagc cgggttattg 4620

gcgttcaatt aatcatagac ttatgaatct gcacggtgtg cgctgcgagt tacttttagc 4680

ttatgcatgc tacttgggtg taatattggg atctgttcgg aaatcaacgg atgctcaatc 4740

gatttcgaca gtaattaatt aagtcataca caagtcagct ttcttcgagc ctcatataag 4800

tataagtagt tcaacgtatt agcactgtac ccagcatctc cgtatcgaga aacacaacaa 4860

catgccccat tggacagatc atgcggatac acaggttgtg cagtatcata catactcgat 4920

cagacaggtc gtctgaccat catacaagct gaacaagcgc tccatacttg cacgctctct 4980

atatacacag ttaaattaca tatccatagt ctaacctcta acagttaatc ttctggtaag 5040

cctcccagcc agccttctgg tatcgcttgg cctcctcaat aggatctcgg ttctggccgt 5100

acagacctcg gccgacaatt atgatatccg ttccggtaga catgacatcc tcaacagttc 5160

ggtactgctg tccgagagcg tctcccttgt cgtcaagacc caccccgggg gtcagaataa 5220

gccagtcctc agagtcgccc ttaggtcggt tctgggcaat gaagccaacc acaaactcgg 5280

ggtcggatcg ggcaagctca atggtctgct tggagtactc gccagtggcc agagagccct 5340

tgcaagacag ctcggccagc atgagcagac ctctggccag cttctcgttg ggagagggga 5400

ctaggaactc cttgtactgg gagttctcgt agtcagagac gtcctccttc ttctgttcag 5460

agacagtttc ctcggcacca gctcgcaggc cagcaatgat tccggttccg ggtacaccgt 5520

gggcgttggt gatatcggac cactcggcga ttcggtgaca ccggtactgg tgcttgacag 5580

tgttgccaat atctgcgaac tttctgtcct cgaacaggaa gaaaccgtgc ttaagagcaa 5640

gttccttgag ggggagcaca gtgccggcgt aggtgaagtc gtcaatgatg tcgatatggg 5700

ttttgatcat gcacacataa ggtccgacct tatcggcaag ctcaatgagc tccttggtgg 5760

tggtaacatc cagagaagca cacaggttgg ttttcttggc tgccacgagc ttgagcactc 5820

gagcggcaaa ggcggacttg tggacgttag ctcgagcttc gtaggagggc attttggtgg 5880

tgaagaggag actgaaataa atttagtctg cagaactttt tatcggaacc ttatctgggg 5940

cagtgaagta tatgttatgg taatagttac gagttagttg aacttataga tagactggac 6000

tatacggcta tcggtccaaa ttagaaagaa cgtcaatggc tctctgggcg tcgcctttgc 6060

cgacaaaaat gtgatcatga tgaaagccag caatgacgtt gcagctgata ttgttgtcgg 6120

ccaaccgcgc cgaaaacgca gctgtcagac ccacagcctc caacgaagaa tgtatcgtca 6180

aagtgatcca agcacactca tagttggagt cgtactccaa aggcggcaat gacgagtcag 6240

acagatactc gtcgacgttt aaaccatcat ctaagggcct caaaactacc tcggaactgc 6300

tgcgctgatc tggacaccac agaggttccg agcactttag gttgcaccaa atgtcccacc 6360

aggtgcaggc agaaaacgct ggaacagcgt gtacagtttg tcttaacaaa aagtgagggc 6420

gctgaggtcg agcagggtgg tgtgacttgt tatagccttt agagctgcga aagcgcgtat 6480

ggatttggct catcaggcca gattgagggt ctgtggacac atgtcatgtt agtgtacttc 6540

aatcgccccc tggatatagc cccgacaata ggccgtggcc tcattttttt gccttccgca 6600

catttccatt gctcggtacc cacaccttgc ttctcctgca cttgccaacc ttaatactgg 6660

tttacattga ccaacatctt acaagcgggg ggcttgtcta gggtatatat aaacagtggc 6720

tctcccaatc ggttgccagt ctcttttttc ctttctttcc ccacagattc gaaatctaaa 6780

ctacacatca cac 6793

<210> 20

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> RGR正向PCR引物

<400> 20

cgagtcagac agatactcg 19

<210> 21

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> RGR反向PCR引物

<400> 21

ccctgtgttg aatccatcc 19

<210> 22

<211> 20

<212> DNA

<213> 解脂耶氏酵母

<400> 22

ggaaggcaca tatggcaagg 20

<210> 23

<211> 21

<212> DNA

<213> 解脂耶氏酵母

<400> 23

gtaagagtgg tttgctccag g 21

<210> 24

<211> 21

<212> DNA

<213> 解脂耶氏酵母

<400> 24

gcacaggtat ttctgccctt c 21

<210> 25

<211> 709

<212> DNA

<213> 人工序列

<220>

<223> RG表达盒

<400> 25

tcgacgttta aaccatcatc taagggcctc aaaactacct cggaactgct gcgctgatct 60

ggacaccaca gaggttccga gcactttagg ttgcaccaaa tgtcccacca ggtgcaggca 120

gaaaacgctg gaacagcgtg tacagtttgt cttaacaaaa agtgagggcg ctgaggtcga 180

gcagggtggt gtgacttgtt atagccttta gagctgcgaa agcgcgtatg gatttggctc 240

atcaggccag attgagggtc tgtggacaca tgtcatgtta gtgtacttca atcgccccct 300

ggatatagcc ccgacaatag gccgtggcct catttttttg ccttccgcac atttccattg 360

ctcggtaccc acaccttgct tctcctgcac ttgccaacct taatactggt ttacattgac 420

caacatctta caagcggggg gcttgtctag ggtatatata aacagtggct ctcccaatcg 480

gttgccagtc tcttttttcc tttctttccc cacagattcg aaatctaaac tacacatcac 540

accatggttt gactgatgag tccgtgagga cgaaacgagt aagctcgtct caaacgatta 600

cccaccctcg ttttagagct agaaatagca agttaaaata aggctagtcc gttatcaact 660

tgaaaaagtg gcaccgagtc ggtgcttttt ttttttgttt tttatgtct 709

<210> 26

<211> 10

<212> DNA

<213> 未知

<220>

<223> 聚-A

<400> 26

aaaaaaaaaa 10

<210> 27

<211> 10

<212> DNA

<213> 未知

<220>

<223> 聚-T

<400> 27

tttttttttt 10

<210> 28

<211> 100

<212> DNA

<213> 人工序列

<220>

<223> CAN1移码供体

<400> 28

ccttaacgac cctgccgtct ccatccatcc gaccacaatg gaaaagacat gactgaggcc 60

cacatccaca tcaaccacac ggcccactcg gatgactcag 100

<210> 29

<211> 100

<212> DNA

<213> 人工序列

<220>

<223> CAN1移码供体互补序列

<400> 29

ctgagtcatc cgagtgggcc gtgtggttga tgtggatgtg ggcctcagtc atgtcttttc 60

cattgtggtc ggatggatgg agacggcagg gtcgttaagg 100

<210> 30

<211> 106

<212> DNA

<213> 人工序列

<220>

<223> CAN1点突变供体

<400> 30

ccatccatcc gaccacaatg gaaaagacat tttcaaacga ttacccaccc tgatgaactg 60

aggcccacat ccacatcaac cacacggccc actcggatga ctcaga 106

<210> 31

<211> 106

<212> DNA

<213> 人工序列

<220>

<223> CAN1点突变供体互补序列

<400> 31

tctgagtcat ccgagtgggc cgtgtggttg atgtggatgt gggcctcagt tcatcagggt 60

gggtaatcgt ttgaaaatgt cttttccatt gtggtcggat ggatgg 106

<210> 32

<211> 655

<212> DNA

<213> 人工序列

<220>

<223> CAN1上游供体臂

<400> 32

gggaagcctt gctacgttag gagaagacgc acggcgatga tacgggtacc cctcatgaca 60

tcaatatccg ctgcccctct tgccagcaag gcgtcagcag gtgctttttt cgctattttc 120

accagaccac agcctttttc cttgtgtctc atcttggatt ccttcaaagg caactcaccg 180

cacctccgag tcgtgtgaac aatgtaataa taggctattg acttttttcc cacctgttta 240

gcgccaaacc caaagcgctt ttcgccccca ctgcagcccg atggaaggca catatggcaa 300

gggaaaagtc ttcaggtaat acatgcctgc tgcaactata tgtactctga ctcattccct 360

cagacgtggg tcatagacag ctgttttaaa ccgggcaaat caatctctgt cgcacaggta 420

tttctgccct tcaaaaccag gttgccacat cagattccat caaagttttt cagactaact 480

tcaatcttaa acggcatctc acaacaagcg aattggacgg aaaaaaagcg tctatcatta 540

ccggcaccta tccacactaa gacagtacta aaggacgacg ctccccacga aacgacgttt 600

cgaccttaac gaccctgccg tctccatcca tccgaccact cccgacgctc tctcc 655

<210> 33

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> 用于扩增CAN1上游供体臂的正向PCR引物

<400> 33

gggaagcttg ctacgttagg agaagacgc 29

<210> 34

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 用于扩增CAN1上游供体臂的反向PCR引物

<400> 34

ggagagagcg tcgggagtgg tcggatggat ggagacg 37

<210> 35

<211> 658

<212> DNA

<213> 人工序列

<220>

<223> CAN1下游供体臂

<400> 35

cgtctccatc catccgacca ctcccgacgc tctctcctgg agcaaaccac tcttaccaag 60

catatagcat atataataac gtattgaatt tattaactga ttgaattgag agtaaagcca 120

gtagcgttgt acggctgtag ctttttagaa aagtggcaga tgagcgatgg tggatatgaa 180

agtaccttta cggcatgtag cgacacaaga tcgcttccaa gaactcgaca ttcaagccca 240

gctcgtacaa gaaaatgaac tagccaatca tatgaactag cacattgaag tcaccgcatc 300

atctctgttg gaaacgacgc gcatgtactc gtgcgtagta aatccgtatc tgtacactcg 360

aaagattaca gtatgtagta gtagcatgac taacgatgta acgtccaaat aacgctctgt 420

gcctactcct gtagatgcat tagaccacct gctaacgtct acacgttatg tccgttagct 480

ccaagattgc acttttccct caaagactct gctgggttac gtcatggtct ctttcgggtc 540

tctggtccgt tctctgcccg cccatatccg cccaggctgc tacgatacag gataagctca 600

taagcttaga ttatttttcc ggaatgacat cacgatgcag tggtggaagg atgtatgg 658

<210> 36

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 用于扩增CAN1下游供体臂的正向PCR引物

<400> 36

cgtctccatc catccgacca ctcccgacgc tctctcc 37

<210> 37

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 用于扩增CAN1下游供体臂的反向PCR引物

<400> 37

ccatacatcc ttccaccact gc 22

<210> 38

<211> 1276

<212> DNA

<213> 人工序列

<220>

<223> CAN1大缺失供体

<400> 38

gggaagcctt gctacgttag gagaagacgc acggcgatga tacgggtacc cctcatgaca 60

tcaatatccg ctgcccctct tgccagcaag gcgtcagcag gtgctttttt cgctattttc 120

accagaccac agcctttttc cttgtgtctc atcttggatt ccttcaaagg caactcaccg 180

cacctccgag tcgtgtgaac aatgtaataa taggctattg acttttttcc cacctgttta 240

gcgccaaacc caaagcgctt ttcgccccca ctgcagcccg atggaaggca catatggcaa 300

gggaaaagtc ttcaggtaat acatgcctgc tgcaactata tgtactctga ctcattccct 360

cagacgtggg tcatagacag ctgttttaaa ccgggcaaat caatctctgt cgcacaggta 420

tttctgccct tcaaaaccag gttgccacat cagattccat caaagttttt cagactaact 480

tcaatcttaa acggcatctc acaacaagcg aattggacgg aaaaaaagcg tctatcatta 540

ccggcaccta tccacactaa gacagtacta aaggacgacg ctccccacga aacgacgttt 600

cgaccttaac gaccctgccg tctccatcca tccgaccact cccgacgctc tctcctggag 660

caaaccactc ttaccaagca tatagcatat ataataacgt attgaattta ttaactgatt 720

gaattgagag taaagccagt agcgttgtac ggctgtagct ttttagaaaa gtggcagatg 780

agcgatggtg gatatgaaag tacctttacg gcatgtagcg acacaagatc gcttccaaga 840

actcgacatt caagcccagc tcgtacaaga aaatgaacta gccaatcata tgaactagca 900

cattgaagtc accgcatcat ctctgttgga aacgacgcgc atgtactcgt gcgtagtaaa 960

tccgtatctg tacactcgaa agattacagt atgtagtagt agcatgacta acgatgtaac 1020

gtccaaataa cgctctgtgc ctactcctgt agatgcatta gaccacctgc taacgtctac 1080

acgttatgtc cgttagctcc aagattgcac ttttccctca aagactctgc tgggttacgt 1140

catggtctct ttcgggtctc tggtccgttc tctgcccgcc catatccgcc caggctgcta 1200

cgatacagga taagctcata agcttagatt atttttccgg aatgacatca cgatgcagtg 1260

gtggaaggat gtatgg 1276

<210> 39

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> RG/RGR正向PCR引物

<400> 39

ggggttaatt aacgagtcag acagatactc g 31

<210> 40

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> RG/RGR反向PCR引物

<400> 40

ggggatcgat ccctgtgttg aatccatcc 29

<210> 41

<211> 11568

<212> DNA

<213> 人工序列

<220>

<223> pRF84质粒

<400> 41

cgatccctgt gttgaatcca tccatcttgg attgccaatt gtgcacacag aaccgggcac 60

tcacttcccc atccacactt gcggccgccc ccaagcttgt cccattcgcc atgccgaagc 120

atgttgccca gccggcgcca gcgaggaggc tgggaccatg ccggccaaaa gcaccaccga 180

ctcggtgcca ctttttcaag ttgataacgg actagcctta ttttaacttg ctatttctag 240

ctctaaaacg agggtgggta atcgtttgag acgagcttac tcgtttcgtc ctcacggact 300

catcagtcaa accatggtgt gatgtgtagt ttagatttcg aatctgtggg gaaagaaagg 360

aaaaaagaga ctggcaaccg attgggagag ccactgttta tatataccct agacaagccc 420

cccgcttgta agatgttggt caatgtaaac cagtattaag gttggcaagt gcaggagaag 480

caaggtgtgg gtaccgagca atggaaatgt gcggaaggca aaaaaatgag gccacggcct 540

attgtcgggg ctatatccag ggggcgattg aagtacacta acatgacatg tgtccacaga 600

ccctcaatct ggcctgatga gccaaatcca tacgcgcttt cgcagctcta aaggctataa 660

caagtcacac caccctgctc gacctcagcg ccctcacttt ttgttaagac aaactgtaca 720

cgctgttcca gcgttttctg cctgcacctg gtgggacatt tggtgcaacc taaagtgctc 780

ggaacctctg tggtgtccag atcagcgcag cagttccgag gtagttttga ggcccttaga 840

tgatggttta aacgtcgacg agtatctgtc tgactcgtta attaagtcat acacaagtca 900

gctttcttcg agcctcatat aagtataagt agttcaacgt attagcactg tacccagcat 960

ctccgtatcg agaaacacaa caacatgccc cattggacag atcatgcgga tacacaggtt 1020

gtgcagtatc atacatactc gatcagacag gtcgtctgac catcatacaa gctgaacaag 1080

cgctccatac ttgcacgctc tctatataca cagttaaatt acatatccat agtctaacct 1140

ctaacagtta atcttctggt aagcctccca gccagccttc tggtatcgct tggcctcctc 1200

aataggatct cggttctggc cgtacagacc tcggccgaca attatgatat ccgttccggt 1260

agacatgaca tcctcaacag ttcggtactg ctgtccgaga gcgtctccct tgtcgtcaag 1320

acccaccccg ggggtcagaa taagccagtc ctcagagtcg cccttaggtc ggttctgggc 1380

aatgaagcca accacaaact cggggtcgga tcgggcaagc tcaatggtct gcttggagta 1440

ctcgccagtg gccagagagc ccttgcaaga cagctcggcc agcatgagca gacctctggc 1500

cagcttctcg ttgggagagg ggactaggaa ctccttgtac tgggagttct cgtagtcaga 1560

gacgtcctcc ttcttctgtt cagagacagt ttcctcggca ccagctcgca ggccagcaat 1620

gattccggtt ccgggtacac cgtgggcgtt ggtgatatcg gaccactcgg cgattcggtg 1680

acaccggtac tggtgcttga cagtgttgcc aatatctgcg aactttctgt cctcgaacag 1740

gaagaaaccg tgcttaagag caagttcctt gagggggagc acagtgccgg cgtaggtgaa 1800

gtcgtcaatg atgtcgatat gggttttgat catgcacaca taaggtccga ccttatcggc 1860

aagctcaatg agctccttgg tggtggtaac atccagagaa gcacacaggt tggttttctt 1920

ggctgccacg agcttgagca ctcgagcggc aaaggcggac ttgtggacgt tagctcgagc 1980

ttcgtaggag ggcattttgg tggtgaagag gagactgaaa taaatttagt ctgcagaact 2040

ttttatcgga accttatctg gggcagtgaa gtatatgtta tggtaatagt tacgagttag 2100

ttgaacttat agatagactg gactatacgg ctatcggtcc aaattagaaa gaacgtcaat 2160

ggctctctgg gcgtcgcctt tgccgacaaa aatgtgatca tgatgaaagc cagcaatgac 2220

gttgcagctg atattgttgt cggccaaccg cgccgaaaac gcagctgtca gacccacagc 2280

ctccaacgaa gaatgtatcg tcaaagtgat ccaagcacac tcatagttgg agtcgtactc 2340

caaaggcggc aatgacgagt cagacagata ctcgtcgacg tttaaaccat catctaaggg 2400

cctcaaaact acctcggaac tgctgcgctg atctggacac cacagaggtt ccgagcactt 2460

taggttgcac caaatgtccc accaggtgca ggcagaaaac gctggaacag cgtgtacagt 2520

ttgtcttaac aaaaagtgag ggcgctgagg tcgagcaggg tggtgtgact tgttatagcc 2580

tttagagctg cgaaagcgcg tatggatttg gctcatcagg ccagattgag ggtctgtgga 2640

cacatgtcat gttagtgtac ttcaatcgcc ccctggatat agccccgaca ataggccgtg 2700

gcctcatttt tttgccttcc gcacatttcc attgctcggt acccacacct tgcttctcct 2760

gcacttgcca accttaatac tggtttacat tgaccaacat cttacaagcg gggggcttgt 2820

ctagggtata tataaacagt ggctctccca atcggttgcc agtctctttt ttcctttctt 2880

tccccacaga ttcgaaatct aaactacaca tcacaccatg gacaagaaat actccatcgg 2940

cctggacatt ggaaccaact ctgtcggctg ggctgtcatc accgacgagt acaaggtgcc 3000

ctccaagaaa ttcaaggtcc tcggaaacac cgatcgacac tccatcaaga aaaacctcat 3060

tggtgccctg ttgttcgatt ctggcgagac tgccgaagct accagactca agcgaactgc 3120

tcggcgacgt tacacccgac ggaagaaccg aatctgctac ctgcaggaga tcttttccaa 3180

cgagatggcc aaggtggacg attcgttctt tcatcgactg gaggaatcct tcctcgtcga 3240

ggaagacaag aaacacgagc gtcatcccat ctttggcaac attgtggacg aggttgctta 3300

ccacgagaag tatcctacca tctaccacct gcgaaagaaa ctcgtcgatt ccaccgacaa 3360

ggcggatctc agacttatct acctcgctct ggcacacatg atcaagtttc gaggtcattt 3420

cctcatcgag ggcgatctca atcccgacaa cagcgatgtg gacaagctgt tcattcagct 3480

cgttcagacc tacaaccagc tgttcgagga aaaccccatc aatgcctccg gagtcgatgc 3540

aaaggccatc ttgtctgctc gactctcgaa gagcagacga ctggagaacc tcattgccca 3600

acttcctggc gagaaaaaga acggactgtt tggcaacctc attgcccttt ctcttggtct 3660

cacacccaac ttcaagtcca acttcgatct ggcggaggac gccaagctcc agctgtccaa 3720

ggacacctac gacgatgacc tcgacaacct gcttgcacag attggcgatc agtacgccga 3780

cctgtttctc gctgccaaga acctttcgga tgctattctc ttgtctgaca ttctgcgagt 3840

caacaccgag atcacaaagg ctcccctttc tgcctccatg atcaagcgat acgacgagca 3900

ccatcaggat ctcacactgc tcaaggctct tgtccgacag caactgcccg agaagtacaa 3960

ggagatcttt ttcgatcagt cgaagaacgg ctacgctgga tacatcgacg gcggagcctc 4020

tcaggaagag ttctacaagt tcatcaagcc aattctcgag aagatggacg gaaccgagga 4080

actgcttgtc aagctcaatc gagaggatct gcttcggaag caacgaacct tcgacaacgg 4140

cagcattcct catcagatcc acctcggtga gctgcacgcc attcttcgac gtcaggaaga 4200

cttctacccc tttctcaagg acaaccgaga gaagatcgag aagattctta cctttcgaat 4260

cccctactat gttggtcctc ttgccagagg aaactctcga tttgcttgga tgactcgaaa 4320

gtccgaggaa accatcactc cctggaactt cgaggaagtc gtggacaagg gtgcctctgc 4380

acagtccttc atcgagcgaa tgaccaactt cgacaagaat ctgcccaacg agaaggttct 4440

tcccaagcat tcgctgctct acgagtactt tacagtctac aacgaactca ccaaagtcaa 4500

gtacgttacc gagggaatgc gaaagcctgc cttcttgtct ggcgaacaga agaaagccat 4560

tgtcgatctc ctgttcaaga ccaaccgaaa ggtcactgtt aagcagctca aggaggacta 4620

cttcaagaaa atcgagtgtt tcgacagcgt cgagatttcc ggagttgagg accgattcaa 4680

cgcctctttg ggcacctatc acgatctgct caagattatc aaggacaagg attttctcga 4740

caacgaggaa aacgaggaca ttctggagga catcgtgctc actcttaccc tgttcgaaga 4800

tcgggagatg atcgaggaac gactcaagac atacgctcac ctgttcgacg acaaggtcat 4860

gaaacaactc aagcgacgta gatacaccgg ctggggaaga ctttcgcgaa agctcatcaa 4920

cggcatcaga gacaagcagt ccggaaagac cattctggac tttctcaagt ccgatggctt 4980

tgccaaccga aacttcatgc agctcattca cgacgattct cttaccttca aggaggacat 5040

ccagaaggca caagtgtccg gtcagggcga cagcttgcac gaacatattg ccaacctggc 5100

tggttcgcca gccatcaaga aaggcattct ccagactgtc aaggttgtcg acgagctggt 5160

gaaggtcatg ggacgtcaca agcccgagaa cattgtgatc gagatggcca gagagaacca 5220

gacaactcaa aagggtcaga aaaactcgcg agagcggatg aagcgaatcg aggaaggcat 5280

caaggagctg ggatcccaga ttctcaagga gcatcccgtc gagaacactc aactgcagaa 5340

cgagaagctg tatctctact atctgcagaa tggtcgagac atgtacgtgg atcaggaact 5400

ggacatcaat cgtctcagcg actacgatgt ggaccacatt gtccctcaat cctttctcaa 5460

ggacgattct atcgacaaca aggtccttac acgatccgac aagaacagag gcaagtcgga 5520

caacgttccc agcgaagagg tggtcaaaaa gatgaagaac tactggcgac agctgctcaa 5580

cgccaagctc attacccagc gaaagttcga caatcttacc aaggccgagc gaggcggtct 5640

gtccgagctc gacaaggctg gcttcatcaa gcgtcaactc gtcgagacca gacagatcac 5700

aaagcacgtc gcacagattc tcgattctcg gatgaacacc aagtacgacg agaacgacaa 5760

gctcatccga gaggtcaagg tgattactct caagtccaaa ctggtctccg atttccgaaa 5820

ggactttcag ttctacaagg tgcgagagat caacaattac caccatgccc acgatgctta 5880

cctcaacgcc gtcgttggca ctgcgctcat caagaaatac cccaagctcg aaagcgagtt 5940

cgtttacggc gattacaagg tctacgacgt tcgaaagatg attgccaagt ccgaacagga 6000

gattggcaag gctactgcca agtacttctt ttactccaac atcatgaact ttttcaagac 6060

cgagatcacc ttggccaacg gagagattcg aaagagacca cttatcgaga ccaacggcga 6120

aactggagag atcgtgtggg acaagggtcg agactttgca accgtgcgaa aggttctgtc 6180

gatgcctcag gtcaacatcg tcaagaaaac cgaggttcag actggcggat tctccaagga 6240

gtcgattctg cccaagcgaa actccgacaa gctcatcgct cgaaagaaag actgggatcc 6300

caagaaatac ggtggcttcg attctcctac cgtcgcctat tccgtgcttg tcgttgcgaa 6360

ggtcgagaag ggcaagtcca aaaagctcaa gtccgtcaag gagctgctcg gaattaccat 6420

catggagcga tcgagcttcg agaagaatcc catcgacttc ttggaagcca agggttacaa 6480

ggaggtcaag aaagacctca ttatcaagct gcccaagtac tctctgttcg aactggagaa 6540

cggtcgaaag cgtatgctcg cctccgctgg cgagctgcag aagggaaacg agcttgcctt 6600

gccttcgaag tacgtcaact ttctctatct ggcttctcac tacgagaagc tcaagggttc 6660

tcccgaggac aacgaacaga agcaactctt cgttgagcag cacaaacatt acctcgacga 6720

gattatcgag cagatttccg agttttcgaa gcgagtcatc ctggctgatg ccaacttgga 6780

caaggtgctc tctgcctaca acaagcatcg ggacaaaccc attcgagaac aggcggagaa 6840

catcattcac ctgtttactc ttaccaacct gggtgctcct gcagctttca agtacttcga 6900

taccactatc gaccgaaagc ggtacacatc caccaaggag gttctcgatg ccaccctgat 6960

tcaccagtcc atcactggcc tgtacgagac ccgaatcgac ctgtctcagc ttggtggcga 7020

ctccagagcc gatcccaaga aaaagcgaaa ggtctaagcg gccgcaagtg tggatgggga 7080

agtgagtgcc cggttctgtg tgcacaattg gcaatccaag atggatggat tcaacacagg 7140

gatatagcga gctacgtggt ggtgcgagga tatagcaacg gatatttatg tttgacactt 7200

gagaatgtac gatacaagca ctgtccaagt acaatactaa acatactgta catactcata 7260

ctcgtacccg ggcaacggtt tcacttgagt gcagtggcta gtgctcttac tcgtacagtg 7320

tgcaatactg cgtatcatag tctttgatgt atatcgtatt cattcatgtt agttgcgtac 7380

gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa 7440

ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat 7500

gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc 7560

tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 7620

cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 7680

gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 7740

gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 7800

gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 7860

ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 7920

atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 7980

tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 8040

ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 8100

gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 8160

ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 8220

ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 8280

agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 8340

ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa 8400

aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca atctaaagta 8460

tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca cctatctcag 8520

cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag ataactacga 8580

tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac ccacgctcac 8640

cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc agaagtggtc 8700

ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct agagtaagta 8760

gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac 8820

gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg cgagttacat 8880

gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc gttgtcagaa 8940

gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg 9000

tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag 9060

aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc 9120

cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct 9180

caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat 9240

cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg 9300

ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatactc ttcctttttc 9360

aatattattg aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta 9420

tttagaaaaa taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg 9480

cgccctgtag cggcgcatta agcgcggcgg gtgtggtggt tacgcgcagc gtgaccgcta 9540

cacttgccag cgccctagcg cccgctcctt tcgctttctt cccttccttt ctcgccacgt 9600

tcgccggctt tccccgtcaa gctctaaatc gggggctccc tttagggttc cgatttagtg 9660

ctttacggca cctcgacccc aaaaaacttg attagggtga tggttcacgt agtgggccat 9720

cgccctgata gacggttttt cgccctttga cgttggagtc cacgttcttt aatagtggac 9780

tcttgttcca aactggaaca acactcaacc ctatctcggt ctattctttt gatttataag 9840

ggattttgcc gatttcggcc tattggttaa aaaatgagct gatttaacaa aaatttaacg 9900

cgaattttaa caaaatatta acgcttacaa tttccattcg ccattcaggc tgcgcaactg 9960

ttgggaaggg cgatcggtgc gggcctcttc gctattacgc cagctggcga aagggggatg 10020

tgctgcaagg cgattaagtt gggtaacgcc agggttttcc cagtcacgac gttgtaaaac 10080

gacggccagt gaattgtaat acgactcact atagggcgaa ttgggtaccg ggccccccct 10140

cgaggtcgat ggtgtcgata agcttgatat cgaattcatg tcacacaaac cgatcttcgc 10200

ctcaaggaaa cctaattcta catccgagag actgccgaga tccagtctac actgattaat 10260

tttcgggcca ataatttaaa aaaatcgtgt tatataatat tatatgtatt atatatatac 10320

atcatgatga tactgacagt catgtcccat tgctaaatag acagactcca tctgccgcct 10380

ccaactgatg ttctcaatat ttaaggggtc atctcgcatt gtttaataat aaacagactc 10440

catctaccgc ctccaaatga tgttctcaaa atatattgta tgaacttatt tttattactt 10500

agtattatta gacaacttac ttgctttatg aaaaacactt cctatttagg aaacaattta 10560

taatggcagt tcgttcattt aacaatttat gtagaataaa tgttataaat gcgtatggga 10620

aatcttaaat atggatagca taaatgatat ctgcattgcc taattcgaaa tcaacagcaa 10680

cgaaaaaaat cccttgtaca acataaatag tcatcgagaa atatcaacta tcaaagaaca 10740

gctattcaca cgttactatt gagattatta ttggacgaga atcacacact caactgtctt 10800

tctctcttct agaaatacag gtacaagtat gtactattct cattgttcat acttctagtc 10860

atttcatccc acatattcct tggatttctc tccaatgaat gacattctat cttgcaaatt 10920

caacaattat aataagatat accaaagtag cggtatagtg gcaatcaaaa agcttctctg 10980

gtgtgcttct cgtatttatt tttattctaa tgatccatta aaggtatata tttatttctt 11040

gttatataat ccttttgttt attacatggg ctggatacat aaaggtattt tgatttaatt 11100

ttttgcttaa attcaatccc ccctcgttca gtgtcaactg taatggtagg aaattaccat 11160

acttttgaag aagcaaaaaa aatgaaagaa aaaaaaaatc gtatttccag gttagacgtt 11220

ccgcagaatc tagaatgcgg tatgcggtac attgttcttc gaacgtaaaa gttgcgctcc 11280

ctgagatatt gtacattttt gcttttacaa gtacaagtac atcgtacaac tatgtactac 11340

tgttgatgca tccacaacag tttgttttgt ttttttttgt tttttttttt tctaatgatt 11400

cattaccgct atgtatacct acttgtactt gtagtaagcc gggttattgg cgttcaatta 11460

atcatagact tatgaatctg cacggtgtgc gctgcgagtt acttttagct tatgcatgct 11520

acttgggtgt aatattggga tctgttcgga aatcaacgga tgctcaat 11568

<210> 42

<211> 11507

<212> DNA

<213> 人工序列

<220>

<223> pRF85质粒

<400> 42

cgatccctgt gttgaatcca tccatcttgg attgccaatt gtgcacacag aaccgggcac 60

tcacttcccc atccacactt gcggccgcag acataaaaaa caaaaaaaaa aagcaccgac 120

tcggtgccac tttttcaagt tgataacgga ctagccttat tttaacttgc tatttctagc 180

tctaaaacga gggtgggtaa tcgtttgaga cgagcttact cgtttcgtcc tcacggactc 240

atcagtcaaa ccatggtgtg atgtgtagtt tagatttcga atctgtgggg aaagaaagga 300

aaaaagagac tggcaaccga ttgggagagc cactgtttat atatacccta gacaagcccc 360

ccgcttgtaa gatgttggtc aatgtaaacc agtattaagg ttggcaagtg caggagaagc 420

aaggtgtggg taccgagcaa tggaaatgtg cggaaggcaa aaaaatgagg ccacggccta 480

ttgtcggggc tatatccagg gggcgattga agtacactaa catgacatgt gtccacagac 540

cctcaatctg gcctgatgag ccaaatccat acgcgctttc gcagctctaa aggctataac 600

aagtcacacc accctgctcg acctcagcgc cctcactttt tgttaagaca aactgtacac 660

gctgttccag cgttttctgc ctgcacctgg tgggacattt ggtgcaacct aaagtgctcg 720

gaacctctgt ggtgtccaga tcagcgcagc agttccgagg tagttttgag gcccttagat 780

gatggtttaa acgtcgacga gtatctgtct gactcgttaa ttaagtcata cacaagtcag 840

ctttcttcga gcctcatata agtataagta gttcaacgta ttagcactgt acccagcatc 900

tccgtatcga gaaacacaac aacatgcccc attggacaga tcatgcggat acacaggttg 960

tgcagtatca tacatactcg atcagacagg tcgtctgacc atcatacaag ctgaacaagc 1020

gctccatact tgcacgctct ctatatacac agttaaatta catatccata gtctaacctc 1080

taacagttaa tcttctggta agcctcccag ccagccttct ggtatcgctt ggcctcctca 1140

ataggatctc ggttctggcc gtacagacct cggccgacaa ttatgatatc cgttccggta 1200

gacatgacat cctcaacagt tcggtactgc tgtccgagag cgtctccctt gtcgtcaaga 1260

cccaccccgg gggtcagaat aagccagtcc tcagagtcgc ccttaggtcg gttctgggca 1320

atgaagccaa ccacaaactc ggggtcggat cgggcaagct caatggtctg cttggagtac 1380

tcgccagtgg ccagagagcc cttgcaagac agctcggcca gcatgagcag acctctggcc 1440

agcttctcgt tgggagaggg gactaggaac tccttgtact gggagttctc gtagtcagag 1500

acgtcctcct tcttctgttc agagacagtt tcctcggcac cagctcgcag gccagcaatg 1560

attccggttc cgggtacacc gtgggcgttg gtgatatcgg accactcggc gattcggtga 1620

caccggtact ggtgcttgac agtgttgcca atatctgcga actttctgtc ctcgaacagg 1680

aagaaaccgt gcttaagagc aagttccttg agggggagca cagtgccggc gtaggtgaag 1740

tcgtcaatga tgtcgatatg ggttttgatc atgcacacat aaggtccgac cttatcggca 1800

agctcaatga gctccttggt ggtggtaaca tccagagaag cacacaggtt ggttttcttg 1860

gctgccacga gcttgagcac tcgagcggca aaggcggact tgtggacgtt agctcgagct 1920

tcgtaggagg gcattttggt ggtgaagagg agactgaaat aaatttagtc tgcagaactt 1980

tttatcggaa ccttatctgg ggcagtgaag tatatgttat ggtaatagtt acgagttagt 2040

tgaacttata gatagactgg actatacggc tatcggtcca aattagaaag aacgtcaatg 2100

gctctctggg cgtcgccttt gccgacaaaa atgtgatcat gatgaaagcc agcaatgacg 2160

ttgcagctga tattgttgtc ggccaaccgc gccgaaaacg cagctgtcag acccacagcc 2220

tccaacgaag aatgtatcgt caaagtgatc caagcacact catagttgga gtcgtactcc 2280

aaaggcggca atgacgagtc agacagatac tcgtcgacgt ttaaaccatc atctaagggc 2340

ctcaaaacta cctcggaact gctgcgctga tctggacacc acagaggttc cgagcacttt 2400

aggttgcacc aaatgtccca ccaggtgcag gcagaaaacg ctggaacagc gtgtacagtt 2460

tgtcttaaca aaaagtgagg gcgctgaggt cgagcagggt ggtgtgactt gttatagcct 2520

ttagagctgc gaaagcgcgt atggatttgg ctcatcaggc cagattgagg gtctgtggac 2580

acatgtcatg ttagtgtact tcaatcgccc cctggatata gccccgacaa taggccgtgg 2640

cctcattttt ttgccttccg cacatttcca ttgctcggta cccacacctt gcttctcctg 2700

cacttgccaa ccttaatact ggtttacatt gaccaacatc ttacaagcgg ggggcttgtc 2760

tagggtatat ataaacagtg gctctcccaa tcggttgcca gtctcttttt tcctttcttt 2820

ccccacagat tcgaaatcta aactacacat cacaccatgg acaagaaata ctccatcggc 2880

ctggacattg gaaccaactc tgtcggctgg gctgtcatca ccgacgagta caaggtgccc 2940

tccaagaaat tcaaggtcct cggaaacacc gatcgacact ccatcaagaa aaacctcatt 3000

ggtgccctgt tgttcgattc tggcgagact gccgaagcta ccagactcaa gcgaactgct 3060

cggcgacgtt acacccgacg gaagaaccga atctgctacc tgcaggagat cttttccaac 3120

gagatggcca aggtggacga ttcgttcttt catcgactgg aggaatcctt cctcgtcgag 3180

gaagacaaga aacacgagcg tcatcccatc tttggcaaca ttgtggacga ggttgcttac 3240

cacgagaagt atcctaccat ctaccacctg cgaaagaaac tcgtcgattc caccgacaag 3300

gcggatctca gacttatcta cctcgctctg gcacacatga tcaagtttcg aggtcatttc 3360

ctcatcgagg gcgatctcaa tcccgacaac agcgatgtgg acaagctgtt cattcagctc 3420

gttcagacct acaaccagct gttcgaggaa aaccccatca atgcctccgg agtcgatgca 3480

aaggccatct tgtctgctcg actctcgaag agcagacgac tggagaacct cattgcccaa 3540

cttcctggcg agaaaaagaa cggactgttt ggcaacctca ttgccctttc tcttggtctc 3600

acacccaact tcaagtccaa cttcgatctg gcggaggacg ccaagctcca gctgtccaag 3660

gacacctacg acgatgacct cgacaacctg cttgcacaga ttggcgatca gtacgccgac 3720

ctgtttctcg ctgccaagaa cctttcggat gctattctct tgtctgacat tctgcgagtc 3780

aacaccgaga tcacaaaggc tcccctttct gcctccatga tcaagcgata cgacgagcac 3840

catcaggatc tcacactgct caaggctctt gtccgacagc aactgcccga gaagtacaag 3900

gagatctttt tcgatcagtc gaagaacggc tacgctggat acatcgacgg cggagcctct 3960

caggaagagt tctacaagtt catcaagcca attctcgaga agatggacgg aaccgaggaa 4020

ctgcttgtca agctcaatcg agaggatctg cttcggaagc aacgaacctt cgacaacggc 4080

agcattcctc atcagatcca cctcggtgag ctgcacgcca ttcttcgacg tcaggaagac 4140

ttctacccct ttctcaagga caaccgagag aagatcgaga agattcttac ctttcgaatc 4200

ccctactatg ttggtcctct tgccagagga aactctcgat ttgcttggat gactcgaaag 4260

tccgaggaaa ccatcactcc ctggaacttc gaggaagtcg tggacaaggg tgcctctgca 4320

cagtccttca tcgagcgaat gaccaacttc gacaagaatc tgcccaacga gaaggttctt 4380

cccaagcatt cgctgctcta cgagtacttt acagtctaca acgaactcac caaagtcaag 4440

tacgttaccg agggaatgcg aaagcctgcc ttcttgtctg gcgaacagaa gaaagccatt 4500

gtcgatctcc tgttcaagac caaccgaaag gtcactgtta agcagctcaa ggaggactac 4560

ttcaagaaaa tcgagtgttt cgacagcgtc gagatttccg gagttgagga ccgattcaac 4620

gcctctttgg gcacctatca cgatctgctc aagattatca aggacaagga ttttctcgac 4680

aacgaggaaa acgaggacat tctggaggac atcgtgctca ctcttaccct gttcgaagat 4740

cgggagatga tcgaggaacg actcaagaca tacgctcacc tgttcgacga caaggtcatg 4800

aaacaactca agcgacgtag atacaccggc tggggaagac tttcgcgaaa gctcatcaac 4860

ggcatcagag acaagcagtc cggaaagacc attctggact ttctcaagtc cgatggcttt 4920

gccaaccgaa acttcatgca gctcattcac gacgattctc ttaccttcaa ggaggacatc 4980

cagaaggcac aagtgtccgg tcagggcgac agcttgcacg aacatattgc caacctggct 5040

ggttcgccag ccatcaagaa aggcattctc cagactgtca aggttgtcga cgagctggtg 5100

aaggtcatgg gacgtcacaa gcccgagaac attgtgatcg agatggccag agagaaccag 5160

acaactcaaa agggtcagaa aaactcgcga gagcggatga agcgaatcga ggaaggcatc 5220

aaggagctgg gatcccagat tctcaaggag catcccgtcg agaacactca actgcagaac 5280

gagaagctgt atctctacta tctgcagaat ggtcgagaca tgtacgtgga tcaggaactg 5340

gacatcaatc gtctcagcga ctacgatgtg gaccacattg tccctcaatc ctttctcaag 5400

gacgattcta tcgacaacaa ggtccttaca cgatccgaca agaacagagg caagtcggac 5460

aacgttccca gcgaagaggt ggtcaaaaag atgaagaact actggcgaca gctgctcaac 5520

gccaagctca ttacccagcg aaagttcgac aatcttacca aggccgagcg aggcggtctg 5580

tccgagctcg acaaggctgg cttcatcaag cgtcaactcg tcgagaccag acagatcaca 5640

aagcacgtcg cacagattct cgattctcgg atgaacacca agtacgacga gaacgacaag 5700

ctcatccgag aggtcaaggt gattactctc aagtccaaac tggtctccga tttccgaaag 5760

gactttcagt tctacaaggt gcgagagatc aacaattacc accatgccca cgatgcttac 5820

ctcaacgccg tcgttggcac tgcgctcatc aagaaatacc ccaagctcga aagcgagttc 5880

gtttacggcg attacaaggt ctacgacgtt cgaaagatga ttgccaagtc cgaacaggag 5940

attggcaagg ctactgccaa gtacttcttt tactccaaca tcatgaactt tttcaagacc 6000

gagatcacct tggccaacgg agagattcga aagagaccac ttatcgagac caacggcgaa 6060

actggagaga tcgtgtggga caagggtcga gactttgcaa ccgtgcgaaa ggttctgtcg 6120

atgcctcagg tcaacatcgt caagaaaacc gaggttcaga ctggcggatt ctccaaggag 6180

tcgattctgc ccaagcgaaa ctccgacaag ctcatcgctc gaaagaaaga ctgggatccc 6240

aagaaatacg gtggcttcga ttctcctacc gtcgcctatt ccgtgcttgt cgttgcgaag 6300

gtcgagaagg gcaagtccaa aaagctcaag tccgtcaagg agctgctcgg aattaccatc 6360

atggagcgat cgagcttcga gaagaatccc atcgacttct tggaagccaa gggttacaag 6420

gaggtcaaga aagacctcat tatcaagctg cccaagtact ctctgttcga actggagaac 6480

ggtcgaaagc gtatgctcgc ctccgctggc gagctgcaga agggaaacga gcttgccttg 6540

ccttcgaagt acgtcaactt tctctatctg gcttctcact acgagaagct caagggttct 6600

cccgaggaca acgaacagaa gcaactcttc gttgagcagc acaaacatta cctcgacgag 6660

attatcgagc agatttccga gttttcgaag cgagtcatcc tggctgatgc caacttggac 6720

aaggtgctct ctgcctacaa caagcatcgg gacaaaccca ttcgagaaca ggcggagaac 6780

atcattcacc tgtttactct taccaacctg ggtgctcctg cagctttcaa gtacttcgat 6840

accactatcg accgaaagcg gtacacatcc accaaggagg ttctcgatgc caccctgatt 6900

caccagtcca tcactggcct gtacgagacc cgaatcgacc tgtctcagct tggtggcgac 6960

tccagagccg atcccaagaa aaagcgaaag gtctaagcgg ccgcaagtgt ggatggggaa 7020

gtgagtgccc ggttctgtgt gcacaattgg caatccaaga tggatggatt caacacaggg 7080

atatagcgag ctacgtggtg gtgcgaggat atagcaacgg atatttatgt ttgacacttg 7140

agaatgtacg atacaagcac tgtccaagta caatactaaa catactgtac atactcatac 7200

tcgtacccgg gcaacggttt cacttgagtg cagtggctag tgctcttact cgtacagtgt 7260

gcaatactgc gtatcatagt ctttgatgta tatcgtattc attcatgtta gttgcgtacg 7320

agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat 7380

tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg 7440

aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct 7500

cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 7560

ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 7620

ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 7680

cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 7740

actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 7800

cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 7860

tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 7920

gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 7980

caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 8040

agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 8100

tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 8160

tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 8220

gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 8280

gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 8340

aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 8400

atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 8460

gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 8520

acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 8580

ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 8640

tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 8700

ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg 8760

ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg 8820

atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag 8880

taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt 8940

catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga 9000

atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc 9060

acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc 9120

aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc 9180

ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc 9240

cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca 9300

atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat 9360

ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgc 9420

gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac 9480

acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt 9540

cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc gatttagtgc 9600

tttacggcac ctcgacccca aaaaacttga ttagggtgat ggttcacgta gtgggccatc 9660

gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact 9720

cttgttccaa actggaacaa cactcaaccc tatctcggtc tattcttttg atttataagg 9780

gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc 9840

gaattttaac aaaatattaa cgcttacaat ttccattcgc cattcaggct gcgcaactgt 9900

tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 9960

gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 10020

acggccagtg aattgtaata cgactcacta tagggcgaat tgggtaccgg gccccccctc 10080

gaggtcgatg gtgtcgataa gcttgatatc gaattcatgt cacacaaacc gatcttcgcc 10140

tcaaggaaac ctaattctac atccgagaga ctgccgagat ccagtctaca ctgattaatt 10200

ttcgggccaa taatttaaaa aaatcgtgtt atataatatt atatgtatta tatatataca 10260

tcatgatgat actgacagtc atgtcccatt gctaaataga cagactccat ctgccgcctc 10320

caactgatgt tctcaatatt taaggggtca tctcgcattg tttaataata aacagactcc 10380

atctaccgcc tccaaatgat gttctcaaaa tatattgtat gaacttattt ttattactta 10440

gtattattag acaacttact tgctttatga aaaacacttc ctatttagga aacaatttat 10500

aatggcagtt cgttcattta acaatttatg tagaataaat gttataaatg cgtatgggaa 10560

atcttaaata tggatagcat aaatgatatc tgcattgcct aattcgaaat caacagcaac 10620

gaaaaaaatc ccttgtacaa cataaatagt catcgagaaa tatcaactat caaagaacag 10680

ctattcacac gttactattg agattattat tggacgagaa tcacacactc aactgtcttt 10740

ctctcttcta gaaatacagg tacaagtatg tactattctc attgttcata cttctagtca 10800

tttcatccca catattcctt ggatttctct ccaatgaatg acattctatc ttgcaaattc 10860

aacaattata ataagatata ccaaagtagc ggtatagtgg caatcaaaaa gcttctctgg 10920

tgtgcttctc gtatttattt ttattctaat gatccattaa aggtatatat ttatttcttg 10980

ttatataatc cttttgttta ttacatgggc tggatacata aaggtatttt gatttaattt 11040

tttgcttaaa ttcaatcccc cctcgttcag tgtcaactgt aatggtagga aattaccata 11100

cttttgaaga agcaaaaaaa atgaaagaaa aaaaaaatcg tatttccagg ttagacgttc 11160

cgcagaatct agaatgcggt atgcggtaca ttgttcttcg aacgtaaaag ttgcgctccc 11220

tgagatattg tacatttttg cttttacaag tacaagtaca tcgtacaact atgtactact 11280

gttgatgcat ccacaacagt ttgttttgtt tttttttgtt tttttttttt ctaatgattc 11340

attaccgcta tgtataccta cttgtacttg tagtaagccg ggttattggc gttcaattaa 11400

tcatagactt atgaatctgc acggtgtgcg ctgcgagtta cttttagctt atgcatgcta 11460

cttgggtgta atattgggat ctgttcggaa atcaacggat gctcaat 11507

<210> 43

<211> 4

<212> RNA

<213> 未知

<220>

<223> RNA成环序列(GAAA)

<400> 43

gaaa 4

<210> 44

<211> 4

<212> RNA

<213> 未知

<220>

<223> RNA成环序列(CAAA)

<400> 44

caaa 4

<210> 45

<211> 4

<212> RNA

<213> 未知

<220>

<223> RNA成环序列(AAAG)

<400> 45

aaag 4

<210> 46

<211> 23

<212> DNA

<213> 未知

<220>

<223> Cas9靶位点:PAM序列的示例

<220>

<221> misc_feature

<222> (1)..(20)

<223> n = A、C、T或G

<220>

<221> misc_feature

<222> (21)..(21)

<223> n = A、C、T或G(在规格中表示为“X”)

<400> 46

nnnnnnnnnn nnnnnnnnnn ngg 23

<210> 47

<211> 3

<212> DNA

<213> 未知

<220>

<223> PAM序列NGG

<220>

<221> misc_feature

<222> (1)..(1)

<223> n = A、C、T或G

<400> 47

ngg 3

<210> 48

<211> 6

<212> DNA

<213> 未知

<220>

<223> PAM序列NNAGAA

<220>

<221> misc_feature

<222> (1)..(2)

<223> n = A、C、T或G

<400> 48

nnagaa 6

<210> 49

<211> 7

<212> DNA

<213> 未知

<220>

<223> PAM序列NNAGAAW

<220>

<221> misc_feature

<222> (1)..(2)

<223> n = A、C、T或G

<220>

<221> misc_feature

<222> (7)..(7)

<223> W=A或T

<400> 49

nnagaaw 7

<210> 50

<211> 5

<212> DNA

<213> 未知

<220>

<223> PAM序列NGGNG

<220>

<221> misc_feature

<222> (1)..(1)

<223> n = A、C、T或G

<220>

<221> misc_feature

<222> (4)..(4)

<223> n = A、C、T或G

<400> 50

nggng 5

<210> 51

<211> 8

<212> DNA

<213> 未知

<220>

<223> PAM序列NNNNGATT

<220>

<221> misc_feature

<222> (1)..(4)

<223> n = A、C、T或G

<400> 51

nnnngatt 8

<210> 52

<211> 6

<212> DNA

<213> 未知

<220>

<223> PAM序列NAAAAC

<220>

<221> misc_feature

<222> (1)..(1)

<223> n = A、C、T或G

<400> 52

naaaac 6

<210> 53

<211> 2

<212> DNA

<213> 未知

<220>

<223> PAM序列NG

<220>

<221> misc_feature

<222> (1)..(1)

<223> n = A、C、T或G

<400> 53

ng 2

<210> 54

<211> 22

<212> RNA

<213> 未知

<220>

<223> TracrRNA配对序列示例1

<400> 54

guuuuuguac ucucaagauu ua 22

<210> 55

<211> 15

<212> RNA

<213> 未知

<220>

<223> TracrRNA配对序列示例2

<400> 55

guuuuuguac ucuca 15

<210> 56

<211> 12

<212> RNA

<213> 未知

<220>

<223> TracrRNA配对序列示例3

<400> 56

guuuuagagc ua 12

<210> 57

<211> 13

<212> RNA

<213> 未知

<220>

<223> TracrRNA配对序列示例4

<400> 57

guuuuagagc uag 13

<210> 58

<211> 60

<212> RNA

<213> 化脓链球菌

<400> 58

uagcaaguua aaauaaggcu aguccguuau caacuugaaa aaguggcacc gagucggugc 60

<210> 59

<211> 45

<212> RNA

<213> 化脓链球菌

<400> 59

uagcaaguua aaauaaggcu aguccguuau caacuugaaa aagug 45

<210> 60

<211> 32

<212> RNA

<213> 化脓链球菌

<400> 60

uagcaaguua aaauaaggcu aguccguuau ca 32

<210> 61

<211> 85

<212> RNA

<213> 嗜热链球菌

<400> 61

uaaaucuugc agaagcuaca aagauaaggc uucaugccga aaucaacacc cugucauuuu 60

auggcagggu guuuucguua uuuaa 85

<210> 62

<211> 77

<212> RNA

<213> 嗜热链球菌

<400> 62

ugcagaagcu acaaagauaa ggcuucaugc cgaaaucaac acccugucau uuuauggcag 60

gguguuuucg uuauuua 77

<210> 63

<211> 65

<212> RNA

<213> 嗜热链球菌

<400> 63

ugcagaagcu acaaagauaa ggcuucaugc cgaaaucaac acccugucau uuuauggcag 60

ggugu 65

<210> 64

<211> 131

<212> RNA

<213> 人工序列

<220>

<223> gRNA示例1

<220>

<221> misc_feature

<222> (1)..(20)

<223> n = A、C、U或G

<400> 64

nnnnnnnnnn nnnnnnnnnn guuuuuguac ucucaagauu uagaaauaaa ucuugcagaa 60

gcuacaaaga uaaggcuuca ugccgaaauc aacacccugu cauuuuaugg caggguguuu 120

ucguuauuua a 131

<210> 65

<211> 117

<212> RNA

<213> 人工序列

<220>

<223> gRNA示例2

<220>

<221> misc_feature

<222> (1)..(20)

<223> n = A、C、U或G

<400> 65

nnnnnnnnnn nnnnnnnnnn guuuuuguac ucucagaaau gcagaagcua caaagauaag 60

gcuucaugcc gaaaucaaca cccugucauu uuauggcagg guguuuucgu uauuuaa 117

<210> 66

<211> 104

<212> RNA

<213> 人工序列

<220>

<223> gRNA示例3

<220>

<221> misc_feature

<222> (1)..(20)

<223> n = A、C、U或G

<400> 66

nnnnnnnnnn nnnnnnnnnn guuuuuguac ucucagaaau gcagaagcua caaagauaag 60

gcuucaugcc gaaaucaaca cccugucauu uuauggcagg gugu 104

<210> 67

<211> 99

<212> RNA

<213> 人工序列

<220>

<223> gRNA示例4

<220>

<221> misc_feature

<222> (1)..(20)

<223> n = A、C、U或G

<400> 67

nnnnnnnnnn nnnnnnnnnn guuuuuguac ucucagaaau agcaaguuaa aauaaggcua 60

guccguuauc aacuugaaaa aguggcaccg agucggugc 99

<210> 68

<211> 81

<212> RNA

<213> 人工序列

<220>

<223> gRNA示例5

<220>

<221> misc_feature

<222> (1)..(20)

<223> n = A、C、U或G

<400> 68

nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu g 81

<210> 69

<211> 68

<212> RNA

<213> 人工序列

<220>

<223> gRNA示例6

<220>

<221> misc_feature

<222> (1)..(20)

<223> n = A、C、U或G

<400> 69

nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuauca 68

<210> 70

<211> 100

<212> RNA

<213> 人工序列

<220>

<223> gRNA示例7

<220>

<221> misc_feature

<222> (1)..(20)

<223> n = A、C、U或G

<400> 70

nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100

<210> 71

<211> 53

<212> DNA

<213> 解脂耶氏酵母

<400> 71

caatggaaaa gacattttca aacgattacc caccctccgg gactgaggcc cac 53

<210> 72

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 序列1示于图5中

<400> 72

caatggaaaa gacattttca aacgattacc cacctccggg actgaggccc ac 52

<210> 73

<211> 51

<212> DNA

<213> 人工序列

<220>

<223> 序列2示于图5中

<400> 73

caatggaaaa gacattttca aacgattacc cactccggga ctgaggccca c 51

<210> 74

<211> 49

<212> DNA

<213> 人工序列

<220>

<223> 序列3示于图5中

<400> 74

caatggaaaa gacattttca aacgattacc caccgggact gaggcccac 49

<210> 75

<211> 46

<212> DNA

<213> 人工序列

<220>

<223> 序列4示于图5中

<400> 75

caatggaaaa gacattttca aacgattacc cgggactgag gcccac 46

<210> 76

<211> 13

<212> DNA

<213> 人工序列

<220>

<223> 序列5示于图5中

<400> 76

cactgaggcc cac 13

<210> 77

<211> 54

<212> DNA

<213> 人工序列

<220>

<223> 序列6示于图5中

<400> 77

caatggaaaa gacattttca aacgattacc caccactccg ggactgaggc ccac 54

<210> 78

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 序列7示于图5中

<400> 78

caatggaaaa gacattttca aacgattacc tccgggactg aggcccac 48

<210> 79

<211> 46

<212> DNA

<213> 人工序列

<220>

<223> 序列8示于图5中

<400> 79

caatggaaaa gacattttca aacgattacc cgggactgag gcccac 46

<210> 80

<211> 44

<212> DNA

<213> 人工序列

<220>

<223> 序列9示于图5中

<400> 80

caatggaaaa gacattttca aacgattacc cacctgaggc ccac 44

<210> 81

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 序列10示于图5中

<400> 81

caatggaaaa gacattttca aacgattacc cacgggactg aggcccac 48

<210> 82

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 序列11示于图5中

<400> 82

caatggaaaa gacattttca aacgattaca cacggcccac 40

<210> 83

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 序列12示于图5中

<400> 83

caatggaaaa gacattttct ccgggactga ggcccac 37

<210> 84

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> 序列13示于图5中

<400> 84

caatggaaaa gacattttca aacgctccgg gactgaggcc cac 43

<210> 85

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> 序列14示于图5中

<400> 85

caatggaaaa gacattttca aacgatccgg gactgaggcc cac 43

<210> 86

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 序列15示于图5中

<400> 86

caatggaaaa gacattttca aacgataccc cac 33

<210> 87

<211> 54

<212> DNA

<213> 人工序列

<220>

<223> 序列16示于图5中

<400> 87

caatggaaaa gacattttca aacgattacc cacccctccg ggactgaggc ccac 54

<210> 88

<211> 49

<212> DNA

<213> 人工序列

<220>

<223> 序列17示于图5中

<400> 88

caatggaaaa gacattttca aacgattacc ctccgggact gaggcccac 49

<210> 89

<211> 54

<212> DNA

<213> 人工序列

<220>

<223> 序列18示于图5中

<400> 89

caatggaaaa gacattttca aacgattacc cacccctccg ggactgaggc ccac 54

<210> 90

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> AarI-去除-1

<400> 90

agaagtatcc taccatctac catctccgaa agaaactcgt cgattcc 47

<210> 91

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> AarI-去除-2

<400> 91

ggaatcgacg agtttctttc ggagatggta gatggtagga tacttct 47

<210> 92

<211> 10706

<212> DNA

<213> 人工序列

<220>

<223> pRF109

<400> 92

catggacaag aaatactcca tcggcctgga cattggaacc aactctgtcg gctgggctgt 60

catcaccgac gagtacaagg tgccctccaa gaaattcaag gtcctcggaa acaccgatcg 120

acactccatc aagaaaaacc tcattggtgc cctgttgttc gattctggcg agactgccga 180

agctaccaga ctcaagcgaa ctgctcggcg acgttacacc cgacggaaga accgaatctg 240

ctacctgcag gagatctttt ccaacgagat ggccaaggtg gacgattcgt tctttcatcg 300

actggaggaa tccttcctcg tcgaggaaga caagaaacac gagcgtcatc ccatctttgg 360

caacattgtg gacgaggttg cttaccacga gaagtatcct accatctacc atctccgaaa 420

gaaactcgtc gattccaccg acaaggcgga tctcagactt atctacctcg ctctggcaca 480

catgatcaag tttcgaggtc atttcctcat cgagggcgat ctcaatcccg acaacagcga 540

tgtggacaag ctgttcattc agctcgttca gacctacaac cagctgttcg aggaaaaccc 600

catcaatgcc tccggagtcg atgcaaaggc catcttgtct gctcgactct cgaagagcag 660

acgactggag aacctcattg cccaacttcc tggcgagaaa aagaacggac tgtttggcaa 720

cctcattgcc ctttctcttg gtctcacacc caacttcaag tccaacttcg atctggcgga 780

ggacgccaag ctccagctgt ccaaggacac ctacgacgat gacctcgaca acctgcttgc 840

acagattggc gatcagtacg ccgacctgtt tctcgctgcc aagaaccttt cggatgctat 900

tctcttgtct gacattctgc gagtcaacac cgagatcaca aaggctcccc tttctgcctc 960

catgatcaag cgatacgacg agcaccatca ggatctcaca ctgctcaagg ctcttgtccg 1020

acagcaactg cccgagaagt acaaggagat ctttttcgat cagtcgaaga acggctacgc 1080

tggatacatc gacggcggag cctctcagga agagttctac aagttcatca agccaattct 1140

cgagaagatg gacggaaccg aggaactgct tgtcaagctc aatcgagagg atctgcttcg 1200

gaagcaacga accttcgaca acggcagcat tcctcatcag atccacctcg gtgagctgca 1260

cgccattctt cgacgtcagg aagacttcta cccctttctc aaggacaacc gagagaagat 1320

cgagaagatt cttacctttc gaatccccta ctatgttggt cctcttgcca gaggaaactc 1380

tcgatttgct tggatgactc gaaagtccga ggaaaccatc actccctgga acttcgagga 1440

agtcgtggac aagggtgcct ctgcacagtc cttcatcgag cgaatgacca acttcgacaa 1500

gaatctgccc aacgagaagg ttcttcccaa gcattcgctg ctctacgagt actttacagt 1560

ctacaacgaa ctcaccaaag tcaagtacgt taccgaggga atgcgaaagc ctgccttctt 1620

gtctggcgaa cagaagaaag ccattgtcga tctcctgttc aagaccaacc gaaaggtcac 1680

tgttaagcag ctcaaggagg actacttcaa gaaaatcgag tgtttcgaca gcgtcgagat 1740

ttccggagtt gaggaccgat tcaacgcctc tttgggcacc tatcacgatc tgctcaagat 1800

tatcaaggac aaggattttc tcgacaacga ggaaaacgag gacattctgg aggacatcgt 1860

gctcactctt accctgttcg aagatcggga gatgatcgag gaacgactca agacatacgc 1920

tcacctgttc gacgacaagg tcatgaaaca actcaagcga cgtagataca ccggctgggg 1980

aagactttcg cgaaagctca tcaacggcat cagagacaag cagtccggaa agaccattct 2040

ggactttctc aagtccgatg gctttgccaa ccgaaacttc atgcagctca ttcacgacga 2100

ttctcttacc ttcaaggagg acatccagaa ggcacaagtg tccggtcagg gcgacagctt 2160

gcacgaacat attgccaacc tggctggttc gccagccatc aagaaaggca ttctccagac 2220

tgtcaaggtt gtcgacgagc tggtgaaggt catgggacgt cacaagcccg agaacattgt 2280

gatcgagatg gccagagaga accagacaac tcaaaagggt cagaaaaact cgcgagagcg 2340

gatgaagcga atcgaggaag gcatcaagga gctgggatcc cagattctca aggagcatcc 2400

cgtcgagaac actcaactgc agaacgagaa gctgtatctc tactatctgc agaatggtcg 2460

agacatgtac gtggatcagg aactggacat caatcgtctc agcgactacg atgtggacca 2520

cattgtccct caatcctttc tcaaggacga ttctatcgac aacaaggtcc ttacacgatc 2580

cgacaagaac agaggcaagt cggacaacgt tcccagcgaa gaggtggtca aaaagatgaa 2640

gaactactgg cgacagctgc tcaacgccaa gctcattacc cagcgaaagt tcgacaatct 2700

taccaaggcc gagcgaggcg gtctgtccga gctcgacaag gctggcttca tcaagcgtca 2760

actcgtcgag accagacaga tcacaaagca cgtcgcacag attctcgatt ctcggatgaa 2820

caccaagtac gacgagaacg acaagctcat ccgagaggtc aaggtgatta ctctcaagtc 2880

caaactggtc tccgatttcc gaaaggactt tcagttctac aaggtgcgag agatcaacaa 2940

ttaccaccat gcccacgatg cttacctcaa cgccgtcgtt ggcactgcgc tcatcaagaa 3000

ataccccaag ctcgaaagcg agttcgttta cggcgattac aaggtctacg acgttcgaaa 3060

gatgattgcc aagtccgaac aggagattgg caaggctact gccaagtact tcttttactc 3120

caacatcatg aactttttca agaccgagat caccttggcc aacggagaga ttcgaaagag 3180

accacttatc gagaccaacg gcgaaactgg agagatcgtg tgggacaagg gtcgagactt 3240

tgcaaccgtg cgaaaggttc tgtcgatgcc tcaggtcaac atcgtcaaga aaaccgaggt 3300

tcagactggc ggattctcca aggagtcgat tctgcccaag cgaaactccg acaagctcat 3360

cgctcgaaag aaagactggg atcccaagaa atacggtggc ttcgattctc ctaccgtcgc 3420

ctattccgtg cttgtcgttg cgaaggtcga gaagggcaag tccaaaaagc tcaagtccgt 3480

caaggagctg ctcggaatta ccatcatgga gcgatcgagc ttcgagaaga atcccatcga 3540

cttcttggaa gccaagggtt acaaggaggt caagaaagac ctcattatca agctgcccaa 3600

gtactctctg ttcgaactgg agaacggtcg aaagcgtatg ctcgcctccg ctggcgagct 3660

gcagaaggga aacgagcttg ccttgccttc gaagtacgtc aactttctct atctggcttc 3720

tcactacgag aagctcaagg gttctcccga ggacaacgaa cagaagcaac tcttcgttga 3780

gcagcacaaa cattacctcg acgagattat cgagcagatt tccgagtttt cgaagcgagt 3840

catcctggct gatgccaact tggacaaggt gctctctgcc tacaacaagc atcgggacaa 3900

acccattcga gaacaggcgg agaacatcat tcacctgttt actcttacca acctgggtgc 3960

tcctgcagct ttcaagtact tcgataccac tatcgaccga aagcggtaca catccaccaa 4020

ggaggttctc gatgccaccc tgattcacca gtccatcact ggcctgtacg agacccgaat 4080

cgacctgtct cagcttggtg gcgactccag agccgatccc aagaaaaagc gaaaggtcta 4140

agcggccgca agtgtggatg gggaagtgag tgcccggttc tgtgtgcaca attggcaatc 4200

caagatggat ggattcaaca cagggatata gcgagctacg tggtggtgcg aggatatagc 4260

aacggatatt tatgtttgac acttgagaat gtacgataca agcactgtcc aagtacaata 4320

ctaaacatac tgtacatact catactcgta cccgggcaac ggtttcactt gagtgcagtg 4380

gctagtgctc ttactcgtac agtgtgcaat actgcgtatc atagtctttg atgtatatcg 4440

tattcattca tgttagttgc gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4500

aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4560

acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4620

ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4680

gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4740

caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 4800

tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 4860

gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 4920

ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 4980

cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 5040

tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 5100

tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 5160

cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 5220

agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 5280

agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5340

gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5400

aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5460

ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5520

gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5580

taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5640

tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5700

tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 5760

gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 5820

gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 5880

ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 5940

cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 6000

tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 6060

cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 6120

agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 6180

cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 6240

aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6300

aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6360

gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6420

gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6480

tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6540

ttccccgaaa agtgccacct gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6600

tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 6660

tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6720

tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 6780

gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 6840

agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 6900

cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 6960

agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttcca 7020

ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7080

acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 7140

ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact cactataggg 7200

cgaattgggt accgggcccc ccctcgaggt cgatggtgtc gataagcttg atatcgaatt 7260

catgtcacac aaaccgatct tcgcctcaag gaaacctaat tctacatccg agagactgcc 7320

gagatccagt ctacactgat taattttcgg gccaataatt taaaaaaatc gtgttatata 7380

atattatatg tattatatat atacatcatg atgatactga cagtcatgtc ccattgctaa 7440

atagacagac tccatctgcc gcctccaact gatgttctca atatttaagg ggtcatctcg 7500

cattgtttaa taataaacag actccatcta ccgcctccaa atgatgttct caaaatatat 7560

tgtatgaact tatttttatt acttagtatt attagacaac ttacttgctt tatgaaaaac 7620

acttcctatt taggaaacaa tttataatgg cagttcgttc atttaacaat ttatgtagaa 7680

taaatgttat aaatgcgtat gggaaatctt aaatatggat agcataaatg atatctgcat 7740

tgcctaattc gaaatcaaca gcaacgaaaa aaatcccttg tacaacataa atagtcatcg 7800

agaaatatca actatcaaag aacagctatt cacacgttac tattgagatt attattggac 7860

gagaatcaca cactcaactg tctttctctc ttctagaaat acaggtacaa gtatgtacta 7920

ttctcattgt tcatacttct agtcatttca tcccacatat tccttggatt tctctccaat 7980

gaatgacatt ctatcttgca aattcaacaa ttataataag atataccaaa gtagcggtat 8040

agtggcaatc aaaaagcttc tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc 8100

attaaaggta tatatttatt tcttgttata taatcctttt gtttattaca tgggctggat 8160

acataaaggt attttgattt aattttttgc ttaaattcaa tcccccctcg ttcagtgtca 8220

actgtaatgg taggaaatta ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa 8280

aatcgtattt ccaggttaga cgttccgcag aatctagaat gcggtatgcg gtacattgtt 8340

cttcgaacgt aaaagttgcg ctccctgaga tattgtacat ttttgctttt acaagtacaa 8400

gtacatcgta caactatgta ctactgttga tgcatccaca acagtttgtt ttgttttttt 8460

ttgttttttt tttttctaat gattcattac cgctatgtat acctacttgt acttgtagta 8520

agccgggtta ttggcgttca attaatcata gacttatgaa tctgcacggt gtgcgctgcg 8580

agttactttt agcttatgca tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa 8640

cggatgctca atcgatttcg acagtaatta attaagtcat acacaagtca gctttcttcg 8700

agcctcatat aagtataagt agttcaacgt attagcactg tacccagcat ctccgtatcg 8760

agaaacacaa caacatgccc cattggacag atcatgcgga tacacaggtt gtgcagtatc 8820

atacatactc gatcagacag gtcgtctgac catcatacaa gctgaacaag cgctccatac 8880

ttgcacgctc tctatataca cagttaaatt acatatccat agtctaacct ctaacagtta 8940

atcttctggt aagcctccca gccagccttc tggtatcgct tggcctcctc aataggatct 9000

cggttctggc cgtacagacc tcggccgaca attatgatat ccgttccggt agacatgaca 9060

tcctcaacag ttcggtactg ctgtccgaga gcgtctccct tgtcgtcaag acccaccccg 9120

ggggtcagaa taagccagtc ctcagagtcg cccttaggtc ggttctgggc aatgaagcca 9180

accacaaact cggggtcgga tcgggcaagc tcaatggtct gcttggagta ctcgccagtg 9240

gccagagagc ccttgcaaga cagctcggcc agcatgagca gacctctggc cagcttctcg 9300

ttgggagagg ggactaggaa ctccttgtac tgggagttct cgtagtcaga gacgtcctcc 9360

ttcttctgtt cagagacagt ttcctcggca ccagctcgca ggccagcaat gattccggtt 9420

ccgggtacac cgtgggcgtt ggtgatatcg gaccactcgg cgattcggtg acaccggtac 9480

tggtgcttga cagtgttgcc aatatctgcg aactttctgt cctcgaacag gaagaaaccg 9540

tgcttaagag caagttcctt gagggggagc acagtgccgg cgtaggtgaa gtcgtcaatg 9600

atgtcgatat gggttttgat catgcacaca taaggtccga ccttatcggc aagctcaatg 9660

agctccttgg tggtggtaac atccagagaa gcacacaggt tggttttctt ggctgccacg 9720

agcttgagca ctcgagcggc aaaggcggac ttgtggacgt tagctcgagc ttcgtaggag 9780

ggcattttgg tggtgaagag gagactgaaa taaatttagt ctgcagaact ttttatcgga 9840

accttatctg gggcagtgaa gtatatgtta tggtaatagt tacgagttag ttgaacttat 9900

agatagactg gactatacgg ctatcggtcc aaattagaaa gaacgtcaat ggctctctgg 9960

gcgtcgcctt tgccgacaaa aatgtgatca tgatgaaagc cagcaatgac gttgcagctg 10020

atattgttgt cggccaaccg cgccgaaaac gcagctgtca gacccacagc ctccaacgaa 10080

gaatgtatcg tcaaagtgat ccaagcacac tcatagttgg agtcgtactc caaaggcggc 10140

aatgacgagt cagacagata ctcgtcgacg tttaaaccat catctaaggg cctcaaaact 10200

acctcggaac tgctgcgctg atctggacac cacagaggtt ccgagcactt taggttgcac 10260

caaatgtccc accaggtgca ggcagaaaac gctggaacag cgtgtacagt ttgtcttaac 10320

aaaaagtgag ggcgctgagg tcgagcaggg tggtgtgact tgttatagcc tttagagctg 10380

cgaaagcgcg tatggatttg gctcatcagg ccagattgag ggtctgtgga cacatgtcat 10440

gttagtgtac ttcaatcgcc ccctggatat agccccgaca ataggccgtg gcctcatttt 10500

tttgccttcc gcacatttcc attgctcggt acccacacct tgcttctcct gcacttgcca 10560

accttaatac tggtttacat tgaccaacat cttacaagcg gggggcttgt ctagggtata 10620

tataaacagt ggctctccca atcggttgcc agtctctttt ttcctttctt tccccacaga 10680

ttcgaaatct aaactacaca tcacac 10706

<210> 93

<211> 4140

<212> DNA

<213> 人工序列

<220>

<223> Aar1- Cas9基因

<400> 93

atggacaaga aatactccat cggcctggac attggaacca actctgtcgg ctgggctgtc 60

atcaccgacg agtacaaggt gccctccaag aaattcaagg tcctcggaaa caccgatcga 120

cactccatca agaaaaacct cattggtgcc ctgttgttcg attctggcga gactgccgaa 180

gctaccagac tcaagcgaac tgctcggcga cgttacaccc gacggaagaa ccgaatctgc 240

tacctgcagg agatcttttc caacgagatg gccaaggtgg acgattcgtt ctttcatcga 300

ctggaggaat ccttcctcgt cgaggaagac aagaaacacg agcgtcatcc catctttggc 360

aacattgtgg acgaggttgc ttaccacgag aagtatccta ccatctacca tctccgaaag 420

aaactcgtcg attccaccga caaggcggat ctcagactta tctacctcgc tctggcacac 480

atgatcaagt ttcgaggtca tttcctcatc gagggcgatc tcaatcccga caacagcgat 540

gtggacaagc tgttcattca gctcgttcag acctacaacc agctgttcga ggaaaacccc 600

atcaatgcct ccggagtcga tgcaaaggcc atcttgtctg ctcgactctc gaagagcaga 660

cgactggaga acctcattgc ccaacttcct ggcgagaaaa agaacggact gtttggcaac 720

ctcattgccc tttctcttgg tctcacaccc aacttcaagt ccaacttcga tctggcggag 780

gacgccaagc tccagctgtc caaggacacc tacgacgatg acctcgacaa cctgcttgca 840

cagattggcg atcagtacgc cgacctgttt ctcgctgcca agaacctttc ggatgctatt 900

ctcttgtctg acattctgcg agtcaacacc gagatcacaa aggctcccct ttctgcctcc 960

atgatcaagc gatacgacga gcaccatcag gatctcacac tgctcaaggc tcttgtccga 1020

cagcaactgc ccgagaagta caaggagatc tttttcgatc agtcgaagaa cggctacgct 1080

ggatacatcg acggcggagc ctctcaggaa gagttctaca agttcatcaa gccaattctc 1140

gagaagatgg acggaaccga ggaactgctt gtcaagctca atcgagagga tctgcttcgg 1200

aagcaacgaa ccttcgacaa cggcagcatt cctcatcaga tccacctcgg tgagctgcac 1260

gccattcttc gacgtcagga agacttctac ccctttctca aggacaaccg agagaagatc 1320

gagaagattc ttacctttcg aatcccctac tatgttggtc ctcttgccag aggaaactct 1380

cgatttgctt ggatgactcg aaagtccgag gaaaccatca ctccctggaa cttcgaggaa 1440

gtcgtggaca agggtgcctc tgcacagtcc ttcatcgagc gaatgaccaa cttcgacaag 1500

aatctgccca acgagaaggt tcttcccaag cattcgctgc tctacgagta ctttacagtc 1560

tacaacgaac tcaccaaagt caagtacgtt accgagggaa tgcgaaagcc tgccttcttg 1620

tctggcgaac agaagaaagc cattgtcgat ctcctgttca agaccaaccg aaaggtcact 1680

gttaagcagc tcaaggagga ctacttcaag aaaatcgagt gtttcgacag cgtcgagatt 1740

tccggagttg aggaccgatt caacgcctct ttgggcacct atcacgatct gctcaagatt 1800

atcaaggaca aggattttct cgacaacgag gaaaacgagg acattctgga ggacatcgtg 1860

ctcactctta ccctgttcga agatcgggag atgatcgagg aacgactcaa gacatacgct 1920

cacctgttcg acgacaaggt catgaaacaa ctcaagcgac gtagatacac cggctgggga 1980

agactttcgc gaaagctcat caacggcatc agagacaagc agtccggaaa gaccattctg 2040

gactttctca agtccgatgg ctttgccaac cgaaacttca tgcagctcat tcacgacgat 2100

tctcttacct tcaaggagga catccagaag gcacaagtgt ccggtcaggg cgacagcttg 2160

cacgaacata ttgccaacct ggctggttcg ccagccatca agaaaggcat tctccagact 2220

gtcaaggttg tcgacgagct ggtgaaggtc atgggacgtc acaagcccga gaacattgtg 2280

atcgagatgg ccagagagaa ccagacaact caaaagggtc agaaaaactc gcgagagcgg 2340

atgaagcgaa tcgaggaagg catcaaggag ctgggatccc agattctcaa ggagcatccc 2400

gtcgagaaca ctcaactgca gaacgagaag ctgtatctct actatctgca gaatggtcga 2460

gacatgtacg tggatcagga actggacatc aatcgtctca gcgactacga tgtggaccac 2520

attgtccctc aatcctttct caaggacgat tctatcgaca acaaggtcct tacacgatcc 2580

gacaagaaca gaggcaagtc ggacaacgtt cccagcgaag aggtggtcaa aaagatgaag 2640

aactactggc gacagctgct caacgccaag ctcattaccc agcgaaagtt cgacaatctt 2700

accaaggccg agcgaggcgg tctgtccgag ctcgacaagg ctggcttcat caagcgtcaa 2760

ctcgtcgaga ccagacagat cacaaagcac gtcgcacaga ttctcgattc tcggatgaac 2820

accaagtacg acgagaacga caagctcatc cgagaggtca aggtgattac tctcaagtcc 2880

aaactggtct ccgatttccg aaaggacttt cagttctaca aggtgcgaga gatcaacaat 2940

taccaccatg cccacgatgc ttacctcaac gccgtcgttg gcactgcgct catcaagaaa 3000

taccccaagc tcgaaagcga gttcgtttac ggcgattaca aggtctacga cgttcgaaag 3060

atgattgcca agtccgaaca ggagattggc aaggctactg ccaagtactt cttttactcc 3120

aacatcatga actttttcaa gaccgagatc accttggcca acggagagat tcgaaagaga 3180

ccacttatcg agaccaacgg cgaaactgga gagatcgtgt gggacaaggg tcgagacttt 3240

gcaaccgtgc gaaaggttct gtcgatgcct caggtcaaca tcgtcaagaa aaccgaggtt 3300

cagactggcg gattctccaa ggagtcgatt ctgcccaagc gaaactccga caagctcatc 3360

gctcgaaaga aagactggga tcccaagaaa tacggtggct tcgattctcc taccgtcgcc 3420

tattccgtgc ttgtcgttgc gaaggtcgag aagggcaagt ccaaaaagct caagtccgtc 3480

aaggagctgc tcggaattac catcatggag cgatcgagct tcgagaagaa tcccatcgac 3540

ttcttggaag ccaagggtta caaggaggtc aagaaagacc tcattatcaa gctgcccaag 3600

tactctctgt tcgaactgga gaacggtcga aagcgtatgc tcgcctccgc tggcgagctg 3660

cagaagggaa acgagcttgc cttgccttcg aagtacgtca actttctcta tctggcttct 3720

cactacgaga agctcaaggg ttctcccgag gacaacgaac agaagcaact cttcgttgag 3780

cagcacaaac attacctcga cgagattatc gagcagattt ccgagttttc gaagcgagtc 3840

atcctggctg atgccaactt ggacaaggtg ctctctgcct acaacaagca tcgggacaaa 3900

cccattcgag aacaggcgga gaacatcatt cacctgttta ctcttaccaa cctgggtgct 3960

cctgcagctt tcaagtactt cgataccact atcgaccgaa agcggtacac atccaccaag 4020

gaggttctcg atgccaccct gattcaccag tccatcactg gcctgtacga gacccgaatc 4080

gacctgtctc agcttggtgg cgactccaga gccgatccca agaaaaagcg aaaggtctaa 4140

<210> 94

<211> 10706

<212> DNA

<213> 人工序列

<220>

<223> pRF141

<400> 94

catggacaag aaatactcca tcggcctgga cattggaacc aactctgtcg gctgggctgt 60

catcaccgac gagtacaagg tgccctccaa gaaattcaag gtcctcggaa acaccgatcg 120

acactccatc aagaaaaacc tcattggtgc cctgttgttc gattctggcg agactgccga 180

agctaccaga ctcaagcgaa ctgctcggcg acgttacacc cgacggaaga accgaatctg 240

ctacctgcag gagatctttt ccaacgagat ggccaaggtg gacgattcgt tctttcatcg 300

actggaggaa tccttcctcg tcgaggaaga caagaaacac gagcgtcatc ccatctttgg 360

caacattgtg gacgaggttg cttaccacga gaagtatcct accatctacc atctccgaaa 420

gaaactcgtc gattccaccg acaaggcgga tctcagactt atctacctcg ctctggcaca 480

catgatcaag tttcgaggtc atttcctcat cgagggcgat ctcaatcccg acaacagcga 540

tgtggacaag ctgttcattc agctcgttca gacctacaac cagctgttcg aggaaaaccc 600

catcaatgcc tccggagtcg atgcaaaggc catcttgtct gctcgactct cgaagagcag 660

acgactggag aacctcattg cccaacttcc tggcgagaaa aagaacggac tgtttggcaa 720

cctcattgcc ctttctcttg gtctcacacc caacttcaag tccaacttcg atctggcgga 780

ggacgccaag ctccagctgt ccaaggacac ctacgacgat gacctcgaca acctgcttgc 840

acagattggc gatcagtacg ccgacctgtt tctcgctgcc aagaaccttt cggatgctat 900

tctcttgtct gacattctgc gagtcaacac cgagatcaca aaggctcccc tttctgcctc 960

catgatcaag cgatacgacg agcaccatca ggatctcaca ctgctcaagg ctcttgtccg 1020

acagcaactg cccgagaagt acaaggagat ctttttcgat cagtcgaaga acggctacgc 1080

tggatacatc gacggcggag cctctcagga agagttctac aagttcatca agccaattct 1140

cgagaagatg gacggaaccg aggaactgct tgtcaagctc aatcgagagg atctgcttcg 1200

gaagcaacga accttcgaca acggcagcat tcctcatcag atccacctcg gtgagctgca 1260

cgccattctt cgacgtcagg aagacttcta cccctttctc aaggacaacc gagagaagat 1320

cgagaagatt cttacctttc gaatccccta ctatgttggt cctcttgcca gaggaaactc 1380

tcgatttgct tggatgactc gaaagtccga ggaaaccatc actccctgga acttcgagga 1440

agtcgtggac aagggtgcct ctgcacagtc cttcatcgag cgaatgacca acttcgacaa 1500

gaatctgccc aacgagaagg ttcttcccaa gcattcgctg ctctacgagt actttacagt 1560

ctacaacgaa ctcaccaaag tcaagtacgt taccgaggga atgcgaaagc ctgccttctt 1620

gtctggcgaa cagaagaaag ccattgtcga tctcctgttc aagaccaacc gaaaggtcac 1680

tgttaagcag ctcaaggagg actacttcaa gaaaatcgag tgtttcgaca gcgtcgagat 1740

ttccggagtt gaggaccgat tcaacgcctc tttgggcacc tatcacgatc tgctcaagat 1800

tatcaaggac aaggattttc tcgacaacga ggaaaacgag gacattctgg aggacatcgt 1860

gctcactctt accctgttcg aagatcggga gatgatcgag gaacgactca agacatacgc 1920

tcacctgttc gacgacaagg tcatgaaaca actcaagcga cgtagataca ccggctgggg 1980

aagactttcg cgaaagctca tcaacggcat cagagacaag cagtccggaa agaccattct 2040

ggactttctc aagtccgatg gctttgccaa ccgaaacttc atgcagctca ttcacgacga 2100

ttctcttacc ttcaaggagg acatccagaa ggcacaagtg tccggtcagg gcgacagctt 2160

gcacgaacat attgccaacc tggctggttc gccagccatc aagaaaggca ttctccagac 2220

tgtcaaggtt gtcgacgagc tggtgaaggt catgggacgt cacaagcccg agaacattgt 2280

gatcgagatg gccagagaga accagacaac tcaaaagggt cagaaaaact cgcgagagcg 2340

gatgaagcga atcgaggaag gcatcaagga gctgggatcc cagattctca aggagcatcc 2400

cgtcgagaac actcaactgc agaacgagaa gctgtatctc tactatctgc agaatggtcg 2460

agacatgtac gtggatcagg aactggacat caatcgtctc agcgactacg atgtggacca 2520

cattgtccct caatcctttc tcaaggacga ttctatcgac aacaaggtcc ttacacgatc 2580

cgacaagaac agaggcaagt cggacaacgt tcccagcgaa gaggtggtca aaaagatgaa 2640

gaactactgg cgacagctgc tcaacgccaa gctcattacc cagcgaaagt tcgacaatct 2700

taccaaggcc gagcgaggcg gtctgtccga gctcgacaag gctggcttca tcaagcgtca 2760

actcgtcgag accagacaga tcacaaagca cgtcgcacag attctcgatt ctcggatgaa 2820

caccaagtac gacgagaacg acaagctcat ccgagaggtc aaggtgatta ctctcaagtc 2880

caaactggtc tccgatttcc gaaaggactt tcagttctac aaggtgcgag agatcaacaa 2940

ttaccaccat gcccacgatg cttacctcaa cgccgtcgtt ggcactgcgc tcatcaagaa 3000

ataccccaag ctcgaaagcg agttcgttta cggcgattac aaggtctacg acgttcgaaa 3060

gatgattgcc aagtccgaac aggagattgg caaggctact gccaagtact tcttttactc 3120

caacatcatg aactttttca agaccgagat caccttggcc aacggagaga ttcgaaagag 3180

accacttatc gagaccaacg gcgaaactgg agagatcgtg tgggacaagg gtcgagactt 3240

tgcaaccgtg cgaaaggttc tgtcgatgcc tcaggtcaac atcgtcaaga aaaccgaggt 3300

tcagactggc ggattctcca aggagtcgat tctgcccaag cgaaactccg acaagctcat 3360

cgctcgaaag aaagactggg atcccaagaa atacggtggc ttcgattctc ctaccgtcgc 3420

ctattccgtg cttgtcgttg cgaaggtcga gaagggcaag tccaaaaagc tcaagtccgt 3480

caaggagctg ctcggaatta ccatcatgga gcgatcgagc ttcgagaaga atcccatcga 3540

cttcttggaa gccaagggtt acaaggaggt caagaaagac ctcattatca agctgcccaa 3600

gtactctctg ttcgaactgg agaacggtcg aaagcgtatg ctcgcctccg ctggcgagct 3660

gcagaaggga aacgagcttg ccttgccttc gaagtacgtc aactttctct atctggcttc 3720

tcactacgag aagctcaagg gttctcccga ggacaacgaa cagaagcaac tcttcgttga 3780

gcagcacaaa cattacctcg acgagattat cgagcagatt tccgagtttt cgaagcgagt 3840

catcctggct gatgccaact tggacaaggt gctctctgcc tacaacaagc atcgggacaa 3900

acccattcga gaacaggcgg agaacatcat tcacctgttt actcttacca acctgggtgc 3960

tcctgcagct ttcaagtact tcgataccac tatcgaccga aagcggtaca catccaccaa 4020

ggaggttctc gatgccaccc tgattcacca gtccatcact ggcctgtacg agacccgaat 4080

cgacctgtct cagcttggtg gcgactccag agccgatccc aagaaaaagc gaaaggtcta 4140

agcggccgca agtgtggatg gggaagtgag tgcccggttc tgtgtgcaca attggcaatc 4200

caagatggat ggattcaaca cagggatata gcgagctacg tggtggtgcg aggatatagc 4260

aacggatatt tatgtttgac acttgagaat gtacgataca agcactgtcc aagtacaata 4320

ctaaacatac tgtacatact catactcgta cccgggcaac ggtttcactt gagtgcagtg 4380

gctagtgctc ttactcgtac agtgtgcaat actgcgtatc atagtctttg atgtatatcg 4440

tattcattca tgttagttgc gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4500

aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4560

acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4620

ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4680

gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4740

caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 4800

tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 4860

gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 4920

ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 4980

cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 5040

tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 5100

tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 5160

cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 5220

agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 5280

agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5340

gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5400

aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5460

ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5520

gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5580

taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5640

tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5700

tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 5760

gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 5820

gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 5880

ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 5940

cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 6000

tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 6060

cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 6120

agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 6180

cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 6240

aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6300

aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6360

gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6420

gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6480

tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6540

ttccccgaaa agtgccacct gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6600

tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 6660

tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6720

tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 6780

gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 6840

agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 6900

cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 6960

agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttcca 7020

ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7080

acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 7140

ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact cactataggg 7200

cgaattgggt accgggcccc ccctcgaggt cgatggtgtc gataagcttg atatcgaatt 7260

catgtcacac aaaccgatct tcgcctcaag gaaacctaat tctacatccg agagactgcc 7320

gagatccagt ctacactgat taattttcgg gccaataatt taaaaaaatc gtgttatata 7380

atattatatg tattatatat atacatcatg atgatactga cagtcatgtc ccattgctaa 7440

atagacagac tccatctgcc gcctccaact gatgttctca atatttaagg ggtcatctcg 7500

cattgtttaa taataaacag actccatcta ccgcctccaa atgatgttct caaaatatat 7560

tgtatgaact tatttttatt acttagtatt attagacaac ttacttgctt tatgaaaaac 7620

acttcctatt taggaaacaa tttataatgg cagttcgttc atttaacaat ttatgtagaa 7680

taaatgttat aaatgcgtat gggaaatctt aaatatggat agcataaatg atatctgcat 7740

tgcctaattc gaaatcaaca gcaacgaaaa aaatcccttg tacaacataa atagtcatcg 7800

agaaatatca actatcaaag aacagctatt cacacgttac tattgagatt attattggac 7860

gagaatcaca cactcaactg tctttctctc ttctagaaat acaggtacaa gtatgtacta 7920

ttctcattgt tcatacttct agtcatttca tcccacatat tccttggatt tctctccaat 7980

gaatgacatt ctatcttgca aattcaacaa ttataataag atataccaaa gtagcggtat 8040

agtggcaatc aaaaagcttc tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc 8100

attaaaggta tatatttatt tcttgttata taatcctttt gtttattaca tgggctggat 8160

acataaaggt attttgattt aattttttgc ttaaattcaa tcccccctcg ttcagtgtca 8220

actgtaatgg taggaaatta ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa 8280

aatcgtattt ccaggttaga cgttccgcag aatctagaat gcggtatgcg gtacattgtt 8340

cttcgaacgt aaaagttgcg ctccctgaga tattgtacat ttttgctttt acaagtacaa 8400

gtacatcgta caactatgta ctactgttga tgcatccaca acagtttgtt ttgttttttt 8460

ttgttttttt tttttctaat gattcattac cgctatgtat acctacttgt acttgtagta 8520

agccgggtta ttggcgttca attaatcata gacttatgaa tctgcacggt gtgcgctgcg 8580

agttactttt agcttatgca tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa 8640

cggatgctca atcgatttcg acagtaatta attaagtcat acacaagtca gctttcttcg 8700

agcctcatat aagtataagt agttcaacgt attagcactg tacccagcat ctccgtatcg 8760

agaaacacaa caacatgccc cattggacag atcatgcgga tacacaggtt gtgcagtatc 8820

atacatactc gatcagacag gtcgtctgac catcatacaa gctgaacaag cgctccatac 8880

ttgcacgctc tctatataca cagttaaatt acatatccat agtctaacct ctaacagtta 8940

atcttctggt aagcctccca gccagccttc tggtatcgct tggcctcctc aataggatct 9000

cggttctggc cgtacagacc tcggccgaca attatgatat ccgttccggt agacatgaca 9060

tcctcaacag ttcggtactg ctgtccgaga gcgtctccct tgtcgtcaag acccaccccg 9120

ggggtcagaa taagccagtc ctcagagtcg cccttaggtc ggttctgggc aatgaagcca 9180

accacaaact cggggtcgga tcgggcaagc tcaatggtct gcttggagta ctcgccagtg 9240

gccagagagc ccttgcaaga cagctcggcc agcatgagca gacctctggc cagcttctcg 9300

ttgggagagg ggactaggaa ctccttgtac tgggagttct cgtagtcaga gacgtcctcc 9360

ttcttctgtt cagagacagt ttcctcggca ccagctcgca ggccagcaat gattccggtt 9420

ccgggtacac cgtgggcgtt ggtgatatcg gaccactcgg cgattcggtg acaccggtac 9480

tggtgcttga cagtgttgcc aatatctgcg aactttctgt cctcgaacag gaagaaaccg 9540

tgcttaagag caagttcctt gagggggagc acagtgccgg cgtaggtgaa gtcgtcaatg 9600

atgtcgatat gggttttgat catgcacaca taaggtccga ccttatcggc aagctcaatg 9660

agctccttgg tggtggtaac atccagagaa gcacacaggt tggttttctt ggctgccacg 9720

agcttgagca ctcgagcggc aaaggcggac ttgtggacgt tagctcgagc ttcgtaggag 9780

ggcattttgg tggtgaagag gagactgaaa taaatttagt ctgcagaact ttttatcgga 9840

accttatctg gggcagtgaa gtatatgtta tggtaatagt tacgagttag ttgaacttat 9900

agatagactg gactatacgg ctatcggtcc aaattagaaa gaacgtcaat ggctctctgg 9960

gcgtcgcctt tgccgacaaa aatgtgatca tgatgaaagc cagcaatgac gttgcagctg 10020

atattgttgt cggccaaccg cgccgaaaac gcagctgtca gacccacagc ctccaacgaa 10080

gaatgtatcg tcaaagtgat ccaagcacac tcatagttgg agtcgtactc caaaggcggc 10140

aatgacgagt cagacagata ctcgtcgacg tttaaaccat catctaaggg cctcaaaact 10200

acctcggaac tgctgcgctg atctggacac cacagaggtt ccgagcactt taggttgcac 10260

caaatgtccc accaggtgca ggcagaaaac gctggaacag cgtgtacagt ttgtcttaac 10320

aaaaagtgag ggcgctgagg tcgagcaggg tggtgtgact tgttatagcc tttagagctg 10380

cgaaagcgcg tatggatttg gctcatcagg ccagattgag ggtctgtgga cacatgtcat 10440

gttagtgtac ttcaatcgcc ccctggatat agccccgaca ataggccgtg gcctcatttt 10500

tttgccttcc gcacatttcc attgctcggt acccacacct tgcttctcct gcacttgcca 10560

accttaatac tggtttacat tgaccaacat cttacaagcg gggggcttgt ctagggtata 10620

tataaacagt ggctctccca atcggttgcc agtctctttt ttcctttctt tccccacaga 10680

ttcgaaatct aaactacaca tcacac 10706

<210> 95

<211> 1048

<212> DNA

<213> 人工序列

<220>

<223> 高通量克隆盒

<400> 95

gcgcacgtta attaaatttt ttttgatttt cttttttgac cccgtcttca attacacttc 60

ccaactggga acacccctct ttatcgaccc attttaggta atttacccta gcccattgtc 120

tccataagga atattaccct aacccacagt ccagggtgcc caggtccttc tttggccaaa 180

ttttaacttc ggtcctatgg cacagcggta gcgcgtgaga ttgcaaatct taaggtcccg 240

agttcgaatc tcggtgggac ctagttattt ttgatagata atttcgtgat gattagaaac 300

ttaacgcaaa ataatggccg gcatggtccc agcctcctcg ctggcgccgg ctgggcaaca 360

tgcttcggca tggcgaatgg gacgcaggtg atggcgggat cgttgtatat ttcttgacac 420

cttttcggca tcgccctaaa ttcggcgtcc tcatattgtg tgaggacgtt ttattacgtg 480

tttacgaagc aaaagctaaa accaggagct atttaatggc aacagttaac cagctggtac 540

gcaaaccacg tgctcgcaaa gttgcgaaaa gcaacgtgcc tgcgctggaa gcatgcccgc 600

aaaaacgtgg cgtatgtact cgtgtatata ctaccactcc taaaaaaccg aactccgcgc 660

tgcgtaaagt atgccgtgtt cgtctgacta acggtttcga agtgacttcc tacatcggtg 720

gtgaaggtca caacctgcag gagcactccg tgatcctgat ccgtggcggt cgtgttaaag 780

acctcccggg tgttcgttac cacaccgtac gtggtgcgct tgactgctcc ggcgttaaag 840

accgtaagca ggctcgttcc aagtatggcg tgaagcgtcc taaggcttag gttaataaca 900

ggcctgctgg taatcgcagg cctttttatt tttacacctg cgttttagag ctagaaatag 960

caagttaaaa taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt 1020

tttttttgtt ttttatcgat gcgcgcac 1048

<210> 96

<211> 300

<212> DNA

<213> 解脂耶氏酵母

<400> 96

attttttttg attttctttt ttgaccccgt cttcaattac acttcccaac tgggaacacc 60

cctctttatc gacccatttt aggtaattta ccctagccca ttgtctccat aaggaatatt 120

accctaaccc acagtccagg gtgcccaggt ccttctttgg ccaaatttta acttcggtcc 180

tatggcacag cggtagcgcg tgagattgca aatcttaagg tcccgagttc gaatctcggt 240

gggacctagt tatttttgat agataatttc gtgatgatta gaaacttaac gcaaaataat 300

<210> 97

<211> 544

<212> DNA

<213> 大肠杆菌

<220>

<221> misc_feature

<222> (1)..(544)

<223> rpsL反向选择盒

<400> 97

atggcgggat cgttgtatat ttcttgacac cttttcggca tcgccctaaa ttcggcgtcc 60

tcatattgtg tgaggacgtt ttattacgtg tttacgaagc aaaagctaaa accaggagct 120

atttaatggc aacagttaac cagctggtac gcaaaccacg tgctcgcaaa gttgcgaaaa 180

gcaacgtgcc tgcgctggaa gcatgcccgc aaaaacgtgg cgtatgtact cgtgtatata 240

ctaccactcc taaaaaaccg aactccgcgc tgcgtaaagt atgccgtgtt cgtctgacta 300

acggtttcga agtgacttcc tacatcggtg gtgaaggtca caacctgcag gagcactccg 360

tgatcctgat ccgtggcggt cgtgttaaag acctcccggg tgttcgttac cacaccgtac 420

gtggtgcgct tgactgctcc ggcgttaaag accgtaagca ggctcgttcc aagtatggcg 480

tgaagcgtcc taaggcttag gttaataaca ggcctgctgg taatcgcagg cctttttatt 540

ttta 544

<210> 98

<211> 11714

<212> DNA

<213> 人工序列

<220>

<223> pRF291

<400> 98

cgataaaaaa caaaaaaaaa agcaccgact cggtgccact ttttcaagtt gataacggac 60

tagccttatt ttaacttgct atttctagct ctaaaacgca ggtgtaaaaa taaaaaggcc 120

tgcgattacc agcaggcctg ttattaacct aagccttagg acgcttcacg ccatacttgg 180

aacgagcctg cttacggtct ttaacgccgg agcagtcaag cgcaccacgt acggtgtggt 240

aacgaacacc cgggaggtct ttaacacgac cgccacggat caggatcacg gagtgctcct 300

gcaggttgtg accttcacca ccgatgtagg aagtcacttc gaaaccgtta gtcagacgaa 360

cacggcatac tttacgcagc gcggagttcg gttttttagg agtggtagta tatacacgag 420

tacatacgcc acgtttttgc gggcatgctt ccagcgcagg cacgttgctt ttcgcaactt 480

tgcgagcacg tggtttgcgt accagctggt taactgttgc cattaaatag ctcctggttt 540

tagcttttgc ttcgtaaaca cgtaataaaa cgtcctcaca caatatgagg acgccgaatt 600

tagggcgatg ccgaaaaggt gtcaagaaat atacaacgat cccgccatca cctgcgtccc 660

attcgccatg ccgaagcatg ttgcccagcc ggcgccagcg aggaggctgg gaccatgccg 720

gccattattt tgcgttaagt ttctaatcat cacgaaatta tctatcaaaa ataactaggt 780

cccaccgaga ttcgaactcg ggaccttaag atttgcaatc tcacgcgcta ccgctgtgcc 840

ataggaccga agttaaaatt tggccaaaga aggacctggg caccctggac tgtgggttag 900

ggtaatattc cttatggaga caatgggcta gggtaaatta cctaaaatgg gtcgataaag 960

aggggtgttc ccagttggga agtgtaattg aagacggggt caaaaaagaa aatcaaaaaa 1020

aatttaatta agtcatacac aagtcagctt tcttcgagcc tcatataagt ataagtagtt 1080

caacgtatta gcactgtacc cagcatctcc gtatcgagaa acacaacaac atgccccatt 1140

ggacagatca tgcggataca caggttgtgc agtatcatac atactcgatc agacaggtcg 1200

tctgaccatc atacaagctg aacaagcgct ccatacttgc acgctctcta tatacacagt 1260

taaattacat atccatagtc taacctctaa cagttaatct tctggtaagc ctcccagcca 1320

gccttctggt atcgcttggc ctcctcaata ggatctcggt tctggccgta cagacctcgg 1380

ccgacaatta tgatatccgt tccggtagac atgacatcct caacagttcg gtactgctgt 1440

ccgagagcgt ctcccttgtc gtcaagaccc accccggggg tcagaataag ccagtcctca 1500

gagtcgccct taggtcggtt ctgggcaatg aagccaacca caaactcggg gtcggatcgg 1560

gcaagctcaa tggtctgctt ggagtactcg ccagtggcca gagagccctt gcaagacagc 1620

tcggccagca tgagcagacc tctggccagc ttctcgttgg gagaggggac taggaactcc 1680

ttgtactggg agttctcgta gtcagagacg tcctccttct tctgttcaga gacagtttcc 1740

tcggcaccag ctcgcaggcc agcaatgatt ccggttccgg gtacaccgtg ggcgttggtg 1800

atatcggacc actcggcgat tcggtgacac cggtactggt gcttgacagt gttgccaata 1860

tctgcgaact ttctgtcctc gaacaggaag aaaccgtgct taagagcaag ttccttgagg 1920

gggagcacag tgccggcgta ggtgaagtcg tcaatgatgt cgatatgggt tttgatcatg 1980

cacacataag gtccgacctt atcggcaagc tcaatgagct ccttggtggt ggtaacatcc 2040

agagaagcac acaggttggt tttcttggct gccacgagct tgagcactcg agcggcaaag 2100

gcggacttgt ggacgttagc tcgagcttcg taggagggca ttttggtggt gaagaggaga 2160

ctgaaataaa tttagtctgc agaacttttt atcggaacct tatctggggc agtgaagtat 2220

atgttatggt aatagttacg agttagttga acttatagat agactggact atacggctat 2280

cggtccaaat tagaaagaac gtcaatggct ctctgggcgt cgcctttgcc gacaaaaatg 2340

tgatcatgat gaaagccagc aatgacgttg cagctgatat tgttgtcggc caaccgcgcc 2400

gaaaacgcag ctgtcagacc cacagcctcc aacgaagaat gtatcgtcaa agtgatccaa 2460

gcacactcat agttggagtc gtactccaaa ggcggcaatg acgagtcaga cagatactcg 2520

tcgacgttta aaccatcatc taagggcctc aaaactacct cggaactgct gcgctgatct 2580

ggacaccaca gaggttccga gcactttagg ttgcaccaaa tgtcccacca ggtgcaggca 2640

gaaaacgctg gaacagcgtg tacagtttgt cttaacaaaa agtgagggcg ctgaggtcga 2700

gcagggtggt gtgacttgtt atagccttta gagctgcgaa agcgcgtatg gatttggctc 2760

atcaggccag attgagggtc tgtggacaca tgtcatgtta gtgtacttca atcgccccct 2820

ggatatagcc ccgacaatag gccgtggcct catttttttg ccttccgcac atttccattg 2880

ctcggtaccc acaccttgct tctcctgcac ttgccaacct taatactggt ttacattgac 2940

caacatctta caagcggggg gcttgtctag ggtatatata aacagtggct ctcccaatcg 3000

gttgccagtc tcttttttcc tttctttccc cacagattcg aaatctaaac tacacatcac 3060

accatggaca agaaatactc catcggcctg gacattggaa ccaactctgt cggctgggct 3120

gtcatcaccg acgagtacaa ggtgccctcc aagaaattca aggtcctcgg aaacaccgat 3180

cgacactcca tcaagaaaaa cctcattggt gccctgttgt tcgattctgg cgagactgcc 3240

gaagctacca gactcaagcg aactgctcgg cgacgttaca cccgacggaa gaaccgaatc 3300

tgctacctgc aggagatctt ttccaacgag atggccaagg tggacgattc gttctttcat 3360

cgactggagg aatccttcct cgtcgaggaa gacaagaaac acgagcgtca tcccatcttt 3420

ggcaacattg tggacgaggt tgcttaccac gagaagtatc ctaccatcta ccatctccga 3480

aagaaactcg tcgattccac cgacaaggcg gatctcagac ttatctacct cgctctggca 3540

cacatgatca agtttcgagg tcatttcctc atcgagggcg atctcaatcc cgacaacagc 3600

gatgtggaca agctgttcat tcagctcgtt cagacctaca accagctgtt cgaggaaaac 3660

cccatcaatg cctccggagt cgatgcaaag gccatcttgt ctgctcgact ctcgaagagc 3720

agacgactgg agaacctcat tgcccaactt cctggcgaga aaaagaacgg actgtttggc 3780

aacctcattg ccctttctct tggtctcaca cccaacttca agtccaactt cgatctggcg 3840

gaggacgcca agctccagct gtccaaggac acctacgacg atgacctcga caacctgctt 3900

gcacagattg gcgatcagta cgccgacctg tttctcgctg ccaagaacct ttcggatgct 3960

attctcttgt ctgacattct gcgagtcaac accgagatca caaaggctcc cctttctgcc 4020

tccatgatca agcgatacga cgagcaccat caggatctca cactgctcaa ggctcttgtc 4080

cgacagcaac tgcccgagaa gtacaaggag atctttttcg atcagtcgaa gaacggctac 4140

gctggataca tcgacggcgg agcctctcag gaagagttct acaagttcat caagccaatt 4200

ctcgagaaga tggacggaac cgaggaactg cttgtcaagc tcaatcgaga ggatctgctt 4260

cggaagcaac gaaccttcga caacggcagc attcctcatc agatccacct cggtgagctg 4320

cacgccattc ttcgacgtca ggaagacttc tacccctttc tcaaggacaa ccgagagaag 4380

atcgagaaga ttcttacctt tcgaatcccc tactatgttg gtcctcttgc cagaggaaac 4440

tctcgatttg cttggatgac tcgaaagtcc gaggaaacca tcactccctg gaacttcgag 4500

gaagtcgtgg acaagggtgc ctctgcacag tccttcatcg agcgaatgac caacttcgac 4560

aagaatctgc ccaacgagaa ggttcttccc aagcattcgc tgctctacga gtactttaca 4620

gtctacaacg aactcaccaa agtcaagtac gttaccgagg gaatgcgaaa gcctgccttc 4680

ttgtctggcg aacagaagaa agccattgtc gatctcctgt tcaagaccaa ccgaaaggtc 4740

actgttaagc agctcaagga ggactacttc aagaaaatcg agtgtttcga cagcgtcgag 4800

atttccggag ttgaggaccg attcaacgcc tctttgggca cctatcacga tctgctcaag 4860

attatcaagg acaaggattt tctcgacaac gaggaaaacg aggacattct ggaggacatc 4920

gtgctcactc ttaccctgtt cgaagatcgg gagatgatcg aggaacgact caagacatac 4980

gctcacctgt tcgacgacaa ggtcatgaaa caactcaagc gacgtagata caccggctgg 5040

ggaagacttt cgcgaaagct catcaacggc atcagagaca agcagtccgg aaagaccatt 5100

ctggactttc tcaagtccga tggctttgcc aaccgaaact tcatgcagct cattcacgac 5160

gattctctta ccttcaagga ggacatccag aaggcacaag tgtccggtca gggcgacagc 5220

ttgcacgaac atattgccaa cctggctggt tcgccagcca tcaagaaagg cattctccag 5280

actgtcaagg ttgtcgacga gctggtgaag gtcatgggac gtcacaagcc cgagaacatt 5340

gtgatcgaga tggccagaga gaaccagaca actcaaaagg gtcagaaaaa ctcgcgagag 5400

cggatgaagc gaatcgagga aggcatcaag gagctgggat cccagattct caaggagcat 5460

cccgtcgaga acactcaact gcagaacgag aagctgtatc tctactatct gcagaatggt 5520

cgagacatgt acgtggatca ggaactggac atcaatcgtc tcagcgacta cgatgtggac 5580

cacattgtcc ctcaatcctt tctcaaggac gattctatcg acaacaaggt ccttacacga 5640

tccgacaaga acagaggcaa gtcggacaac gttcccagcg aagaggtggt caaaaagatg 5700

aagaactact ggcgacagct gctcaacgcc aagctcatta cccagcgaaa gttcgacaat 5760

cttaccaagg ccgagcgagg cggtctgtcc gagctcgaca aggctggctt catcaagcgt 5820

caactcgtcg agaccagaca gatcacaaag cacgtcgcac agattctcga ttctcggatg 5880

aacaccaagt acgacgagaa cgacaagctc atccgagagg tcaaggtgat tactctcaag 5940

tccaaactgg tctccgattt ccgaaaggac tttcagttct acaaggtgcg agagatcaac 6000

aattaccacc atgcccacga tgcttacctc aacgccgtcg ttggcactgc gctcatcaag 6060

aaatacccca agctcgaaag cgagttcgtt tacggcgatt acaaggtcta cgacgttcga 6120

aagatgattg ccaagtccga acaggagatt ggcaaggcta ctgccaagta cttcttttac 6180

tccaacatca tgaacttttt caagaccgag atcaccttgg ccaacggaga gattcgaaag 6240

agaccactta tcgagaccaa cggcgaaact ggagagatcg tgtgggacaa gggtcgagac 6300

tttgcaaccg tgcgaaaggt tctgtcgatg cctcaggtca acatcgtcaa gaaaaccgag 6360

gttcagactg gcggattctc caaggagtcg attctgccca agcgaaactc cgacaagctc 6420

atcgctcgaa agaaagactg ggatcccaag aaatacggtg gcttcgattc tcctaccgtc 6480

gcctattccg tgcttgtcgt tgcgaaggtc gagaagggca agtccaaaaa gctcaagtcc 6540

gtcaaggagc tgctcggaat taccatcatg gagcgatcga gcttcgagaa gaatcccatc 6600

gacttcttgg aagccaaggg ttacaaggag gtcaagaaag acctcattat caagctgccc 6660

aagtactctc tgttcgaact ggagaacggt cgaaagcgta tgctcgcctc cgctggcgag 6720

ctgcagaagg gaaacgagct tgccttgcct tcgaagtacg tcaactttct ctatctggct 6780

tctcactacg agaagctcaa gggttctccc gaggacaacg aacagaagca actcttcgtt 6840

gagcagcaca aacattacct cgacgagatt atcgagcaga tttccgagtt ttcgaagcga 6900

gtcatcctgg ctgatgccaa cttggacaag gtgctctctg cctacaacaa gcatcgggac 6960

aaacccattc gagaacaggc ggagaacatc attcacctgt ttactcttac caacctgggt 7020

gctcctgcag ctttcaagta cttcgatacc actatcgacc gaaagcggta cacatccacc 7080

aaggaggttc tcgatgccac cctgattcac cagtccatca ctggcctgta cgagacccga 7140

atcgacctgt ctcagcttgg tggcgactcc agagccgatc ccaagaaaaa gcgaaaggtc 7200

taagcggccg caagtgtgga tggggaagtg agtgcccggt tctgtgtgca caattggcaa 7260

tccaagatgg atggattcaa cacagggata tagcgagcta cgtggtggtg cgaggatata 7320

gcaacggata tttatgtttg acacttgaga atgtacgata caagcactgt ccaagtacaa 7380

tactaaacat actgtacata ctcatactcg tacccgggca acggtttcac ttgagtgcag 7440

tggctagtgc tcttactcgt acagtgtgca atactgcgta tcatagtctt tgatgtatat 7500

cgtattcatt catgttagtt gcgtacgagc cggaagcata aagtgtaaag cctggggtgc 7560

ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg 7620

aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg 7680

tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg 7740

gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa 7800

cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc 7860

gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc 7920

aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag 7980

ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct 8040

cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta 8100

ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc 8160

cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc 8220

agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt 8280

gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct gcgctctgct 8340

gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc 8400

tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca 8460

agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta 8520

agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa 8580

atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg 8640

cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg 8700

actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc 8760

aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc 8820

cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa 8880

ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc 8940

cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg 9000

ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc 9060

cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat 9120

ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg 9180

tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc 9240

ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg 9300

aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat 9360

gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg 9420

gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg 9480

ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct 9540

catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac 9600

atttccccga aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg cggcgggtgt 9660

ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc 9720

tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg 9780

gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta 9840

gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt 9900

ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat 9960

ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa 10020

tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttc 10080

cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta 10140

ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg 10200

ttttcccagt cacgacgttg taaaacgacg gccagtgaat tgtaatacga ctcactatag 10260

ggcgaattgg gtaccgggcc ccccctcgag gtcgatggtg tcgataagct tgatatcgaa 10320

ttcatgtcac acaaaccgat cttcgcctca aggaaaccta attctacatc cgagagactg 10380

ccgagatcca gtctacactg attaattttc gggccaataa tttaaaaaaa tcgtgttata 10440

taatattata tgtattatat atatacatca tgatgatact gacagtcatg tcccattgct 10500

aaatagacag actccatctg ccgcctccaa ctgatgttct caatatttaa ggggtcatct 10560

cgcattgttt aataataaac agactccatc taccgcctcc aaatgatgtt ctcaaaatat 10620

attgtatgaa cttattttta ttacttagta ttattagaca acttacttgc tttatgaaaa 10680

acacttccta tttaggaaac aatttataat ggcagttcgt tcatttaaca atttatgtag 10740

aataaatgtt ataaatgcgt atgggaaatc ttaaatatgg atagcataaa tgatatctgc 10800

attgcctaat tcgaaatcaa cagcaacgaa aaaaatccct tgtacaacat aaatagtcat 10860

cgagaaatat caactatcaa agaacagcta ttcacacgtt actattgaga ttattattgg 10920

acgagaatca cacactcaac tgtctttctc tcttctagaa atacaggtac aagtatgtac 10980

tattctcatt gttcatactt ctagtcattt catcccacat attccttgga tttctctcca 11040

atgaatgaca ttctatcttg caaattcaac aattataata agatatacca aagtagcggt 11100

atagtggcaa tcaaaaagct tctctggtgt gcttctcgta tttattttta ttctaatgat 11160

ccattaaagg tatatattta tttcttgtta tataatcctt ttgtttatta catgggctgg 11220

atacataaag gtattttgat ttaatttttt gcttaaattc aatcccccct cgttcagtgt 11280

caactgtaat ggtaggaaat taccatactt ttgaagaagc aaaaaaaatg aaagaaaaaa 11340

aaaatcgtat ttccaggtta gacgttccgc agaatctaga atgcggtatg cggtacattg 11400

ttcttcgaac gtaaaagttg cgctccctga gatattgtac atttttgctt ttacaagtac 11460

aagtacatcg tacaactatg tactactgtt gatgcatcca caacagtttg ttttgttttt 11520

ttttgttttt tttttttcta atgattcatt accgctatgt atacctactt gtacttgtag 11580

taagccgggt tattggcgtt caattaatca tagacttatg aatctgcacg gtgtgcgctg 11640

cgagttactt ttagcttatg catgctactt gggtgtaata ttgggatctg ttcggaaatc 11700

aacggatgct caat 11714

<210> 99

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> Can1-1F

<400> 99

aatgggactc aaacgattac ccaccctcgt tt 32

<210> 100

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> Can1-1R

<400> 100

tctaaaacga gggtgggtaa tcgtttgagt cc 32

<210> 101

<211> 23

<212> DNA

<213> 解脂耶氏酵母

<220>

<221> misc_feature

<222> (1)..(23)

<223> Can1-1靶位点和PAM

<400> 101

tcaaacgatt acccaccctc cgg 23

<210> 102

<211> 480

<212> DNA

<213> 人工序列

<220>

<223> Can1-1 gRNA表达盒

<400> 102

attttttttg attttctttt ttgaccccgt cttcaattac acttcccaac tgggaacacc 60

cctctttatc gacccatttt aggtaattta ccctagccca ttgtctccat aaggaatatt 120

accctaaccc acagtccagg gtgcccaggt ccttctttgg ccaaatttta acttcggtcc 180

tatggcacag cggtagcgcg tgagattgca aatcttaagg tcccgagttc gaatctcggt 240

gggacctagt tatttttgat agataatttc gtgatgatta gaaacttaac gcaaaataat 300

ggccggcatg gtcccagcct cctcgctggc gccggctggg caacatgctt cggcatggcg 360

aatgggactc aaacgattac ccaccctcgt tttagagcta gaaatagcaa ttaaaataag 420

gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcttttttt tttgtttttt 480

<210> 103

<211> 11176

<212> DNA

<213> 人工序列

<220>

<223> pRF303

<400> 103

tctaaaacga gggtgggtaa tcgtttgagt cccattcgcc atgccgaagc atgttgccca 60

gccggcgcca gcgaggaggc tgggaccatg ccggccatta ttttgcgtta agtttctaat 120

catcacgaaa ttatctatca aaaataacta ggtcccaccg agattcgaac tcgggacctt 180

aagatttgca atctcacgcg ctaccgctgt gccataggac cgaagttaaa atttggccaa 240

agaaggacct gggcaccctg gactgtgggt tagggtaata ttccttatgg agacaatggg 300

ctagggtaaa ttacctaaaa tgggtcgata aagaggggtg ttcccagttg ggaagtgtaa 360

ttgaagacgg ggtcaaaaaa gaaaatcaaa aaaaatttaa ttaagtcata cacaagtcag 420

ctttcttcga gcctcatata agtataagta gttcaacgta ttagcactgt acccagcatc 480

tccgtatcga gaaacacaac aacatgcccc attggacaga tcatgcggat acacaggttg 540

tgcagtatca tacatactcg atcagacagg tcgtctgacc atcatacaag ctgaacaagc 600

gctccatact tgcacgctct ctatatacac agttaaatta catatccata gtctaacctc 660

taacagttaa tcttctggta agcctcccag ccagccttct ggtatcgctt ggcctcctca 720

ataggatctc ggttctggcc gtacagacct cggccgacaa ttatgatatc cgttccggta 780

gacatgacat cctcaacagt tcggtactgc tgtccgagag cgtctccctt gtcgtcaaga 840

cccaccccgg gggtcagaat aagccagtcc tcagagtcgc ccttaggtcg gttctgggca 900

atgaagccaa ccacaaactc ggggtcggat cgggcaagct caatggtctg cttggagtac 960

tcgccagtgg ccagagagcc cttgcaagac agctcggcca gcatgagcag acctctggcc 1020

agcttctcgt tgggagaggg gactaggaac tccttgtact gggagttctc gtagtcagag 1080

acgtcctcct tcttctgttc agagacagtt tcctcggcac cagctcgcag gccagcaatg 1140

attccggttc cgggtacacc gtgggcgttg gtgatatcgg accactcggc gattcggtga 1200

caccggtact ggtgcttgac agtgttgcca atatctgcga actttctgtc ctcgaacagg 1260

aagaaaccgt gcttaagagc aagttccttg agggggagca cagtgccggc gtaggtgaag 1320

tcgtcaatga tgtcgatatg ggttttgatc atgcacacat aaggtccgac cttatcggca 1380

agctcaatga gctccttggt ggtggtaaca tccagagaag cacacaggtt ggttttcttg 1440

gctgccacga gcttgagcac tcgagcggca aaggcggact tgtggacgtt agctcgagct 1500

tcgtaggagg gcattttggt ggtgaagagg agactgaaat aaatttagtc tgcagaactt 1560

tttatcggaa ccttatctgg ggcagtgaag tatatgttat ggtaatagtt acgagttagt 1620

tgaacttata gatagactgg actatacggc tatcggtcca aattagaaag aacgtcaatg 1680

gctctctggg cgtcgccttt gccgacaaaa atgtgatcat gatgaaagcc agcaatgacg 1740

ttgcagctga tattgttgtc ggccaaccgc gccgaaaacg cagctgtcag acccacagcc 1800

tccaacgaag aatgtatcgt caaagtgatc caagcacact catagttgga gtcgtactcc 1860

aaaggcggca atgacgagtc agacagatac tcgtcgacgt ttaaaccatc atctaagggc 1920

ctcaaaacta cctcggaact gctgcgctga tctggacacc acagaggttc cgagcacttt 1980

aggttgcacc aaatgtccca ccaggtgcag gcagaaaacg ctggaacagc gtgtacagtt 2040

tgtcttaaca aaaagtgagg gcgctgaggt cgagcagggt ggtgtgactt gttatagcct 2100

ttagagctgc gaaagcgcgt atggatttgg ctcatcaggc cagattgagg gtctgtggac 2160

acatgtcatg ttagtgtact tcaatcgccc cctggatata gccccgacaa taggccgtgg 2220

cctcattttt ttgccttccg cacatttcca ttgctcggta cccacacctt gcttctcctg 2280

cacttgccaa ccttaatact ggtttacatt gaccaacatc ttacaagcgg ggggcttgtc 2340

tagggtatat ataaacagtg gctctcccaa tcggttgcca gtctcttttt tcctttcttt 2400

ccccacagat tcgaaatcta aactacacat cacaccatgg acaagaaata ctccatcggc 2460

ctggacattg gaaccaactc tgtcggctgg gctgtcatca ccgacgagta caaggtgccc 2520

tccaagaaat tcaaggtcct cggaaacacc gatcgacact ccatcaagaa aaacctcatt 2580

ggtgccctgt tgttcgattc tggcgagact gccgaagcta ccagactcaa gcgaactgct 2640

cggcgacgtt acacccgacg gaagaaccga atctgctacc tgcaggagat cttttccaac 2700

gagatggcca aggtggacga ttcgttcttt catcgactgg aggaatcctt cctcgtcgag 2760

gaagacaaga aacacgagcg tcatcccatc tttggcaaca ttgtggacga ggttgcttac 2820

cacgagaagt atcctaccat ctaccatctc cgaaagaaac tcgtcgattc caccgacaag 2880

gcggatctca gacttatcta cctcgctctg gcacacatga tcaagtttcg aggtcatttc 2940

ctcatcgagg gcgatctcaa tcccgacaac agcgatgtgg acaagctgtt cattcagctc 3000

gttcagacct acaaccagct gttcgaggaa aaccccatca atgcctccgg agtcgatgca 3060

aaggccatct tgtctgctcg actctcgaag agcagacgac tggagaacct cattgcccaa 3120

cttcctggcg agaaaaagaa cggactgttt ggcaacctca ttgccctttc tcttggtctc 3180

acacccaact tcaagtccaa cttcgatctg gcggaggacg ccaagctcca gctgtccaag 3240

gacacctacg acgatgacct cgacaacctg cttgcacaga ttggcgatca gtacgccgac 3300

ctgtttctcg ctgccaagaa cctttcggat gctattctct tgtctgacat tctgcgagtc 3360

aacaccgaga tcacaaaggc tcccctttct gcctccatga tcaagcgata cgacgagcac 3420

catcaggatc tcacactgct caaggctctt gtccgacagc aactgcccga gaagtacaag 3480

gagatctttt tcgatcagtc gaagaacggc tacgctggat acatcgacgg cggagcctct 3540

caggaagagt tctacaagtt catcaagcca attctcgaga agatggacgg aaccgaggaa 3600

ctgcttgtca agctcaatcg agaggatctg cttcggaagc aacgaacctt cgacaacggc 3660

agcattcctc atcagatcca cctcggtgag ctgcacgcca ttcttcgacg tcaggaagac 3720

ttctacccct ttctcaagga caaccgagag aagatcgaga agattcttac ctttcgaatc 3780

ccctactatg ttggtcctct tgccagagga aactctcgat ttgcttggat gactcgaaag 3840

tccgaggaaa ccatcactcc ctggaacttc gaggaagtcg tggacaaggg tgcctctgca 3900

cagtccttca tcgagcgaat gaccaacttc gacaagaatc tgcccaacga gaaggttctt 3960

cccaagcatt cgctgctcta cgagtacttt acagtctaca acgaactcac caaagtcaag 4020

tacgttaccg agggaatgcg aaagcctgcc ttcttgtctg gcgaacagaa gaaagccatt 4080

gtcgatctcc tgttcaagac caaccgaaag gtcactgtta agcagctcaa ggaggactac 4140

ttcaagaaaa tcgagtgttt cgacagcgtc gagatttccg gagttgagga ccgattcaac 4200

gcctctttgg gcacctatca cgatctgctc aagattatca aggacaagga ttttctcgac 4260

aacgaggaaa acgaggacat tctggaggac atcgtgctca ctcttaccct gttcgaagat 4320

cgggagatga tcgaggaacg actcaagaca tacgctcacc tgttcgacga caaggtcatg 4380

aaacaactca agcgacgtag atacaccggc tggggaagac tttcgcgaaa gctcatcaac 4440

ggcatcagag acaagcagtc cggaaagacc attctggact ttctcaagtc cgatggcttt 4500

gccaaccgaa acttcatgca gctcattcac gacgattctc ttaccttcaa ggaggacatc 4560

cagaaggcac aagtgtccgg tcagggcgac agcttgcacg aacatattgc caacctggct 4620

ggttcgccag ccatcaagaa aggcattctc cagactgtca aggttgtcga cgagctggtg 4680

aaggtcatgg gacgtcacaa gcccgagaac attgtgatcg agatggccag agagaaccag 4740

acaactcaaa agggtcagaa aaactcgcga gagcggatga agcgaatcga ggaaggcatc 4800

aaggagctgg gatcccagat tctcaaggag catcccgtcg agaacactca actgcagaac 4860

gagaagctgt atctctacta tctgcagaat ggtcgagaca tgtacgtgga tcaggaactg 4920

gacatcaatc gtctcagcga ctacgatgtg gaccacattg tccctcaatc ctttctcaag 4980

gacgattcta tcgacaacaa ggtccttaca cgatccgaca agaacagagg caagtcggac 5040

aacgttccca gcgaagaggt ggtcaaaaag atgaagaact actggcgaca gctgctcaac 5100

gccaagctca ttacccagcg aaagttcgac aatcttacca aggccgagcg aggcggtctg 5160

tccgagctcg acaaggctgg cttcatcaag cgtcaactcg tcgagaccag acagatcaca 5220

aagcacgtcg cacagattct cgattctcgg atgaacacca agtacgacga gaacgacaag 5280

ctcatccgag aggtcaaggt gattactctc aagtccaaac tggtctccga tttccgaaag 5340

gactttcagt tctacaaggt gcgagagatc aacaattacc accatgccca cgatgcttac 5400

ctcaacgccg tcgttggcac tgcgctcatc aagaaatacc ccaagctcga aagcgagttc 5460

gtttacggcg attacaaggt ctacgacgtt cgaaagatga ttgccaagtc cgaacaggag 5520

attggcaagg ctactgccaa gtacttcttt tactccaaca tcatgaactt tttcaagacc 5580

gagatcacct tggccaacgg agagattcga aagagaccac ttatcgagac caacggcgaa 5640

actggagaga tcgtgtggga caagggtcga gactttgcaa ccgtgcgaaa ggttctgtcg 5700

atgcctcagg tcaacatcgt caagaaaacc gaggttcaga ctggcggatt ctccaaggag 5760

tcgattctgc ccaagcgaaa ctccgacaag ctcatcgctc gaaagaaaga ctgggatccc 5820

aagaaatacg gtggcttcga ttctcctacc gtcgcctatt ccgtgcttgt cgttgcgaag 5880

gtcgagaagg gcaagtccaa aaagctcaag tccgtcaagg agctgctcgg aattaccatc 5940

atggagcgat cgagcttcga gaagaatccc atcgacttct tggaagccaa gggttacaag 6000

gaggtcaaga aagacctcat tatcaagctg cccaagtact ctctgttcga actggagaac 6060

ggtcgaaagc gtatgctcgc ctccgctggc gagctgcaga agggaaacga gcttgccttg 6120

ccttcgaagt acgtcaactt tctctatctg gcttctcact acgagaagct caagggttct 6180

cccgaggaca acgaacagaa gcaactcttc gttgagcagc acaaacatta cctcgacgag 6240

attatcgagc agatttccga gttttcgaag cgagtcatcc tggctgatgc caacttggac 6300

aaggtgctct ctgcctacaa caagcatcgg gacaaaccca ttcgagaaca ggcggagaac 6360

atcattcacc tgtttactct taccaacctg ggtgctcctg cagctttcaa gtacttcgat 6420

accactatcg accgaaagcg gtacacatcc accaaggagg ttctcgatgc caccctgatt 6480

caccagtcca tcactggcct gtacgagacc cgaatcgacc tgtctcagct tggtggcgac 6540

tccagagccg atcccaagaa aaagcgaaag gtctaagcgg ccgcaagtgt ggatggggaa 6600

gtgagtgccc ggttctgtgt gcacaattgg caatccaaga tggatggatt caacacaggg 6660

atatagcgag ctacgtggtg gtgcgaggat atagcaacgg atatttatgt ttgacacttg 6720

agaatgtacg atacaagcac tgtccaagta caatactaaa catactgtac atactcatac 6780

tcgtacccgg gcaacggttt cacttgagtg cagtggctag tgctcttact cgtacagtgt 6840

gcaatactgc gtatcatagt ctttgatgta tatcgtattc attcatgtta gttgcgtacg 6900

agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat 6960

tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg 7020

aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct 7080

cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 7140

ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 7200

ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 7260

cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 7320

actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 7380

cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 7440

tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 7500

gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 7560

caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 7620

agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 7680

tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 7740

tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 7800

gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 7860

gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 7920

aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 7980

atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 8040

gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 8100

acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 8160

ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 8220

tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 8280

ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg 8340

ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg 8400

atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag 8460

taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt 8520

catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga 8580

atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc 8640

acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc 8700

aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc 8760

ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc 8820

cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca 8880

atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat 8940

ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgc 9000

gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac 9060

acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt 9120

cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc gatttagtgc 9180

tttacggcac ctcgacccca aaaaacttga ttagggtgat ggttcacgta gtgggccatc 9240

gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact 9300

cttgttccaa actggaacaa cactcaaccc tatctcggtc tattcttttg atttataagg 9360

gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc 9420

gaattttaac aaaatattaa cgcttacaat ttccattcgc cattcaggct gcgcaactgt 9480

tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 9540

gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 9600

acggccagtg aattgtaata cgactcacta tagggcgaat tgggtaccgg gccccccctc 9660

gaggtcgatg gtgtcgataa gcttgatatc gaattcatgt cacacaaacc gatcttcgcc 9720

tcaaggaaac ctaattctac atccgagaga ctgccgagat ccagtctaca ctgattaatt 9780

ttcgggccaa taatttaaaa aaatcgtgtt atataatatt atatgtatta tatatataca 9840

tcatgatgat actgacagtc atgtcccatt gctaaataga cagactccat ctgccgcctc 9900

caactgatgt tctcaatatt taaggggtca tctcgcattg tttaataata aacagactcc 9960

atctaccgcc tccaaatgat gttctcaaaa tatattgtat gaacttattt ttattactta 10020

gtattattag acaacttact tgctttatga aaaacacttc ctatttagga aacaatttat 10080

aatggcagtt cgttcattta acaatttatg tagaataaat gttataaatg cgtatgggaa 10140

atcttaaata tggatagcat aaatgatatc tgcattgcct aattcgaaat caacagcaac 10200

gaaaaaaatc ccttgtacaa cataaatagt catcgagaaa tatcaactat caaagaacag 10260

ctattcacac gttactattg agattattat tggacgagaa tcacacactc aactgtcttt 10320

ctctcttcta gaaatacagg tacaagtatg tactattctc attgttcata cttctagtca 10380

tttcatccca catattcctt ggatttctct ccaatgaatg acattctatc ttgcaaattc 10440

aacaattata ataagatata ccaaagtagc ggtatagtgg caatcaaaaa gcttctctgg 10500

tgtgcttctc gtatttattt ttattctaat gatccattaa aggtatatat ttatttcttg 10560

ttatataatc cttttgttta ttacatgggc tggatacata aaggtatttt gatttaattt 10620

tttgcttaaa ttcaatcccc cctcgttcag tgtcaactgt aatggtagga aattaccata 10680

cttttgaaga agcaaaaaaa atgaaagaaa aaaaaaatcg tatttccagg ttagacgttc 10740

cgcagaatct agaatgcggt atgcggtaca ttgttcttcg aacgtaaaag ttgcgctccc 10800

tgagatattg tacatttttg cttttacaag tacaagtaca tcgtacaact atgtactact 10860

gttgatgcat ccacaacagt ttgttttgtt tttttttgtt tttttttttt ctaatgattc 10920

attaccgcta tgtataccta cttgtacttg tagtaagccg ggttattggc gttcaattaa 10980

tcatagactt atgaatctgc acggtgtgcg ctgcgagtta cttttagctt atgcatgcta 11040

cttgggtgta atattgggat ctgttcggaa atcaacggat gctcaatcga taaaaaacaa 11100

aaaaaaaagc accgactcgg tgccactttt tcaagttgat aacggactag ccttatttta 11160

acttgctatt tctagc 11176

<210> 104

<211> 168

<212> RNA

<213> 人工序列

<220>

<223> Cas1-1的核酶-向导RNA

<400> 104

ggccggcaug gucccagccu ccucgcuggc gccggcuggg caacaugcuu cggcauggcg 60

aaugggacuc aaacgauuac ccacccucgu uuuagagcua gaaauagcaa guuaaaauaa 120

ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg gugcuuuu 168

<210> 105

<211> 1719

<212> DNA

<213> 解脂耶氏酵母

<220>

<221> misc_feature

<222> (1)..(1719)

<223> Can1基因

<400> 105

atggaaaaga cattttcaaa cgattaccca ccctccggga ctgaggccca catccacatc 60

aaccacacgg cccactcgga tgactcagag gaggtgccct cgcacaagga aaattacaac 120

accagtggcc acgacctgga ggagtccgac ccggataacc atgtcggtga gaccctcgag 180

gtcaagcgag gtctcaagat gcgacacatc tccatgatct cgcttggagg aaccattggt 240

accggtctct tcattggtac cggaggagct ctccagcagg ccggtccctg tggcgccctc 300

gtcgcctacg tgttcatggc caccattgtc tactctgttg ccgagtctct tggagaactg 360

gctacgtaca ttcccatcac cggctccttt gccgtcttta ctacccgata tctgtcacag 420

tcgtttggtg cctccatggg ctggctatac tggttctcgt gggcgatcac cttcgccatc 480

gagctcaaca ccattggtcc cgtgattgag tactggactg acgccgttcc tactgctgcc 540

tggattgcca tcttcttcgt catcctcact accatcaact tcttccccgt gggcttctat 600

ggcgaagtcg agttctgggt ggcctccgtg aaggtcattg ccatcattgg atggctcatc 660

tacgcgctct gcatgacgtg tggagcaggt gtaacaggtc ctgtgggatt cagatactgg 720

aaccaccccg gacccatggg agacggaatc tggaccgacg gcgtgcccat tgtgcgaaac 780

gcgcccggtc gacgattcat gggatggctc aattcgctcg ttaacgccgc cttcacctac 840

cagggctgtg agctggtcgg agtcactgcc ggtgaggccc agaaccccag aaagtccgtc 900

cctcgagcca tcaaccgagt ctttgctcga atttgcatct tctacattgg ctctatcttc 960

ttcatgggca tgctcgtgcc ctttaacgac cccaagctga ccgatgactc ctccgtcatc 1020

gcctcctctc cttttgttat tgccattatc aactctggca ccaaggtgct ccctcacatt 1080

ttcaacgccg tcattctcat caccctgatt tcggcaggaa actccaacgt ctacattggc 1140

tcgcgagtgg tctacgccct ggctgactcc ggaaccgcac caaagttctt caagcgaacc 1200

accaagaagg gagtgccgta cgtggcagtc tgcttcacct cggcgtttgg tctgctggcc 1260

ttcatgtctg tgtccgagtc gtcgtccact gtcttcgact ggttcatcaa catctccgct 1320

gtggccggcc tcatctgttg ggccttcatc tctgcctccc acatccgatt catgcaagtg 1380

cttaagcaca gagggatctc cagagatacg ctgcccttca aggcacgatg gcagccattc 1440

tactcatggt acgcgctcgt ctccatcatc ttcatcactc tcatccaggg cttcacgtcc 1500

ttctggcact ttaccgccgc caagttcatg actgcataca tctccgtcat tgtctgggtc 1560

ggtttgtaca ttatcttcca gtgtctgttc cgatgcaagt tccttatccc tattgaggat 1620

gtggacattg acaccggccg acgagagatt gacgacgatg tgtgggagga gaagatcccc 1680

acaaagtggt acgagaagtt ttggaatatt attgcataa 1719

<210> 106

<211> 23

<212> DNA

<213> 解脂耶氏酵母

<220>

<221> misc_feature

<222> (1)..(23)

<223> Can1-2靶位点和PAM

<400> 106

ggcccactcg gatgactcag agg 23

<210> 107

<211> 27

<212> DNA

<213> 解脂耶氏酵母

<220>

<221> misc_feature

<222> (1)..(17)

<223> Sou2-1靶位点和PAM

<400> 107

gtctggacct tccaccctcg ccacggg 27

<210> 108

<211> 25

<212> DNA

<213> 解脂耶氏酵母

<220>

<221> misc_feature

<222> (1)..(25)

<223> Sou2-2靶位点和PAM

<400> 108

gcagtcccgt ggcgagggtg gaagg 25

<210> 109

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> Can1-2的可变靶向结构域

<400> 109

ggcccacucg gaugacucag 20

<210> 110

<211> 24

<212> RNA

<213> 人工序列

<220>

<223> Sou2-1的可变靶向结构域

<400> 110

gucuggaccu uccacccucg ccac 24

<210> 111

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> Sou2-2的可变靶向结构域

<400> 111

gcagucccgu ggcgagggug ga 22

<210> 112

<211> 23

<212> DNA

<213> 解脂耶氏酵母

<400> 112

cagctcgaga cgtcctagaa cgg 23

<210> 113

<211> 23

<212> DNA

<213> 解脂耶氏酵母

<400> 113

ttcctctgtc acagacgttt cgg 23

<210> 114

<211> 23

<212> DNA

<213> 解脂耶氏酵母

<400> 114

gaaaagtgcg ttttgattct cgg 23

<210> 115

<211> 19

<212> RNA

<213> 人工序列

<220>

<223> ura3-1的可变靶向结构域

<400> 115

gccgcucgag ugcucaagc 19

<210> 116

<211> 22

<212> DNA

<213> 解脂耶氏酵母

<220>

<221> misc_feature

<222> (1)..(22)

<223> URa3-1靶位点和PAM

<400> 116

gccgctcgag tgctcaagct cg 22

<210> 117

<211> 1379

<212> PRT

<213> 人工序列

<220>

<223> Cas9-SV40 NLS D10A H840A

<400> 117

Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe

20 25 30

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

115 120 125

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

130 135 140

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

180 185 190

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

195 200 205

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

225 230 235 240

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

260 265 270

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

340 345 350

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

355 360 365

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

420 425 430

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

625 630 635 640

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

645 650 655

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

705 710 715 720

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

755 760 765

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

770 775 780

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

785 790 795 800

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

805 810 815

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

820 825 830

Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys

835 840 845

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

850 855 860

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

865 870 875 880

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

885 890 895

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

900 905 910

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

930 935 940

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

945 950 955 960

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

965 970 975

Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

980 985 990

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe

995 1000 1005

Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala

1010 1015 1020

Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe

1025 1030 1035

Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala

1040 1045 1050

Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu

1055 1060 1065

Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val

1070 1075 1080

Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr

1085 1090 1095

Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys

1100 1105 1110

Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro

1115 1120 1125

Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val

1130 1135 1140

Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys

1145 1150 1155

Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser

1160 1165 1170

Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys

1175 1180 1185

Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu

1190 1195 1200

Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly

1205 1210 1215

Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val

1220 1225 1230

Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser

1235 1240 1245

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys

1250 1255 1260

His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys

1265 1270 1275

Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala

1280 1285 1290

Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn

1295 1300 1305

Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala

1310 1315 1320

Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser

1325 1330 1335

Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr

1340 1345 1350

Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp

1355 1360 1365

Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val

1370 1375

<210> 118

<211> 41

<212> DNA

<213> 人工序列

<220>

<223> D10AF

<400> 118

gaaatactcc atcggcctgg ccattggaac caactctgtc g 41

<210> 119

<211> 41

<212> DNA

<213> 人工序列

<220>

<223> D10AR

<400> 119

cgacagagtt ggttccaatg gccaggccga tggagtattt c 41

<210> 120

<211> 4140

<212> DNA

<213> 人工序列

<220>

<223> 经耶氏酵母优化的Cas9 D10A

<400> 120

atggacaaga aatactccat cggcctggcc attggaacca actctgtcgg ctgggctgtc 60

atcaccgacg agtacaaggt gccctccaag aaattcaagg tcctcggaaa caccgatcga 120

cactccatca agaaaaacct cattggtgcc ctgttgttcg attctggcga gactgccgaa 180

gctaccagac tcaagcgaac tgctcggcga cgttacaccc gacggaagaa ccgaatctgc 240

tacctgcagg agatcttttc caacgagatg gccaaggtgg acgattcgtt ctttcatcga 300

ctggaggaat ccttcctcgt cgaggaagac aagaaacacg agcgtcatcc catctttggc 360

aacattgtgg acgaggttgc ttaccacgag aagtatccta ccatctacca cctgcgaaag 420

aaactcgtcg attccaccga caaggcggat ctcagactta tctacctcgc tctggcacac 480

atgatcaagt ttcgaggtca tttcctcatc gagggcgatc tcaatcccga caacagcgat 540

gtggacaagc tgttcattca gctcgttcag acctacaacc agctgttcga ggaaaacccc 600

atcaatgcct ccggagtcga tgcaaaggcc atcttgtctg ctcgactctc gaagagcaga 660

cgactggaga acctcattgc ccaacttcct ggcgagaaaa agaacggact gtttggcaac 720

ctcattgccc tttctcttgg tctcacaccc aacttcaagt ccaacttcga tctggcggag 780

gacgccaagc tccagctgtc caaggacacc tacgacgatg acctcgacaa cctgcttgca 840

cagattggcg atcagtacgc cgacctgttt ctcgctgcca agaacctttc ggatgctatt 900

ctcttgtctg acattctgcg agtcaacacc gagatcacaa aggctcccct ttctgcctcc 960

atgatcaagc gatacgacga gcaccatcag gatctcacac tgctcaaggc tcttgtccga 1020

cagcaactgc ccgagaagta caaggagatc tttttcgatc agtcgaagaa cggctacgct 1080

ggatacatcg acggcggagc ctctcaggaa gagttctaca agttcatcaa gccaattctc 1140

gagaagatgg acggaaccga ggaactgctt gtcaagctca atcgagagga tctgcttcgg 1200

aagcaacgaa ccttcgacaa cggcagcatt cctcatcaga tccacctcgg tgagctgcac 1260

gccattcttc gacgtcagga agacttctac ccctttctca aggacaaccg agagaagatc 1320

gagaagattc ttacctttcg aatcccctac tatgttggtc ctcttgccag aggaaactct 1380

cgatttgctt ggatgactcg aaagtccgag gaaaccatca ctccctggaa cttcgaggaa 1440

gtcgtggaca agggtgcctc tgcacagtcc ttcatcgagc gaatgaccaa cttcgacaag 1500

aatctgccca acgagaaggt tcttcccaag cattcgctgc tctacgagta ctttacagtc 1560

tacaacgaac tcaccaaagt caagtacgtt accgagggaa tgcgaaagcc tgccttcttg 1620

tctggcgaac agaagaaagc cattgtcgat ctcctgttca agaccaaccg aaaggtcact 1680

gttaagcagc tcaaggagga ctacttcaag aaaatcgagt gtttcgacag cgtcgagatt 1740

tccggagttg aggaccgatt caacgcctct ttgggcacct atcacgatct gctcaagatt 1800

atcaaggaca aggattttct cgacaacgag gaaaacgagg acattctgga ggacatcgtg 1860

ctcactctta ccctgttcga agatcgggag atgatcgagg aacgactcaa gacatacgct 1920

cacctgttcg acgacaaggt catgaaacaa ctcaagcgac gtagatacac cggctgggga 1980

agactttcgc gaaagctcat caacggcatc agagacaagc agtccggaaa gaccattctg 2040

gactttctca agtccgatgg ctttgccaac cgaaacttca tgcagctcat tcacgacgat 2100

tctcttacct tcaaggagga catccagaag gcacaagtgt ccggtcaggg cgacagcttg 2160

cacgaacata ttgccaacct ggctggttcg ccagccatca agaaaggcat tctccagact 2220

gtcaaggttg tcgacgagct ggtgaaggtc atgggacgtc acaagcccga gaacattgtg 2280

atcgagatgg ccagagagaa ccagacaact caaaagggtc agaaaaactc gcgagagcgg 2340

atgaagcgaa tcgaggaagg catcaaggag ctgggatccc agattctcaa ggagcatccc 2400

gtcgagaaca ctcaactgca gaacgagaag ctgtatctct actatctgca gaatggtcga 2460

gacatgtacg tggatcagga actggacatc aatcgtctca gcgactacga tgtggaccac 2520

attgtccctc aatcctttct caaggacgat tctatcgaca acaaggtcct tacacgatcc 2580

gacaagaaca gaggcaagtc ggacaacgtt cccagcgaag aggtggtcaa aaagatgaag 2640

aactactggc gacagctgct caacgccaag ctcattaccc agcgaaagtt cgacaatctt 2700

accaaggccg agcgaggcgg tctgtccgag ctcgacaagg ctggcttcat caagcgtcaa 2760

ctcgtcgaga ccagacagat cacaaagcac gtcgcacaga ttctcgattc tcggatgaac 2820

accaagtacg acgagaacga caagctcatc cgagaggtca aggtgattac tctcaagtcc 2880

aaactggtct ccgatttccg aaaggacttt cagttctaca aggtgcgaga gatcaacaat 2940

taccaccatg cccacgatgc ttacctcaac gccgtcgttg gcactgcgct catcaagaaa 3000

taccccaagc tcgaaagcga gttcgtttac ggcgattaca aggtctacga cgttcgaaag 3060

atgattgcca agtccgaaca ggagattggc aaggctactg ccaagtactt cttttactcc 3120

aacatcatga actttttcaa gaccgagatc accttggcca acggagagat tcgaaagaga 3180

ccacttatcg agaccaacgg cgaaactgga gagatcgtgt gggacaaggg tcgagacttt 3240

gcaaccgtgc gaaaggttct gtcgatgcct caggtcaaca tcgtcaagaa aaccgaggtt 3300

cagactggcg gattctccaa ggagtcgatt ctgcccaagc gaaactccga caagctcatc 3360

gctcgaaaga aagactggga tcccaagaaa tacggtggct tcgattctcc taccgtcgcc 3420

tattccgtgc ttgtcgttgc gaaggtcgag aagggcaagt ccaaaaagct caagtccgtc 3480

aaggagctgc tcggaattac catcatggag cgatcgagct tcgagaagaa tcccatcgac 3540

ttcttggaag ccaagggtta caaggaggtc aagaaagacc tcattatcaa gctgcccaag 3600

tactctctgt tcgaactgga gaacggtcga aagcgtatgc tcgcctccgc tggcgagctg 3660

cagaagggaa acgagcttgc cttgccttcg aagtacgtca actttctcta tctggcttct 3720

cactacgaga agctcaaggg ttctcccgag gacaacgaac agaagcaact cttcgttgag 3780

cagcacaaac attacctcga cgagattatc gagcagattt ccgagttttc gaagcgagtc 3840

atcctggctg atgccaactt ggacaaggtg ctctctgcct acaacaagca tcgggacaaa 3900

cccattcgag aacaggcgga gaacatcatt cacctgttta ctcttaccaa cctgggtgct 3960

cctgcagctt tcaagtactt cgataccact atcgaccgaa agcggtacac atccaccaag 4020

gaggttctcg atgccaccct gattcaccag tccatcactg gcctgtacga gacccgaatc 4080

gacctgtctc agcttggtgg cgactccaga gccgatccca agaaaaagcg aaaggtctaa 4140

<210> 121

<211> 10706

<212> DNA

<213> 人工序列

<220>

<223> pRF111

<400> 121

catggacaag aaatactcca tcggcctggc cattggaacc aactctgtcg gctgggctgt 60

catcaccgac gagtacaagg tgccctccaa gaaattcaag gtcctcggaa acaccgatcg 120

acactccatc aagaaaaacc tcattggtgc cctgttgttc gattctggcg agactgccga 180

agctaccaga ctcaagcgaa ctgctcggcg acgttacacc cgacggaaga accgaatctg 240

ctacctgcag gagatctttt ccaacgagat ggccaaggtg gacgattcgt tctttcatcg 300

actggaggaa tccttcctcg tcgaggaaga caagaaacac gagcgtcatc ccatctttgg 360

caacattgtg gacgaggttg cttaccacga gaagtatcct accatctacc acctgcgaaa 420

gaaactcgtc gattccaccg acaaggcgga tctcagactt atctacctcg ctctggcaca 480

catgatcaag tttcgaggtc atttcctcat cgagggcgat ctcaatcccg acaacagcga 540

tgtggacaag ctgttcattc agctcgttca gacctacaac cagctgttcg aggaaaaccc 600

catcaatgcc tccggagtcg atgcaaaggc catcttgtct gctcgactct cgaagagcag 660

acgactggag aacctcattg cccaacttcc tggcgagaaa aagaacggac tgtttggcaa 720

cctcattgcc ctttctcttg gtctcacacc caacttcaag tccaacttcg atctggcgga 780

ggacgccaag ctccagctgt ccaaggacac ctacgacgat gacctcgaca acctgcttgc 840

acagattggc gatcagtacg ccgacctgtt tctcgctgcc aagaaccttt cggatgctat 900

tctcttgtct gacattctgc gagtcaacac cgagatcaca aaggctcccc tttctgcctc 960

catgatcaag cgatacgacg agcaccatca ggatctcaca ctgctcaagg ctcttgtccg 1020

acagcaactg cccgagaagt acaaggagat ctttttcgat cagtcgaaga acggctacgc 1080

tggatacatc gacggcggag cctctcagga agagttctac aagttcatca agccaattct 1140

cgagaagatg gacggaaccg aggaactgct tgtcaagctc aatcgagagg atctgcttcg 1200

gaagcaacga accttcgaca acggcagcat tcctcatcag atccacctcg gtgagctgca 1260

cgccattctt cgacgtcagg aagacttcta cccctttctc aaggacaacc gagagaagat 1320

cgagaagatt cttacctttc gaatccccta ctatgttggt cctcttgcca gaggaaactc 1380

tcgatttgct tggatgactc gaaagtccga ggaaaccatc actccctgga acttcgagga 1440

agtcgtggac aagggtgcct ctgcacagtc cttcatcgag cgaatgacca acttcgacaa 1500

gaatctgccc aacgagaagg ttcttcccaa gcattcgctg ctctacgagt actttacagt 1560

ctacaacgaa ctcaccaaag tcaagtacgt taccgaggga atgcgaaagc ctgccttctt 1620

gtctggcgaa cagaagaaag ccattgtcga tctcctgttc aagaccaacc gaaaggtcac 1680

tgttaagcag ctcaaggagg actacttcaa gaaaatcgag tgtttcgaca gcgtcgagat 1740

ttccggagtt gaggaccgat tcaacgcctc tttgggcacc tatcacgatc tgctcaagat 1800

tatcaaggac aaggattttc tcgacaacga ggaaaacgag gacattctgg aggacatcgt 1860

gctcactctt accctgttcg aagatcggga gatgatcgag gaacgactca agacatacgc 1920

tcacctgttc gacgacaagg tcatgaaaca actcaagcga cgtagataca ccggctgggg 1980

aagactttcg cgaaagctca tcaacggcat cagagacaag cagtccggaa agaccattct 2040

ggactttctc aagtccgatg gctttgccaa ccgaaacttc atgcagctca ttcacgacga 2100

ttctcttacc ttcaaggagg acatccagaa ggcacaagtg tccggtcagg gcgacagctt 2160

gcacgaacat attgccaacc tggctggttc gccagccatc aagaaaggca ttctccagac 2220

tgtcaaggtt gtcgacgagc tggtgaaggt catgggacgt cacaagcccg agaacattgt 2280

gatcgagatg gccagagaga accagacaac tcaaaagggt cagaaaaact cgcgagagcg 2340

gatgaagcga atcgaggaag gcatcaagga gctgggatcc cagattctca aggagcatcc 2400

cgtcgagaac actcaactgc agaacgagaa gctgtatctc tactatctgc agaatggtcg 2460

agacatgtac gtggatcagg aactggacat caatcgtctc agcgactacg atgtggacca 2520

cattgtccct caatcctttc tcaaggacga ttctatcgac aacaaggtcc ttacacgatc 2580

cgacaagaac agaggcaagt cggacaacgt tcccagcgaa gaggtggtca aaaagatgaa 2640

gaactactgg cgacagctgc tcaacgccaa gctcattacc cagcgaaagt tcgacaatct 2700

taccaaggcc gagcgaggcg gtctgtccga gctcgacaag gctggcttca tcaagcgtca 2760

actcgtcgag accagacaga tcacaaagca cgtcgcacag attctcgatt ctcggatgaa 2820

caccaagtac gacgagaacg acaagctcat ccgagaggtc aaggtgatta ctctcaagtc 2880

caaactggtc tccgatttcc gaaaggactt tcagttctac aaggtgcgag agatcaacaa 2940

ttaccaccat gcccacgatg cttacctcaa cgccgtcgtt ggcactgcgc tcatcaagaa 3000

ataccccaag ctcgaaagcg agttcgttta cggcgattac aaggtctacg acgttcgaaa 3060

gatgattgcc aagtccgaac aggagattgg caaggctact gccaagtact tcttttactc 3120

caacatcatg aactttttca agaccgagat caccttggcc aacggagaga ttcgaaagag 3180

accacttatc gagaccaacg gcgaaactgg agagatcgtg tgggacaagg gtcgagactt 3240

tgcaaccgtg cgaaaggttc tgtcgatgcc tcaggtcaac atcgtcaaga aaaccgaggt 3300

tcagactggc ggattctcca aggagtcgat tctgcccaag cgaaactccg acaagctcat 3360

cgctcgaaag aaagactggg atcccaagaa atacggtggc ttcgattctc ctaccgtcgc 3420

ctattccgtg cttgtcgttg cgaaggtcga gaagggcaag tccaaaaagc tcaagtccgt 3480

caaggagctg ctcggaatta ccatcatgga gcgatcgagc ttcgagaaga atcccatcga 3540

cttcttggaa gccaagggtt acaaggaggt caagaaagac ctcattatca agctgcccaa 3600

gtactctctg ttcgaactgg agaacggtcg aaagcgtatg ctcgcctccg ctggcgagct 3660

gcagaaggga aacgagcttg ccttgccttc gaagtacgtc aactttctct atctggcttc 3720

tcactacgag aagctcaagg gttctcccga ggacaacgaa cagaagcaac tcttcgttga 3780

gcagcacaaa cattacctcg acgagattat cgagcagatt tccgagtttt cgaagcgagt 3840

catcctggct gatgccaact tggacaaggt gctctctgcc tacaacaagc atcgggacaa 3900

acccattcga gaacaggcgg agaacatcat tcacctgttt actcttacca acctgggtgc 3960

tcctgcagct ttcaagtact tcgataccac tatcgaccga aagcggtaca catccaccaa 4020

ggaggttctc gatgccaccc tgattcacca gtccatcact ggcctgtacg agacccgaat 4080

cgacctgtct cagcttggtg gcgactccag agccgatccc aagaaaaagc gaaaggtcta 4140

agcggccgca agtgtggatg gggaagtgag tgcccggttc tgtgtgcaca attggcaatc 4200

caagatggat ggattcaaca cagggatata gcgagctacg tggtggtgcg aggatatagc 4260

aacggatatt tatgtttgac acttgagaat gtacgataca agcactgtcc aagtacaata 4320

ctaaacatac tgtacatact catactcgta cccgggcaac ggtttcactt gagtgcagtg 4380

gctagtgctc ttactcgtac agtgtgcaat actgcgtatc atagtctttg atgtatatcg 4440

tattcattca tgttagttgc gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4500

aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4560

acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4620

ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4680

gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4740

caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 4800

tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 4860

gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 4920

ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 4980

cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 5040

tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 5100

tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 5160

cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 5220

agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 5280

agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5340

gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5400

aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5460

ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5520

gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5580

taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5640

tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5700

tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 5760

gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 5820

gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 5880

ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 5940

cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 6000

tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 6060

cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 6120

agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 6180

cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 6240

aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6300

aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6360

gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6420

gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6480

tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6540

ttccccgaaa agtgccacct gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6600

tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 6660

tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6720

tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 6780

gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 6840

agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 6900

cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 6960

agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttcca 7020

ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7080

acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 7140

ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact cactataggg 7200

cgaattgggt accgggcccc ccctcgaggt cgatggtgtc gataagcttg atatcgaatt 7260

catgtcacac aaaccgatct tcgcctcaag gaaacctaat tctacatccg agagactgcc 7320

gagatccagt ctacactgat taattttcgg gccaataatt taaaaaaatc gtgttatata 7380

atattatatg tattatatat atacatcatg atgatactga cagtcatgtc ccattgctaa 7440

atagacagac tccatctgcc gcctccaact gatgttctca atatttaagg ggtcatctcg 7500

cattgtttaa taataaacag actccatcta ccgcctccaa atgatgttct caaaatatat 7560

tgtatgaact tatttttatt acttagtatt attagacaac ttacttgctt tatgaaaaac 7620

acttcctatt taggaaacaa tttataatgg cagttcgttc atttaacaat ttatgtagaa 7680

taaatgttat aaatgcgtat gggaaatctt aaatatggat agcataaatg atatctgcat 7740

tgcctaattc gaaatcaaca gcaacgaaaa aaatcccttg tacaacataa atagtcatcg 7800

agaaatatca actatcaaag aacagctatt cacacgttac tattgagatt attattggac 7860

gagaatcaca cactcaactg tctttctctc ttctagaaat acaggtacaa gtatgtacta 7920

ttctcattgt tcatacttct agtcatttca tcccacatat tccttggatt tctctccaat 7980

gaatgacatt ctatcttgca aattcaacaa ttataataag atataccaaa gtagcggtat 8040

agtggcaatc aaaaagcttc tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc 8100

attaaaggta tatatttatt tcttgttata taatcctttt gtttattaca tgggctggat 8160

acataaaggt attttgattt aattttttgc ttaaattcaa tcccccctcg ttcagtgtca 8220

actgtaatgg taggaaatta ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa 8280

aatcgtattt ccaggttaga cgttccgcag aatctagaat gcggtatgcg gtacattgtt 8340

cttcgaacgt aaaagttgcg ctccctgaga tattgtacat ttttgctttt acaagtacaa 8400

gtacatcgta caactatgta ctactgttga tgcatccaca acagtttgtt ttgttttttt 8460

ttgttttttt tttttctaat gattcattac cgctatgtat acctacttgt acttgtagta 8520

agccgggtta ttggcgttca attaatcata gacttatgaa tctgcacggt gtgcgctgcg 8580

agttactttt agcttatgca tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa 8640

cggatgctca atcgatttcg acagtaatta attaagtcat acacaagtca gctttcttcg 8700

agcctcatat aagtataagt agttcaacgt attagcactg tacccagcat ctccgtatcg 8760

agaaacacaa caacatgccc cattggacag atcatgcgga tacacaggtt gtgcagtatc 8820

atacatactc gatcagacag gtcgtctgac catcatacaa gctgaacaag cgctccatac 8880

ttgcacgctc tctatataca cagttaaatt acatatccat agtctaacct ctaacagtta 8940

atcttctggt aagcctccca gccagccttc tggtatcgct tggcctcctc aataggatct 9000

cggttctggc cgtacagacc tcggccgaca attatgatat ccgttccggt agacatgaca 9060

tcctcaacag ttcggtactg ctgtccgaga gcgtctccct tgtcgtcaag acccaccccg 9120

ggggtcagaa taagccagtc ctcagagtcg cccttaggtc ggttctgggc aatgaagcca 9180

accacaaact cggggtcgga tcgggcaagc tcaatggtct gcttggagta ctcgccagtg 9240

gccagagagc ccttgcaaga cagctcggcc agcatgagca gacctctggc cagcttctcg 9300

ttgggagagg ggactaggaa ctccttgtac tgggagttct cgtagtcaga gacgtcctcc 9360

ttcttctgtt cagagacagt ttcctcggca ccagctcgca ggccagcaat gattccggtt 9420

ccgggtacac cgtgggcgtt ggtgatatcg gaccactcgg cgattcggtg acaccggtac 9480

tggtgcttga cagtgttgcc aatatctgcg aactttctgt cctcgaacag gaagaaaccg 9540

tgcttaagag caagttcctt gagggggagc acagtgccgg cgtaggtgaa gtcgtcaatg 9600

atgtcgatat gggttttgat catgcacaca taaggtccga ccttatcggc aagctcaatg 9660

agctccttgg tggtggtaac atccagagaa gcacacaggt tggttttctt ggctgccacg 9720

agcttgagca ctcgagcggc aaaggcggac ttgtggacgt tagctcgagc ttcgtaggag 9780

ggcattttgg tggtgaagag gagactgaaa taaatttagt ctgcagaact ttttatcgga 9840

accttatctg gggcagtgaa gtatatgtta tggtaatagt tacgagttag ttgaacttat 9900

agatagactg gactatacgg ctatcggtcc aaattagaaa gaacgtcaat ggctctctgg 9960

gcgtcgcctt tgccgacaaa aatgtgatca tgatgaaagc cagcaatgac gttgcagctg 10020

atattgttgt cggccaaccg cgccgaaaac gcagctgtca gacccacagc ctccaacgaa 10080

gaatgtatcg tcaaagtgat ccaagcacac tcatagttgg agtcgtactc caaaggcggc 10140

aatgacgagt cagacagata ctcgtcgacg tttaaaccat catctaaggg cctcaaaact 10200

acctcggaac tgctgcgctg atctggacac cacagaggtt ccgagcactt taggttgcac 10260

caaatgtccc accaggtgca ggcagaaaac gctggaacag cgtgtacagt ttgtcttaac 10320

aaaaagtgag ggcgctgagg tcgagcaggg tggtgtgact tgttatagcc tttagagctg 10380

cgaaagcgcg tatggatttg gctcatcagg ccagattgag ggtctgtgga cacatgtcat 10440

gttagtgtac ttcaatcgcc ccctggatat agccccgaca ataggccgtg gcctcatttt 10500

tttgccttcc gcacatttcc attgctcggt acccacacct tgcttctcct gcacttgcca 10560

accttaatac tggtttacat tgaccaacat cttacaagcg gggggcttgt ctagggtata 10620

tataaacagt ggctctccca atcggttgcc agtctctttt ttcctttctt tccccacaga 10680

ttcgaaatct aaactacaca tcacac 10706

<210> 122

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> H840A1

<400> 122

tcagcgacta cgatgtggac gccattgtcc ctcaatcctt tct 43

<210> 123

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> H840A2

<400> 123

agaaaggatt gagggacaat ggcgtccaca tcgtagtcgc tga 43

<210> 124

<211> 4140

<212> DNA

<213> 人工序列

<220>

<223> 经耶氏酵母密码子优化的失活的Cas9

<400> 124

atggacaaga aatactccat cggcctggcc attggaacca actctgtcgg ctgggctgtc 60

atcaccgacg agtacaaggt gccctccaag aaattcaagg tcctcggaaa caccgatcga 120

cactccatca agaaaaacct cattggtgcc ctgttgttcg attctggcga gactgccgaa 180

gctaccagac tcaagcgaac tgctcggcga cgttacaccc gacggaagaa ccgaatctgc 240

tacctgcagg agatcttttc caacgagatg gccaaggtgg acgattcgtt ctttcatcga 300

ctggaggaat ccttcctcgt cgaggaagac aagaaacacg agcgtcatcc catctttggc 360

aacattgtgg acgaggttgc ttaccacgag aagtatccta ccatctacca cctgcgaaag 420

aaactcgtcg attccaccga caaggcggat ctcagactta tctacctcgc tctggcacac 480

atgatcaagt ttcgaggtca tttcctcatc gagggcgatc tcaatcccga caacagcgat 540

gtggacaagc tgttcattca gctcgttcag acctacaacc agctgttcga ggaaaacccc 600

atcaatgcct ccggagtcga tgcaaaggcc atcttgtctg ctcgactctc gaagagcaga 660

cgactggaga acctcattgc ccaacttcct ggcgagaaaa agaacggact gtttggcaac 720

ctcattgccc tttctcttgg tctcacaccc aacttcaagt ccaacttcga tctggcggag 780

gacgccaagc tccagctgtc caaggacacc tacgacgatg acctcgacaa cctgcttgca 840

cagattggcg atcagtacgc cgacctgttt ctcgctgcca agaacctttc ggatgctatt 900

ctcttgtctg acattctgcg agtcaacacc gagatcacaa aggctcccct ttctgcctcc 960

atgatcaagc gatacgacga gcaccatcag gatctcacac tgctcaaggc tcttgtccga 1020

cagcaactgc ccgagaagta caaggagatc tttttcgatc agtcgaagaa cggctacgct 1080

ggatacatcg acggcggagc ctctcaggaa gagttctaca agttcatcaa gccaattctc 1140

gagaagatgg acggaaccga ggaactgctt gtcaagctca atcgagagga tctgcttcgg 1200

aagcaacgaa ccttcgacaa cggcagcatt cctcatcaga tccacctcgg tgagctgcac 1260

gccattcttc gacgtcagga agacttctac ccctttctca aggacaaccg agagaagatc 1320

gagaagattc ttacctttcg aatcccctac tatgttggtc ctcttgccag aggaaactct 1380

cgatttgctt ggatgactcg aaagtccgag gaaaccatca ctccctggaa cttcgaggaa 1440

gtcgtggaca agggtgcctc tgcacagtcc ttcatcgagc gaatgaccaa cttcgacaag 1500

aatctgccca acgagaaggt tcttcccaag cattcgctgc tctacgagta ctttacagtc 1560

tacaacgaac tcaccaaagt caagtacgtt accgagggaa tgcgaaagcc tgccttcttg 1620

tctggcgaac agaagaaagc cattgtcgat ctcctgttca agaccaaccg aaaggtcact 1680

gttaagcagc tcaaggagga ctacttcaag aaaatcgagt gtttcgacag cgtcgagatt 1740

tccggagttg aggaccgatt caacgcctct ttgggcacct atcacgatct gctcaagatt 1800

atcaaggaca aggattttct cgacaacgag gaaaacgagg acattctgga ggacatcgtg 1860

ctcactctta ccctgttcga agatcgggag atgatcgagg aacgactcaa gacatacgct 1920

cacctgttcg acgacaaggt catgaaacaa ctcaagcgac gtagatacac cggctgggga 1980

agactttcgc gaaagctcat caacggcatc agagacaagc agtccggaaa gaccattctg 2040

gactttctca agtccgatgg ctttgccaac cgaaacttca tgcagctcat tcacgacgat 2100

tctcttacct tcaaggagga catccagaag gcacaagtgt ccggtcaggg cgacagcttg 2160

cacgaacata ttgccaacct ggctggttcg ccagccatca agaaaggcat tctccagact 2220

gtcaaggttg tcgacgagct ggtgaaggtc atgggacgtc acaagcccga gaacattgtg 2280

atcgagatgg ccagagagaa ccagacaact caaaagggtc agaaaaactc gcgagagcgg 2340

atgaagcgaa tcgaggaagg catcaaggag ctgggatccc agattctcaa ggagcatccc 2400

gtcgagaaca ctcaactgca gaacgagaag ctgtatctct actatctgca gaatggtcga 2460

gacatgtacg tggatcagga actggacatc aatcgtctca gcgactacga tgtggacgcc 2520

attgtccctc aatcctttct caaggacgat tctatcgaca acaaggtcct tacacgatcc 2580

gacaagaaca gaggcaagtc ggacaacgtt cccagcgaag aggtggtcaa aaagatgaag 2640

aactactggc gacagctgct caacgccaag ctcattaccc agcgaaagtt cgacaatctt 2700

accaaggccg agcgaggcgg tctgtccgag ctcgacaagg ctggcttcat caagcgtcaa 2760

ctcgtcgaga ccagacagat cacaaagcac gtcgcacaga ttctcgattc tcggatgaac 2820

accaagtacg acgagaacga caagctcatc cgagaggtca aggtgattac tctcaagtcc 2880

aaactggtct ccgatttccg aaaggacttt cagttctaca aggtgcgaga gatcaacaat 2940

taccaccatg cccacgatgc ttacctcaac gccgtcgttg gcactgcgct catcaagaaa 3000

taccccaagc tcgaaagcga gttcgtttac ggcgattaca aggtctacga cgttcgaaag 3060

atgattgcca agtccgaaca ggagattggc aaggctactg ccaagtactt cttttactcc 3120

aacatcatga actttttcaa gaccgagatc accttggcca acggagagat tcgaaagaga 3180

ccacttatcg agaccaacgg cgaaactgga gagatcgtgt gggacaaggg tcgagacttt 3240

gcaaccgtgc gaaaggttct gtcgatgcct caggtcaaca tcgtcaagaa aaccgaggtt 3300

cagactggcg gattctccaa ggagtcgatt ctgcccaagc gaaactccga caagctcatc 3360

gctcgaaaga aagactggga tcccaagaaa tacggtggct tcgattctcc taccgtcgcc 3420

tattccgtgc ttgtcgttgc gaaggtcgag aagggcaagt ccaaaaagct caagtccgtc 3480

aaggagctgc tcggaattac catcatggag cgatcgagct tcgagaagaa tcccatcgac 3540

ttcttggaag ccaagggtta caaggaggtc aagaaagacc tcattatcaa gctgcccaag 3600

tactctctgt tcgaactgga gaacggtcga aagcgtatgc tcgcctccgc tggcgagctg 3660

cagaagggaa acgagcttgc cttgccttcg aagtacgtca actttctcta tctggcttct 3720

cactacgaga agctcaaggg ttctcccgag gacaacgaac agaagcaact cttcgttgag 3780

cagcacaaac attacctcga cgagattatc gagcagattt ccgagttttc gaagcgagtc 3840

atcctggctg atgccaactt ggacaaggtg ctctctgcct acaacaagca tcgggacaaa 3900

cccattcgag aacaggcgga gaacatcatt cacctgttta ctcttaccaa cctgggtgct 3960

cctgcagctt tcaagtactt cgataccact atcgaccgaa agcggtacac atccaccaag 4020

gaggttctcg atgccaccct gattcaccag tccatcactg gcctgtacga gacccgaatc 4080

gacctgtctc agcttggtgg cgactccaga gccgatccca agaaaaagcg aaaggtctaa 4140

<210> 125

<211> 10706

<212> DNA

<213> 人工序列

<220>

<223> pRF143

<400> 125

catggacaag aaatactcca tcggcctggc cattggaacc aactctgtcg gctgggctgt 60

catcaccgac gagtacaagg tgccctccaa gaaattcaag gtcctcggaa acaccgatcg 120

acactccatc aagaaaaacc tcattggtgc cctgttgttc gattctggcg agactgccga 180

agctaccaga ctcaagcgaa ctgctcggcg acgttacacc cgacggaaga accgaatctg 240

ctacctgcag gagatctttt ccaacgagat ggccaaggtg gacgattcgt tctttcatcg 300

actggaggaa tccttcctcg tcgaggaaga caagaaacac gagcgtcatc ccatctttgg 360

caacattgtg gacgaggttg cttaccacga gaagtatcct accatctacc acctgcgaaa 420

gaaactcgtc gattccaccg acaaggcgga tctcagactt atctacctcg ctctggcaca 480

catgatcaag tttcgaggtc atttcctcat cgagggcgat ctcaatcccg acaacagcga 540

tgtggacaag ctgttcattc agctcgttca gacctacaac cagctgttcg aggaaaaccc 600

catcaatgcc tccggagtcg atgcaaaggc catcttgtct gctcgactct cgaagagcag 660

acgactggag aacctcattg cccaacttcc tggcgagaaa aagaacggac tgtttggcaa 720

cctcattgcc ctttctcttg gtctcacacc caacttcaag tccaacttcg atctggcgga 780

ggacgccaag ctccagctgt ccaaggacac ctacgacgat gacctcgaca acctgcttgc 840

acagattggc gatcagtacg ccgacctgtt tctcgctgcc aagaaccttt cggatgctat 900

tctcttgtct gacattctgc gagtcaacac cgagatcaca aaggctcccc tttctgcctc 960

catgatcaag cgatacgacg agcaccatca ggatctcaca ctgctcaagg ctcttgtccg 1020

acagcaactg cccgagaagt acaaggagat ctttttcgat cagtcgaaga acggctacgc 1080

tggatacatc gacggcggag cctctcagga agagttctac aagttcatca agccaattct 1140

cgagaagatg gacggaaccg aggaactgct tgtcaagctc aatcgagagg atctgcttcg 1200

gaagcaacga accttcgaca acggcagcat tcctcatcag atccacctcg gtgagctgca 1260

cgccattctt cgacgtcagg aagacttcta cccctttctc aaggacaacc gagagaagat 1320

cgagaagatt cttacctttc gaatccccta ctatgttggt cctcttgcca gaggaaactc 1380

tcgatttgct tggatgactc gaaagtccga ggaaaccatc actccctgga acttcgagga 1440

agtcgtggac aagggtgcct ctgcacagtc cttcatcgag cgaatgacca acttcgacaa 1500

gaatctgccc aacgagaagg ttcttcccaa gcattcgctg ctctacgagt actttacagt 1560

ctacaacgaa ctcaccaaag tcaagtacgt taccgaggga atgcgaaagc ctgccttctt 1620

gtctggcgaa cagaagaaag ccattgtcga tctcctgttc aagaccaacc gaaaggtcac 1680

tgttaagcag ctcaaggagg actacttcaa gaaaatcgag tgtttcgaca gcgtcgagat 1740

ttccggagtt gaggaccgat tcaacgcctc tttgggcacc tatcacgatc tgctcaagat 1800

tatcaaggac aaggattttc tcgacaacga ggaaaacgag gacattctgg aggacatcgt 1860

gctcactctt accctgttcg aagatcggga gatgatcgag gaacgactca agacatacgc 1920

tcacctgttc gacgacaagg tcatgaaaca actcaagcga cgtagataca ccggctgggg 1980

aagactttcg cgaaagctca tcaacggcat cagagacaag cagtccggaa agaccattct 2040

ggactttctc aagtccgatg gctttgccaa ccgaaacttc atgcagctca ttcacgacga 2100

ttctcttacc ttcaaggagg acatccagaa ggcacaagtg tccggtcagg gcgacagctt 2160

gcacgaacat attgccaacc tggctggttc gccagccatc aagaaaggca ttctccagac 2220

tgtcaaggtt gtcgacgagc tggtgaaggt catgggacgt cacaagcccg agaacattgt 2280

gatcgagatg gccagagaga accagacaac tcaaaagggt cagaaaaact cgcgagagcg 2340

gatgaagcga atcgaggaag gcatcaagga gctgggatcc cagattctca aggagcatcc 2400

cgtcgagaac actcaactgc agaacgagaa gctgtatctc tactatctgc agaatggtcg 2460

agacatgtac gtggatcagg aactggacat caatcgtctc agcgactacg atgtggacgc 2520

cattgtccct caatcctttc tcaaggacga ttctatcgac aacaaggtcc ttacacgatc 2580

cgacaagaac agaggcaagt cggacaacgt tcccagcgaa gaggtggtca aaaagatgaa 2640

gaactactgg cgacagctgc tcaacgccaa gctcattacc cagcgaaagt tcgacaatct 2700

taccaaggcc gagcgaggcg gtctgtccga gctcgacaag gctggcttca tcaagcgtca 2760

actcgtcgag accagacaga tcacaaagca cgtcgcacag attctcgatt ctcggatgaa 2820

caccaagtac gacgagaacg acaagctcat ccgagaggtc aaggtgatta ctctcaagtc 2880

caaactggtc tccgatttcc gaaaggactt tcagttctac aaggtgcgag agatcaacaa 2940

ttaccaccat gcccacgatg cttacctcaa cgccgtcgtt ggcactgcgc tcatcaagaa 3000

ataccccaag ctcgaaagcg agttcgttta cggcgattac aaggtctacg acgttcgaaa 3060

gatgattgcc aagtccgaac aggagattgg caaggctact gccaagtact tcttttactc 3120

caacatcatg aactttttca agaccgagat caccttggcc aacggagaga ttcgaaagag 3180

accacttatc gagaccaacg gcgaaactgg agagatcgtg tgggacaagg gtcgagactt 3240

tgcaaccgtg cgaaaggttc tgtcgatgcc tcaggtcaac atcgtcaaga aaaccgaggt 3300

tcagactggc ggattctcca aggagtcgat tctgcccaag cgaaactccg acaagctcat 3360

cgctcgaaag aaagactggg atcccaagaa atacggtggc ttcgattctc ctaccgtcgc 3420

ctattccgtg cttgtcgttg cgaaggtcga gaagggcaag tccaaaaagc tcaagtccgt 3480

caaggagctg ctcggaatta ccatcatgga gcgatcgagc ttcgagaaga atcccatcga 3540

cttcttggaa gccaagggtt acaaggaggt caagaaagac ctcattatca agctgcccaa 3600

gtactctctg ttcgaactgg agaacggtcg aaagcgtatg ctcgcctccg ctggcgagct 3660

gcagaaggga aacgagcttg ccttgccttc gaagtacgtc aactttctct atctggcttc 3720

tcactacgag aagctcaagg gttctcccga ggacaacgaa cagaagcaac tcttcgttga 3780

gcagcacaaa cattacctcg acgagattat cgagcagatt tccgagtttt cgaagcgagt 3840

catcctggct gatgccaact tggacaaggt gctctctgcc tacaacaagc atcgggacaa 3900

acccattcga gaacaggcgg agaacatcat tcacctgttt actcttacca acctgggtgc 3960

tcctgcagct ttcaagtact tcgataccac tatcgaccga aagcggtaca catccaccaa 4020

ggaggttctc gatgccaccc tgattcacca gtccatcact ggcctgtacg agacccgaat 4080

cgacctgtct cagcttggtg gcgactccag agccgatccc aagaaaaagc gaaaggtcta 4140

agcggccgca agtgtggatg gggaagtgag tgcccggttc tgtgtgcaca attggcaatc 4200

caagatggat ggattcaaca cagggatata gcgagctacg tggtggtgcg aggatatagc 4260

aacggatatt tatgtttgac acttgagaat gtacgataca agcactgtcc aagtacaata 4320

ctaaacatac tgtacatact catactcgta cccgggcaac ggtttcactt gagtgcagtg 4380

gctagtgctc ttactcgtac agtgtgcaat actgcgtatc atagtctttg atgtatatcg 4440

tattcattca tgttagttgc gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4500

aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4560

acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4620

ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4680

gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4740

caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 4800

tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 4860

gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 4920

ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 4980

cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 5040

tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 5100

tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 5160

cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 5220

agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 5280

agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5340

gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5400

aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5460

ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5520

gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5580

taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5640

tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5700

tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 5760

gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 5820

gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 5880

ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 5940

cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 6000

tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 6060

cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 6120

agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 6180

cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 6240

aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6300

aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6360

gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6420

gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6480

tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6540

ttccccgaaa agtgccacct gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6600

tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 6660

tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6720

tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 6780

gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 6840

agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 6900

cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 6960

agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttcca 7020

ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7080

acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 7140

ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact cactataggg 7200

cgaattgggt accgggcccc ccctcgaggt cgatggtgtc gataagcttg atatcgaatt 7260

catgtcacac aaaccgatct tcgcctcaag gaaacctaat tctacatccg agagactgcc 7320

gagatccagt ctacactgat taattttcgg gccaataatt taaaaaaatc gtgttatata 7380

atattatatg tattatatat atacatcatg atgatactga cagtcatgtc ccattgctaa 7440

atagacagac tccatctgcc gcctccaact gatgttctca atatttaagg ggtcatctcg 7500

cattgtttaa taataaacag actccatcta ccgcctccaa atgatgttct caaaatatat 7560

tgtatgaact tatttttatt acttagtatt attagacaac ttacttgctt tatgaaaaac 7620

acttcctatt taggaaacaa tttataatgg cagttcgttc atttaacaat ttatgtagaa 7680

taaatgttat aaatgcgtat gggaaatctt aaatatggat agcataaatg atatctgcat 7740

tgcctaattc gaaatcaaca gcaacgaaaa aaatcccttg tacaacataa atagtcatcg 7800

agaaatatca actatcaaag aacagctatt cacacgttac tattgagatt attattggac 7860

gagaatcaca cactcaactg tctttctctc ttctagaaat acaggtacaa gtatgtacta 7920

ttctcattgt tcatacttct agtcatttca tcccacatat tccttggatt tctctccaat 7980

gaatgacatt ctatcttgca aattcaacaa ttataataag atataccaaa gtagcggtat 8040

agtggcaatc aaaaagcttc tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc 8100

attaaaggta tatatttatt tcttgttata taatcctttt gtttattaca tgggctggat 8160

acataaaggt attttgattt aattttttgc ttaaattcaa tcccccctcg ttcagtgtca 8220

actgtaatgg taggaaatta ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa 8280

aatcgtattt ccaggttaga cgttccgcag aatctagaat gcggtatgcg gtacattgtt 8340

cttcgaacgt aaaagttgcg ctccctgaga tattgtacat ttttgctttt acaagtacaa 8400

gtacatcgta caactatgta ctactgttga tgcatccaca acagtttgtt ttgttttttt 8460

ttgttttttt tttttctaat gattcattac cgctatgtat acctacttgt acttgtagta 8520

agccgggtta ttggcgttca attaatcata gacttatgaa tctgcacggt gtgcgctgcg 8580

agttactttt agcttatgca tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa 8640

cggatgctca atcgatttcg acagtaatta attaagtcat acacaagtca gctttcttcg 8700

agcctcatat aagtataagt agttcaacgt attagcactg tacccagcat ctccgtatcg 8760

agaaacacaa caacatgccc cattggacag atcatgcgga tacacaggtt gtgcagtatc 8820

atacatactc gatcagacag gtcgtctgac catcatacaa gctgaacaag cgctccatac 8880

ttgcacgctc tctatataca cagttaaatt acatatccat agtctaacct ctaacagtta 8940

atcttctggt aagcctccca gccagccttc tggtatcgct tggcctcctc aataggatct 9000

cggttctggc cgtacagacc tcggccgaca attatgatat ccgttccggt agacatgaca 9060

tcctcaacag ttcggtactg ctgtccgaga gcgtctccct tgtcgtcaag acccaccccg 9120

ggggtcagaa taagccagtc ctcagagtcg cccttaggtc ggttctgggc aatgaagcca 9180

accacaaact cggggtcgga tcgggcaagc tcaatggtct gcttggagta ctcgccagtg 9240

gccagagagc ccttgcaaga cagctcggcc agcatgagca gacctctggc cagcttctcg 9300

ttgggagagg ggactaggaa ctccttgtac tgggagttct cgtagtcaga gacgtcctcc 9360

ttcttctgtt cagagacagt ttcctcggca ccagctcgca ggccagcaat gattccggtt 9420

ccgggtacac cgtgggcgtt ggtgatatcg gaccactcgg cgattcggtg acaccggtac 9480

tggtgcttga cagtgttgcc aatatctgcg aactttctgt cctcgaacag gaagaaaccg 9540

tgcttaagag caagttcctt gagggggagc acagtgccgg cgtaggtgaa gtcgtcaatg 9600

atgtcgatat gggttttgat catgcacaca taaggtccga ccttatcggc aagctcaatg 9660

agctccttgg tggtggtaac atccagagaa gcacacaggt tggttttctt ggctgccacg 9720

agcttgagca ctcgagcggc aaaggcggac ttgtggacgt tagctcgagc ttcgtaggag 9780

ggcattttgg tggtgaagag gagactgaaa taaatttagt ctgcagaact ttttatcgga 9840

accttatctg gggcagtgaa gtatatgtta tggtaatagt tacgagttag ttgaacttat 9900

agatagactg gactatacgg ctatcggtcc aaattagaaa gaacgtcaat ggctctctgg 9960

gcgtcgcctt tgccgacaaa aatgtgatca tgatgaaagc cagcaatgac gttgcagctg 10020

atattgttgt cggccaaccg cgccgaaaac gcagctgtca gacccacagc ctccaacgaa 10080

gaatgtatcg tcaaagtgat ccaagcacac tcatagttgg agtcgtactc caaaggcggc 10140

aatgacgagt cagacagata ctcgtcgacg tttaaaccat catctaaggg cctcaaaact 10200

acctcggaac tgctgcgctg atctggacac cacagaggtt ccgagcactt taggttgcac 10260

caaatgtccc accaggtgca ggcagaaaac gctggaacag cgtgtacagt ttgtcttaac 10320

aaaaagtgag ggcgctgagg tcgagcaggg tggtgtgact tgttatagcc tttagagctg 10380

cgaaagcgcg tatggatttg gctcatcagg ccagattgag ggtctgtgga cacatgtcat 10440

gttagtgtac ttcaatcgcc ccctggatat agccccgaca ataggccgtg gcctcatttt 10500

tttgccttcc gcacatttcc attgctcggt acccacacct tgcttctcct gcacttgcca 10560

accttaatac tggtttacat tgaccaacat cttacaagcg gggggcttgt ctagggtata 10620

tataaacagt ggctctccca atcggttgcc agtctctttt ttcctttctt tccccacaga 10680

ttcgaaatct aaactacaca tcacac 10706

<210> 126

<211> 678

<212> DNA

<213> 人工序列

<220>

<223> 经耶氏酵母优化的dsREDexpress ORF

<400> 126

atggcctcct cggaggacgt catcaaggag ttcatgcgat tcaaggtccg aatggaaggc 60

tccgtgaacg gtcacgagtt tgagattgag ggagagggtg aaggccgacc ctacgaaggc 120

acccagaccg cgaagctgaa ggtgaccaag ggtggacccc tgcccttcgc ctgggacatt 180

ctgtctcctc agtttcagta cggttctaag gtgtacgtga agcaccctgc tgacattccc 240

gactacaaga aactttcctt tcccgagggc ttcaagtggg agcgagttat gaacttcgag 300

gatggcggtg tcgttaccgt tactcaggac tcctcgctcc aggacggctc gttcatctac 360

aaggttaagt tcatcggtgt caacttccct agcgatggac ccgtcatgca aaagaaaact 420

atgggatggg aagcctctac agagcggctg taccctcgag acggagtgtt gaagggcgag 480

attcacaagg ccctgaagct caaggacggt ggacactatc tcgttgagtt taagtctatc 540

tacatggcaa agaaacccgt gcagcttcca ggctactatt acgtcgattc caagctcgat 600

atcaccagcc ataatgagga ctacactatt gtcgaacagt acgagcgtgc tgagggaaga 660

caccatctgt ttctttaa 678

<210> 127

<211> 696

<212> DNA

<213> 人工序列

<220>

<223> 经耶氏酵母优化的dsREDexpress克隆片段

<400> 127

ggggccatgg cctcctcgga ggacgtcatc aaggagttca tgcgattcaa ggtccgaatg 60

gaaggctccg tgaacggtca cgagtttgag attgagggag agggtgaagg ccgaccctac 120

gaaggcaccc agaccgcgaa gctgaaggtg accaagggtg gacccctgcc cttcgcctgg 180

gacattctgt ctcctcagtt tcagtacggt tctaaggtgt acgtgaagca ccctgctgac 240

attcccgact acaagaaact ttcctttccc gagggcttca agtgggagcg agttatgaac 300

ttcgaggatg gcggtgtcgt taccgttact caggactcct cgctccagga cggctcgttc 360

atctacaagg ttaagttcat cggtgtcaac ttccctagcg atggacccgt catgcaaaag 420

aaaactatgg gatgggaagc ctctacagag cggctgtacc ctcgagacgg agtgttgaag 480

ggcgagattc acaaggccct gaagctcaag gacggtggac actatctcgt tgagtttaag 540

tctatctaca tggcaaagaa acccgtgcag cttccaggct actattacgt cgattccaag 600

ctcgatatca ccagccataa tgaggactac actattgtcg aacagtacga gcgtgctgag 660

ggaagacacc atctgtttct ttaagcggcc gcgggg 696

<210> 128

<211> 1212

<212> DNA

<213> 人工序列

<220>

<223> FBA1-dsREDexpress表达盒

<400> 128

aaaccatcat ctaagggcct caaaactacc tcggaactgc tgcgctgatc tggacaccac 60

agaggttccg agcactttag gttgcaccaa atgtcccacc aggtgcaggc agaaaacgct 120

ggaacagcgt gtacagtttg tcttaacaaa aagtgagggc gctgaggtcg agcagggtgg 180

tgtgacttgt tatagccttt agagctgcga aagcgcgtat ggatttggct catcaggcca 240

gattgagggt ctgtggacac atgtcatgtt agtgtacttc aatcgccccc tggatatagc 300

cccgacaata ggccgtggcc tcattttttt gccttccgca catttccatt gctcggtacc 360

cacaccttgc ttctcctgca cttgccaacc ttaatactgg tttacattga ccaacatctt 420

acaagcgggg ggcttgtcta gggtatatat aaacagtggc tctcccaatc ggttgccagt 480

ctcttttttc ctttctttcc ccacagattc gaaatctaaa ctacacatca caccatggcc 540

tcctcggagg acgtcatcaa ggagttcatg cgattcaagg tccgaatgga aggctccgtg 600

aacggtcacg agtttgagat tgagggagag ggtgaaggcc gaccctacga aggcacccag 660

accgcgaagc tgaaggtgac caagggtgga cccctgccct tcgcctggga cattctgtct 720

cctcagtttc agtacggttc taaggtgtac gtgaagcacc ctgctgacat tcccgactac 780

aagaaacttt cctttcccga gggcttcaag tgggagcgag ttatgaactt cgaggatggc 840

ggtgtcgtta ccgttactca ggactcctcg ctccaggacg gctcgttcat ctacaaggtt 900

aagttcatcg gtgtcaactt ccctagcgat ggacccgtca tgcaaaagaa aactatggga 960

tgggaagcct ctacagagcg gctgtaccct cgagacggag tgttgaaggg cgagattcac 1020

aaggccctga agctcaagga cggtggacac tatctcgttg agtttaagtc tatctacatg 1080

gcaaagaaac ccgtgcagct tccaggctac tattacgtcg attccaagct cgatatcacc 1140

agccataatg aggactacac tattgtcgaa cagtacgagc gtgctgaggg aagacaccat 1200

ctgtttcttt aa 1212

<210> 129

<211> 7244

<212> DNA

<213> 人工序列

<220>

<223> pRF165

<400> 129

ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa 60

gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac 120

ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta 180

aacatactgt acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct 240

agtgctctta ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat 300

tcattcatgt tagttgcgta cgagccggaa gcataaagtg taaagcctgg ggtgcctaat 360

gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc 420

tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg 480

ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag 540

cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag 600

gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc 660

tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc 720

agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc 780

tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt 840

cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg 900

ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat 960

ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag 1020

ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt 1080

ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct ctgctgaagc 1140

cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta 1200

gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag 1260

atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga 1320

ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa 1380

gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa 1440

tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc 1500

ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga 1560

taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa 1620

gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt 1680

gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg 1740

ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc 1800

aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg 1860

gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag 1920

cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt 1980

actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt 2040

caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac 2100

gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac 2160

ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag 2220

caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa 2280

tactcatact cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga 2340

gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc 2400

cccgaaaagt gccacctgac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg 2460

ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct 2520

tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc 2580

ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg 2640

atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt 2700

ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg 2760

tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc 2820

tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgcttaca atttccattc 2880

gccattcagg ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg 2940

ccagctggcg aaagggggat gtgctgcaag gcgattaagt tgggtaacgc cagggttttc 3000

ccagtcacga cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga 3060

attgggtacc gggccccccc tcgaggtcga tggtgtcgat aagcttgata tcgaattcat 3120

gtcacacaaa ccgatcttcg cctcaaggaa acctaattct acatccgaga gactgccgag 3180

atccagtcta cactgattaa ttttcgggcc aataatttaa aaaaatcgtg ttatataata 3240

ttatatgtat tatatatata catcatgatg atactgacag tcatgtccca ttgctaaata 3300

gacagactcc atctgccgcc tccaactgat gttctcaata tttaaggggt catctcgcat 3360

tgtttaataa taaacagact ccatctaccg cctccaaatg atgttctcaa aatatattgt 3420

atgaacttat ttttattact tagtattatt agacaactta cttgctttat gaaaaacact 3480

tcctatttag gaaacaattt ataatggcag ttcgttcatt taacaattta tgtagaataa 3540

atgttataaa tgcgtatggg aaatcttaaa tatggatagc ataaatgata tctgcattgc 3600

ctaattcgaa atcaacagca acgaaaaaaa tcccttgtac aacataaata gtcatcgaga 3660

aatatcaact atcaaagaac agctattcac acgttactat tgagattatt attggacgag 3720

aatcacacac tcaactgtct ttctctcttc tagaaataca ggtacaagta tgtactattc 3780

tcattgttca tacttctagt catttcatcc cacatattcc ttggatttct ctccaatgaa 3840

tgacattcta tcttgcaaat tcaacaatta taataagata taccaaagta gcggtatagt 3900

ggcaatcaaa aagcttctct ggtgtgcttc tcgtatttat ttttattcta atgatccatt 3960

aaaggtatat atttatttct tgttatataa tccttttgtt tattacatgg gctggataca 4020

taaaggtatt ttgatttaat tttttgctta aattcaatcc cccctcgttc agtgtcaact 4080

gtaatggtag gaaattacca tacttttgaa gaagcaaaaa aaatgaaaga aaaaaaaaat 4140

cgtatttcca ggttagacgt tccgcagaat ctagaatgcg gtatgcggta cattgttctt 4200

cgaacgtaaa agttgcgctc cctgagatat tgtacatttt tgcttttaca agtacaagta 4260

catcgtacaa ctatgtacta ctgttgatgc atccacaaca gtttgttttg tttttttttg 4320

tttttttttt ttctaatgat tcattaccgc tatgtatacc tacttgtact tgtagtaagc 4380

cgggttattg gcgttcaatt aatcatagac ttatgaatct gcacggtgtg cgctgcgagt 4440

tacttttagc ttatgcatgc tacttgggtg taatattggg atctgttcgg aaatcaacgg 4500

atgctcaatc gatttcgaca gtaattaatt aagtcataca caagtcagct ttcttcgagc 4560

ctcatataag tataagtagt tcaacgtatt agcactgtac ccagcatctc cgtatcgaga 4620

aacacaacaa catgccccat tggacagatc atgcggatac acaggttgtg cagtatcata 4680

catactcgat cagacaggtc gtctgaccat catacaagct gaacaagcgc tccatacttg 4740

cacgctctct atatacacag ttaaattaca tatccatagt ctaacctcta acagttaatc 4800

ttctggtaag cctcccagcc agccttctgg tatcgcttgg cctcctcaat aggatctcgg 4860

ttctggccgt acagacctcg gccgacaatt atgatatccg ttccggtaga catgacatcc 4920

tcaacagttc ggtactgctg tccgagagcg tctcccttgt cgtcaagacc caccccgggg 4980

gtcagaataa gccagtcctc agagtcgccc ttaggtcggt tctgggcaat gaagccaacc 5040

acaaactcgg ggtcggatcg ggcaagctca atggtctgct tggagtactc gccagtggcc 5100

agagagccct tgcaagacag ctcggccagc atgagcagac ctctggccag cttctcgttg 5160

ggagagggga ctaggaactc cttgtactgg gagttctcgt agtcagagac gtcctccttc 5220

ttctgttcag agacagtttc ctcggcacca gctcgcaggc cagcaatgat tccggttccg 5280

ggtacaccgt gggcgttggt gatatcggac cactcggcga ttcggtgaca ccggtactgg 5340

tgcttgacag tgttgccaat atctgcgaac tttctgtcct cgaacaggaa gaaaccgtgc 5400

ttaagagcaa gttccttgag ggggagcaca gtgccggcgt aggtgaagtc gtcaatgatg 5460

tcgatatggg ttttgatcat gcacacataa ggtccgacct tatcggcaag ctcaatgagc 5520

tccttggtgg tggtaacatc cagagaagca cacaggttgg ttttcttggc tgccacgagc 5580

ttgagcactc gagcggcaaa ggcggacttg tggacgttag ctcgagcttc gtaggagggc 5640

attttggtgg tgaagaggag actgaaataa atttagtctg cagaactttt tatcggaacc 5700

ttatctgggg cagtgaagta tatgttatgg taatagttac gagttagttg aacttataga 5760

tagactggac tatacggcta tcggtccaaa ttagaaagaa cgtcaatggc tctctgggcg 5820

tcgcctttgc cgacaaaaat gtgatcatga tgaaagccag caatgacgtt gcagctgata 5880

ttgttgtcgg ccaaccgcgc cgaaaacgca gctgtcagac ccacagcctc caacgaagaa 5940

tgtatcgtca aagtgatcca agcacactca tagttggagt cgtactccaa aggcggcaat 6000

gacgagtcag acagatactc gtcgacgttt aaaccatcat ctaagggcct caaaactacc 6060

tcggaactgc tgcgctgatc tggacaccac agaggttccg agcactttag gttgcaccaa 6120

atgtcccacc aggtgcaggc agaaaacgct ggaacagcgt gtacagtttg tcttaacaaa 6180

aagtgagggc gctgaggtcg agcagggtgg tgtgacttgt tatagccttt agagctgcga 6240

aagcgcgtat ggatttggct catcaggcca gattgagggt ctgtggacac atgtcatgtt 6300

agtgtacttc aatcgccccc tggatatagc cccgacaata ggccgtggcc tcattttttt 6360

gccttccgca catttccatt gctcggtacc cacaccttgc ttctcctgca cttgccaacc 6420

ttaatactgg tttacattga ccaacatctt acaagcgggg ggcttgtcta gggtatatat 6480

aaacagtggc tctcccaatc ggttgccagt ctcttttttc ctttctttcc ccacagattc 6540

gaaatctaaa ctacacatca caccatggcc tcctcggagg acgtcatcaa ggagttcatg 6600

cgattcaagg tccgaatgga aggctccgtg aacggtcacg agtttgagat tgagggagag 6660

ggtgaaggcc gaccctacga aggcacccag accgcgaagc tgaaggtgac caagggtgga 6720

cccctgccct tcgcctggga cattctgtct cctcagtttc agtacggttc taaggtgtac 6780

gtgaagcacc ctgctgacat tcccgactac aagaaacttt cctttcccga gggcttcaag 6840

tgggagcgag ttatgaactt cgaggatggc ggtgtcgtta ccgttactca ggactcctcg 6900

ctccaggacg gctcgttcat ctacaaggtt aagttcatcg gtgtcaactt ccctagcgat 6960

ggacccgtca tgcaaaagaa aactatggga tgggaagcct ctacagagcg gctgtaccct 7020

cgagacggag tgttgaaggg cgagattcac aaggccctga agctcaagga cggtggacac 7080

tatctcgttg agtttaagtc tatctacatg gcaaagaaac ccgtgcagct tccaggctac 7140

tattacgtcg attccaagct cgatatcacc agccataatg aggactacac tattgtcgaa 7200

cagtacgagc gtgctgaggg aagacaccat ctgtttcttt aagc 7244

<210> 130

<211> 1214

<212> DNA

<213> 人工序列

<220>

<223> 来自PmeI NotI片段上的pRF165的FBA1耶氏酵母dsREDexpress盒

<400> 130

aaaccatcat ctaagggcct caaaactacc tcggaactgc tgcgctgatc tggacaccac 60

agaggttccg agcactttag gttgcaccaa atgtcccacc aggtgcaggc agaaaacgct 120

ggaacagcgt gtacagtttg tcttaacaaa aagtgagggc gctgaggtcg agcagggtgg 180

tgtgacttgt tatagccttt agagctgcga aagcgcgtat ggatttggct catcaggcca 240

gattgagggt ctgtggacac atgtcatgtt agtgtacttc aatcgccccc tggatatagc 300

cccgacaata ggccgtggcc tcattttttt gccttccgca catttccatt gctcggtacc 360

cacaccttgc ttctcctgca cttgccaacc ttaatactgg tttacattga ccaacatctt 420

acaagcgggg ggcttgtcta gggtatatat aaacagtggc tctcccaatc ggttgccagt 480

ctcttttttc ctttctttcc ccacagattc gaaatctaaa ctacacatca caccatggcc 540

tcctcggagg acgtcatcaa ggagttcatg cgattcaagg tccgaatgga aggctccgtg 600

aacggtcacg agtttgagat tgagggagag ggtgaaggcc gaccctacga aggcacccag 660

accgcgaagc tgaaggtgac caagggtgga cccctgccct tcgcctggga cattctgtct 720

cctcagtttc agtacggttc taaggtgtac gtgaagcacc ctgctgacat tcccgactac 780

aagaaacttt cctttcccga gggcttcaag tgggagcgag ttatgaactt cgaggatggc 840

ggtgtcgtta ccgttactca ggactcctcg ctccaggacg gctcgttcat ctacaaggtt 900

aagttcatcg gtgtcaactt ccctagcgat ggacccgtca tgcaaaagaa aactatggga 960

tgggaagcct ctacagagcg gctgtaccct cgagacggag tgttgaaggg cgagattcac 1020

aaggccctga agctcaagga cggtggacac tatctcgttg agtttaagtc tatctacatg 1080

gcaaagaaac ccgtgcagct tccaggctac tattacgtcg attccaagct cgatatcacc 1140

agccataatg aggactacac tattgtcgaa cagtacgagc gtgctgaggg aagacaccat 1200

ctgtttcttt aagc 1214

<210> 131

<211> 11526

<212> DNA

<213> 人工序列

<220>

<223> p2PO69整合载体

<400> 131

ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa 60

gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac 120

ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta 180

aacatactgt acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct 240

agtgctctta ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat 300

tcattcatgt tagttgcgta cgggcgtcgt tgcttgtgtg atttttgagg acccatccct 360

ttggtatata agtatactct ggggttaagg ttgcccgtgt agtctaggtt atagttttca 420

tgtgaaatac cgagagccga gggagaataa acgggggtat ttggacttgt ttttttcgcg 480

gaaaagcgtc gaatcaaccc tgcgggcctt gcaccatgtc cacgacgtgt ttctcgcccc 540

aattcgcccc ttgcacgtca aaattaggcc tccatctaga cccctccata acatgtgact 600

gtggggaaaa gtataaggga aaccatgcaa ccatagacga cgtgaaagac ggggaggaac 660

caatggaggc caaagaaatg gggtagcaac agtccaggag acagacaagg agacaaggag 720

agggcgcccg aaagatcgga aaaacaaaca tgtccaattg gggcagtgac ggaaacgaca 780

cggacacttc agtacaatgg accgaccatc tccaagccag ggttattccg gtatcacctt 840

ggccgtaacc tcccgctggt acctgatatt gtacacgttc acattcaata tactttcagc 900

tacaataaga gaggctgttt gtcgggcatg tgtgtccgtc gtatggggtg atgtccgagg 960

gcgaaattcg ctacaagctt aactctggcg cttgtccagt atgaatagac aagtcaagac 1020

cagtggtgcc atgattgaca gggaggtaca agacttcgat actcgagcat tactcggact 1080

tgtggcgatt gaacagacgg gcgatcgctt ctcccccgta ttgccggcgc gccagctgca 1140

ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc 1200

ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc 1260

aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc 1320

aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag 1380

gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc 1440

gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt 1500

tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct 1560

ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg 1620

ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct 1680

tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat 1740

tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg 1800

ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa 1860

aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt 1920

ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc 1980

tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt 2040

atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta 2100

aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat 2160

ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 2220

tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg 2280

ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 2340

tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 2400

aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt 2460

gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 2520

tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt 2580

cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct 2640

tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt 2700

ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac 2760

cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa 2820

actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa 2880

ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca 2940

aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct 3000

ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga 3060

atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc 3120

tgatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggaaattgt 3180

aagcgttaat attttgttaa aattcgcgtt aaatttttgt taaatcagct cattttttaa 3240

ccaataggcc gaaatcggca aaatccctta taaatcaaaa gaatagaccg agatagggtt 3300

gagtgttgtt ccagtttgga acaagagtcc actattaaag aacgtggact ccaacgtcaa 3360

agggcgaaaa accgtctatc agggcgatgg cccactacgt gaaccatcac cctaatcaag 3420

ttttttgggg tcgaggtgcc gtaaagcact aaatcggaac cctaaaggga gcccccgatt 3480

tagagcttga cggggaaagc cggcgaacgt ggcgagaaag gaagggaaga aagcgaaagg 3540

agcgggcgct agggcgctgg caagtgtagc ggtcacgctg cgcgtaacca ccacacccgc 3600

cgcgcttaat gcgccgctac agggcgcgtc cattcgccat tcaggctgcg caactgttgg 3660

gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct 3720

gcaaggcgat taagttgggt aacgccaggg ttttcccagt cacgacgttg taaaacgacg 3780

gccagtgaat tgtaatacga ctcactatag ggcgaattgg gcccgacgtc gcatgcgctg 3840

atgacacttt ggtctgaaag agatgcattt tgaatcccaa acttgcagtg cccaagtgac 3900

atacatctcc gcgttttgga aaatgttcag aaacagttga ttgtgttgga atggggaatg 3960

gggaatggaa aaatgactca agtatcaatt ccaaaaactt ctctggctgg cagtacctac 4020

tgtccatact actgcatttt ctccagtcag gccactctat actcgacgac acagtagtaa 4080

aacccagata atttcgacat aaacaagaaa acagacccaa taatatttat atatagtcag 4140

ccgtttgtcc agttcagact gtaatagccg aaaaaaaatc caaagtttct attctaggaa 4200

aatatattcc aatattttta attcttaatc tcatttattt tattctagcg aaatacattt 4260

cagctacttg agacatgtga tacccacaaa tcggattcgg actcggttgt tcagaagagc 4320

atatggcatt cgtgctcgct tgttcacgta ttcttcctgt tccatctctt ggccgacaat 4380

cacacaaaaa tggggttttt tttttaattc taatgattca ttacagcaaa attgagatat 4440

agcagaccac gtattccata atcaccaagg aagttcttgg gcgtcttaat taagttgcga 4500

cacatgtctt gatagtatct tggcttctct ctcttgagct tttccataac aagttcttct 4560

gcctccagga agtccatggt gaatgattct tatactcaga aggaaatgct taacgatttc 4620

gggtgtgagt tgacaaggag agagagaaaa gaagaggaaa ggtaattcgg ggacggtggt 4680

cttttatacc cttggctaaa gtcccaacca caaagcaaaa aaattttcag tagtctattt 4740

tgcgtccggc atgggttacc cggatggcca gacaaagaaa ctagtacaaa gtctgaacaa 4800

gcgtagattc cagactgcag taccctacgc ccttaacggc aagtgtggga accgggggag 4860

gtttgatatg tggggtgaag ggggctctcg ccggggttgg gcccgctact gggtcaattt 4920

ggggtcaatt ggggcaattg gggctgtttt ttgggacaca aatacgccgc caacccggtc 4980

tctcctgaat tctgcagatg ggctgcagga attccgtcgt cgcctgagtc gacatcattt 5040

atttaccagt tggccacaaa cccttgacga tctcgtatgt cccctccgac atactcccgg 5100

ccggctgggg tacgttcgat agcgctatcg gcatcgacaa ggtttgggtc cctagccgat 5160

accgcactac ctgagtcaca atcttcggag gtttagtctt ccacatagca cgggcaaaag 5220

tgcgtatata tacaagagcg tttgccagcc acagattttc actccacaca ccacatcaca 5280

catacaacca cacacatcca caatggaacc cgaaactaag aagaccaaga ctgactccaa 5340

gaagattgtt cttctcggcg gcgacttctg tggccccgag gtgattgccg aggccgtcaa 5400

ggtgctcaag tctgttgctg aggcctccgg caccgagttt gtgtttgagg accgactcat 5460

tggaggagct gccattgaga aggagggcga gcccatcacc gacgctactc tcgacatctg 5520

ccgaaaggct gactctatta tgctcggtgc tgtcggaggc gctgccaaca ccgtatggac 5580

cactcccgac ggacgaaccg acgtgcgacc cgagcagggt ctcctcaagc tgcgaaagga 5640

cctgaacctg tacgccaacc tgcgaccctg ccagctgctg tcgcccaagc tcgccgatct 5700

ctcccccatc cgaaacgttg agggcaccga cttcatcatt gtccgagagc tcgtcggagg 5760

tatctacttt ggagagcgaa aggaggatga cggatctggc gtcgcttccg acaccgagac 5820

ctactccgtt cctgaggttg agcgaattgc ccgaatggcc gccttcctgg cccttcagca 5880

caacccccct cttcccgtgt ggtctcttga caaggccaac gtgctggcct cctctcgact 5940

ttggcgaaag actgtcactc gagtcctcaa ggacgaattc ccccagctcg agctcaacca 6000

ccagctgatc gactcggccg ccatgatcct catcaagcag ccctccaaga tgaatggtat 6060

catcatcacc accaacatgt ttggcgatat catctccgac gaggcctccg tcatccccgg 6120

ttctctgggt ctgctgccct ccgcctctct ggcttctctg cccgacacca acgaggcgtt 6180

cggtctgtac gagccctgtc acggatctgc ccccgatctc ggcaagcaga aggtcaaccc 6240

cattgccacc attctgtctg ccgccatgat gctcaagttc tctcttaaca tgaagcccgc 6300

cggtgacgct gttgaggctg ccgtcaagga gtccgtcgag gctggtatca ctaccgccga 6360

tatcggaggc tcttcctcca cctccgaggt cggagacttg ttgccaacaa ggtcaaggag 6420

ctgctcaaga aggagtaagt cgtttctacg acgcattgat ggaaggagca aactgacgcg 6480

cctgcgggtt ggtctaccgg cagggtccgc tagtgtataa gactctataa aaagggccct 6540

gccctgctaa tgaaatgatg atttataatt taccggtgta gcaaccttga ctagaagaag 6600

cagattgggt gtgtttgtag tggaggacag tggtacgttt tggaaacagt cttcttgaaa 6660

gtgtcttgtc tacagtatat tcactcataa cctcaatagc caagggtgta gtcggtttat 6720

taaaggaagg gagttgtggc tgatgtggat agatatcttt aagctggcga ctgcacccaa 6780

cgagtgtggt ggtagcttgt tagatctgta tattcggtaa gatatatttt gtggggtttt 6840

agtggtgttt aaaccatcat ctaagggcct caaaactacc tcggaactgc tgcgctgatc 6900

tggacaccac agaggttccg agcactttag gttgcaccaa atgtcccacc aggtgcaggc 6960

agaaaacgct ggaacagcgt gtacagtttg tcttaacaaa aagtgagggc gctgaggtcg 7020

agcagggtgg tgtgacttgt tatagccttt agagctgcga aagcgcgtat ggatttggct 7080

catcaggcca gattgagggt ctgtggacac atgtcatgtt agtgtacttc aatcgccccc 7140

tggatatagc cccgacaata ggccgtggcc tcattttttt gccttccgca catttccatt 7200

gctcggtacc cacaccttgc ttctcctgca cttgccaacc ttaatactgg tttacattga 7260

ccaacatctt acaagcgggg ggcttgtcta gggtatatat aaacagtggc tctcccaatc 7320

ggttgccagt ctcttttttc ctttctttcc ccacagattc gaaatctaaa ctacacatca 7380

caccatggac aagaaatact ccatcggcct ggacattgga accaactctg tcggctgggc 7440

tgtcatcacc gacgagtaca aggtgccctc caagaaattc aaggtcctcg gaaacaccga 7500

tcgacactcc atcaagaaaa acctcattgg tgccctgttg ttcgattctg gcgagactgc 7560

cgaagctacc agactcaagc gaactgctcg gcgacgttac acccgacgga agaaccgaat 7620

ctgctacctg caggagatct tttccaacga gatggccaag gtggacgatt cgttctttca 7680

tcgactggag gaatccttcc tcgtcgagga agacaagaaa cacgagcgtc atcccatctt 7740

tggcaacatt gtggacgagg ttgcttacca cgagaagtat cctaccatct accacctgcg 7800

aaagaaactc gtcgattcca ccgacaaggc ggatctcaga cttatctacc tcgctctggc 7860

acacatgatc aagtttcgag gtcatttcct catcgagggc gatctcaatc ccgacaacag 7920

cgatgtggac aagctgttca ttcagctcgt tcagacctac aaccagctgt tcgaggaaaa 7980

ccccatcaat gcctccggag tcgatgcaaa ggccatcttg tctgctcgac tctcgaagag 8040

cagacgactg gagaacctca ttgcccaact tcctggcgag aaaaagaacg gactgtttgg 8100

caacctcatt gccctttctc ttggtctcac acccaacttc aagtccaact tcgatctggc 8160

ggaggacgcc aagctccagc tgtccaagga cacctacgac gatgacctcg acaacctgct 8220

tgcacagatt ggcgatcagt acgccgacct gtttctcgct gccaagaacc tttcggatgc 8280

tattctcttg tctgacattc tgcgagtcaa caccgagatc acaaaggctc ccctttctgc 8340

ctccatgatc aagcgatacg acgagcacca tcaggatctc acactgctca aggctcttgt 8400

ccgacagcaa ctgcccgaga agtacaagga gatctttttc gatcagtcga agaacggcta 8460

cgctggatac atcgacggcg gagcctctca ggaagagttc tacaagttca tcaagccaat 8520

tctcgagaag atggacggaa ccgaggaact gcttgtcaag ctcaatcgag aggatctgct 8580

tcggaagcaa cgaaccttcg acaacggcag cattcctcat cagatccacc tcggtgagct 8640

gcacgccatt cttcgacgtc aggaagactt ctaccccttt ctcaaggaca accgagagaa 8700

gatcgagaag attcttacct ttcgaatccc ctactatgtt ggtcctcttg ccagaggaaa 8760

ctctcgattt gcttggatga ctcgaaagtc cgaggaaacc atcactccct ggaacttcga 8820

ggaagtcgtg gacaagggtg cctctgcaca gtccttcatc gagcgaatga ccaacttcga 8880

caagaatctg cccaacgaga aggttcttcc caagcattcg ctgctctacg agtactttac 8940

agtctacaac gaactcacca aagtcaagta cgttaccgag ggaatgcgaa agcctgcctt 9000

cttgtctggc gaacagaaga aagccattgt cgatctcctg ttcaagacca accgaaaggt 9060

cactgttaag cagctcaagg aggactactt caagaaaatc gagtgtttcg acagcgtcga 9120

gatttccgga gttgaggacc gattcaacgc ctctttgggc acctatcacg atctgctcaa 9180

gattatcaag gacaaggatt ttctcgacaa cgaggaaaac gaggacattc tggaggacat 9240

cgtgctcact cttaccctgt tcgaagatcg ggagatgatc gaggaacgac tcaagacata 9300

cgctcacctg ttcgacgaca aggtcatgaa acaactcaag cgacgtagat acaccggctg 9360

gggaagactt tcgcgaaagc tcatcaacgg catcagagac aagcagtccg gaaagaccat 9420

tctggacttt ctcaagtccg atggctttgc caaccgaaac ttcatgcagc tcattcacga 9480

cgattctctt accttcaagg aggacatcca gaaggcacaa gtgtccggtc agggcgacag 9540

cttgcacgaa catattgcca acctggctgg ttcgccagcc atcaagaaag gcattctcca 9600

gactgtcaag gttgtcgacg agctggtgaa ggtcatggga cgtcacaagc ccgagaacat 9660

tgtgatcgag atggccagag agaaccagac aactcaaaag ggtcagaaaa actcgcgaga 9720

gcggatgaag cgaatcgagg aaggcatcaa ggagctggga tcccagattc tcaaggagca 9780

tcccgtcgag aacactcaac tgcagaacga gaagctgtat ctctactatc tgcagaatgg 9840

tcgagacatg tacgtggatc aggaactgga catcaatcgt ctcagcgact acgatgtgga 9900

ccacattgtc cctcaatcct ttctcaagga cgattctatc gacaacaagg tccttacacg 9960

atccgacaag aacagaggca agtcggacaa cgttcccagc gaagaggtgg tcaaaaagat 10020

gaagaactac tggcgacagc tgctcaacgc caagctcatt acccagcgaa agttcgacaa 10080

tcttaccaag gccgagcgag gcggtctgtc cgagctcgac aaggctggct tcatcaagcg 10140

tcaactcgtc gagaccagac agatcacaaa gcacgtcgca cagattctcg attctcggat 10200

gaacaccaag tacgacgaga acgacaagct catccgagag gtcaaggtga ttactctcaa 10260

gtccaaactg gtctccgatt tccgaaagga ctttcagttc tacaaggtgc gagagatcaa 10320

caattaccac catgcccacg atgcttacct caacgccgtc gttggcactg cgctcatcaa 10380

gaaatacccc aagctcgaaa gcgagttcgt ttacggcgat tacaaggtct acgacgttcg 10440

aaagatgatt gccaagtccg aacaggagat tggcaaggct actgccaagt acttctttta 10500

ctccaacatc atgaactttt tcaagaccga gatcaccttg gccaacggag agattcgaaa 10560

gagaccactt atcgagacca acggcgaaac tggagagatc gtgtgggaca agggtcgaga 10620

ctttgcaacc gtgcgaaagg ttctgtcgat gcctcaggtc aacatcgtca agaaaaccga 10680

ggttcagact ggcggattct ccaaggagtc gattctgccc aagcgaaact ccgacaagct 10740

catcgctcga aagaaagact gggatcccaa gaaatacggt ggcttcgatt ctcctaccgt 10800

cgcctattcc gtgcttgtcg ttgcgaaggt cgagaagggc aagtccaaaa agctcaagtc 10860

cgtcaaggag ctgctcggaa ttaccatcat ggagcgatcg agcttcgaga agaatcccat 10920

cgacttcttg gaagccaagg gttacaagga ggtcaagaaa gacctcatta tcaagctgcc 10980

caagtactct ctgttcgaac tggagaacgg tcgaaagcgt atgctcgcct ccgctggcga 11040

gctgcagaag ggaaacgagc ttgccttgcc ttcgaagtac gtcaactttc tctatctggc 11100

ttctcactac gagaagctca agggttctcc cgaggacaac gaacagaagc aactcttcgt 11160

tgagcagcac aaacattacc tcgacgagat tatcgagcag atttccgagt tttcgaagcg 11220

agtcatcctg gctgatgcca acttggacaa ggtgctctct gcctacaaca agcatcggga 11280

caaacccatt cgagaacagg cggagaacat cattcacctg tttactctta ccaacctggg 11340

tgctcctgca gctttcaagt acttcgatac cactatcgac cgaaagcggt acacatccac 11400

caaggaggtt ctcgatgcca ccctgattca ccagtccatc actggcctgt acgagacccg 11460

aatcgacctg tctcagcttg gtggcgactc cagagccgat cccaagaaaa agcgaaaggt 11520

ctaagc 11526

<210> 132

<211> 8064

<212> DNA

<213> 人工序列

<220>

<223> pRF201

<400> 132

aaaccatcat ctaagggcct caaaactacc tcggaactgc tgcgctgatc tggacaccac 60

agaggttccg agcactttag gttgcaccaa atgtcccacc aggtgcaggc agaaaacgct 120

ggaacagcgt gtacagtttg tcttaacaaa aagtgagggc gctgaggtcg agcagggtgg 180

tgtgacttgt tatagccttt agagctgcga aagcgcgtat ggatttggct catcaggcca 240

gattgagggt ctgtggacac atgtcatgtt agtgtacttc aatcgccccc tggatatagc 300

cccgacaata ggccgtggcc tcattttttt gccttccgca catttccatt gctcggtacc 360

cacaccttgc ttctcctgca cttgccaacc ttaatactgg tttacattga ccaacatctt 420

acaagcgggg ggcttgtcta gggtatatat aaacagtggc tctcccaatc ggttgccagt 480

ctcttttttc ctttctttcc ccacagattc gaaatctaaa ctacacatca caccatggcc 540

tcctcggagg acgtcatcaa ggagttcatg cgattcaagg tccgaatgga aggctccgtg 600

aacggtcacg agtttgagat tgagggagag ggtgaaggcc gaccctacga aggcacccag 660

accgcgaagc tgaaggtgac caagggtgga cccctgccct tcgcctggga cattctgtct 720

cctcagtttc agtacggttc taaggtgtac gtgaagcacc ctgctgacat tcccgactac 780

aagaaacttt cctttcccga gggcttcaag tgggagcgag ttatgaactt cgaggatggc 840

ggtgtcgtta ccgttactca ggactcctcg ctccaggacg gctcgttcat ctacaaggtt 900

aagttcatcg gtgtcaactt ccctagcgat ggacccgtca tgcaaaagaa aactatggga 960

tgggaagcct ctacagagcg gctgtaccct cgagacggag tgttgaaggg cgagattcac 1020

aaggccctga agctcaagga cggtggacac tatctcgttg agtttaagtc tatctacatg 1080

gcaaagaaac ccgtgcagct tccaggctac tattacgtcg attccaagct cgatatcacc 1140

agccataatg aggactacac tattgtcgaa cagtacgagc gtgctgaggg aagacaccat 1200

ctgtttcttt aagcggccgc aagtgtggat ggggaagtga gtgcccggtt ctgtgtgcac 1260

aattggcaat ccaagatgga tggattcaac acagggatat agcgagctac gtggtggtgc 1320

gaggatatag caacggatat ttatgtttga cacttgagaa tgtacgatac aagcactgtc 1380

caagtacaat actaaacata ctgtacatac tcatactcgt acccgggcaa cggtttcact 1440

tgagtgcagt ggctagtgct cttactcgta cagtgtgcaa tactgcgtat catagtcttt 1500

gatgtatatc gtattcattc atgttagttg cgtacgggcg tcgttgcttg tgtgattttt 1560

gaggacccat ccctttggta tataagtata ctctggggtt aaggttgccc gtgtagtcta 1620

ggttatagtt ttcatgtgaa ataccgagag ccgagggaga ataaacgggg gtatttggac 1680

ttgttttttt cgcggaaaag cgtcgaatca accctgcggg ccttgcacca tgtccacgac 1740

gtgtttctcg ccccaattcg ccccttgcac gtcaaaatta ggcctccatc tagacccctc 1800

cataacatgt gactgtgggg aaaagtataa gggaaaccat gcaaccatag acgacgtgaa 1860

agacggggag gaaccaatgg aggccaaaga aatggggtag caacagtcca ggagacagac 1920

aaggagacaa ggagagggcg cccgaaagat cggaaaaaca aacatgtcca attggggcag 1980

tgacggaaac gacacggaca cttcagtaca atggaccgac catctccaag ccagggttat 2040

tccggtatca ccttggccgt aacctcccgc tggtacctga tattgtacac gttcacattc 2100

aatatacttt cagctacaat aagagaggct gtttgtcggg catgtgtgtc cgtcgtatgg 2160

ggtgatgtcc gagggcgaaa ttcgctacaa gcttaactct ggcgcttgtc cagtatgaat 2220

agacaagtca agaccagtgg tgccatgatt gacagggagg tacaagactt cgatactcga 2280

gcattactcg gacttgtggc gattgaacag acgggcgatc gcttctcccc cgtattgccg 2340

gcgcgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg 2400

cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg 2460

gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga 2520

aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg 2580

gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag 2640

aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc 2700

gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg 2760

ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt 2820

cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc 2880

ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc 2940

actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg 3000

tggcctaact acggctacac tagaagaaca gtatttggta tctgcgctct gctgaagcca 3060

gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc 3120

ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat 3180

cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt 3240

ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt 3300

tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc 3360

agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc 3420

gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata 3480

ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg 3540

gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc 3600

cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct 3660

acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa 3720

cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt 3780

cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca 3840

ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac 3900

tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca 3960

atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt 4020

tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc 4080

actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca 4140

aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata 4200

ctcatactct tcctttttca atattattga agcatttatc agggttattg tctcatgagc 4260

ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc 4320

cgaaaagtgc cacctgatgc ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg 4380

catcaggaaa ttgtaagcgt taatattttg ttaaaattcg cgttaaattt ttgttaaatc 4440

agctcatttt ttaaccaata ggccgaaatc ggcaaaatcc cttataaatc aaaagaatag 4500

accgagatag ggttgagtgt tgttccagtt tggaacaaga gtccactatt aaagaacgtg 4560

gactccaacg tcaaagggcg aaaaaccgtc tatcagggcg atggcccact acgtgaacca 4620

tcaccctaat caagtttttt ggggtcgagg tgccgtaaag cactaaatcg gaaccctaaa 4680

gggagccccc gatttagagc ttgacgggga aagccggcga acgtggcgag aaaggaaggg 4740

aagaaagcga aaggagcggg cgctagggcg ctggcaagtg tagcggtcac gctgcgcgta 4800

accaccacac ccgccgcgct taatgcgccg ctacagggcg cgtccattcg ccattcaggc 4860

tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc gctattacgc cagctggcga 4920

aagggggatg tgctgcaagg cgattaagtt gggtaacgcc agggttttcc cagtcacgac 4980

gttgtaaaac gacggccagt gaattgtaat acgactcact atagggcgaa ttgggcccga 5040

cgtcgcatgc gctgatgaca ctttggtctg aaagagatgc attttgaatc ccaaacttgc 5100

agtgcccaag tgacatacat ctccgcgttt tggaaaatgt tcagaaacag ttgattgtgt 5160

tggaatgggg aatggggaat ggaaaaatga ctcaagtatc aattccaaaa acttctctgg 5220

ctggcagtac ctactgtcca tactactgca ttttctccag tcaggccact ctatactcga 5280

cgacacagta gtaaaaccca gataatttcg acataaacaa gaaaacagac ccaataatat 5340

ttatatatag tcagccgttt gtccagttca gactgtaata gccgaaaaaa aatccaaagt 5400

ttctattcta ggaaaatata ttccaatatt tttaattctt aatctcattt attttattct 5460

agcgaaatac atttcagcta cttgagacat gtgataccca caaatcggat tcggactcgg 5520

ttgttcagaa gagcatatgg cattcgtgct cgcttgttca cgtattcttc ctgttccatc 5580

tcttggccga caatcacaca aaaatggggt ttttttttta attctaatga ttcattacag 5640

caaaattgag atatagcaga ccacgtattc cataatcacc aaggaagttc ttgggcgtct 5700

taattaagtt gcgacacatg tcttgatagt atcttggctt ctctctcttg agcttttcca 5760

taacaagttc ttctgcctcc aggaagtcca tggtgaatga ttcttatact cagaaggaaa 5820

tgcttaacga tttcgggtgt gagttgacaa ggagagagag aaaagaagag gaaaggtaat 5880

tcggggacgg tggtctttta tacccttggc taaagtccca accacaaagc aaaaaaattt 5940

tcagtagtct attttgcgtc cggcatgggt tacccggatg gccagacaaa gaaactagta 6000

caaagtctga acaagcgtag attccagact gcagtaccct acgcccttaa cggcaagtgt 6060

gggaaccggg ggaggtttga tatgtggggt gaagggggct ctcgccgggg ttgggcccgc 6120

tactgggtca atttggggtc aattggggca attggggctg ttttttggga cacaaatacg 6180

ccgccaaccc ggtctctcct gaattctgca gatgggctgc aggaattccg tcgtcgcctg 6240

agtcgacatc atttatttac cagttggcca caaacccttg acgatctcgt atgtcccctc 6300

cgacatactc ccggccggct ggggtacgtt cgatagcgct atcggcatcg acaaggtttg 6360

ggtccctagc cgataccgca ctacctgagt cacaatcttc ggaggtttag tcttccacat 6420

agcacgggca aaagtgcgta tatatacaag agcgtttgcc agccacagat tttcactcca 6480

cacaccacat cacacataca accacacaca tccacaatgg aacccgaaac taagaagacc 6540

aagactgact ccaagaagat tgttcttctc ggcggcgact tctgtggccc cgaggtgatt 6600

gccgaggccg tcaaggtgct caagtctgtt gctgaggcct ccggcaccga gtttgtgttt 6660

gaggaccgac tcattggagg agctgccatt gagaaggagg gcgagcccat caccgacgct 6720

actctcgaca tctgccgaaa ggctgactct attatgctcg gtgctgtcgg aggcgctgcc 6780

aacaccgtat ggaccactcc cgacggacga accgacgtgc gacccgagca gggtctcctc 6840

aagctgcgaa aggacctgaa cctgtacgcc aacctgcgac cctgccagct gctgtcgccc 6900

aagctcgccg atctctcccc catccgaaac gttgagggca ccgacttcat cattgtccga 6960

gagctcgtcg gaggtatcta ctttggagag cgaaaggagg atgacggatc tggcgtcgct 7020

tccgacaccg agacctactc cgttcctgag gttgagcgaa ttgcccgaat ggccgccttc 7080

ctggcccttc agcacaaccc ccctcttccc gtgtggtctc ttgacaaggc caacgtgctg 7140

gcctcctctc gactttggcg aaagactgtc actcgagtcc tcaaggacga attcccccag 7200

ctcgagctca accaccagct gatcgactcg gccgccatga tcctcatcaa gcagccctcc 7260

aagatgaatg gtatcatcat caccaccaac atgtttggcg atatcatctc cgacgaggcc 7320

tccgtcatcc ccggttctct gggtctgctg ccctccgcct ctctggcttc tctgcccgac 7380

accaacgagg cgttcggtct gtacgagccc tgtcacggat ctgcccccga tctcggcaag 7440

cagaaggtca accccattgc caccattctg tctgccgcca tgatgctcaa gttctctctt 7500

aacatgaagc ccgccggtga cgctgttgag gctgccgtca aggagtccgt cgaggctggt 7560

atcactaccg ccgatatcgg aggctcttcc tccacctccg aggtcggaga cttgttgcca 7620

acaaggtcaa ggagctgctc aagaaggagt aagtcgtttc tacgacgcat tgatggaagg 7680

agcaaactga cgcgcctgcg ggttggtcta ccggcagggt ccgctagtgt ataagactct 7740

ataaaaaggg ccctgccctg ctaatgaaat gatgatttat aatttaccgg tgtagcaacc 7800

ttgactagaa gaagcagatt gggtgtgttt gtagtggagg acagtggtac gttttggaaa 7860

cagtcttctt gaaagtgtct tgtctacagt atattcactc ataacctcaa tagccaaggg 7920

tgtagtcggt ttattaaagg aagggagttg tggctgatgt ggatagatat ctttaagctg 7980

gcgactgcac ccaacgagtg tggtggtagc ttgttagatc tgtatattcg gtaagatata 8040

ttttgtgggg ttttagtggt gttt 8064

<210> 133

<211> 5356

<212> DNA

<213> 人工序列

<220>

<223> 来自pRF201的AscI/SphI整合片段

<400> 133

cgctgatgac actttggtct gaaagagatg cattttgaat cccaaacttg cagtgcccaa 60

gtgacataca tctccgcgtt ttggaaaatg ttcagaaaca gttgattgtg ttggaatggg 120

gaatggggaa tggaaaaatg actcaagtat caattccaaa aacttctctg gctggcagta 180

cctactgtcc atactactgc attttctcca gtcaggccac tctatactcg acgacacagt 240

agtaaaaccc agataatttc gacataaaca agaaaacaga cccaataata tttatatata 300

gtcagccgtt tgtccagttc agactgtaat agccgaaaaa aaatccaaag tttctattct 360

aggaaaatat attccaatat ttttaattct taatctcatt tattttattc tagcgaaata 420

catttcagct acttgagaca tgtgataccc acaaatcgga ttcggactcg gttgttcaga 480

agagcatatg gcattcgtgc tcgcttgttc acgtattctt cctgttccat ctcttggccg 540

acaatcacac aaaaatgggg tttttttttt aattctaatg attcattaca gcaaaattga 600

gatatagcag accacgtatt ccataatcac caaggaagtt cttgggcgtc ttaattaagt 660

tgcgacacat gtcttgatag tatcttggct tctctctctt gagcttttcc ataacaagtt 720

cttctgcctc caggaagtcc atggtgaatg attcttatac tcagaaggaa atgcttaacg 780

atttcgggtg tgagttgaca aggagagaga gaaaagaaga ggaaaggtaa ttcggggacg 840

gtggtctttt atacccttgg ctaaagtccc aaccacaaag caaaaaaatt ttcagtagtc 900

tattttgcgt ccggcatggg ttacccggat ggccagacaa agaaactagt acaaagtctg 960

aacaagcgta gattccagac tgcagtaccc tacgccctta acggcaagtg tgggaaccgg 1020

gggaggtttg atatgtgggg tgaagggggc tctcgccggg gttgggcccg ctactgggtc 1080

aatttggggt caattggggc aattggggct gttttttggg acacaaatac gccgccaacc 1140

cggtctctcc tgaattctgc agatgggctg caggaattcc gtcgtcgcct gagtcgacat 1200

catttattta ccagttggcc acaaaccctt gacgatctcg tatgtcccct ccgacatact 1260

cccggccggc tggggtacgt tcgatagcgc tatcggcatc gacaaggttt gggtccctag 1320

ccgataccgc actacctgag tcacaatctt cggaggttta gtcttccaca tagcacgggc 1380

aaaagtgcgt atatatacaa gagcgtttgc cagccacaga ttttcactcc acacaccaca 1440

tcacacatac aaccacacac atccacaatg gaacccgaaa ctaagaagac caagactgac 1500

tccaagaaga ttgttcttct cggcggcgac ttctgtggcc ccgaggtgat tgccgaggcc 1560

gtcaaggtgc tcaagtctgt tgctgaggcc tccggcaccg agtttgtgtt tgaggaccga 1620

ctcattggag gagctgccat tgagaaggag ggcgagccca tcaccgacgc tactctcgac 1680

atctgccgaa aggctgactc tattatgctc ggtgctgtcg gaggcgctgc caacaccgta 1740

tggaccactc ccgacggacg aaccgacgtg cgacccgagc agggtctcct caagctgcga 1800

aaggacctga acctgtacgc caacctgcga ccctgccagc tgctgtcgcc caagctcgcc 1860

gatctctccc ccatccgaaa cgttgagggc accgacttca tcattgtccg agagctcgtc 1920

ggaggtatct actttggaga gcgaaaggag gatgacggat ctggcgtcgc ttccgacacc 1980

gagacctact ccgttcctga ggttgagcga attgcccgaa tggccgcctt cctggccctt 2040

cagcacaacc cccctcttcc cgtgtggtct cttgacaagg ccaacgtgct ggcctcctct 2100

cgactttggc gaaagactgt cactcgagtc ctcaaggacg aattccccca gctcgagctc 2160

aaccaccagc tgatcgactc ggccgccatg atcctcatca agcagccctc caagatgaat 2220

ggtatcatca tcaccaccaa catgtttggc gatatcatct ccgacgaggc ctccgtcatc 2280

cccggttctc tgggtctgct gccctccgcc tctctggctt ctctgcccga caccaacgag 2340

gcgttcggtc tgtacgagcc ctgtcacgga tctgcccccg atctcggcaa gcagaaggtc 2400

aaccccattg ccaccattct gtctgccgcc atgatgctca agttctctct taacatgaag 2460

cccgccggtg acgctgttga ggctgccgtc aaggagtccg tcgaggctgg tatcactacc 2520

gccgatatcg gaggctcttc ctccacctcc gaggtcggag acttgttgcc aacaaggtca 2580

aggagctgct caagaaggag taagtcgttt ctacgacgca ttgatggaag gagcaaactg 2640

acgcgcctgc gggttggtct accggcaggg tccgctagtg tataagactc tataaaaagg 2700

gccctgccct gctaatgaaa tgatgattta taatttaccg gtgtagcaac cttgactaga 2760

agaagcagat tgggtgtgtt tgtagtggag gacagtggta cgttttggaa acagtcttct 2820

tgaaagtgtc ttgtctacag tatattcact cataacctca atagccaagg gtgtagtcgg 2880

tttattaaag gaagggagtt gtggctgatg tggatagata tctttaagct ggcgactgca 2940

cccaacgagt gtggtggtag cttgttagat ctgtatattc ggtaagatat attttgtggg 3000

gttttagtgg tgtttaaacc atcatctaag ggcctcaaaa ctacctcgga actgctgcgc 3060

tgatctggac accacagagg ttccgagcac tttaggttgc accaaatgtc ccaccaggtg 3120

caggcagaaa acgctggaac agcgtgtaca gtttgtctta acaaaaagtg agggcgctga 3180

ggtcgagcag ggtggtgtga cttgttatag cctttagagc tgcgaaagcg cgtatggatt 3240

tggctcatca ggccagattg agggtctgtg gacacatgtc atgttagtgt acttcaatcg 3300

ccccctggat atagccccga caataggccg tggcctcatt tttttgcctt ccgcacattt 3360

ccattgctcg gtacccacac cttgcttctc ctgcacttgc caaccttaat actggtttac 3420

attgaccaac atcttacaag cggggggctt gtctagggta tatataaaca gtggctctcc 3480

caatcggttg ccagtctctt ttttcctttc tttccccaca gattcgaaat ctaaactaca 3540

catcacacca tggcctcctc ggaggacgtc atcaaggagt tcatgcgatt caaggtccga 3600

atggaaggct ccgtgaacgg tcacgagttt gagattgagg gagagggtga aggccgaccc 3660

tacgaaggca cccagaccgc gaagctgaag gtgaccaagg gtggacccct gcccttcgcc 3720

tgggacattc tgtctcctca gtttcagtac ggttctaagg tgtacgtgaa gcaccctgct 3780

gacattcccg actacaagaa actttccttt cccgagggct tcaagtggga gcgagttatg 3840

aacttcgagg atggcggtgt cgttaccgtt actcaggact cctcgctcca ggacggctcg 3900

ttcatctaca aggttaagtt catcggtgtc aacttcccta gcgatggacc cgtcatgcaa 3960

aagaaaacta tgggatggga agcctctaca gagcggctgt accctcgaga cggagtgttg 4020

aagggcgaga ttcacaaggc cctgaagctc aaggacggtg gacactatct cgttgagttt 4080

aagtctatct acatggcaaa gaaacccgtg cagcttccag gctactatta cgtcgattcc 4140

aagctcgata tcaccagcca taatgaggac tacactattg tcgaacagta cgagcgtgct 4200

gagggaagac accatctgtt tctttaagcg gccgcaagtg tggatgggga agtgagtgcc 4260

cggttctgtg tgcacaattg gcaatccaag atggatggat tcaacacagg gatatagcga 4320

gctacgtggt ggtgcgagga tatagcaacg gatatttatg tttgacactt gagaatgtac 4380

gatacaagca ctgtccaagt acaatactaa acatactgta catactcata ctcgtacccg 4440

ggcaacggtt tcacttgagt gcagtggcta gtgctcttac tcgtacagtg tgcaatactg 4500

cgtatcatag tctttgatgt atatcgtatt cattcatgtt agttgcgtac gggcgtcgtt 4560

gcttgtgtga tttttgagga cccatccctt tggtatataa gtatactctg gggttaaggt 4620

tgcccgtgta gtctaggtta tagttttcat gtgaaatacc gagagccgag ggagaataaa 4680

cgggggtatt tggacttgtt tttttcgcgg aaaagcgtcg aatcaaccct gcgggccttg 4740

caccatgtcc acgacgtgtt tctcgcccca attcgcccct tgcacgtcaa aattaggcct 4800

ccatctagac ccctccataa catgtgactg tggggaaaag tataagggaa accatgcaac 4860

catagacgac gtgaaagacg gggaggaacc aatggaggcc aaagaaatgg ggtagcaaca 4920

gtccaggaga cagacaagga gacaaggaga gggcgcccga aagatcggaa aaacaaacat 4980

gtccaattgg ggcagtgacg gaaacgacac ggacacttca gtacaatgga ccgaccatct 5040

ccaagccagg gttattccgg tatcaccttg gccgtaacct cccgctggta cctgatattg 5100

tacacgttca cattcaatat actttcagct acaataagag aggctgtttg tcgggcatgt 5160

gtgtccgtcg tatggggtga tgtccgaggg cgaaattcgc tacaagctta actctggcgc 5220

ttgtccagta tgaatagaca agtcaagacc agtggtgcca tgattgacag ggaggtacaa 5280

gacttcgata ctcgagcatt actcggactt gtggcgattg aacagacggg cgatcgcttc 5340

tcccccgtat tgccgg 5356

<210> 134

<211> 38

<212> DNA

<213> 人工序列

<220>

<223> HY026

<400> 134

gcgcgtttaa accatcatct aagggcctca aaactacc 38

<210> 135

<211> 38

<212> DNA

<213> 人工序列

<220>

<223> HY027

<400> 135

gagagcggcc gcttaaagaa acagatggtg tcttccct 38

<210> 136

<211> 11952

<212> DNA

<213> 人工序列

<220>

<223> pRF169

<400> 136

catggacaag aaatactcca tcggcctgga cattggaacc aactctgtcg gctgggctgt 60

catcaccgac gagtacaagg tgccctccaa gaaattcaag gtcctcggaa acaccgatcg 120

acactccatc aagaaaaacc tcattggtgc cctgttgttc gattctggcg agactgccga 180

agctaccaga ctcaagcgaa ctgctcggcg acgttacacc cgacggaaga accgaatctg 240

ctacctgcag gagatctttt ccaacgagat ggccaaggtg gacgattcgt tctttcatcg 300

actggaggaa tccttcctcg tcgaggaaga caagaaacac gagcgtcatc ccatctttgg 360

caacattgtg gacgaggttg cttaccacga gaagtatcct accatctacc atctccgaaa 420

gaaactcgtc gattccaccg acaaggcgga tctcagactt atctacctcg ctctggcaca 480

catgatcaag tttcgaggtc atttcctcat cgagggcgat ctcaatcccg acaacagcga 540

tgtggacaag ctgttcattc agctcgttca gacctacaac cagctgttcg aggaaaaccc 600

catcaatgcc tccggagtcg atgcaaaggc catcttgtct gctcgactct cgaagagcag 660

acgactggag aacctcattg cccaacttcc tggcgagaaa aagaacggac tgtttggcaa 720

cctcattgcc ctttctcttg gtctcacacc caacttcaag tccaacttcg atctggcgga 780

ggacgccaag ctccagctgt ccaaggacac ctacgacgat gacctcgaca acctgcttgc 840

acagattggc gatcagtacg ccgacctgtt tctcgctgcc aagaaccttt cggatgctat 900

tctcttgtct gacattctgc gagtcaacac cgagatcaca aaggctcccc tttctgcctc 960

catgatcaag cgatacgacg agcaccatca ggatctcaca ctgctcaagg ctcttgtccg 1020

acagcaactg cccgagaagt acaaggagat ctttttcgat cagtcgaaga acggctacgc 1080

tggatacatc gacggcggag cctctcagga agagttctac aagttcatca agccaattct 1140

cgagaagatg gacggaaccg aggaactgct tgtcaagctc aatcgagagg atctgcttcg 1200

gaagcaacga accttcgaca acggcagcat tcctcatcag atccacctcg gtgagctgca 1260

cgccattctt cgacgtcagg aagacttcta cccctttctc aaggacaacc gagagaagat 1320

cgagaagatt cttacctttc gaatccccta ctatgttggt cctcttgcca gaggaaactc 1380

tcgatttgct tggatgactc gaaagtccga ggaaaccatc actccctgga acttcgagga 1440

agtcgtggac aagggtgcct ctgcacagtc cttcatcgag cgaatgacca acttcgacaa 1500

gaatctgccc aacgagaagg ttcttcccaa gcattcgctg ctctacgagt actttacagt 1560

ctacaacgaa ctcaccaaag tcaagtacgt taccgaggga atgcgaaagc ctgccttctt 1620

gtctggcgaa cagaagaaag ccattgtcga tctcctgttc aagaccaacc gaaaggtcac 1680

tgttaagcag ctcaaggagg actacttcaa gaaaatcgag tgtttcgaca gcgtcgagat 1740

ttccggagtt gaggaccgat tcaacgcctc tttgggcacc tatcacgatc tgctcaagat 1800

tatcaaggac aaggattttc tcgacaacga ggaaaacgag gacattctgg aggacatcgt 1860

gctcactctt accctgttcg aagatcggga gatgatcgag gaacgactca agacatacgc 1920

tcacctgttc gacgacaagg tcatgaaaca actcaagcga cgtagataca ccggctgggg 1980

aagactttcg cgaaagctca tcaacggcat cagagacaag cagtccggaa agaccattct 2040

ggactttctc aagtccgatg gctttgccaa ccgaaacttc atgcagctca ttcacgacga 2100

ttctcttacc ttcaaggagg acatccagaa ggcacaagtg tccggtcagg gcgacagctt 2160

gcacgaacat attgccaacc tggctggttc gccagccatc aagaaaggca ttctccagac 2220

tgtcaaggtt gtcgacgagc tggtgaaggt catgggacgt cacaagcccg agaacattgt 2280

gatcgagatg gccagagaga accagacaac tcaaaagggt cagaaaaact cgcgagagcg 2340

gatgaagcga atcgaggaag gcatcaagga gctgggatcc cagattctca aggagcatcc 2400

cgtcgagaac actcaactgc agaacgagaa gctgtatctc tactatctgc agaatggtcg 2460

agacatgtac gtggatcagg aactggacat caatcgtctc agcgactacg atgtggacca 2520

cattgtccct caatcctttc tcaaggacga ttctatcgac aacaaggtcc ttacacgatc 2580

cgacaagaac agaggcaagt cggacaacgt tcccagcgaa gaggtggtca aaaagatgaa 2640

gaactactgg cgacagctgc tcaacgccaa gctcattacc cagcgaaagt tcgacaatct 2700

taccaaggcc gagcgaggcg gtctgtccga gctcgacaag gctggcttca tcaagcgtca 2760

actcgtcgag accagacaga tcacaaagca cgtcgcacag attctcgatt ctcggatgaa 2820

caccaagtac gacgagaacg acaagctcat ccgagaggtc aaggtgatta ctctcaagtc 2880

caaactggtc tccgatttcc gaaaggactt tcagttctac aaggtgcgag agatcaacaa 2940

ttaccaccat gcccacgatg cttacctcaa cgccgtcgtt ggcactgcgc tcatcaagaa 3000

ataccccaag ctcgaaagcg agttcgttta cggcgattac aaggtctacg acgttcgaaa 3060

gatgattgcc aagtccgaac aggagattgg caaggctact gccaagtact tcttttactc 3120

caacatcatg aactttttca agaccgagat caccttggcc aacggagaga ttcgaaagag 3180

accacttatc gagaccaacg gcgaaactgg agagatcgtg tgggacaagg gtcgagactt 3240

tgcaaccgtg cgaaaggttc tgtcgatgcc tcaggtcaac atcgtcaaga aaaccgaggt 3300

tcagactggc ggattctcca aggagtcgat tctgcccaag cgaaactccg acaagctcat 3360

cgctcgaaag aaagactggg atcccaagaa atacggtggc ttcgattctc ctaccgtcgc 3420

ctattccgtg cttgtcgttg cgaaggtcga gaagggcaag tccaaaaagc tcaagtccgt 3480

caaggagctg ctcggaatta ccatcatgga gcgatcgagc ttcgagaaga atcccatcga 3540

cttcttggaa gccaagggtt acaaggaggt caagaaagac ctcattatca agctgcccaa 3600

gtactctctg ttcgaactgg agaacggtcg aaagcgtatg ctcgcctccg ctggcgagct 3660

gcagaaggga aacgagcttg ccttgccttc gaagtacgtc aactttctct atctggcttc 3720

tcactacgag aagctcaagg gttctcccga ggacaacgaa cagaagcaac tcttcgttga 3780

gcagcacaaa cattacctcg acgagattat cgagcagatt tccgagtttt cgaagcgagt 3840

catcctggct gatgccaact tggacaaggt gctctctgcc tacaacaagc atcgggacaa 3900

acccattcga gaacaggcgg agaacatcat tcacctgttt actcttacca acctgggtgc 3960

tcctgcagct ttcaagtact tcgataccac tatcgaccga aagcggtaca catccaccaa 4020

ggaggttctc gatgccaccc tgattcacca gtccatcact ggcctgtacg agacccgaat 4080

cgacctgtct cagcttggtg gcgactccag agccgatccc aagaaaaagc gaaaggtcta 4140

agcggccgca agtgtggatg gggaagtgag tgcccggttc tgtgtgcaca attggcaatc 4200

caagatggat ggattcaaca cagggatata gcgagctacg tggtggtgcg aggatatagc 4260

aacggatatt tatgtttgac acttgagaat gtacgataca agcactgtcc aagtacaata 4320

ctaaacatac tgtacatact catactcgta cccgggcaac ggtttcactt gagtgcagtg 4380

gctagtgctc ttactcgtac agtgtgcaat actgcgtatc atagtctttg atgtatatcg 4440

tattcattca tgttagttgc gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4500

aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4560

acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4620

ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4680

gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4740

caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 4800

tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 4860

gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 4920

ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 4980

cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 5040

tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 5100

tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 5160

cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 5220

agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 5280

agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5340

gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5400

aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5460

ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5520

gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5580

taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5640

tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5700

tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 5760

gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 5820

gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 5880

ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 5940

cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 6000

tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 6060

cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 6120

agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 6180

cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 6240

aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6300

aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6360

gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6420

gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6480

tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6540

ttccccgaaa agtgccacct gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6600

tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 6660

tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6720

tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 6780

gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 6840

agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 6900

cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 6960

agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttcca 7020

ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7080

acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 7140

ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact cactataggg 7200

cgaattgggt accgggcccc ccctcgaggt cgatggtgtc gataagcttg atatcgaatt 7260

catgtcacac aaaccgatct tcgcctcaag gaaacctaat tctacatccg agagactgcc 7320

gagatccagt ctacactgat taattttcgg gccaataatt taaaaaaatc gtgttatata 7380

atattatatg tattatatat atacatcatg atgatactga cagtcatgtc ccattgctaa 7440

atagacagac tccatctgcc gcctccaact gatgttctca atatttaagg ggtcatctcg 7500

cattgtttaa taataaacag actccatcta ccgcctccaa atgatgttct caaaatatat 7560

tgtatgaact tatttttatt acttagtatt attagacaac ttacttgctt tatgaaaaac 7620

acttcctatt taggaaacaa tttataatgg cagttcgttc atttaacaat ttatgtagaa 7680

taaatgttat aaatgcgtat gggaaatctt aaatatggat agcataaatg atatctgcat 7740

tgcctaattc gaaatcaaca gcaacgaaaa aaatcccttg tacaacataa atagtcatcg 7800

agaaatatca actatcaaag aacagctatt cacacgttac tattgagatt attattggac 7860

gagaatcaca cactcaactg tctttctctc ttctagaaat acaggtacaa gtatgtacta 7920

ttctcattgt tcatacttct agtcatttca tcccacatat tccttggatt tctctccaat 7980

gaatgacatt ctatcttgca aattcaacaa ttataataag atataccaaa gtagcggtat 8040

agtggcaatc aaaaagcttc tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc 8100

attaaaggta tatatttatt tcttgttata taatcctttt gtttattaca tgggctggat 8160

acataaaggt attttgattt aattttttgc ttaaattcaa tcccccctcg ttcagtgtca 8220

actgtaatgg taggaaatta ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa 8280

aatcgtattt ccaggttaga cgttccgcag aatctagaat gcggtatgcg gtacattgtt 8340

cttcgaacgt aaaagttgcg ctccctgaga tattgtacat ttttgctttt acaagtacaa 8400

gtacatcgta caactatgta ctactgttga tgcatccaca acagtttgtt ttgttttttt 8460

ttgttttttt tttttctaat gattcattac cgctatgtat acctacttgt acttgtagta 8520

agccgggtta ttggcgttca attaatcata gacttatgaa tctgcacggt gtgcgctgcg 8580

agttactttt agcttatgca tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa 8640

cggatgctca atcgatcgcc agcaacgcgg ccttagacat aaaaaacaaa aaaaaaaagc 8700

accgactcgg tgccactttt tcaagttgat aacggactag ccttatttta acttgctatt 8760

tctagctcta aaacgcaggt gtaaaaataa aaaggcctgc gattaccagc aggcctgtta 8820

ttaacctaag ccttaggacg cttcacgcca tacttggaac gagcctgctt acggtcttta 8880

acgccggagc agtcaagcgc accacgtacg gtgtggtaac gaacacccgg gaggtcttta 8940

acacgaccgc cacggatcag gatcacggag tgctcctgca ggttgtgacc ttcaccaccg 9000

atgtaggaag tcacttcgaa accgttagtc agacgaacac ggcatacttt acgcagcgcg 9060

gagttcggtt ttttaggagt ggtagtatat acacgagtac atacgccacg tttttgcggg 9120

catgcttcca gcgcaggcac gttgcttttc gcaactttgc gagcacgtgg tttgcgtacc 9180

agctggttaa ctgttgccat taaatagctc ctggttttag cttttgcttc gtaaacacgt 9240

aataaaacgt cctcacacaa tatgaggacg ccgaatttag ggcgatgccg aaaaggtgtc 9300

aagaaatata caacgatccc gccatcggcg cgcccacctg ctacgcatgg ttgatgtgtg 9360

tttaattcaa gaatgaatat agagaagaga agaagaaaaa agattcaatt gagccggcga 9420

tgcagaccct tatataaatg ttgccttgga cagacggagc aagcccgccc aaacctacgt 9480

tcggtataat atgttaagct ttttaacaca aaggtttggc ttggggtaac ctgatgtggt 9540

gcaaaagacc gggcgttggc gagccattgc gcgggcgaat ggggtcgtga ctcgtctcaa 9600

attcgagggc gtgcctcaat tcgtgccccc gtggcttttt cccgccgttt ccgccccgtt 9660

tgcaccactg cagccgcttc tttggttcgg acaccttgct gcgagctagg tgccttgtgc 9720

tacttaaaaa gtggcctccc aacaccaaca tgacatgagt gcgtgggcca agacacgttg 9780

gcggggtcgc agtcggctca atggcccgga aaaaacgctg ctggagctgg ttcggacgca 9840

gtccgccgcg gcgtatggat atccgcaagg ttccatagcg ccattgccct ccgtcggcgt 9900

ctatcccgca accttaatta agtcatacac aagtcagctt tcttcgagcc tcatataagt 9960

ataagtagtt caacgtatta gcactgtacc cagcatctcc gtatcgagaa acacaacaac 10020

atgccccatt ggacagatca tgcggataca caggttgtgc agtatcatac atactcgatc 10080

agacaggtcg tctgaccatc atacaagctg aacaagcgct ccatacttgc acgctctcta 10140

tatacacagt taaattacat atccatagtc taacctctaa cagttaatct tctggtaagc 10200

ctcccagcca gccttctggt atcgcttggc ctcctcaata ggatctcggt tctggccgta 10260

cagacctcgg ccgacaatta tgatatccgt tccggtagac atgacatcct caacagttcg 10320

gtactgctgt ccgagagcgt ctcccttgtc gtcaagaccc accccggggg tcagaataag 10380

ccagtcctca gagtcgccct taggtcggtt ctgggcaatg aagccaacca caaactcggg 10440

gtcggatcgg gcaagctcaa tggtctgctt ggagtactcg ccagtggcca gagagccctt 10500

gcaagacagc tcggccagca tgagcagacc tctggccagc ttctcgttgg gagaggggac 10560

taggaactcc ttgtactggg agttctcgta gtcagagacg tcctccttct tctgttcaga 10620

gacagtttcc tcggcaccag ctcgcaggcc agcaatgatt ccggttccgg gtacaccgtg 10680

ggcgttggtg atatcggacc actcggcgat tcggtgacac cggtactggt gcttgacagt 10740

gttgccaata tctgcgaact ttctgtcctc gaacaggaag aaaccgtgct taagagcaag 10800

ttccttgagg gggagcacag tgccggcgta ggtgaagtcg tcaatgatgt cgatatgggt 10860

tttgatcatg cacacataag gtccgacctt atcggcaagc tcaatgagct ccttggtggt 10920

ggtaacatcc agagaagcac acaggttggt tttcttggct gccacgagct tgagcactcg 10980

agcggcaaag gcggacttgt ggacgttagc tcgagcttcg taggagggca ttttggtggt 11040

gaagaggaga ctgaaataaa tttagtctgc agaacttttt atcggaacct tatctggggc 11100

agtgaagtat atgttatggt aatagttacg agttagttga acttatagat agactggact 11160

atacggctat cggtccaaat tagaaagaac gtcaatggct ctctgggcgt cgcctttgcc 11220

gacaaaaatg tgatcatgat gaaagccagc aatgacgttg cagctgatat tgttgtcggc 11280

caaccgcgcc gaaaacgcag ctgtcagacc cacagcctcc aacgaagaat gtatcgtcaa 11340

agtgatccaa gcacactcat agttggagtc gtactccaaa ggcggcaatg acgagtcaga 11400

cagatactcg tcgacgttta aaccatcatc taagggcctc aaaactacct cggaactgct 11460

gcgctgatct ggacaccaca gaggttccga gcactttagg ttgcaccaaa tgtcccacca 11520

ggtgcaggca gaaaacgctg gaacagcgtg tacagtttgt cttaacaaaa agtgagggcg 11580

ctgaggtcga gcagggtggt gtgacttgtt atagccttta gagctgcgaa agcgcgtatg 11640

gatttggctc atcaggccag attgagggtc tgtggacaca tgtcatgtta gtgtacttca 11700

atcgccccct ggatatagcc ccgacaatag gccgtggcct catttttttg ccttccgcac 11760

atttccattg ctcggtaccc acaccttgct tctcctgcac ttgccaacct taatactggt 11820

ttacattgac caacatctta caagcggggg gcttgtctag ggtatatata aacagtggct 11880

ctcccaatcg gttgccagtc tcttttttcc tttctttccc cacagattcg aaatctaaac 11940

tacacatcac ac 11952

<210> 137

<211> 564

<212> DNA

<213> 解脂耶氏酵母

<220>

<221> misc_feature

<222> (1)..(564)

<223> GPD启动子

<400> 137

ggttgcggga tagacgccga cggagggcaa tggcgctatg gaaccttgcg gatatccata 60

cgccgcggcg gactgcgtcc gaaccagctc cagcagcgtt ttttccgggc cattgagccg 120

actgcgaccc cgccaacgtg tcttggccca cgcactcatg tcatgttggt gttgggaggc 180

cactttttaa gtagcacaag gcacctagct cgcagcaagg tgtccgaacc aaagaagcgg 240

ctgcagtggt gcaaacgggg cggaaacggc gggaaaaagc cacgggggca cgaattgagg 300

cacgccctcg aatttgagac gagtcacgac cccattcgcc cgcgcaatgg ctcgccaacg 360

cccggtcttt tgcaccacat caggttaccc caagccaaac ctttgtgtta aaaagcttaa 420

catattatac cgaacgtagg tttgggcggg cttgctccgt ctgtccaagg caacatttat 480

ataagggtct gcatcgccgg ctcaattgaa tcttttttct tcttctcttc tctatattca 540

ttcttgaatt aaacacacat caac 564

<210> 138

<211> 1271

<212> DNA

<213> 人工序列

<220>

<223> GPD启动子-反向可选择标记物-CER-终止子

<400> 138

ttaattaagg ttgcgggata gacgccgacg gagggcaatg gcgctatgga accttgcgga 60

tatccatacg ccgcggcgga ctgcgtccga accagctcca gcagcgtttt ttccgggcca 120

ttgagccgac tgcgaccccg ccaacgtgtc ttggcccacg cactcatgtc atgttggtgt 180

tgggaggcca ctttttaagt agcacaaggc acctagctcg cagcaaggtg tccgaaccaa 240

agaagcggct gcagtggtgc aaacggggcg gaaacggcgg gaaaaagcca cgggggcacg 300

aattgaggca cgccctcgaa tttgagacga gtcacgaccc cattcgcccg cgcaatggct 360

cgccaacgcc cggtcttttg caccacatca ggttacccca agccaaacct ttgtgttaaa 420

aagcttaaca tattataccg aacgtaggtt tgggcgggct tgctccgtct gtccaaggca 480

acatttatat aagggtctgc atcgccggct caattgaatc ttttttcttc ttctcttctc 540

tatattcatt cttgaattaa acacacatca accatgcgta gcaggtgggc gcgccgatgg 600

cgggatcgtt gtatatttct tgacaccttt tcggcatcgc cctaaattcg gcgtcctcat 660

attgtgtgag gacgttttat tacgtgttta cgaagcaaaa gctaaaacca ggagctattt 720

aatggcaaca gttaaccagc tggtacgcaa accacgtgct cgcaaagttg cgaaaagcaa 780

cgtgcctgcg ctggaagcat gcccgcaaaa acgtggcgta tgtactcgtg tatatactac 840

cactcctaaa aaaccgaact ccgcgctgcg taaagtatgc cgtgttcgtc tgactaacgg 900

tttcgaagtg acttcctaca tcggtggtga aggtcacaac ctgcaggagc actccgtgat 960

cctgatccgt ggcggtcgtg ttaaagacct cccgggtgtt cgttaccaca ccgtacgtgg 1020

tgcgcttgac tgctccggcg ttaaagaccg taagcaggct cgttccaagt atggcgtgaa 1080

gcgtcctaag gcttaggtta ataacaggcc tgctggtaat cgcaggcctt tttattttta 1140

cacctgcgtt ttagagctag aaatagcaag ttaaaataag gctagtccgt tatcaacttg 1200

aaaaagtggc accgagtcgg tgcttttttt ttttgttttt tatgtctaag gccgcgttgc 1260

tggcgatcga t 1271

<210> 139

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> ds-temp-1靶位点

<400> 139

tcagtttcag tacggttcta agg 23

<210> 140

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> ds-temp-2靶位点

<400> 140

cggtgtcgtt accgttactc agg 23

<210> 141

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> ds-nontemp-3靶位点

<400> 141

cttggtcacc ttcagcttcg cgg 23

<210> 142

<211> 63

<212> DNA

<213> 人工序列

<220>

<223> 锤头核酶-VT融合体

<220>

<221> misc_feature

<222> (1)..(6)

<223> N是a、c、g、或t

<220>

<221> misc_feature

<222> (44)..(63)

<223> N是a、c、g、或t

<400> 142

nnnnnnctga tgagtccgtg aggacgaaac gagtaagctc gtcnnnnnnn nnnnnnnnnn 60

nnn 63

<210> 143

<211> 63

<212> RNA

<213> 人工序列

<220>

<223> 锤头核酶-VT融合体

<220>

<221> misc_feature

<222> (1)..(6)

<223> n是a、c、g、或u

<220>

<221> misc_feature

<222> (44)..(63)

<223> n是a、c、g、或u

<400> 143

nnnnnncuga ugaguccgug aggacgaaac gaguaagcuc gucnnnnnnn nnnnnnnnnn 60

nnn 63

<210> 144

<211> 75

<212> DNA

<213> 人工序列

<220>

<223> ds-temp-1F

<400> 144

catgcgtaaa ctgactgatg agtccgtgag gacgaaacga gtaagctcgt ctcagtttca 60

gtacggttct agttt 75

<210> 145

<211> 75

<212> DNA

<213> 人工序列

<220>

<223> 145 ds-temp-1R

<400> 145

tctaaaacta gaaccgtact gaaactgaga cgagcttact cgtttcgtcc tcacggactc 60

atcagtcagt ttacg 75

<210> 146

<211> 75

<212> DNA

<213> 人工序列

<220>

<223> 146 ds-temp-2F

<400> 146

catgcgtaac accgctgatg agtccgtgag gacgaaacga gtaagctcgt ccggtgtcgt 60

taccgttact cgttt 75

<210> 147

<211> 75

<212> DNA

<213> 人工序列

<220>

<223> ds-temp-2R

<400> 147

tctaaaacga gtaacggtaa cgacaccgga cgagcttact cgtttcgtcc tcacggactc 60

atcagcggtg ttacg 75

<210> 148

<211> 75

<212> DNA

<213> 人工序列

<220>

<223> ds-nontemp-1F

<400> 148

catgcgtaac caggctgatg agtccgtgag gacgaaacga gtaagctcgt ccttggtcac 60

cttcagcttc ggttt 75

<210> 149

<211> 75

<212> DNA

<213> 人工序列

<220>

<223> ds-nontemp-1R

<400> 149

tctaaaaccg aagctgaagg tgaccaagga cgagcttact cgtttcgtcc tcacggactc 60

atcagcctgg ttacg 75

<210> 150

<211> 11448

<212> DNA

<213> 人工序列

<220>

<223> pRF296

<400> 150

catggacaag aaatactcca tcggcctgga cattggaacc aactctgtcg gctgggctgt 60

catcaccgac gagtacaagg tgccctccaa gaaattcaag gtcctcggaa acaccgatcg 120

acactccatc aagaaaaacc tcattggtgc cctgttgttc gattctggcg agactgccga 180

agctaccaga ctcaagcgaa ctgctcggcg acgttacacc cgacggaaga accgaatctg 240

ctacctgcag gagatctttt ccaacgagat ggccaaggtg gacgattcgt tctttcatcg 300

actggaggaa tccttcctcg tcgaggaaga caagaaacac gagcgtcatc ccatctttgg 360

caacattgtg gacgaggttg cttaccacga gaagtatcct accatctacc atctccgaaa 420

gaaactcgtc gattccaccg acaaggcgga tctcagactt atctacctcg ctctggcaca 480

catgatcaag tttcgaggtc atttcctcat cgagggcgat ctcaatcccg acaacagcga 540

tgtggacaag ctgttcattc agctcgttca gacctacaac cagctgttcg aggaaaaccc 600

catcaatgcc tccggagtcg atgcaaaggc catcttgtct gctcgactct cgaagagcag 660

acgactggag aacctcattg cccaacttcc tggcgagaaa aagaacggac tgtttggcaa 720

cctcattgcc ctttctcttg gtctcacacc caacttcaag tccaacttcg atctggcgga 780

ggacgccaag ctccagctgt ccaaggacac ctacgacgat gacctcgaca acctgcttgc 840

acagattggc gatcagtacg ccgacctgtt tctcgctgcc aagaaccttt cggatgctat 900

tctcttgtct gacattctgc gagtcaacac cgagatcaca aaggctcccc tttctgcctc 960

catgatcaag cgatacgacg agcaccatca ggatctcaca ctgctcaagg ctcttgtccg 1020

acagcaactg cccgagaagt acaaggagat ctttttcgat cagtcgaaga acggctacgc 1080

tggatacatc gacggcggag cctctcagga agagttctac aagttcatca agccaattct 1140

cgagaagatg gacggaaccg aggaactgct tgtcaagctc aatcgagagg atctgcttcg 1200

gaagcaacga accttcgaca acggcagcat tcctcatcag atccacctcg gtgagctgca 1260

cgccattctt cgacgtcagg aagacttcta cccctttctc aaggacaacc gagagaagat 1320

cgagaagatt cttacctttc gaatccccta ctatgttggt cctcttgcca gaggaaactc 1380

tcgatttgct tggatgactc gaaagtccga ggaaaccatc actccctgga acttcgagga 1440

agtcgtggac aagggtgcct ctgcacagtc cttcatcgag cgaatgacca acttcgacaa 1500

gaatctgccc aacgagaagg ttcttcccaa gcattcgctg ctctacgagt actttacagt 1560

ctacaacgaa ctcaccaaag tcaagtacgt taccgaggga atgcgaaagc ctgccttctt 1620

gtctggcgaa cagaagaaag ccattgtcga tctcctgttc aagaccaacc gaaaggtcac 1680

tgttaagcag ctcaaggagg actacttcaa gaaaatcgag tgtttcgaca gcgtcgagat 1740

ttccggagtt gaggaccgat tcaacgcctc tttgggcacc tatcacgatc tgctcaagat 1800

tatcaaggac aaggattttc tcgacaacga ggaaaacgag gacattctgg aggacatcgt 1860

gctcactctt accctgttcg aagatcggga gatgatcgag gaacgactca agacatacgc 1920

tcacctgttc gacgacaagg tcatgaaaca actcaagcga cgtagataca ccggctgggg 1980

aagactttcg cgaaagctca tcaacggcat cagagacaag cagtccggaa agaccattct 2040

ggactttctc aagtccgatg gctttgccaa ccgaaacttc atgcagctca ttcacgacga 2100

ttctcttacc ttcaaggagg acatccagaa ggcacaagtg tccggtcagg gcgacagctt 2160

gcacgaacat attgccaacc tggctggttc gccagccatc aagaaaggca ttctccagac 2220

tgtcaaggtt gtcgacgagc tggtgaaggt catgggacgt cacaagcccg agaacattgt 2280

gatcgagatg gccagagaga accagacaac tcaaaagggt cagaaaaact cgcgagagcg 2340

gatgaagcga atcgaggaag gcatcaagga gctgggatcc cagattctca aggagcatcc 2400

cgtcgagaac actcaactgc agaacgagaa gctgtatctc tactatctgc agaatggtcg 2460

agacatgtac gtggatcagg aactggacat caatcgtctc agcgactacg atgtggacca 2520

cattgtccct caatcctttc tcaaggacga ttctatcgac aacaaggtcc ttacacgatc 2580

cgacaagaac agaggcaagt cggacaacgt tcccagcgaa gaggtggtca aaaagatgaa 2640

gaactactgg cgacagctgc tcaacgccaa gctcattacc cagcgaaagt tcgacaatct 2700

taccaaggcc gagcgaggcg gtctgtccga gctcgacaag gctggcttca tcaagcgtca 2760

actcgtcgag accagacaga tcacaaagca cgtcgcacag attctcgatt ctcggatgaa 2820

caccaagtac gacgagaacg acaagctcat ccgagaggtc aaggtgatta ctctcaagtc 2880

caaactggtc tccgatttcc gaaaggactt tcagttctac aaggtgcgag agatcaacaa 2940

ttaccaccat gcccacgatg cttacctcaa cgccgtcgtt ggcactgcgc tcatcaagaa 3000

ataccccaag ctcgaaagcg agttcgttta cggcgattac aaggtctacg acgttcgaaa 3060

gatgattgcc aagtccgaac aggagattgg caaggctact gccaagtact tcttttactc 3120

caacatcatg aactttttca agaccgagat caccttggcc aacggagaga ttcgaaagag 3180

accacttatc gagaccaacg gcgaaactgg agagatcgtg tgggacaagg gtcgagactt 3240

tgcaaccgtg cgaaaggttc tgtcgatgcc tcaggtcaac atcgtcaaga aaaccgaggt 3300

tcagactggc ggattctcca aggagtcgat tctgcccaag cgaaactccg acaagctcat 3360

cgctcgaaag aaagactggg atcccaagaa atacggtggc ttcgattctc ctaccgtcgc 3420

ctattccgtg cttgtcgttg cgaaggtcga gaagggcaag tccaaaaagc tcaagtccgt 3480

caaggagctg ctcggaatta ccatcatgga gcgatcgagc ttcgagaaga atcccatcga 3540

cttcttggaa gccaagggtt acaaggaggt caagaaagac ctcattatca agctgcccaa 3600

gtactctctg ttcgaactgg agaacggtcg aaagcgtatg ctcgcctccg ctggcgagct 3660

gcagaaggga aacgagcttg ccttgccttc gaagtacgtc aactttctct atctggcttc 3720

tcactacgag aagctcaagg gttctcccga ggacaacgaa cagaagcaac tcttcgttga 3780

gcagcacaaa cattacctcg acgagattat cgagcagatt tccgagtttt cgaagcgagt 3840

catcctggct gatgccaact tggacaaggt gctctctgcc tacaacaagc atcgggacaa 3900

acccattcga gaacaggcgg agaacatcat tcacctgttt actcttacca acctgggtgc 3960

tcctgcagct ttcaagtact tcgataccac tatcgaccga aagcggtaca catccaccaa 4020

ggaggttctc gatgccaccc tgattcacca gtccatcact ggcctgtacg agacccgaat 4080

cgacctgtct cagcttggtg gcgactccag agccgatccc aagaaaaagc gaaaggtcta 4140

agcggccgca agtgtggatg gggaagtgag tgcccggttc tgtgtgcaca attggcaatc 4200

caagatggat ggattcaaca cagggatata gcgagctacg tggtggtgcg aggatatagc 4260

aacggatatt tatgtttgac acttgagaat gtacgataca agcactgtcc aagtacaata 4320

ctaaacatac tgtacatact catactcgta cccgggcaac ggtttcactt gagtgcagtg 4380

gctagtgctc ttactcgtac agtgtgcaat actgcgtatc atagtctttg atgtatatcg 4440

tattcattca tgttagttgc gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4500

aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4560

acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4620

ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4680

gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4740

caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 4800

tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 4860

gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 4920

ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 4980

cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 5040

tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 5100

tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 5160

cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 5220

agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 5280

agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5340

gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5400

aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5460

ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5520

gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5580

taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5640

tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5700

tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 5760

gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 5820

gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 5880

ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 5940

cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 6000

tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 6060

cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 6120

agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 6180

cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 6240

aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6300

aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6360

gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6420

gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6480

tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6540

ttccccgaaa agtgccacct gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6600

tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 6660

tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6720

tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 6780

gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 6840

agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 6900

cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 6960

agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttcca 7020

ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7080

acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 7140

ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact cactataggg 7200

cgaattgggt accgggcccc ccctcgaggt cgatggtgtc gataagcttg atatcgaatt 7260

catgtcacac aaaccgatct tcgcctcaag gaaacctaat tctacatccg agagactgcc 7320

gagatccagt ctacactgat taattttcgg gccaataatt taaaaaaatc gtgttatata 7380

atattatatg tattatatat atacatcatg atgatactga cagtcatgtc ccattgctaa 7440

atagacagac tccatctgcc gcctccaact gatgttctca atatttaagg ggtcatctcg 7500

cattgtttaa taataaacag actccatcta ccgcctccaa atgatgttct caaaatatat 7560

tgtatgaact tatttttatt acttagtatt attagacaac ttacttgctt tatgaaaaac 7620

acttcctatt taggaaacaa tttataatgg cagttcgttc atttaacaat ttatgtagaa 7680

taaatgttat aaatgcgtat gggaaatctt aaatatggat agcataaatg atatctgcat 7740

tgcctaattc gaaatcaaca gcaacgaaaa aaatcccttg tacaacataa atagtcatcg 7800

agaaatatca actatcaaag aacagctatt cacacgttac tattgagatt attattggac 7860

gagaatcaca cactcaactg tctttctctc ttctagaaat acaggtacaa gtatgtacta 7920

ttctcattgt tcatacttct agtcatttca tcccacatat tccttggatt tctctccaat 7980

gaatgacatt ctatcttgca aattcaacaa ttataataag atataccaaa gtagcggtat 8040

agtggcaatc aaaaagcttc tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc 8100

attaaaggta tatatttatt tcttgttata taatcctttt gtttattaca tgggctggat 8160

acataaaggt attttgattt aattttttgc ttaaattcaa tcccccctcg ttcagtgtca 8220

actgtaatgg taggaaatta ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa 8280

aatcgtattt ccaggttaga cgttccgcag aatctagaat gcggtatgcg gtacattgtt 8340

cttcgaacgt aaaagttgcg ctccctgaga tattgtacat ttttgctttt acaagtacaa 8400

gtacatcgta caactatgta ctactgttga tgcatccaca acagtttgtt ttgttttttt 8460

ttgttttttt tttttctaat gattcattac cgctatgtat acctacttgt acttgtagta 8520

agccgggtta ttggcgttca attaatcata gacttatgaa tctgcacggt gtgcgctgcg 8580

agttactttt agcttatgca tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa 8640

cggatgctca atcgatcgcc agcaacgcgg ccttagacat aaaaaacaaa aaaaaaaagc 8700

accgactcgg tgccactttt tcaagttgat aacggactag ccttatttta acttgctatt 8760

tctagctcta aaactagaac cgtactgaaa ctgagacgag cttactcgtt tcgtcctcac 8820

ggactcatca gtcagtttac gcatggttga tgtgtgttta attcaagaat gaatatagag 8880

aagagaagaa gaaaaaagat tcaattgagc cggcgatgca gacccttata taaatgttgc 8940

cttggacaga cggagcaagc ccgcccaaac ctacgttcgg tataatatgt taagcttttt 9000

aacacaaagg tttggcttgg ggtaacctga tgtggtgcaa aagaccgggc gttggcgagc 9060

cattgcgcgg gcgaatgggg tcgtgactcg tctcaaattc gagggcgtgc ctcaattcgt 9120

gcccccgtgg ctttttcccg ccgtttccgc cccgtttgca ccactgcagc cgcttctttg 9180

gttcggacac cttgctgcga gctaggtgcc ttgtgctact taaaaagtgg cctcccaaca 9240

ccaacatgac atgagtgcgt gggccaagac acgttggcgg ggtcgcagtc ggctcaatgg 9300

cccggaaaaa acgctgctgg agctggttcg gacgcagtcc gccgcggcgt atggatatcc 9360

gcaaggttcc atagcgccat tgccctccgt cggcgtctat cccgcaacct taattaagtc 9420

atacacaagt cagctttctt cgagcctcat ataagtataa gtagttcaac gtattagcac 9480

tgtacccagc atctccgtat cgagaaacac aacaacatgc cccattggac agatcatgcg 9540

gatacacagg ttgtgcagta tcatacatac tcgatcagac aggtcgtctg accatcatac 9600

aagctgaaca agcgctccat acttgcacgc tctctatata cacagttaaa ttacatatcc 9660

atagtctaac ctctaacagt taatcttctg gtaagcctcc cagccagcct tctggtatcg 9720

cttggcctcc tcaataggat ctcggttctg gccgtacaga cctcggccga caattatgat 9780

atccgttccg gtagacatga catcctcaac agttcggtac tgctgtccga gagcgtctcc 9840

cttgtcgtca agacccaccc cgggggtcag aataagccag tcctcagagt cgcccttagg 9900

tcggttctgg gcaatgaagc caaccacaaa ctcggggtcg gatcgggcaa gctcaatggt 9960

ctgcttggag tactcgccag tggccagaga gcccttgcaa gacagctcgg ccagcatgag 10020

cagacctctg gccagcttct cgttgggaga ggggactagg aactccttgt actgggagtt 10080

ctcgtagtca gagacgtcct ccttcttctg ttcagagaca gtttcctcgg caccagctcg 10140

caggccagca atgattccgg ttccgggtac accgtgggcg ttggtgatat cggaccactc 10200

ggcgattcgg tgacaccggt actggtgctt gacagtgttg ccaatatctg cgaactttct 10260

gtcctcgaac aggaagaaac cgtgcttaag agcaagttcc ttgaggggga gcacagtgcc 10320

ggcgtaggtg aagtcgtcaa tgatgtcgat atgggttttg atcatgcaca cataaggtcc 10380

gaccttatcg gcaagctcaa tgagctcctt ggtggtggta acatccagag aagcacacag 10440

gttggttttc ttggctgcca cgagcttgag cactcgagcg gcaaaggcgg acttgtggac 10500

gttagctcga gcttcgtagg agggcatttt ggtggtgaag aggagactga aataaattta 10560

gtctgcagaa ctttttatcg gaaccttatc tggggcagtg aagtatatgt tatggtaata 10620

gttacgagtt agttgaactt atagatagac tggactatac ggctatcggt ccaaattaga 10680

aagaacgtca atggctctct gggcgtcgcc tttgccgaca aaaatgtgat catgatgaaa 10740

gccagcaatg acgttgcagc tgatattgtt gtcggccaac cgcgccgaaa acgcagctgt 10800

cagacccaca gcctccaacg aagaatgtat cgtcaaagtg atccaagcac actcatagtt 10860

ggagtcgtac tccaaaggcg gcaatgacga gtcagacaga tactcgtcga cgtttaaacc 10920

atcatctaag ggcctcaaaa ctacctcgga actgctgcgc tgatctggac accacagagg 10980

ttccgagcac tttaggttgc accaaatgtc ccaccaggtg caggcagaaa acgctggaac 11040

agcgtgtaca gtttgtctta acaaaaagtg agggcgctga ggtcgagcag ggtggtgtga 11100

cttgttatag cctttagagc tgcgaaagcg cgtatggatt tggctcatca ggccagattg 11160

agggtctgtg gacacatgtc atgttagtgt acttcaatcg ccccctggat atagccccga 11220

caataggccg tggcctcatt tttttgcctt ccgcacattt ccattgctcg gtacccacac 11280

cttgcttctc ctgcacttgc caaccttaat actggtttac attgaccaac atcttacaag 11340

cggggggctt gtctagggta tatataaaca gtggctctcc caatcggttg ccagtctctt 11400

ttttcctttc tttccccaca gattcgaaat ctaaactaca catcacac 11448

<210> 151

<211> 11448

<212> DNA

<213> 人工序列

<220>

<223> pRF298

<400> 151

catggacaag aaatactcca tcggcctgga cattggaacc aactctgtcg gctgggctgt 60

catcaccgac gagtacaagg tgccctccaa gaaattcaag gtcctcggaa acaccgatcg 120

acactccatc aagaaaaacc tcattggtgc cctgttgttc gattctggcg agactgccga 180

agctaccaga ctcaagcgaa ctgctcggcg acgttacacc cgacggaaga accgaatctg 240

ctacctgcag gagatctttt ccaacgagat ggccaaggtg gacgattcgt tctttcatcg 300

actggaggaa tccttcctcg tcgaggaaga caagaaacac gagcgtcatc ccatctttgg 360

caacattgtg gacgaggttg cttaccacga gaagtatcct accatctacc atctccgaaa 420

gaaactcgtc gattccaccg acaaggcgga tctcagactt atctacctcg ctctggcaca 480

catgatcaag tttcgaggtc atttcctcat cgagggcgat ctcaatcccg acaacagcga 540

tgtggacaag ctgttcattc agctcgttca gacctacaac cagctgttcg aggaaaaccc 600

catcaatgcc tccggagtcg atgcaaaggc catcttgtct gctcgactct cgaagagcag 660

acgactggag aacctcattg cccaacttcc tggcgagaaa aagaacggac tgtttggcaa 720

cctcattgcc ctttctcttg gtctcacacc caacttcaag tccaacttcg atctggcgga 780

ggacgccaag ctccagctgt ccaaggacac ctacgacgat gacctcgaca acctgcttgc 840

acagattggc gatcagtacg ccgacctgtt tctcgctgcc aagaaccttt cggatgctat 900

tctcttgtct gacattctgc gagtcaacac cgagatcaca aaggctcccc tttctgcctc 960

catgatcaag cgatacgacg agcaccatca ggatctcaca ctgctcaagg ctcttgtccg 1020

acagcaactg cccgagaagt acaaggagat ctttttcgat cagtcgaaga acggctacgc 1080

tggatacatc gacggcggag cctctcagga agagttctac aagttcatca agccaattct 1140

cgagaagatg gacggaaccg aggaactgct tgtcaagctc aatcgagagg atctgcttcg 1200

gaagcaacga accttcgaca acggcagcat tcctcatcag atccacctcg gtgagctgca 1260

cgccattctt cgacgtcagg aagacttcta cccctttctc aaggacaacc gagagaagat 1320

cgagaagatt cttacctttc gaatccccta ctatgttggt cctcttgcca gaggaaactc 1380

tcgatttgct tggatgactc gaaagtccga ggaaaccatc actccctgga acttcgagga 1440

agtcgtggac aagggtgcct ctgcacagtc cttcatcgag cgaatgacca acttcgacaa 1500

gaatctgccc aacgagaagg ttcttcccaa gcattcgctg ctctacgagt actttacagt 1560

ctacaacgaa ctcaccaaag tcaagtacgt taccgaggga atgcgaaagc ctgccttctt 1620

gtctggcgaa cagaagaaag ccattgtcga tctcctgttc aagaccaacc gaaaggtcac 1680

tgttaagcag ctcaaggagg actacttcaa gaaaatcgag tgtttcgaca gcgtcgagat 1740

ttccggagtt gaggaccgat tcaacgcctc tttgggcacc tatcacgatc tgctcaagat 1800

tatcaaggac aaggattttc tcgacaacga ggaaaacgag gacattctgg aggacatcgt 1860

gctcactctt accctgttcg aagatcggga gatgatcgag gaacgactca agacatacgc 1920

tcacctgttc gacgacaagg tcatgaaaca actcaagcga cgtagataca ccggctgggg 1980

aagactttcg cgaaagctca tcaacggcat cagagacaag cagtccggaa agaccattct 2040

ggactttctc aagtccgatg gctttgccaa ccgaaacttc atgcagctca ttcacgacga 2100

ttctcttacc ttcaaggagg acatccagaa ggcacaagtg tccggtcagg gcgacagctt 2160

gcacgaacat attgccaacc tggctggttc gccagccatc aagaaaggca ttctccagac 2220

tgtcaaggtt gtcgacgagc tggtgaaggt catgggacgt cacaagcccg agaacattgt 2280

gatcgagatg gccagagaga accagacaac tcaaaagggt cagaaaaact cgcgagagcg 2340

gatgaagcga atcgaggaag gcatcaagga gctgggatcc cagattctca aggagcatcc 2400

cgtcgagaac actcaactgc agaacgagaa gctgtatctc tactatctgc agaatggtcg 2460

agacatgtac gtggatcagg aactggacat caatcgtctc agcgactacg atgtggacca 2520

cattgtccct caatcctttc tcaaggacga ttctatcgac aacaaggtcc ttacacgatc 2580

cgacaagaac agaggcaagt cggacaacgt tcccagcgaa gaggtggtca aaaagatgaa 2640

gaactactgg cgacagctgc tcaacgccaa gctcattacc cagcgaaagt tcgacaatct 2700

taccaaggcc gagcgaggcg gtctgtccga gctcgacaag gctggcttca tcaagcgtca 2760

actcgtcgag accagacaga tcacaaagca cgtcgcacag attctcgatt ctcggatgaa 2820

caccaagtac gacgagaacg acaagctcat ccgagaggtc aaggtgatta ctctcaagtc 2880

caaactggtc tccgatttcc gaaaggactt tcagttctac aaggtgcgag agatcaacaa 2940

ttaccaccat gcccacgatg cttacctcaa cgccgtcgtt ggcactgcgc tcatcaagaa 3000

ataccccaag ctcgaaagcg agttcgttta cggcgattac aaggtctacg acgttcgaaa 3060

gatgattgcc aagtccgaac aggagattgg caaggctact gccaagtact tcttttactc 3120

caacatcatg aactttttca agaccgagat caccttggcc aacggagaga ttcgaaagag 3180

accacttatc gagaccaacg gcgaaactgg agagatcgtg tgggacaagg gtcgagactt 3240

tgcaaccgtg cgaaaggttc tgtcgatgcc tcaggtcaac atcgtcaaga aaaccgaggt 3300

tcagactggc ggattctcca aggagtcgat tctgcccaag cgaaactccg acaagctcat 3360

cgctcgaaag aaagactggg atcccaagaa atacggtggc ttcgattctc ctaccgtcgc 3420

ctattccgtg cttgtcgttg cgaaggtcga gaagggcaag tccaaaaagc tcaagtccgt 3480

caaggagctg ctcggaatta ccatcatgga gcgatcgagc ttcgagaaga atcccatcga 3540

cttcttggaa gccaagggtt acaaggaggt caagaaagac ctcattatca agctgcccaa 3600

gtactctctg ttcgaactgg agaacggtcg aaagcgtatg ctcgcctccg ctggcgagct 3660

gcagaaggga aacgagcttg ccttgccttc gaagtacgtc aactttctct atctggcttc 3720

tcactacgag aagctcaagg gttctcccga ggacaacgaa cagaagcaac tcttcgttga 3780

gcagcacaaa cattacctcg acgagattat cgagcagatt tccgagtttt cgaagcgagt 3840

catcctggct gatgccaact tggacaaggt gctctctgcc tacaacaagc atcgggacaa 3900

acccattcga gaacaggcgg agaacatcat tcacctgttt actcttacca acctgggtgc 3960

tcctgcagct ttcaagtact tcgataccac tatcgaccga aagcggtaca catccaccaa 4020

ggaggttctc gatgccaccc tgattcacca gtccatcact ggcctgtacg agacccgaat 4080

cgacctgtct cagcttggtg gcgactccag agccgatccc aagaaaaagc gaaaggtcta 4140

agcggccgca agtgtggatg gggaagtgag tgcccggttc tgtgtgcaca attggcaatc 4200

caagatggat ggattcaaca cagggatata gcgagctacg tggtggtgcg aggatatagc 4260

aacggatatt tatgtttgac acttgagaat gtacgataca agcactgtcc aagtacaata 4320

ctaaacatac tgtacatact catactcgta cccgggcaac ggtttcactt gagtgcagtg 4380

gctagtgctc ttactcgtac agtgtgcaat actgcgtatc atagtctttg atgtatatcg 4440

tattcattca tgttagttgc gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4500

aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4560

acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4620

ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4680

gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4740

caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 4800

tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 4860

gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 4920

ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 4980

cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 5040

tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 5100

tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 5160

cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 5220

agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 5280

agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5340

gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5400

aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5460

ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5520

gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5580

taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5640

tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5700

tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 5760

gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 5820

gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 5880

ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 5940

cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 6000

tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 6060

cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 6120

agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 6180

cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 6240

aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6300

aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6360

gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6420

gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6480

tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6540

ttccccgaaa agtgccacct gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6600

tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 6660

tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6720

tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 6780

gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 6840

agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 6900

cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 6960

agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttcca 7020

ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7080

acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 7140

ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact cactataggg 7200

cgaattgggt accgggcccc ccctcgaggt cgatggtgtc gataagcttg atatcgaatt 7260

catgtcacac aaaccgatct tcgcctcaag gaaacctaat tctacatccg agagactgcc 7320

gagatccagt ctacactgat taattttcgg gccaataatt taaaaaaatc gtgttatata 7380

atattatatg tattatatat atacatcatg atgatactga cagtcatgtc ccattgctaa 7440

atagacagac tccatctgcc gcctccaact gatgttctca atatttaagg ggtcatctcg 7500

cattgtttaa taataaacag actccatcta ccgcctccaa atgatgttct caaaatatat 7560

tgtatgaact tatttttatt acttagtatt attagacaac ttacttgctt tatgaaaaac 7620

acttcctatt taggaaacaa tttataatgg cagttcgttc atttaacaat ttatgtagaa 7680

taaatgttat aaatgcgtat gggaaatctt aaatatggat agcataaatg atatctgcat 7740

tgcctaattc gaaatcaaca gcaacgaaaa aaatcccttg tacaacataa atagtcatcg 7800

agaaatatca actatcaaag aacagctatt cacacgttac tattgagatt attattggac 7860

gagaatcaca cactcaactg tctttctctc ttctagaaat acaggtacaa gtatgtacta 7920

ttctcattgt tcatacttct agtcatttca tcccacatat tccttggatt tctctccaat 7980

gaatgacatt ctatcttgca aattcaacaa ttataataag atataccaaa gtagcggtat 8040

agtggcaatc aaaaagcttc tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc 8100

attaaaggta tatatttatt tcttgttata taatcctttt gtttattaca tgggctggat 8160

acataaaggt attttgattt aattttttgc ttaaattcaa tcccccctcg ttcagtgtca 8220

actgtaatgg taggaaatta ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa 8280

aatcgtattt ccaggttaga cgttccgcag aatctagaat gcggtatgcg gtacattgtt 8340

cttcgaacgt aaaagttgcg ctccctgaga tattgtacat ttttgctttt acaagtacaa 8400

gtacatcgta caactatgta ctactgttga tgcatccaca acagtttgtt ttgttttttt 8460

ttgttttttt tttttctaat gattcattac cgctatgtat acctacttgt acttgtagta 8520

agccgggtta ttggcgttca attaatcata gacttatgaa tctgcacggt gtgcgctgcg 8580

agttactttt agcttatgca tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa 8640

cggatgctca atcgatcgcc agcaacgcgg ccttagacat aaaaaacaaa aaaaaaaagc 8700

accgactcgg tgccactttt tcaagttgat aacggactag ccttatttta acttgctatt 8760

tctagctcta aaacgagtaa cggtaacgac accggacgag cttactcgtt tcgtcctcac 8820

ggactcatca gcggtgttac gcatggttga tgtgtgttta attcaagaat gaatatagag 8880

aagagaagaa gaaaaaagat tcaattgagc cggcgatgca gacccttata taaatgttgc 8940

cttggacaga cggagcaagc ccgcccaaac ctacgttcgg tataatatgt taagcttttt 9000

aacacaaagg tttggcttgg ggtaacctga tgtggtgcaa aagaccgggc gttggcgagc 9060

cattgcgcgg gcgaatgggg tcgtgactcg tctcaaattc gagggcgtgc ctcaattcgt 9120

gcccccgtgg ctttttcccg ccgtttccgc cccgtttgca ccactgcagc cgcttctttg 9180

gttcggacac cttgctgcga gctaggtgcc ttgtgctact taaaaagtgg cctcccaaca 9240

ccaacatgac atgagtgcgt gggccaagac acgttggcgg ggtcgcagtc ggctcaatgg 9300

cccggaaaaa acgctgctgg agctggttcg gacgcagtcc gccgcggcgt atggatatcc 9360

gcaaggttcc atagcgccat tgccctccgt cggcgtctat cccgcaacct taattaagtc 9420

atacacaagt cagctttctt cgagcctcat ataagtataa gtagttcaac gtattagcac 9480

tgtacccagc atctccgtat cgagaaacac aacaacatgc cccattggac agatcatgcg 9540

gatacacagg ttgtgcagta tcatacatac tcgatcagac aggtcgtctg accatcatac 9600

aagctgaaca agcgctccat acttgcacgc tctctatata cacagttaaa ttacatatcc 9660

atagtctaac ctctaacagt taatcttctg gtaagcctcc cagccagcct tctggtatcg 9720

cttggcctcc tcaataggat ctcggttctg gccgtacaga cctcggccga caattatgat 9780

atccgttccg gtagacatga catcctcaac agttcggtac tgctgtccga gagcgtctcc 9840

cttgtcgtca agacccaccc cgggggtcag aataagccag tcctcagagt cgcccttagg 9900

tcggttctgg gcaatgaagc caaccacaaa ctcggggtcg gatcgggcaa gctcaatggt 9960

ctgcttggag tactcgccag tggccagaga gcccttgcaa gacagctcgg ccagcatgag 10020

cagacctctg gccagcttct cgttgggaga ggggactagg aactccttgt actgggagtt 10080

ctcgtagtca gagacgtcct ccttcttctg ttcagagaca gtttcctcgg caccagctcg 10140

caggccagca atgattccgg ttccgggtac accgtgggcg ttggtgatat cggaccactc 10200

ggcgattcgg tgacaccggt actggtgctt gacagtgttg ccaatatctg cgaactttct 10260

gtcctcgaac aggaagaaac cgtgcttaag agcaagttcc ttgaggggga gcacagtgcc 10320

ggcgtaggtg aagtcgtcaa tgatgtcgat atgggttttg atcatgcaca cataaggtcc 10380

gaccttatcg gcaagctcaa tgagctcctt ggtggtggta acatccagag aagcacacag 10440

gttggttttc ttggctgcca cgagcttgag cactcgagcg gcaaaggcgg acttgtggac 10500

gttagctcga gcttcgtagg agggcatttt ggtggtgaag aggagactga aataaattta 10560

gtctgcagaa ctttttatcg gaaccttatc tggggcagtg aagtatatgt tatggtaata 10620

gttacgagtt agttgaactt atagatagac tggactatac ggctatcggt ccaaattaga 10680

aagaacgtca atggctctct gggcgtcgcc tttgccgaca aaaatgtgat catgatgaaa 10740

gccagcaatg acgttgcagc tgatattgtt gtcggccaac cgcgccgaaa acgcagctgt 10800

cagacccaca gcctccaacg aagaatgtat cgtcaaagtg atccaagcac actcatagtt 10860

ggagtcgtac tccaaaggcg gcaatgacga gtcagacaga tactcgtcga cgtttaaacc 10920

atcatctaag ggcctcaaaa ctacctcgga actgctgcgc tgatctggac accacagagg 10980

ttccgagcac tttaggttgc accaaatgtc ccaccaggtg caggcagaaa acgctggaac 11040

agcgtgtaca gtttgtctta acaaaaagtg agggcgctga ggtcgagcag ggtggtgtga 11100

cttgttatag cctttagagc tgcgaaagcg cgtatggatt tggctcatca ggccagattg 11160

agggtctgtg gacacatgtc atgttagtgt acttcaatcg ccccctggat atagccccga 11220

caataggccg tggcctcatt tttttgcctt ccgcacattt ccattgctcg gtacccacac 11280

cttgcttctc ctgcacttgc caaccttaat actggtttac attgaccaac atcttacaag 11340

cggggggctt gtctagggta tatataaaca gtggctctcc caatcggttg ccagtctctt 11400

ttttcctttc tttccccaca gattcgaaat ctaaactaca catcacac 11448

<210> 152

<211> 11448

<212> DNA

<213> 人工序列

<220>

<223> pRF300

<400> 152

catggacaag aaatactcca tcggcctgga cattggaacc aactctgtcg gctgggctgt 60

catcaccgac gagtacaagg tgccctccaa gaaattcaag gtcctcggaa acaccgatcg 120

acactccatc aagaaaaacc tcattggtgc cctgttgttc gattctggcg agactgccga 180

agctaccaga ctcaagcgaa ctgctcggcg acgttacacc cgacggaaga accgaatctg 240

ctacctgcag gagatctttt ccaacgagat ggccaaggtg gacgattcgt tctttcatcg 300

actggaggaa tccttcctcg tcgaggaaga caagaaacac gagcgtcatc ccatctttgg 360

caacattgtg gacgaggttg cttaccacga gaagtatcct accatctacc atctccgaaa 420

gaaactcgtc gattccaccg acaaggcgga tctcagactt atctacctcg ctctggcaca 480

catgatcaag tttcgaggtc atttcctcat cgagggcgat ctcaatcccg acaacagcga 540

tgtggacaag ctgttcattc agctcgttca gacctacaac cagctgttcg aggaaaaccc 600

catcaatgcc tccggagtcg atgcaaaggc catcttgtct gctcgactct cgaagagcag 660

acgactggag aacctcattg cccaacttcc tggcgagaaa aagaacggac tgtttggcaa 720

cctcattgcc ctttctcttg gtctcacacc caacttcaag tccaacttcg atctggcgga 780

ggacgccaag ctccagctgt ccaaggacac ctacgacgat gacctcgaca acctgcttgc 840

acagattggc gatcagtacg ccgacctgtt tctcgctgcc aagaaccttt cggatgctat 900

tctcttgtct gacattctgc gagtcaacac cgagatcaca aaggctcccc tttctgcctc 960

catgatcaag cgatacgacg agcaccatca ggatctcaca ctgctcaagg ctcttgtccg 1020

acagcaactg cccgagaagt acaaggagat ctttttcgat cagtcgaaga acggctacgc 1080

tggatacatc gacggcggag cctctcagga agagttctac aagttcatca agccaattct 1140

cgagaagatg gacggaaccg aggaactgct tgtcaagctc aatcgagagg atctgcttcg 1200

gaagcaacga accttcgaca acggcagcat tcctcatcag atccacctcg gtgagctgca 1260

cgccattctt cgacgtcagg aagacttcta cccctttctc aaggacaacc gagagaagat 1320

cgagaagatt cttacctttc gaatccccta ctatgttggt cctcttgcca gaggaaactc 1380

tcgatttgct tggatgactc gaaagtccga ggaaaccatc actccctgga acttcgagga 1440

agtcgtggac aagggtgcct ctgcacagtc cttcatcgag cgaatgacca acttcgacaa 1500

gaatctgccc aacgagaagg ttcttcccaa gcattcgctg ctctacgagt actttacagt 1560

ctacaacgaa ctcaccaaag tcaagtacgt taccgaggga atgcgaaagc ctgccttctt 1620

gtctggcgaa cagaagaaag ccattgtcga tctcctgttc aagaccaacc gaaaggtcac 1680

tgttaagcag ctcaaggagg actacttcaa gaaaatcgag tgtttcgaca gcgtcgagat 1740

ttccggagtt gaggaccgat tcaacgcctc tttgggcacc tatcacgatc tgctcaagat 1800

tatcaaggac aaggattttc tcgacaacga ggaaaacgag gacattctgg aggacatcgt 1860

gctcactctt accctgttcg aagatcggga gatgatcgag gaacgactca agacatacgc 1920

tcacctgttc gacgacaagg tcatgaaaca actcaagcga cgtagataca ccggctgggg 1980

aagactttcg cgaaagctca tcaacggcat cagagacaag cagtccggaa agaccattct 2040

ggactttctc aagtccgatg gctttgccaa ccgaaacttc atgcagctca ttcacgacga 2100

ttctcttacc ttcaaggagg acatccagaa ggcacaagtg tccggtcagg gcgacagctt 2160

gcacgaacat attgccaacc tggctggttc gccagccatc aagaaaggca ttctccagac 2220

tgtcaaggtt gtcgacgagc tggtgaaggt catgggacgt cacaagcccg agaacattgt 2280

gatcgagatg gccagagaga accagacaac tcaaaagggt cagaaaaact cgcgagagcg 2340

gatgaagcga atcgaggaag gcatcaagga gctgggatcc cagattctca aggagcatcc 2400

cgtcgagaac actcaactgc agaacgagaa gctgtatctc tactatctgc agaatggtcg 2460

agacatgtac gtggatcagg aactggacat caatcgtctc agcgactacg atgtggacca 2520

cattgtccct caatcctttc tcaaggacga ttctatcgac aacaaggtcc ttacacgatc 2580

cgacaagaac agaggcaagt cggacaacgt tcccagcgaa gaggtggtca aaaagatgaa 2640

gaactactgg cgacagctgc tcaacgccaa gctcattacc cagcgaaagt tcgacaatct 2700

taccaaggcc gagcgaggcg gtctgtccga gctcgacaag gctggcttca tcaagcgtca 2760

actcgtcgag accagacaga tcacaaagca cgtcgcacag attctcgatt ctcggatgaa 2820

caccaagtac gacgagaacg acaagctcat ccgagaggtc aaggtgatta ctctcaagtc 2880

caaactggtc tccgatttcc gaaaggactt tcagttctac aaggtgcgag agatcaacaa 2940

ttaccaccat gcccacgatg cttacctcaa cgccgtcgtt ggcactgcgc tcatcaagaa 3000

ataccccaag ctcgaaagcg agttcgttta cggcgattac aaggtctacg acgttcgaaa 3060

gatgattgcc aagtccgaac aggagattgg caaggctact gccaagtact tcttttactc 3120

caacatcatg aactttttca agaccgagat caccttggcc aacggagaga ttcgaaagag 3180

accacttatc gagaccaacg gcgaaactgg agagatcgtg tgggacaagg gtcgagactt 3240

tgcaaccgtg cgaaaggttc tgtcgatgcc tcaggtcaac atcgtcaaga aaaccgaggt 3300

tcagactggc ggattctcca aggagtcgat tctgcccaag cgaaactccg acaagctcat 3360

cgctcgaaag aaagactggg atcccaagaa atacggtggc ttcgattctc ctaccgtcgc 3420

ctattccgtg cttgtcgttg cgaaggtcga gaagggcaag tccaaaaagc tcaagtccgt 3480

caaggagctg ctcggaatta ccatcatgga gcgatcgagc ttcgagaaga atcccatcga 3540

cttcttggaa gccaagggtt acaaggaggt caagaaagac ctcattatca agctgcccaa 3600

gtactctctg ttcgaactgg agaacggtcg aaagcgtatg ctcgcctccg ctggcgagct 3660

gcagaaggga aacgagcttg ccttgccttc gaagtacgtc aactttctct atctggcttc 3720

tcactacgag aagctcaagg gttctcccga ggacaacgaa cagaagcaac tcttcgttga 3780

gcagcacaaa cattacctcg acgagattat cgagcagatt tccgagtttt cgaagcgagt 3840

catcctggct gatgccaact tggacaaggt gctctctgcc tacaacaagc atcgggacaa 3900

acccattcga gaacaggcgg agaacatcat tcacctgttt actcttacca acctgggtgc 3960

tcctgcagct ttcaagtact tcgataccac tatcgaccga aagcggtaca catccaccaa 4020

ggaggttctc gatgccaccc tgattcacca gtccatcact ggcctgtacg agacccgaat 4080

cgacctgtct cagcttggtg gcgactccag agccgatccc aagaaaaagc gaaaggtcta 4140

agcggccgca agtgtggatg gggaagtgag tgcccggttc tgtgtgcaca attggcaatc 4200

caagatggat ggattcaaca cagggatata gcgagctacg tggtggtgcg aggatatagc 4260

aacggatatt tatgtttgac acttgagaat gtacgataca agcactgtcc aagtacaata 4320

ctaaacatac tgtacatact catactcgta cccgggcaac ggtttcactt gagtgcagtg 4380

gctagtgctc ttactcgtac agtgtgcaat actgcgtatc atagtctttg atgtatatcg 4440

tattcattca tgttagttgc gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4500

aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4560

acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4620

ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4680

gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4740

caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 4800

tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 4860

gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 4920

ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 4980

cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 5040

tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 5100

tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 5160

cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 5220

agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 5280

agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5340

gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5400

aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5460

ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5520

gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5580

taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5640

tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5700

tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 5760

gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 5820

gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 5880

ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 5940

cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 6000

tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 6060

cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 6120

agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 6180

cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 6240

aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6300

aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6360

gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6420

gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6480

tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6540

ttccccgaaa agtgccacct gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6600

tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 6660

tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6720

tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 6780

gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 6840

agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 6900

cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 6960

agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttcca 7020

ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7080

acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 7140

ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact cactataggg 7200

cgaattgggt accgggcccc ccctcgaggt cgatggtgtc gataagcttg atatcgaatt 7260

catgtcacac aaaccgatct tcgcctcaag gaaacctaat tctacatccg agagactgcc 7320

gagatccagt ctacactgat taattttcgg gccaataatt taaaaaaatc gtgttatata 7380

atattatatg tattatatat atacatcatg atgatactga cagtcatgtc ccattgctaa 7440

atagacagac tccatctgcc gcctccaact gatgttctca atatttaagg ggtcatctcg 7500

cattgtttaa taataaacag actccatcta ccgcctccaa atgatgttct caaaatatat 7560

tgtatgaact tatttttatt acttagtatt attagacaac ttacttgctt tatgaaaaac 7620

acttcctatt taggaaacaa tttataatgg cagttcgttc atttaacaat ttatgtagaa 7680

taaatgttat aaatgcgtat gggaaatctt aaatatggat agcataaatg atatctgcat 7740

tgcctaattc gaaatcaaca gcaacgaaaa aaatcccttg tacaacataa atagtcatcg 7800

agaaatatca actatcaaag aacagctatt cacacgttac tattgagatt attattggac 7860

gagaatcaca cactcaactg tctttctctc ttctagaaat acaggtacaa gtatgtacta 7920

ttctcattgt tcatacttct agtcatttca tcccacatat tccttggatt tctctccaat 7980

gaatgacatt ctatcttgca aattcaacaa ttataataag atataccaaa gtagcggtat 8040

agtggcaatc aaaaagcttc tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc 8100

attaaaggta tatatttatt tcttgttata taatcctttt gtttattaca tgggctggat 8160

acataaaggt attttgattt aattttttgc ttaaattcaa tcccccctcg ttcagtgtca 8220

actgtaatgg taggaaatta ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa 8280

aatcgtattt ccaggttaga cgttccgcag aatctagaat gcggtatgcg gtacattgtt 8340

cttcgaacgt aaaagttgcg ctccctgaga tattgtacat ttttgctttt acaagtacaa 8400

gtacatcgta caactatgta ctactgttga tgcatccaca acagtttgtt ttgttttttt 8460

ttgttttttt tttttctaat gattcattac cgctatgtat acctacttgt acttgtagta 8520

agccgggtta ttggcgttca attaatcata gacttatgaa tctgcacggt gtgcgctgcg 8580

agttactttt agcttatgca tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa 8640

cggatgctca atcgatcgcc agcaacgcgg ccttagacat aaaaaacaaa aaaaaaaagc 8700

accgactcgg tgccactttt tcaagttgat aacggactag ccttatttta acttgctatt 8760

tctagctcta aaaccgaagc tgaaggtgac caaggacgag cttactcgtt tcgtcctcac 8820

ggactcatca gcctggttac gcatggttga tgtgtgttta attcaagaat gaatatagag 8880

aagagaagaa gaaaaaagat tcaattgagc cggcgatgca gacccttata taaatgttgc 8940

cttggacaga cggagcaagc ccgcccaaac ctacgttcgg tataatatgt taagcttttt 9000

aacacaaagg tttggcttgg ggtaacctga tgtggtgcaa aagaccgggc gttggcgagc 9060

cattgcgcgg gcgaatgggg tcgtgactcg tctcaaattc gagggcgtgc ctcaattcgt 9120

gcccccgtgg ctttttcccg ccgtttccgc cccgtttgca ccactgcagc cgcttctttg 9180

gttcggacac cttgctgcga gctaggtgcc ttgtgctact taaaaagtgg cctcccaaca 9240

ccaacatgac atgagtgcgt gggccaagac acgttggcgg ggtcgcagtc ggctcaatgg 9300

cccggaaaaa acgctgctgg agctggttcg gacgcagtcc gccgcggcgt atggatatcc 9360

gcaaggttcc atagcgccat tgccctccgt cggcgtctat cccgcaacct taattaagtc 9420

atacacaagt cagctttctt cgagcctcat ataagtataa gtagttcaac gtattagcac 9480

tgtacccagc atctccgtat cgagaaacac aacaacatgc cccattggac agatcatgcg 9540

gatacacagg ttgtgcagta tcatacatac tcgatcagac aggtcgtctg accatcatac 9600

aagctgaaca agcgctccat acttgcacgc tctctatata cacagttaaa ttacatatcc 9660

atagtctaac ctctaacagt taatcttctg gtaagcctcc cagccagcct tctggtatcg 9720

cttggcctcc tcaataggat ctcggttctg gccgtacaga cctcggccga caattatgat 9780

atccgttccg gtagacatga catcctcaac agttcggtac tgctgtccga gagcgtctcc 9840

cttgtcgtca agacccaccc cgggggtcag aataagccag tcctcagagt cgcccttagg 9900

tcggttctgg gcaatgaagc caaccacaaa ctcggggtcg gatcgggcaa gctcaatggt 9960

ctgcttggag tactcgccag tggccagaga gcccttgcaa gacagctcgg ccagcatgag 10020

cagacctctg gccagcttct cgttgggaga ggggactagg aactccttgt actgggagtt 10080

ctcgtagtca gagacgtcct ccttcttctg ttcagagaca gtttcctcgg caccagctcg 10140

caggccagca atgattccgg ttccgggtac accgtgggcg ttggtgatat cggaccactc 10200

ggcgattcgg tgacaccggt actggtgctt gacagtgttg ccaatatctg cgaactttct 10260

gtcctcgaac aggaagaaac cgtgcttaag agcaagttcc ttgaggggga gcacagtgcc 10320

ggcgtaggtg aagtcgtcaa tgatgtcgat atgggttttg atcatgcaca cataaggtcc 10380

gaccttatcg gcaagctcaa tgagctcctt ggtggtggta acatccagag aagcacacag 10440

gttggttttc ttggctgcca cgagcttgag cactcgagcg gcaaaggcgg acttgtggac 10500

gttagctcga gcttcgtagg agggcatttt ggtggtgaag aggagactga aataaattta 10560

gtctgcagaa ctttttatcg gaaccttatc tggggcagtg aagtatatgt tatggtaata 10620

gttacgagtt agttgaactt atagatagac tggactatac ggctatcggt ccaaattaga 10680

aagaacgtca atggctctct gggcgtcgcc tttgccgaca aaaatgtgat catgatgaaa 10740

gccagcaatg acgttgcagc tgatattgtt gtcggccaac cgcgccgaaa acgcagctgt 10800

cagacccaca gcctccaacg aagaatgtat cgtcaaagtg atccaagcac actcatagtt 10860

ggagtcgtac tccaaaggcg gcaatgacga gtcagacaga tactcgtcga cgtttaaacc 10920

atcatctaag ggcctcaaaa ctacctcgga actgctgcgc tgatctggac accacagagg 10980

ttccgagcac tttaggttgc accaaatgtc ccaccaggtg caggcagaaa acgctggaac 11040

agcgtgtaca gtttgtctta acaaaaagtg agggcgctga ggtcgagcag ggtggtgtga 11100

cttgttatag cctttagagc tgcgaaagcg cgtatggatt tggctcatca ggccagattg 11160

agggtctgtg gacacatgtc atgttagtgt acttcaatcg ccccctggat atagccccga 11220

caataggccg tggcctcatt tttttgcctt ccgcacattt ccattgctcg gtacccacac 11280

cttgcttctc ctgcacttgc caaccttaat actggtttac attgaccaac atcttacaag 11340

cggggggctt gtctagggta tatataaaca gtggctctcc caatcggttg ccagtctctt 11400

ttttcctttc tttccccaca gattcgaaat ctaaactaca catcacac 11448

<210> 153

<211> 11448

<212> DNA

<213> 人工序列

<220>

<223> pRF339

<400> 153

catggacaag aaatactcca tcggcctggc cattggaacc aactctgtcg gctgggctgt 60

catcaccgac gagtacaagg tgccctccaa gaaattcaag gtcctcggaa acaccgatcg 120

acactccatc aagaaaaacc tcattggtgc cctgttgttc gattctggcg agactgccga 180

agctaccaga ctcaagcgaa ctgctcggcg acgttacacc cgacggaaga accgaatctg 240

ctacctgcag gagatctttt ccaacgagat ggccaaggtg gacgattcgt tctttcatcg 300

actggaggaa tccttcctcg tcgaggaaga caagaaacac gagcgtcatc ccatctttgg 360

caacattgtg gacgaggttg cttaccacga gaagtatcct accatctacc acctgcgaaa 420

gaaactcgtc gattccaccg acaaggcgga tctcagactt atctacctcg ctctggcaca 480

catgatcaag tttcgaggtc atttcctcat cgagggcgat ctcaatcccg acaacagcga 540

tgtggacaag ctgttcattc agctcgttca gacctacaac cagctgttcg aggaaaaccc 600

catcaatgcc tccggagtcg atgcaaaggc catcttgtct gctcgactct cgaagagcag 660

acgactggag aacctcattg cccaacttcc tggcgagaaa aagaacggac tgtttggcaa 720

cctcattgcc ctttctcttg gtctcacacc caacttcaag tccaacttcg atctggcgga 780

ggacgccaag ctccagctgt ccaaggacac ctacgacgat gacctcgaca acctgcttgc 840

acagattggc gatcagtacg ccgacctgtt tctcgctgcc aagaaccttt cggatgctat 900

tctcttgtct gacattctgc gagtcaacac cgagatcaca aaggctcccc tttctgcctc 960

catgatcaag cgatacgacg agcaccatca ggatctcaca ctgctcaagg ctcttgtccg 1020

acagcaactg cccgagaagt acaaggagat ctttttcgat cagtcgaaga acggctacgc 1080

tggatacatc gacggcggag cctctcagga agagttctac aagttcatca agccaattct 1140

cgagaagatg gacggaaccg aggaactgct tgtcaagctc aatcgagagg atctgcttcg 1200

gaagcaacga accttcgaca acggcagcat tcctcatcag atccacctcg gtgagctgca 1260

cgccattctt cgacgtcagg aagacttcta cccctttctc aaggacaacc gagagaagat 1320

cgagaagatt cttacctttc gaatccccta ctatgttggt cctcttgcca gaggaaactc 1380

tcgatttgct tggatgactc gaaagtccga ggaaaccatc actccctgga acttcgagga 1440

agtcgtggac aagggtgcct ctgcacagtc cttcatcgag cgaatgacca acttcgacaa 1500

gaatctgccc aacgagaagg ttcttcccaa gcattcgctg ctctacgagt actttacagt 1560

ctacaacgaa ctcaccaaag tcaagtacgt taccgaggga atgcgaaagc ctgccttctt 1620

gtctggcgaa cagaagaaag ccattgtcga tctcctgttc aagaccaacc gaaaggtcac 1680

tgttaagcag ctcaaggagg actacttcaa gaaaatcgag tgtttcgaca gcgtcgagat 1740

ttccggagtt gaggaccgat tcaacgcctc tttgggcacc tatcacgatc tgctcaagat 1800

tatcaaggac aaggattttc tcgacaacga ggaaaacgag gacattctgg aggacatcgt 1860

gctcactctt accctgttcg aagatcggga gatgatcgag gaacgactca agacatacgc 1920

tcacctgttc gacgacaagg tcatgaaaca actcaagcga cgtagataca ccggctgggg 1980

aagactttcg cgaaagctca tcaacggcat cagagacaag cagtccggaa agaccattct 2040

ggactttctc aagtccgatg gctttgccaa ccgaaacttc atgcagctca ttcacgacga 2100

ttctcttacc ttcaaggagg acatccagaa ggcacaagtg tccggtcagg gcgacagctt 2160

gcacgaacat attgccaacc tggctggttc gccagccatc aagaaaggca ttctccagac 2220

tgtcaaggtt gtcgacgagc tggtgaaggt catgggacgt cacaagcccg agaacattgt 2280

gatcgagatg gccagagaga accagacaac tcaaaagggt cagaaaaact cgcgagagcg 2340

gatgaagcga atcgaggaag gcatcaagga gctgggatcc cagattctca aggagcatcc 2400

cgtcgagaac actcaactgc agaacgagaa gctgtatctc tactatctgc agaatggtcg 2460

agacatgtac gtggatcagg aactggacat caatcgtctc agcgactacg atgtggacgc 2520

cattgtccct caatcctttc tcaaggacga ttctatcgac aacaaggtcc ttacacgatc 2580

cgacaagaac agaggcaagt cggacaacgt tcccagcgaa gaggtggtca aaaagatgaa 2640

gaactactgg cgacagctgc tcaacgccaa gctcattacc cagcgaaagt tcgacaatct 2700

taccaaggcc gagcgaggcg gtctgtccga gctcgacaag gctggcttca tcaagcgtca 2760

actcgtcgag accagacaga tcacaaagca cgtcgcacag attctcgatt ctcggatgaa 2820

caccaagtac gacgagaacg acaagctcat ccgagaggtc aaggtgatta ctctcaagtc 2880

caaactggtc tccgatttcc gaaaggactt tcagttctac aaggtgcgag agatcaacaa 2940

ttaccaccat gcccacgatg cttacctcaa cgccgtcgtt ggcactgcgc tcatcaagaa 3000

ataccccaag ctcgaaagcg agttcgttta cggcgattac aaggtctacg acgttcgaaa 3060

gatgattgcc aagtccgaac aggagattgg caaggctact gccaagtact tcttttactc 3120

caacatcatg aactttttca agaccgagat caccttggcc aacggagaga ttcgaaagag 3180

accacttatc gagaccaacg gcgaaactgg agagatcgtg tgggacaagg gtcgagactt 3240

tgcaaccgtg cgaaaggttc tgtcgatgcc tcaggtcaac atcgtcaaga aaaccgaggt 3300

tcagactggc ggattctcca aggagtcgat tctgcccaag cgaaactccg acaagctcat 3360

cgctcgaaag aaagactggg atcccaagaa atacggtggc ttcgattctc ctaccgtcgc 3420

ctattccgtg cttgtcgttg cgaaggtcga gaagggcaag tccaaaaagc tcaagtccgt 3480

caaggagctg ctcggaatta ccatcatgga gcgatcgagc ttcgagaaga atcccatcga 3540

cttcttggaa gccaagggtt acaaggaggt caagaaagac ctcattatca agctgcccaa 3600

gtactctctg ttcgaactgg agaacggtcg aaagcgtatg ctcgcctccg ctggcgagct 3660

gcagaaggga aacgagcttg ccttgccttc gaagtacgtc aactttctct atctggcttc 3720

tcactacgag aagctcaagg gttctcccga ggacaacgaa cagaagcaac tcttcgttga 3780

gcagcacaaa cattacctcg acgagattat cgagcagatt tccgagtttt cgaagcgagt 3840

catcctggct gatgccaact tggacaaggt gctctctgcc tacaacaagc atcgggacaa 3900

acccattcga gaacaggcgg agaacatcat tcacctgttt actcttacca acctgggtgc 3960

tcctgcagct ttcaagtact tcgataccac tatcgaccga aagcggtaca catccaccaa 4020

ggaggttctc gatgccaccc tgattcacca gtccatcact ggcctgtacg agacccgaat 4080

cgacctgtct cagcttggtg gcgactccag agccgatccc aagaaaaagc gaaaggtcta 4140

agcggccgca agtgtggatg gggaagtgag tgcccggttc tgtgtgcaca attggcaatc 4200

caagatggat ggattcaaca cagggatata gcgagctacg tggtggtgcg aggatatagc 4260

aacggatatt tatgtttgac acttgagaat gtacgataca agcactgtcc aagtacaata 4320

ctaaacatac tgtacatact catactcgta cccgggcaac ggtttcactt gagtgcagtg 4380

gctagtgctc ttactcgtac agtgtgcaat actgcgtatc atagtctttg atgtatatcg 4440

tattcattca tgttagttgc gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4500

aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4560

acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4620

ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4680

gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4740

caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 4800

tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 4860

gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 4920

ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 4980

cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 5040

tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 5100

tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 5160

cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 5220

agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 5280

agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5340

gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5400

aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5460

ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5520

gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5580

taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5640

tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5700

tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 5760

gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 5820

gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 5880

ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 5940

cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 6000

tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 6060

cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 6120

agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 6180

cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 6240

aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6300

aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6360

gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6420

gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6480

tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6540

ttccccgaaa agtgccacct gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6600

tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 6660

tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6720

tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 6780

gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 6840

agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 6900

cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 6960

agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttcca 7020

ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7080

acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 7140

ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact cactataggg 7200

cgaattgggt accgggcccc ccctcgaggt cgatggtgtc gataagcttg atatcgaatt 7260

catgtcacac aaaccgatct tcgcctcaag gaaacctaat tctacatccg agagactgcc 7320

gagatccagt ctacactgat taattttcgg gccaataatt taaaaaaatc gtgttatata 7380

atattatatg tattatatat atacatcatg atgatactga cagtcatgtc ccattgctaa 7440

atagacagac tccatctgcc gcctccaact gatgttctca atatttaagg ggtcatctcg 7500

cattgtttaa taataaacag actccatcta ccgcctccaa atgatgttct caaaatatat 7560

tgtatgaact tatttttatt acttagtatt attagacaac ttacttgctt tatgaaaaac 7620

acttcctatt taggaaacaa tttataatgg cagttcgttc atttaacaat ttatgtagaa 7680

taaatgttat aaatgcgtat gggaaatctt aaatatggat agcataaatg atatctgcat 7740

tgcctaattc gaaatcaaca gcaacgaaaa aaatcccttg tacaacataa atagtcatcg 7800

agaaatatca actatcaaag aacagctatt cacacgttac tattgagatt attattggac 7860

gagaatcaca cactcaactg tctttctctc ttctagaaat acaggtacaa gtatgtacta 7920

ttctcattgt tcatacttct agtcatttca tcccacatat tccttggatt tctctccaat 7980

gaatgacatt ctatcttgca aattcaacaa ttataataag atataccaaa gtagcggtat 8040

agtggcaatc aaaaagcttc tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc 8100

attaaaggta tatatttatt tcttgttata taatcctttt gtttattaca tgggctggat 8160

acataaaggt attttgattt aattttttgc ttaaattcaa tcccccctcg ttcagtgtca 8220

actgtaatgg taggaaatta ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa 8280

aatcgtattt ccaggttaga cgttccgcag aatctagaat gcggtatgcg gtacattgtt 8340

cttcgaacgt aaaagttgcg ctccctgaga tattgtacat ttttgctttt acaagtacaa 8400

gtacatcgta caactatgta ctactgttga tgcatccaca acagtttgtt ttgttttttt 8460

ttgttttttt tttttctaat gattcattac cgctatgtat acctacttgt acttgtagta 8520

agccgggtta ttggcgttca attaatcata gacttatgaa tctgcacggt gtgcgctgcg 8580

agttactttt agcttatgca tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa 8640

cggatgctca atcgatcgcc agcaacgcgg ccttagacat aaaaaacaaa aaaaaaaagc 8700

accgactcgg tgccactttt tcaagttgat aacggactag ccttatttta acttgctatt 8760

tctagctcta aaactagaac cgtactgaaa ctgagacgag cttactcgtt tcgtcctcac 8820

ggactcatca gtcagtttac gcatggttga tgtgtgttta attcaagaat gaatatagag 8880

aagagaagaa gaaaaaagat tcaattgagc cggcgatgca gacccttata taaatgttgc 8940

cttggacaga cggagcaagc ccgcccaaac ctacgttcgg tataatatgt taagcttttt 9000

aacacaaagg tttggcttgg ggtaacctga tgtggtgcaa aagaccgggc gttggcgagc 9060

cattgcgcgg gcgaatgggg tcgtgactcg tctcaaattc gagggcgtgc ctcaattcgt 9120

gcccccgtgg ctttttcccg ccgtttccgc cccgtttgca ccactgcagc cgcttctttg 9180

gttcggacac cttgctgcga gctaggtgcc ttgtgctact taaaaagtgg cctcccaaca 9240

ccaacatgac atgagtgcgt gggccaagac acgttggcgg ggtcgcagtc ggctcaatgg 9300

cccggaaaaa acgctgctgg agctggttcg gacgcagtcc gccgcggcgt atggatatcc 9360

gcaaggttcc atagcgccat tgccctccgt cggcgtctat cccgcaacct taattaagtc 9420

atacacaagt cagctttctt cgagcctcat ataagtataa gtagttcaac gtattagcac 9480

tgtacccagc atctccgtat cgagaaacac aacaacatgc cccattggac agatcatgcg 9540

gatacacagg ttgtgcagta tcatacatac tcgatcagac aggtcgtctg accatcatac 9600

aagctgaaca agcgctccat acttgcacgc tctctatata cacagttaaa ttacatatcc 9660

atagtctaac ctctaacagt taatcttctg gtaagcctcc cagccagcct tctggtatcg 9720

cttggcctcc tcaataggat ctcggttctg gccgtacaga cctcggccga caattatgat 9780

atccgttccg gtagacatga catcctcaac agttcggtac tgctgtccga gagcgtctcc 9840

cttgtcgtca agacccaccc cgggggtcag aataagccag tcctcagagt cgcccttagg 9900

tcggttctgg gcaatgaagc caaccacaaa ctcggggtcg gatcgggcaa gctcaatggt 9960

ctgcttggag tactcgccag tggccagaga gcccttgcaa gacagctcgg ccagcatgag 10020

cagacctctg gccagcttct cgttgggaga ggggactagg aactccttgt actgggagtt 10080

ctcgtagtca gagacgtcct ccttcttctg ttcagagaca gtttcctcgg caccagctcg 10140

caggccagca atgattccgg ttccgggtac accgtgggcg ttggtgatat cggaccactc 10200

ggcgattcgg tgacaccggt actggtgctt gacagtgttg ccaatatctg cgaactttct 10260

gtcctcgaac aggaagaaac cgtgcttaag agcaagttcc ttgaggggga gcacagtgcc 10320

ggcgtaggtg aagtcgtcaa tgatgtcgat atgggttttg atcatgcaca cataaggtcc 10380

gaccttatcg gcaagctcaa tgagctcctt ggtggtggta acatccagag aagcacacag 10440

gttggttttc ttggctgcca cgagcttgag cactcgagcg gcaaaggcgg acttgtggac 10500

gttagctcga gcttcgtagg agggcatttt ggtggtgaag aggagactga aataaattta 10560

gtctgcagaa ctttttatcg gaaccttatc tggggcagtg aagtatatgt tatggtaata 10620

gttacgagtt agttgaactt atagatagac tggactatac ggctatcggt ccaaattaga 10680

aagaacgtca atggctctct gggcgtcgcc tttgccgaca aaaatgtgat catgatgaaa 10740

gccagcaatg acgttgcagc tgatattgtt gtcggccaac cgcgccgaaa acgcagctgt 10800

cagacccaca gcctccaacg aagaatgtat cgtcaaagtg atccaagcac actcatagtt 10860

ggagtcgtac tccaaaggcg gcaatgacga gtcagacaga tactcgtcga cgtttaaacc 10920

atcatctaag ggcctcaaaa ctacctcgga actgctgcgc tgatctggac accacagagg 10980

ttccgagcac tttaggttgc accaaatgtc ccaccaggtg caggcagaaa acgctggaac 11040

agcgtgtaca gtttgtctta acaaaaagtg agggcgctga ggtcgagcag ggtggtgtga 11100

cttgttatag cctttagagc tgcgaaagcg cgtatggatt tggctcatca ggccagattg 11160

agggtctgtg gacacatgtc atgttagtgt acttcaatcg ccccctggat atagccccga 11220

caataggccg tggcctcatt tttttgcctt ccgcacattt ccattgctcg gtacccacac 11280

cttgcttctc ctgcacttgc caaccttaat actggtttac attgaccaac atcttacaag 11340

cggggggctt gtctagggta tatataaaca gtggctctcc caatcggttg ccagtctctt 11400

ttttcctttc tttccccaca gattcgaaat ctaaactaca catcacac 11448

<210> 154

<211> 11448

<212> DNA

<213> 人工序列

<220>

<223> pRF341

<400> 154

catggacaag aaatactcca tcggcctggc cattggaacc aactctgtcg gctgggctgt 60

catcaccgac gagtacaagg tgccctccaa gaaattcaag gtcctcggaa acaccgatcg 120

acactccatc aagaaaaacc tcattggtgc cctgttgttc gattctggcg agactgccga 180

agctaccaga ctcaagcgaa ctgctcggcg acgttacacc cgacggaaga accgaatctg 240

ctacctgcag gagatctttt ccaacgagat ggccaaggtg gacgattcgt tctttcatcg 300

actggaggaa tccttcctcg tcgaggaaga caagaaacac gagcgtcatc ccatctttgg 360

caacattgtg gacgaggttg cttaccacga gaagtatcct accatctacc acctgcgaaa 420

gaaactcgtc gattccaccg acaaggcgga tctcagactt atctacctcg ctctggcaca 480

catgatcaag tttcgaggtc atttcctcat cgagggcgat ctcaatcccg acaacagcga 540

tgtggacaag ctgttcattc agctcgttca gacctacaac cagctgttcg aggaaaaccc 600

catcaatgcc tccggagtcg atgcaaaggc catcttgtct gctcgactct cgaagagcag 660

acgactggag aacctcattg cccaacttcc tggcgagaaa aagaacggac tgtttggcaa 720

cctcattgcc ctttctcttg gtctcacacc caacttcaag tccaacttcg atctggcgga 780

ggacgccaag ctccagctgt ccaaggacac ctacgacgat gacctcgaca acctgcttgc 840

acagattggc gatcagtacg ccgacctgtt tctcgctgcc aagaaccttt cggatgctat 900

tctcttgtct gacattctgc gagtcaacac cgagatcaca aaggctcccc tttctgcctc 960

catgatcaag cgatacgacg agcaccatca ggatctcaca ctgctcaagg ctcttgtccg 1020

acagcaactg cccgagaagt acaaggagat ctttttcgat cagtcgaaga acggctacgc 1080

tggatacatc gacggcggag cctctcagga agagttctac aagttcatca agccaattct 1140

cgagaagatg gacggaaccg aggaactgct tgtcaagctc aatcgagagg atctgcttcg 1200

gaagcaacga accttcgaca acggcagcat tcctcatcag atccacctcg gtgagctgca 1260

cgccattctt cgacgtcagg aagacttcta cccctttctc aaggacaacc gagagaagat 1320

cgagaagatt cttacctttc gaatccccta ctatgttggt cctcttgcca gaggaaactc 1380

tcgatttgct tggatgactc gaaagtccga ggaaaccatc actccctgga acttcgagga 1440

agtcgtggac aagggtgcct ctgcacagtc cttcatcgag cgaatgacca acttcgacaa 1500

gaatctgccc aacgagaagg ttcttcccaa gcattcgctg ctctacgagt actttacagt 1560

ctacaacgaa ctcaccaaag tcaagtacgt taccgaggga atgcgaaagc ctgccttctt 1620

gtctggcgaa cagaagaaag ccattgtcga tctcctgttc aagaccaacc gaaaggtcac 1680

tgttaagcag ctcaaggagg actacttcaa gaaaatcgag tgtttcgaca gcgtcgagat 1740

ttccggagtt gaggaccgat tcaacgcctc tttgggcacc tatcacgatc tgctcaagat 1800

tatcaaggac aaggattttc tcgacaacga ggaaaacgag gacattctgg aggacatcgt 1860

gctcactctt accctgttcg aagatcggga gatgatcgag gaacgactca agacatacgc 1920

tcacctgttc gacgacaagg tcatgaaaca actcaagcga cgtagataca ccggctgggg 1980

aagactttcg cgaaagctca tcaacggcat cagagacaag cagtccggaa agaccattct 2040

ggactttctc aagtccgatg gctttgccaa ccgaaacttc atgcagctca ttcacgacga 2100

ttctcttacc ttcaaggagg acatccagaa ggcacaagtg tccggtcagg gcgacagctt 2160

gcacgaacat attgccaacc tggctggttc gccagccatc aagaaaggca ttctccagac 2220

tgtcaaggtt gtcgacgagc tggtgaaggt catgggacgt cacaagcccg agaacattgt 2280

gatcgagatg gccagagaga accagacaac tcaaaagggt cagaaaaact cgcgagagcg 2340

gatgaagcga atcgaggaag gcatcaagga gctgggatcc cagattctca aggagcatcc 2400

cgtcgagaac actcaactgc agaacgagaa gctgtatctc tactatctgc agaatggtcg 2460

agacatgtac gtggatcagg aactggacat caatcgtctc agcgactacg atgtggacgc 2520

cattgtccct caatcctttc tcaaggacga ttctatcgac aacaaggtcc ttacacgatc 2580

cgacaagaac agaggcaagt cggacaacgt tcccagcgaa gaggtggtca aaaagatgaa 2640

gaactactgg cgacagctgc tcaacgccaa gctcattacc cagcgaaagt tcgacaatct 2700

taccaaggcc gagcgaggcg gtctgtccga gctcgacaag gctggcttca tcaagcgtca 2760

actcgtcgag accagacaga tcacaaagca cgtcgcacag attctcgatt ctcggatgaa 2820

caccaagtac gacgagaacg acaagctcat ccgagaggtc aaggtgatta ctctcaagtc 2880

caaactggtc tccgatttcc gaaaggactt tcagttctac aaggtgcgag agatcaacaa 2940

ttaccaccat gcccacgatg cttacctcaa cgccgtcgtt ggcactgcgc tcatcaagaa 3000

ataccccaag ctcgaaagcg agttcgttta cggcgattac aaggtctacg acgttcgaaa 3060

gatgattgcc aagtccgaac aggagattgg caaggctact gccaagtact tcttttactc 3120

caacatcatg aactttttca agaccgagat caccttggcc aacggagaga ttcgaaagag 3180

accacttatc gagaccaacg gcgaaactgg agagatcgtg tgggacaagg gtcgagactt 3240

tgcaaccgtg cgaaaggttc tgtcgatgcc tcaggtcaac atcgtcaaga aaaccgaggt 3300

tcagactggc ggattctcca aggagtcgat tctgcccaag cgaaactccg acaagctcat 3360

cgctcgaaag aaagactggg atcccaagaa atacggtggc ttcgattctc ctaccgtcgc 3420

ctattccgtg cttgtcgttg cgaaggtcga gaagggcaag tccaaaaagc tcaagtccgt 3480

caaggagctg ctcggaatta ccatcatgga gcgatcgagc ttcgagaaga atcccatcga 3540

cttcttggaa gccaagggtt acaaggaggt caagaaagac ctcattatca agctgcccaa 3600

gtactctctg ttcgaactgg agaacggtcg aaagcgtatg ctcgcctccg ctggcgagct 3660

gcagaaggga aacgagcttg ccttgccttc gaagtacgtc aactttctct atctggcttc 3720

tcactacgag aagctcaagg gttctcccga ggacaacgaa cagaagcaac tcttcgttga 3780

gcagcacaaa cattacctcg acgagattat cgagcagatt tccgagtttt cgaagcgagt 3840

catcctggct gatgccaact tggacaaggt gctctctgcc tacaacaagc atcgggacaa 3900

acccattcga gaacaggcgg agaacatcat tcacctgttt actcttacca acctgggtgc 3960

tcctgcagct ttcaagtact tcgataccac tatcgaccga aagcggtaca catccaccaa 4020

ggaggttctc gatgccaccc tgattcacca gtccatcact ggcctgtacg agacccgaat 4080

cgacctgtct cagcttggtg gcgactccag agccgatccc aagaaaaagc gaaaggtcta 4140

agcggccgca agtgtggatg gggaagtgag tgcccggttc tgtgtgcaca attggcaatc 4200

caagatggat ggattcaaca cagggatata gcgagctacg tggtggtgcg aggatatagc 4260

aacggatatt tatgtttgac acttgagaat gtacgataca agcactgtcc aagtacaata 4320

ctaaacatac tgtacatact catactcgta cccgggcaac ggtttcactt gagtgcagtg 4380

gctagtgctc ttactcgtac agtgtgcaat actgcgtatc atagtctttg atgtatatcg 4440

tattcattca tgttagttgc gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4500

aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4560

acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4620

ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4680

gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4740

caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 4800

tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 4860

gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 4920

ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 4980

cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 5040

tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 5100

tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 5160

cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 5220

agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 5280

agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5340

gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5400

aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5460

ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5520

gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5580

taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5640

tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5700

tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 5760

gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 5820

gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 5880

ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 5940

cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 6000

tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 6060

cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 6120

agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 6180

cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 6240

aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6300

aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6360

gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6420

gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6480

tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6540

ttccccgaaa agtgccacct gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6600

tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 6660

tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6720

tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 6780

gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 6840

agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 6900

cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 6960

agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttcca 7020

ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7080

acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 7140

ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact cactataggg 7200

cgaattgggt accgggcccc ccctcgaggt cgatggtgtc gataagcttg atatcgaatt 7260

catgtcacac aaaccgatct tcgcctcaag gaaacctaat tctacatccg agagactgcc 7320

gagatccagt ctacactgat taattttcgg gccaataatt taaaaaaatc gtgttatata 7380

atattatatg tattatatat atacatcatg atgatactga cagtcatgtc ccattgctaa 7440

atagacagac tccatctgcc gcctccaact gatgttctca atatttaagg ggtcatctcg 7500

cattgtttaa taataaacag actccatcta ccgcctccaa atgatgttct caaaatatat 7560

tgtatgaact tatttttatt acttagtatt attagacaac ttacttgctt tatgaaaaac 7620

acttcctatt taggaaacaa tttataatgg cagttcgttc atttaacaat ttatgtagaa 7680

taaatgttat aaatgcgtat gggaaatctt aaatatggat agcataaatg atatctgcat 7740

tgcctaattc gaaatcaaca gcaacgaaaa aaatcccttg tacaacataa atagtcatcg 7800

agaaatatca actatcaaag aacagctatt cacacgttac tattgagatt attattggac 7860

gagaatcaca cactcaactg tctttctctc ttctagaaat acaggtacaa gtatgtacta 7920

ttctcattgt tcatacttct agtcatttca tcccacatat tccttggatt tctctccaat 7980

gaatgacatt ctatcttgca aattcaacaa ttataataag atataccaaa gtagcggtat 8040

agtggcaatc aaaaagcttc tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc 8100

attaaaggta tatatttatt tcttgttata taatcctttt gtttattaca tgggctggat 8160

acataaaggt attttgattt aattttttgc ttaaattcaa tcccccctcg ttcagtgtca 8220

actgtaatgg taggaaatta ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa 8280

aatcgtattt ccaggttaga cgttccgcag aatctagaat gcggtatgcg gtacattgtt 8340

cttcgaacgt aaaagttgcg ctccctgaga tattgtacat ttttgctttt acaagtacaa 8400

gtacatcgta caactatgta ctactgttga tgcatccaca acagtttgtt ttgttttttt 8460

ttgttttttt tttttctaat gattcattac cgctatgtat acctacttgt acttgtagta 8520

agccgggtta ttggcgttca attaatcata gacttatgaa tctgcacggt gtgcgctgcg 8580

agttactttt agcttatgca tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa 8640

cggatgctca atcgatcgcc agcaacgcgg ccttagacat aaaaaacaaa aaaaaaaagc 8700

accgactcgg tgccactttt tcaagttgat aacggactag ccttatttta acttgctatt 8760

tctagctcta aaacgagtaa cggtaacgac accggacgag cttactcgtt tcgtcctcac 8820

ggactcatca gcggtgttac gcatggttga tgtgtgttta attcaagaat gaatatagag 8880

aagagaagaa gaaaaaagat tcaattgagc cggcgatgca gacccttata taaatgttgc 8940

cttggacaga cggagcaagc ccgcccaaac ctacgttcgg tataatatgt taagcttttt 9000

aacacaaagg tttggcttgg ggtaacctga tgtggtgcaa aagaccgggc gttggcgagc 9060

cattgcgcgg gcgaatgggg tcgtgactcg tctcaaattc gagggcgtgc ctcaattcgt 9120

gcccccgtgg ctttttcccg ccgtttccgc cccgtttgca ccactgcagc cgcttctttg 9180

gttcggacac cttgctgcga gctaggtgcc ttgtgctact taaaaagtgg cctcccaaca 9240

ccaacatgac atgagtgcgt gggccaagac acgttggcgg ggtcgcagtc ggctcaatgg 9300

cccggaaaaa acgctgctgg agctggttcg gacgcagtcc gccgcggcgt atggatatcc 9360

gcaaggttcc atagcgccat tgccctccgt cggcgtctat cccgcaacct taattaagtc 9420

atacacaagt cagctttctt cgagcctcat ataagtataa gtagttcaac gtattagcac 9480

tgtacccagc atctccgtat cgagaaacac aacaacatgc cccattggac agatcatgcg 9540

gatacacagg ttgtgcagta tcatacatac tcgatcagac aggtcgtctg accatcatac 9600

aagctgaaca agcgctccat acttgcacgc tctctatata cacagttaaa ttacatatcc 9660

atagtctaac ctctaacagt taatcttctg gtaagcctcc cagccagcct tctggtatcg 9720

cttggcctcc tcaataggat ctcggttctg gccgtacaga cctcggccga caattatgat 9780

atccgttccg gtagacatga catcctcaac agttcggtac tgctgtccga gagcgtctcc 9840

cttgtcgtca agacccaccc cgggggtcag aataagccag tcctcagagt cgcccttagg 9900

tcggttctgg gcaatgaagc caaccacaaa ctcggggtcg gatcgggcaa gctcaatggt 9960

ctgcttggag tactcgccag tggccagaga gcccttgcaa gacagctcgg ccagcatgag 10020

cagacctctg gccagcttct cgttgggaga ggggactagg aactccttgt actgggagtt 10080

ctcgtagtca gagacgtcct ccttcttctg ttcagagaca gtttcctcgg caccagctcg 10140

caggccagca atgattccgg ttccgggtac accgtgggcg ttggtgatat cggaccactc 10200

ggcgattcgg tgacaccggt actggtgctt gacagtgttg ccaatatctg cgaactttct 10260

gtcctcgaac aggaagaaac cgtgcttaag agcaagttcc ttgaggggga gcacagtgcc 10320

ggcgtaggtg aagtcgtcaa tgatgtcgat atgggttttg atcatgcaca cataaggtcc 10380

gaccttatcg gcaagctcaa tgagctcctt ggtggtggta acatccagag aagcacacag 10440

gttggttttc ttggctgcca cgagcttgag cactcgagcg gcaaaggcgg acttgtggac 10500

gttagctcga gcttcgtagg agggcatttt ggtggtgaag aggagactga aataaattta 10560

gtctgcagaa ctttttatcg gaaccttatc tggggcagtg aagtatatgt tatggtaata 10620

gttacgagtt agttgaactt atagatagac tggactatac ggctatcggt ccaaattaga 10680

aagaacgtca atggctctct gggcgtcgcc tttgccgaca aaaatgtgat catgatgaaa 10740

gccagcaatg acgttgcagc tgatattgtt gtcggccaac cgcgccgaaa acgcagctgt 10800

cagacccaca gcctccaacg aagaatgtat cgtcaaagtg atccaagcac actcatagtt 10860

ggagtcgtac tccaaaggcg gcaatgacga gtcagacaga tactcgtcga cgtttaaacc 10920

atcatctaag ggcctcaaaa ctacctcgga actgctgcgc tgatctggac accacagagg 10980

ttccgagcac tttaggttgc accaaatgtc ccaccaggtg caggcagaaa acgctggaac 11040

agcgtgtaca gtttgtctta acaaaaagtg agggcgctga ggtcgagcag ggtggtgtga 11100

cttgttatag cctttagagc tgcgaaagcg cgtatggatt tggctcatca ggccagattg 11160

agggtctgtg gacacatgtc atgttagtgt acttcaatcg ccccctggat atagccccga 11220

caataggccg tggcctcatt tttttgcctt ccgcacattt ccattgctcg gtacccacac 11280

cttgcttctc ctgcacttgc caaccttaat actggtttac attgaccaac atcttacaag 11340

cggggggctt gtctagggta tatataaaca gtggctctcc caatcggttg ccagtctctt 11400

ttttcctttc tttccccaca gattcgaaat ctaaactaca catcacac 11448

<210> 155

<211> 11448

<212> DNA

<213> 人工序列

<220>

<223> pRF343

<400> 155

catggacaag aaatactcca tcggcctggc cattggaacc aactctgtcg gctgggctgt 60

catcaccgac gagtacaagg tgccctccaa gaaattcaag gtcctcggaa acaccgatcg 120

acactccatc aagaaaaacc tcattggtgc cctgttgttc gattctggcg agactgccga 180

agctaccaga ctcaagcgaa ctgctcggcg acgttacacc cgacggaaga accgaatctg 240

ctacctgcag gagatctttt ccaacgagat ggccaaggtg gacgattcgt tctttcatcg 300

actggaggaa tccttcctcg tcgaggaaga caagaaacac gagcgtcatc ccatctttgg 360

caacattgtg gacgaggttg cttaccacga gaagtatcct accatctacc acctgcgaaa 420

gaaactcgtc gattccaccg acaaggcgga tctcagactt atctacctcg ctctggcaca 480

catgatcaag tttcgaggtc atttcctcat cgagggcgat ctcaatcccg acaacagcga 540

tgtggacaag ctgttcattc agctcgttca gacctacaac cagctgttcg aggaaaaccc 600

catcaatgcc tccggagtcg atgcaaaggc catcttgtct gctcgactct cgaagagcag 660

acgactggag aacctcattg cccaacttcc tggcgagaaa aagaacggac tgtttggcaa 720

cctcattgcc ctttctcttg gtctcacacc caacttcaag tccaacttcg atctggcgga 780

ggacgccaag ctccagctgt ccaaggacac ctacgacgat gacctcgaca acctgcttgc 840

acagattggc gatcagtacg ccgacctgtt tctcgctgcc aagaaccttt cggatgctat 900

tctcttgtct gacattctgc gagtcaacac cgagatcaca aaggctcccc tttctgcctc 960

catgatcaag cgatacgacg agcaccatca ggatctcaca ctgctcaagg ctcttgtccg 1020

acagcaactg cccgagaagt acaaggagat ctttttcgat cagtcgaaga acggctacgc 1080

tggatacatc gacggcggag cctctcagga agagttctac aagttcatca agccaattct 1140

cgagaagatg gacggaaccg aggaactgct tgtcaagctc aatcgagagg atctgcttcg 1200

gaagcaacga accttcgaca acggcagcat tcctcatcag atccacctcg gtgagctgca 1260

cgccattctt cgacgtcagg aagacttcta cccctttctc aaggacaacc gagagaagat 1320

cgagaagatt cttacctttc gaatccccta ctatgttggt cctcttgcca gaggaaactc 1380

tcgatttgct tggatgactc gaaagtccga ggaaaccatc actccctgga acttcgagga 1440

agtcgtggac aagggtgcct ctgcacagtc cttcatcgag cgaatgacca acttcgacaa 1500

gaatctgccc aacgagaagg ttcttcccaa gcattcgctg ctctacgagt actttacagt 1560

ctacaacgaa ctcaccaaag tcaagtacgt taccgaggga atgcgaaagc ctgccttctt 1620

gtctggcgaa cagaagaaag ccattgtcga tctcctgttc aagaccaacc gaaaggtcac 1680

tgttaagcag ctcaaggagg actacttcaa gaaaatcgag tgtttcgaca gcgtcgagat 1740

ttccggagtt gaggaccgat tcaacgcctc tttgggcacc tatcacgatc tgctcaagat 1800

tatcaaggac aaggattttc tcgacaacga ggaaaacgag gacattctgg aggacatcgt 1860

gctcactctt accctgttcg aagatcggga gatgatcgag gaacgactca agacatacgc 1920

tcacctgttc gacgacaagg tcatgaaaca actcaagcga cgtagataca ccggctgggg 1980

aagactttcg cgaaagctca tcaacggcat cagagacaag cagtccggaa agaccattct 2040

ggactttctc aagtccgatg gctttgccaa ccgaaacttc atgcagctca ttcacgacga 2100

ttctcttacc ttcaaggagg acatccagaa ggcacaagtg tccggtcagg gcgacagctt 2160

gcacgaacat attgccaacc tggctggttc gccagccatc aagaaaggca ttctccagac 2220

tgtcaaggtt gtcgacgagc tggtgaaggt catgggacgt cacaagcccg agaacattgt 2280

gatcgagatg gccagagaga accagacaac tcaaaagggt cagaaaaact cgcgagagcg 2340

gatgaagcga atcgaggaag gcatcaagga gctgggatcc cagattctca aggagcatcc 2400

cgtcgagaac actcaactgc agaacgagaa gctgtatctc tactatctgc agaatggtcg 2460

agacatgtac gtggatcagg aactggacat caatcgtctc agcgactacg atgtggacgc 2520

cattgtccct caatcctttc tcaaggacga ttctatcgac aacaaggtcc ttacacgatc 2580

cgacaagaac agaggcaagt cggacaacgt tcccagcgaa gaggtggtca aaaagatgaa 2640

gaactactgg cgacagctgc tcaacgccaa gctcattacc cagcgaaagt tcgacaatct 2700

taccaaggcc gagcgaggcg gtctgtccga gctcgacaag gctggcttca tcaagcgtca 2760

actcgtcgag accagacaga tcacaaagca cgtcgcacag attctcgatt ctcggatgaa 2820

caccaagtac gacgagaacg acaagctcat ccgagaggtc aaggtgatta ctctcaagtc 2880

caaactggtc tccgatttcc gaaaggactt tcagttctac aaggtgcgag agatcaacaa 2940

ttaccaccat gcccacgatg cttacctcaa cgccgtcgtt ggcactgcgc tcatcaagaa 3000

ataccccaag ctcgaaagcg agttcgttta cggcgattac aaggtctacg acgttcgaaa 3060

gatgattgcc aagtccgaac aggagattgg caaggctact gccaagtact tcttttactc 3120

caacatcatg aactttttca agaccgagat caccttggcc aacggagaga ttcgaaagag 3180

accacttatc gagaccaacg gcgaaactgg agagatcgtg tgggacaagg gtcgagactt 3240

tgcaaccgtg cgaaaggttc tgtcgatgcc tcaggtcaac atcgtcaaga aaaccgaggt 3300

tcagactggc ggattctcca aggagtcgat tctgcccaag cgaaactccg acaagctcat 3360

cgctcgaaag aaagactggg atcccaagaa atacggtggc ttcgattctc ctaccgtcgc 3420

ctattccgtg cttgtcgttg cgaaggtcga gaagggcaag tccaaaaagc tcaagtccgt 3480

caaggagctg ctcggaatta ccatcatgga gcgatcgagc ttcgagaaga atcccatcga 3540

cttcttggaa gccaagggtt acaaggaggt caagaaagac ctcattatca agctgcccaa 3600

gtactctctg ttcgaactgg agaacggtcg aaagcgtatg ctcgcctccg ctggcgagct 3660

gcagaaggga aacgagcttg ccttgccttc gaagtacgtc aactttctct atctggcttc 3720

tcactacgag aagctcaagg gttctcccga ggacaacgaa cagaagcaac tcttcgttga 3780

gcagcacaaa cattacctcg acgagattat cgagcagatt tccgagtttt cgaagcgagt 3840

catcctggct gatgccaact tggacaaggt gctctctgcc tacaacaagc atcgggacaa 3900

acccattcga gaacaggcgg agaacatcat tcacctgttt actcttacca acctgggtgc 3960

tcctgcagct ttcaagtact tcgataccac tatcgaccga aagcggtaca catccaccaa 4020

ggaggttctc gatgccaccc tgattcacca gtccatcact ggcctgtacg agacccgaat 4080

cgacctgtct cagcttggtg gcgactccag agccgatccc aagaaaaagc gaaaggtcta 4140

agcggccgca agtgtggatg gggaagtgag tgcccggttc tgtgtgcaca attggcaatc 4200

caagatggat ggattcaaca cagggatata gcgagctacg tggtggtgcg aggatatagc 4260

aacggatatt tatgtttgac acttgagaat gtacgataca agcactgtcc aagtacaata 4320

ctaaacatac tgtacatact catactcgta cccgggcaac ggtttcactt gagtgcagtg 4380

gctagtgctc ttactcgtac agtgtgcaat actgcgtatc atagtctttg atgtatatcg 4440

tattcattca tgttagttgc gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4500

aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4560

acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4620

ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4680

gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4740

caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 4800

tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 4860

gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 4920

ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 4980

cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 5040

tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 5100

tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 5160

cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 5220

agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 5280

agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5340

gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5400

aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5460

ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5520

gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5580

taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5640

tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5700

tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 5760

gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 5820

gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 5880

ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 5940

cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 6000

tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 6060

cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 6120

agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 6180

cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 6240

aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6300

aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6360

gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6420

gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6480

tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6540

ttccccgaaa agtgccacct gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6600

tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 6660

tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6720

tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 6780

gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 6840

agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 6900

cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 6960

agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttcca 7020

ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7080

acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 7140

ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact cactataggg 7200

cgaattgggt accgggcccc ccctcgaggt cgatggtgtc gataagcttg atatcgaatt 7260

catgtcacac aaaccgatct tcgcctcaag gaaacctaat tctacatccg agagactgcc 7320

gagatccagt ctacactgat taattttcgg gccaataatt taaaaaaatc gtgttatata 7380

atattatatg tattatatat atacatcatg atgatactga cagtcatgtc ccattgctaa 7440

atagacagac tccatctgcc gcctccaact gatgttctca atatttaagg ggtcatctcg 7500

cattgtttaa taataaacag actccatcta ccgcctccaa atgatgttct caaaatatat 7560

tgtatgaact tatttttatt acttagtatt attagacaac ttacttgctt tatgaaaaac 7620

acttcctatt taggaaacaa tttataatgg cagttcgttc atttaacaat ttatgtagaa 7680

taaatgttat aaatgcgtat gggaaatctt aaatatggat agcataaatg atatctgcat 7740

tgcctaattc gaaatcaaca gcaacgaaaa aaatcccttg tacaacataa atagtcatcg 7800

agaaatatca actatcaaag aacagctatt cacacgttac tattgagatt attattggac 7860

gagaatcaca cactcaactg tctttctctc ttctagaaat acaggtacaa gtatgtacta 7920

ttctcattgt tcatacttct agtcatttca tcccacatat tccttggatt tctctccaat 7980

gaatgacatt ctatcttgca aattcaacaa ttataataag atataccaaa gtagcggtat 8040

agtggcaatc aaaaagcttc tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc 8100

attaaaggta tatatttatt tcttgttata taatcctttt gtttattaca tgggctggat 8160

acataaaggt attttgattt aattttttgc ttaaattcaa tcccccctcg ttcagtgtca 8220

actgtaatgg taggaaatta ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa 8280

aatcgtattt ccaggttaga cgttccgcag aatctagaat gcggtatgcg gtacattgtt 8340

cttcgaacgt aaaagttgcg ctccctgaga tattgtacat ttttgctttt acaagtacaa 8400

gtacatcgta caactatgta ctactgttga tgcatccaca acagtttgtt ttgttttttt 8460

ttgttttttt tttttctaat gattcattac cgctatgtat acctacttgt acttgtagta 8520

agccgggtta ttggcgttca attaatcata gacttatgaa tctgcacggt gtgcgctgcg 8580

agttactttt agcttatgca tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa 8640

cggatgctca atcgatcgcc agcaacgcgg ccttagacat aaaaaacaaa aaaaaaaagc 8700

accgactcgg tgccactttt tcaagttgat aacggactag ccttatttta acttgctatt 8760

tctagctcta aaaccgaagc tgaaggtgac caaggacgag cttactcgtt tcgtcctcac 8820

ggactcatca gcctggttac gcatggttga tgtgtgttta attcaagaat gaatatagag 8880

aagagaagaa gaaaaaagat tcaattgagc cggcgatgca gacccttata taaatgttgc 8940

cttggacaga cggagcaagc ccgcccaaac ctacgttcgg tataatatgt taagcttttt 9000

aacacaaagg tttggcttgg ggtaacctga tgtggtgcaa aagaccgggc gttggcgagc 9060

cattgcgcgg gcgaatgggg tcgtgactcg tctcaaattc gagggcgtgc ctcaattcgt 9120

gcccccgtgg ctttttcccg ccgtttccgc cccgtttgca ccactgcagc cgcttctttg 9180

gttcggacac cttgctgcga gctaggtgcc ttgtgctact taaaaagtgg cctcccaaca 9240

ccaacatgac atgagtgcgt gggccaagac acgttggcgg ggtcgcagtc ggctcaatgg 9300

cccggaaaaa acgctgctgg agctggttcg gacgcagtcc gccgcggcgt atggatatcc 9360

gcaaggttcc atagcgccat tgccctccgt cggcgtctat cccgcaacct taattaagtc 9420

atacacaagt cagctttctt cgagcctcat ataagtataa gtagttcaac gtattagcac 9480

tgtacccagc atctccgtat cgagaaacac aacaacatgc cccattggac agatcatgcg 9540

gatacacagg ttgtgcagta tcatacatac tcgatcagac aggtcgtctg accatcatac 9600

aagctgaaca agcgctccat acttgcacgc tctctatata cacagttaaa ttacatatcc 9660

atagtctaac ctctaacagt taatcttctg gtaagcctcc cagccagcct tctggtatcg 9720

cttggcctcc tcaataggat ctcggttctg gccgtacaga cctcggccga caattatgat 9780

atccgttccg gtagacatga catcctcaac agttcggtac tgctgtccga gagcgtctcc 9840

cttgtcgtca agacccaccc cgggggtcag aataagccag tcctcagagt cgcccttagg 9900

tcggttctgg gcaatgaagc caaccacaaa ctcggggtcg gatcgggcaa gctcaatggt 9960

ctgcttggag tactcgccag tggccagaga gcccttgcaa gacagctcgg ccagcatgag 10020

cagacctctg gccagcttct cgttgggaga ggggactagg aactccttgt actgggagtt 10080

ctcgtagtca gagacgtcct ccttcttctg ttcagagaca gtttcctcgg caccagctcg 10140

caggccagca atgattccgg ttccgggtac accgtgggcg ttggtgatat cggaccactc 10200

ggcgattcgg tgacaccggt actggtgctt gacagtgttg ccaatatctg cgaactttct 10260

gtcctcgaac aggaagaaac cgtgcttaag agcaagttcc ttgaggggga gcacagtgcc 10320

ggcgtaggtg aagtcgtcaa tgatgtcgat atgggttttg atcatgcaca cataaggtcc 10380

gaccttatcg gcaagctcaa tgagctcctt ggtggtggta acatccagag aagcacacag 10440

gttggttttc ttggctgcca cgagcttgag cactcgagcg gcaaaggcgg acttgtggac 10500

gttagctcga gcttcgtagg agggcatttt ggtggtgaag aggagactga aataaattta 10560

gtctgcagaa ctttttatcg gaaccttatc tggggcagtg aagtatatgt tatggtaata 10620

gttacgagtt agttgaactt atagatagac tggactatac ggctatcggt ccaaattaga 10680

aagaacgtca atggctctct gggcgtcgcc tttgccgaca aaaatgtgat catgatgaaa 10740

gccagcaatg acgttgcagc tgatattgtt gtcggccaac cgcgccgaaa acgcagctgt 10800

cagacccaca gcctccaacg aagaatgtat cgtcaaagtg atccaagcac actcatagtt 10860

ggagtcgtac tccaaaggcg gcaatgacga gtcagacaga tactcgtcga cgtttaaacc 10920

atcatctaag ggcctcaaaa ctacctcgga actgctgcgc tgatctggac accacagagg 10980

ttccgagcac tttaggttgc accaaatgtc ccaccaggtg caggcagaaa acgctggaac 11040

agcgtgtaca gtttgtctta acaaaaagtg agggcgctga ggtcgagcag ggtggtgtga 11100

cttgttatag cctttagagc tgcgaaagcg cgtatggatt tggctcatca ggccagattg 11160

agggtctgtg gacacatgtc atgttagtgt acttcaatcg ccccctggat atagccccga 11220

caataggccg tggcctcatt tttttgcctt ccgcacattt ccattgctcg gtacccacac 11280

cttgcttctc ctgcacttgc caaccttaat actggtttac attgaccaac atcttacaag 11340

cggggggctt gtctagggta tatataaaca gtggctctcc caatcggttg ccagtctctt 11400

ttttcctttc tttccccaca gattcgaaat ctaaactaca catcacac 11448

<210> 156

<211> 3901

<212> DNA

<213> 人工序列

<220>

<223> pRF80

<400> 156

agcttgctac gttaggagaa gacgcacggc gatgatacgg gtacccctca tgacatcaat 60

atccgctgcc cctcttgcca gcaaggcgtc agcaggtgct tttttcgcta ttttcaccag 120

accacagcct ttttccttgt gtctcatctt ggattccttc aaaggcaact caccgcacct 180

ccgagtcgtg tgaacaatgt aataataggc tattgacttt tttcccacct gtttagcgcc 240

aaacccaaag cgcttttcgc ccccactgca gcccgatgga aggcacatat ggcaagggaa 300

aagtcttcag gtaatacatg cctgctgcaa ctatatgtac tctgactcat tccctcagac 360

gtgggtcata gacagctgtt ttaaaccggg caaatcaatc tctgtcgcac aggtatttct 420

gcccttcaaa accaggttgc cacatcagat tccatcaaag tttttcagac taacttcaat 480

cttaaacggc atctcacaac aagcgaattg gacggaaaaa aagcgtctat cattaccggc 540

acctatccac actaagacag tactaaagga cgacgctccc cacgaaacga cgtttcgacc 600

ttaacgaccc tgccgtctcc atccatccga ccactcccga cgctctctcc tggagcaaac 660

cactcttacc aagcatatag catatataat aacgtattga atttattaac tgattgaatt 720

gagagtaaag ccagtagcgt tgtacggctg tagcttttta gaaaagtggc agatgagcga 780

tggtggatat gaaagtacct ttacggcatg tagcgacaca agatcgcttc caagaactcg 840

acattcaagc ccagctcgta caagaaaatg aactagccaa tcatatgaac tagcacattg 900

aagtcaccgc atcatctctg ttggaaacga cgcgcatgta ctcgtgcgta gtaaatccgt 960

atctgtacac tcgaaagatt acagtatgta gtagtagcat gactaacgat gtaacgtcca 1020

aataacgctc tgtgcctact cctgtagatg cattagacca cctgctaacg tctacacgtt 1080

atgtccgtta gctccaagat tgcacttttc cctcaaagac tctgctgggt tacgtcatgg 1140

tctctttcgg gtctctggtc cgttctctgc ccgcccatat ccgcccaggc tgctacgata 1200

caggataagc tcataagctt gcatgcctgc aggtcgactc tagaggatcc ccgggtaccg 1260

agctcgaatt cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta tccgctcaca 1320

attccacaca acatacgagc cggaagcata aagtgtaaag cctggggtgc ctaatgagtg 1380

agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg 1440

tgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc 1500

tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 1560

tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 1620

aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 1680

tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 1740

tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 1800

cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 1860

agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 1920

tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 1980

aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 2040

ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 2100

cctaactacg gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt 2160

accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 2220

ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 2280

ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 2340

gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 2400

aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 2460

gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 2520

gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 2580

cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 2640

gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 2700

gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 2760

ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 2820

tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 2880

ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 2940

cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 3000

accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 3060

cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 3120

tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 3180

cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 3240

acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 3300

atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 3360

tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 3420

aaagtgccac ctgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 3480

cgtatcacga ggccctttcg tctcgcgcgt ttcggtgatg acggtgaaaa cctctgacac 3540

atgcagctcc cggagacggt cacagcttgt ctgtaagcgg atgccgggag cagacaagcc 3600

cgtcagggcg cgtcagcggg tgttggcggg tgtcggggct ggcttaacta tgcggcatca 3660

gagcagattg tactgagagt gcaccatatg cggtgtgaaa taccgcacag atgcgtaagg 3720

agaaaatacc gcatcaggcg ccattcgcca ttcaggctgc gcaactgttg ggaagggcga 3780

tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc tgcaaggcga 3840

ttaagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac ggccagtgcc 3900

a 3901

<210> 157

<211> 1215

<212> DNA

<213> 人工序列

<220>

<223> 短Can1缺失编码模板

<400> 157

agcttgctac gttaggagaa gacgcacggc gatgatacgg gtacccctca tgacatcaat 60

atccgctgcc cctcttgcca gcaaggcgtc agcaggtgct tttttcgcta ttttcaccag 120

accacagcct ttttccttgt gtctcatctt ggattccttc aaaggcaact caccgcacct 180

ccgagtcgtg tgaacaatgt aataataggc tattgacttt tttcccacct gtttagcgcc 240

aaacccaaag cgcttttcgc ccccactgca gcccgatgga aggcacatat ggcaagggaa 300

aagtcttcag gtaatacatg cctgctgcaa ctatatgtac tctgactcat tccctcagac 360

gtgggtcata gacagctgtt ttaaaccggg caaatcaatc tctgtcgcac aggtatttct 420

gcccttcaaa accaggttgc cacatcagat tccatcaaag tttttcagac taacttcaat 480

cttaaacggc atctcacaac aagcgaattg gacggaaaaa aagcgtctat cattaccggc 540

acctatccac actaagacag tactaaagga cgacgctccc cacgaaacga cgtttcgacc 600

ttaacgaccc tgccgtctcc atccatccga ccactcccga cgctctctcc tggagcaaac 660

cactcttacc aagcatatag catatataat aacgtattga atttattaac tgattgaatt 720

gagagtaaag ccagtagcgt tgtacggctg tagcttttta gaaaagtggc agatgagcga 780

tggtggatat gaaagtacct ttacggcatg tagcgacaca agatcgcttc caagaactcg 840

acattcaagc ccagctcgta caagaaaatg aactagccaa tcatatgaac tagcacattg 900

aagtcaccgc atcatctctg ttggaaacga cgcgcatgta ctcgtgcgta gtaaatccgt 960

atctgtacac tcgaaagatt acagtatgta gtagtagcat gactaacgat gtaacgtcca 1020

aataacgctc tgtgcctact cctgtagatg cattagacca cctgctaacg tctacacgtt 1080

atgtccgtta gctccaagat tgcacttttc cctcaaagac tctgctgggt tacgtcatgg 1140

tctctttcgg gtctctggtc cgttctctgc ccgcccatat ccgcccaggc tgctacgata 1200

caggataagc tcata 1215

<210> 158

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物80F

<400> 158

agcttgctac gttaggagaa 20

<210> 159

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物80R

<400> 159

tatgagctta tcctgtatcg 20

<210> 160

<211> 2125

<212> DNA

<213> 解脂耶氏酵母

<220>

<221> misc_feature

<222> (1)..(2125)

<223> Can1基因座WT(野生型)

<400> 160

ggaaggcaca tatggcaagg gaaaagtctt caggtaatac atgcctgctg caactatatg 60

tactctgact cattccctca gacgtgggtc atagacagct gttttaaacc gggcaaatca 120

atctctgtcg cacaggtatt tctgcccttc aaaaccaggt tgccacatca gattccatca 180

aagtttttca gactaacttc aatcttaaac ggcatctcac aacaagcgaa ttggacggaa 240

aaaaagcgtc tatcattacc ggcacctatc cacactaaga cagtactaaa ggacgacgct 300

ccccacgaaa cgacgtttcg accttaacga ccctgccgtc tccatccatc cgaccacaat 360

ggaaaagaca ttttcaaacg attacccacc ctccgggact gaggcccaca tccacatcaa 420

ccacacggcc cactcggatg actcagagga ggtgccctcg cacaaggaaa attacaacac 480

cagtggccac gacctggagg agtccgaccc ggataaccat gtcggtgaga ccctcgaggt 540

caagcgaggt ctcaagatgc gacacatctc catgatctcg cttggaggaa ccattggtac 600

cggtctcttc attggtaccg gaggagctct ccagcaggcc ggtccctgtg gcgccctcgt 660

cgcctacgtg ttcatggcca ccattgtcta ctctgttgcc gagtctcttg gagaactggc 720

tacgtacatt cccatcaccg gctcctttgc cgtctttact acccgatatc tgtcacagtc 780

gtttggtgcc tccatgggct ggctatactg gttctcgtgg gcgatcacct tcgccatcga 840

gctcaacacc attggtcccg tgattgagta ctggactgac gccgttccta ctgctgcctg 900

gattgccatc ttcttcgtca tcctcactac catcaacttc ttccccgtgg gcttctatgg 960

cgaagtcgag ttctgggtgg cctccgtgaa ggtcattgcc atcattggat ggctcatcta 1020

cgcgctctgc atgacgtgtg gagcaggtgt aacaggtcct gtgggattca gatactggaa 1080

ccaccccgga cccatgggag acggaatctg gaccgacggc gtgcccattg tgcgaaacgc 1140

gcccggtcga cgattcatgg gatggctcaa ttcgctcgtt aacgccgcct tcacctacca 1200

gggctgtgag ctggtcggag tcactgccgg tgaggcccag aaccccagaa agtccgtccc 1260

tcgagccatc aaccgagtct ttgctcgaat ttgcatcttc tacattggct ctatcttctt 1320

catgggcatg ctcgtgccct ttaacgaccc caagctgacc gatgactcct ccgtcatcgc 1380

ctcctctcct tttgttattg ccattatcaa ctctggcacc aaggtgctcc ctcacatttt 1440

caacgccgtc attctcatca ccctgatttc ggcaggaaac tccaacgtct acattggctc 1500

gcgagtggtc tacgccctgg ctgactccgg aaccgcacca aagttcttca agcgaaccac 1560

caagaaggga gtgccgtacg tggcagtctg cttcacctcg gcgtttggtc tgctggcctt 1620

catgtctgtg tccgagtcgt cgtccactgt cttcgactgg ttcatcaaca tctccgctgt 1680

ggccggcctc atctgttggg ccttcatctc tgcctcccac atccgattca tgcaagtgct 1740

taagcacaga gggatctcca gagatacgct gcccttcaag gcacgatggc agccattcta 1800

ctcatggtac gcgctcgtct ccatcatctt catcactctc atccagggct tcacgtcctt 1860

ctggcacttt accgccgcca agttcatgac tgcatacatc tccgtcattg tctgggtcgg 1920

tttgtacatt atcttccagt gtctgttccg atgcaagttc cttatcccta ttgaggatgt 1980

ggacattgac accggccgac gagagattga cgacgatgtg tgggaggaga agatccccac 2040

aaagtggtac gagaagtttt ggaatattat tgcataagaa gatcggggat tcccgacgct 2100

ctctcctgga gcaaaccact cttac 2125

<210> 161

<211> 392

<212> DNA

<213> 人工序列

<220>

<223> Can1基因座缺失菌株

<400> 161

ggaaggcaca tatggcaagg gaaaagtctt caggtaatac atgcctgctg caactatatg 60

tactctgact cattccctca gacgtgggtc atagacagct gttttaaacc gggcaaatca 120

atctctgtcg cacaggtatt tctgcccttc aaaaccaggt tgccacatca gattccatca 180

aagtttttca gactaacttc aatcttaaac ggcatctcac aacaagcgaa ttggacggaa 240

aaaaagcgtc tatcattacc ggcacctatc cacactaaga cagtactaaa ggacgacgct 300

ccccacgaaa cgacgtttcg accttaacga ccctgccgtc tccatccatc cgaccactcc 360

cgacgctctc tcctggagca aaccactctt ac 392

<210> 162

<211> 73

<212> DNA

<213> 人工序列

<220>

<223> 图13-B的正向寡核苷酸

<400> 162

catgcgtaaa ctgactgatg agtccgtgag gacgaaacga gtaagctcgt cagtttcagt 60

acggttctag ttt 73

<210> 163

<211> 75

<212> DNA

<213> 人工序列

<220>

<223> 图13-B的反向寡核苷酸

<400> 163

tctaaaacta gaaccgtact gaaactgaga cgagcttact cgtttcgtcc tcacggactc 60

atcagtcagt ttacg 75

<210> 164

<211> 211

<212> RNA

<213> 人工序列

<220>

<223> pre-sgRNA URA3.1(RGR-URA3.1)

<400> 164

gaacagcuga ugaguccgug aggacgaaac gaguaagcuc guccuguuca gagacaguuu 60

ccuguuuuag agcuagaaau agcaaguuaa aauaaggcua guccguuauc aacuugaaaa 120

aguggcaccg agucggugcu uuuggccggc auggucccag ccuccucgcu ggcgccggcu 180

gggcaacaug cuucggcaug gcgaauggga c 211

<210> 165

<211> 20

<212> DNA

<213> 解脂耶氏酵母

<400> 165

ctgttcagag acagtttcct 20

<210> 166

<211> 211

<212> RNA

<213> 人工序列

<220>

<223> pre-sgRNA URA3.2 (RGR-URA3.2

<400> 166

auguuacuga ugaguccgug aggacgaaac gaguaagcuc gucuaacauc cagagaagca 60

cacguuuuag agcuagaaau agcaaguuaa aauaaggcua guccguuauc aacuugaaaa 120

aguggcaccg agucggugcu uuuggccggc auggucccag ccuccucgcu ggcgccggcu 180

gggcaacaug cuucggcaug gcgaauggga c 211

<210> 167

<211> 20

<212> DNA

<213> 解脂耶氏酵母

<400> 167

taacatccag agaagcacac 20

<210> 168

<211> 838

<212> DNA

<213> 人工序列

<220>

<223> FBA1L启动子

<400> 168

gtttaaacag tgtacgcagt actatagagg aacaattgcc ccggagaaga cggccaggcc 60

gcctagatga caaattcaac aactcacagc tgactttctg ccattgccac tagggggggg 120

cctttttata tggccaagcc aagctctcca cgtcggttgg gctgcaccca acaataaatg 180

ggtagggttg caccaacaaa gggatgggat ggggggtaga agatacgagg ataacggggc 240

tcaatggcac aaataagaac gaatactgcc attaagactc gtgatccagc gactgacacc 300

attgcatcat ctaagggcct caaaactacc tcggaactgc tgcgctgatc tggacaccac 360

agaggttccg agcactttag gttgcaccaa atgtcccacc aggtgcaggc agaaaacgct 420

ggaacagcgt gtacagtttg tcttaacaaa aagtgagggc gctgaggtcg agcagggtgg 480

tgtgacttgt tatagccttt agagctgcga aagcgcgtat ggatttggct catcaggcca 540

gattgagggt ctgtggacac atgtcatgtt agtgtacttc aatcgccccc tggatatagc 600

cccgacaata ggccgtggcc tcattttttt gccttccgca catttccatt gctcggtacc 660

cacaccttgc ttctcctgca cttgccaacc ttaatactgg tttacattga ccaacatctt 720

acaagcgggg ggcttgtcta gggtatatat aaacagtggc tctcccaatc ggttgccagt 780

ctcttttttc ctttctttcc ccacagattc gaaatctaaa ctacacatca caccatgg 838

<210> 169

<211> 1839

<212> DNA

<213> 人工序列

<220>

<223> 乙酰羟酸合酶基因

<400> 169

atggacgagt ccttcatcgg aatgtctgga ggagagatct tccacgagat gatgctgcga 60

cacaacgtcg acactgtctt cggttacccc ggtggagcca ttctccccgt ctttgacgcc 120

attcacaact ctgaatactt caactttgtg ctccctcgac acgagcaggg tgccggccac 180

atggccgagg gctacgctcg agcctctggt aagcccggtg tcgttctcgt cacctctggc 240

cccggtgcca ccaacgtcat cacccccatg caggacgctc tttccgatgg tacccctatg 300

gttgtcttca ccggtcaggt cctgacctcc gttatcggca ctgacgcctt ccaggaggcc 360

gatgttgtcg gcatctcccg atcttgcacc aagtggaacg tcatggtcaa gaacgttgct 420

gagctccccc gacgaatcaa cgaggccttt gagattgcta cttccggccg acccggtccc 480

gttctcgtcg atctgcccaa ggatgttact gctgccatcc tgcgagagcc catccccacc 540

aagtccacca ttccctcgca ttctctgacc aacctcacct ctgccgccgc caccgagttc 600

cagaagcagg ctatccagcg agccgccaac ctcatcaacc agtccaagaa gcccgtcctt 660

tacgtcggac agggtatcct tggctccgag gagggtccta agctgcttaa ggagctggct 720

gagaaggccg agattcccgt caccactact ctgcagggtc ttggtgcctt tgacgagcga 780

gaccccaagt ctctgcacat gctcggtatg cacggttccg gctacgccaa catggccatg 840

cagaacgctg actgtatcat tgctctcggc gcccgatttg atgaccgagt taccggctcc 900

atccccaagt ttgcccccga ggctcgagcc gctgcccttg agggtcgagg tggtattgtt 960

cactttgaga tccaggccaa gaacatcaac aaggttgttc aggccaccga agccgttgag 1020

ggagacgtta ccgagtctgt ccgacagctc atccccctca tcaacaaggt ctctgccgct 1080

gagcgagctc cctggactga gactatccag tcctggaagc agcagttccc cttcctcttc 1140

gaggctgaag gtgaggatgg tgttatcaag ccccagtccg tcattgctct gctctctgac 1200

ctgacagaga acaacaagga caagaccatc atcaccaccg gtgttggtca gcatcagatg 1260

tggactgccc agcatttccg atggcgacac cctcgaacca tgatcacttc tggtggtctt 1320

ggaactatgg gttacggcct gcccgccgct atcggcgcca aggttgcccg acctgactgc 1380

gacgtcattg acattgatgg tgacgcttct ttcaacatga ctctgaccga gctgtccacc 1440

gccgttcagt tcaacattgg cgtcaaggct attgtcctca acaacgagga acagggtatg 1500

gtcacccagc tgcagtctct cttctacgag aaccgatact gccacactca tcagaagaac 1560

cccgacttca tgaagctggc cgagtcgatg ggcatgaagg gtatccgaat cactcacatt 1620

gaccagctgg aggccggtct caaggagatg ctcgcataca agggccctgt gctcgttgag 1680

gttgttgtcg acaagaagat ccccgttctt cctatggttc ccgctggtaa ggctttgcat 1740

gagttccttg tctacgacgc tgacgccgag gctgcttctc gacccgatcg actgaagaat 1800

gcccccgccc ctcacgtcca ccagaccacc tttgagaac 1839

<210> 170

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> RHO705

<400> 170

gtacagacct cggccgacaa ttatgatatc 30

<210> 171

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> RHO719

<400> 171

gttccgaggt agttttgagg cccttagatg 30

<210> 172

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> RHO733

<400> 172

gttgggagag gggactagga actccttgta 30

<210> 173

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> RHO734

<400> 173

ctacgaagct cgagctaacg tccacaagtc 30

<210> 174

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> RHO707

<400> 174

gtcggtggct acaatacgtg agtcagaagg 30

<210> 175

<211> 53

<212> DNA

<213> 解脂耶氏酵母

<400> 175

cgtcctcctt cttctgttca gagacagttt cctcggcacc agctcgcagg cca 53

<210> 176

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 来自菌落1的质粒URA3的片段

<400> 176

cgtcctcctt cttctgttca gagacagttc ctcggcacca gctcgcaggc ca 52

<210> 177

<211> 51

<212> DNA

<213> 人工序列

<220>

<223> 来自菌落2的质粒URA3的片段

<400> 177

cgtcctcctt cttctgttca gagacagtcc tcggcaccag ctcgcaggcc a 51

<210> 178

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 来自菌落3的质粒URA3的片段

<400> 178

cgtcctcctt cttctgttca gagacagttc ctcggcacca gctcgcaggc ca 52

<210> 179

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 来自菌落5的质粒URA3的片段

<400> 179

cgtcctcctt cttctgttca gagacagttc ctcggcacca gctcgcaggc ca 52

<210> 180

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 来自菌落6的质粒URA3的片段

<400> 180

cgtcctcctt cttctgttca gagacagttc ctcggcacca gctcgcaggc ca 52

<210> 181

<211> 39

<212> DNA

<213> 人工序列

<220>

<223> 来自菌落1的基因组URA3的片段

<220>

<221> misc_feature

<222> (29)..(29)

<223> N是a、c、g、或t

<220>

<221> misc_feature

<222> (32)..(32)

<223> N是a、c、g、或t

<400> 181

cgtcctcctt cttctgttca gagacagtnc cncggcccc 39

<210> 182

<211> 54

<212> DNA

<213> 人工序列

<220>

<223> 来自菌落2的基因组URA3的片段

<400> 182

cgtcctcctt cttctgttca gagacagttt acctcggcac cagctcgcag gcca 54

<210> 183

<211> 44

<212> DNA

<213> 人工序列

<220>

<223> 来自菌落3的基因组URA3的片段

<400> 183

cgtcctcctt cttctgttca gagacagttt cagctcgcag gcca 44

<210> 184

<211> 49

<212> DNA

<213> 人工序列

<220>

<223> 来自菌落5的基因组URA3的片段

<220>

<221> misc_feature

<222> (23)..(23)

<223> N是a、c、g、或t

<220>

<221> misc_feature

<222> (38)..(38)

<223> N是a、c、g、或t

<400> 184

cgtcctcctt cttctgttca ganacagttt ggcaccanct cgcaggcca 49

<210> 185

<211> 54

<212> DNA

<213> 人工序列

<220>

<223> 来自菌落6的基因组URA3的片段

<400> 185

cgtcctcctt cttctgttca gagacagttt ccctcggcac cagctcgcag gcca 54

<210> 186

<211> 1029

<212> DNA

<213> 人工序列

<220>

<223> 潮霉素抗生素抗性选择标记物

<400> 186

atggccaaaa agcctgaact caccgcgacg tctgtcgaga agtttctgat cgaaaagttc 60

gacagcgtct ccgacctgat gcagctctcg gagggcgaag aatctcgtgc tttcagcttc 120

gatgtaggag ggcgtggata tgtcctgcgg gtaaatagct gcgccgatgg tttctacaaa 180

gatcgttatg tttatcggca ctttgcatcg gccgcgctcc cgattccgga agtgcttgac 240

attggggagt tcagcgagag cctgacctat tgcatctccc gccgtgcaca gggtgtcacg 300

ttgcaagacc tgcctgaaac cgaactgccc gctgttctgc agccggtcgc ggaggctatg 360

gatgcgatcg ctgcggccga tcttagccag acgagcgggt tcggcccatt cggaccgcaa 420

ggaatcggtc aatacactac atggcgtgat ttcatatgcg cgattgctga tccccatgtg 480

tatcactggc aaactgtgat ggacgacacc gtcagtgcgt ccgtcgcgca ggctctcgat 540

gagctgatgc tttgggccga ggactgcccc gaagtccggc acctcgtgca cgcggatttc 600

ggctccaaca atgtcctgac ggacaatggc cgcataacag cggtcattga ctggagcgag 660

gcgatgttcg gggattccca atacgaggtc gccaacatct tcttctggag gccgtggttg 720

gcttgtatgg agcagcagac gcgctacttc gagcggaggc atccggagct tgcaggatcg 780

ccgcggctcc gggcgtatat gctccgcatt ggtcttgacc aactctatca gagcttggtt 840

gacggcaatt tcgatgatgc agcttgggcg cagggtcgat gcgacgcaat cgtccgatcc 900

ggagccggga ctgtcgggcg tacacaaatc gcccgcagaa gcgcggccgt ctggaccgat 960

ggctgtgtag aagtactcgc cgatagtgga aaccgacgcc ccagcactcg tccgagggca 1020

aaggaatag 1029

<210> 187

<211> 565

<212> DNA

<213> 人工序列

<220>

<223> TDH1或GPD启动子

<400> 187

ggttgcggga tagacgccga cggagggcaa tggcgctatg gaaccttgcg gatatccata 60

cgccgcggcg gactgcgtcc gaaccagctc cagcagcgtt ttttccgggc cattgagccg 120

actgcgaccc cgccaacgtg tcttggccca cgcactcatg tcatgttggt gttgggaggc 180

cactttttaa gtagcacaag gcacctagct cgcagcaagg tgtccgaacc aaagaagcgg 240

ctgcagtggt gcaaacgggg cggaaacggc gggaaaaagc cacgggggca cgaattgagg 300

cacgccctcg aatttgagac gagtcacggc cccattcgcc cgcgcaatgg ctcgccaacg 360

cccggtcttt tgcaccacat caggttaccc caagccaaac ctttgtgtta aaaagcttaa 420

catattatac cgaacgtagg tttgggcggg cttgctccgt ctgtccaagg caacatttat 480

ataagggtct gcatcgccgg ctcaattgaa tcttttttct tcttctcttc tctatattca 540

ttcttgaatt aaacacacat caacc 565

<210> 188

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> RHO804

<400> 188

gatcaacgta cgagtgtacg cagtactata gaggaacaat tgc 43

<210> 189

<211> 44

<212> DNA

<213> 人工序列

<220>

<223> RHO805

<400> 189

gatcaacgta cgccccaagc ttgtcccatt cgccatgccg aagc 44

<210> 190

<211> 746

<212> DNA

<213> 人工序列

<220>

<223> TDH1启动子-RGR-URA3.3融合体

<400> 190

gatcaacgta cgatacgccg cggcggactg cgtccgaacc agctccagca gcgttttttc 60

cgggccattg agccgactgc gaccccgcca acgtgtcttg gcccacgcac tcatgtcatg 120

ttggtgttgg gaggccactt tttaagtagc acaaggcacc tagctcgcag caaggtgtcc 180

gaaccaaaga agcggctgca gtggtgcaaa cggggcggaa acggcgggaa aaagccacgg 240

gggcacgaat tgaggcacgc cctcgaattt gagacgagtc acggccccat tcgcccgcgc 300

aatggctcgc caacgcccgg tcttttgcac cacatcaggt taccccaagc caaacctttg 360

tgttaaaaag cttaacatat tataccgaac gtaggtttgg gcgggcttgc tccgtctgtc 420

caaggcaaca tttatataag ggtctgcatc gccggctcaa ttgaatcttt tttcttcttc 480

tcttctctat attcattctt gaattaaaca cacatcaaca atgacagttc tgatgagtcc 540

gtgaggacga aacgagtaag ctcgtcaact gttagaggtt agactagttt tagagctaga 600

aatagcaagt taaaataagg ctagtccgtt atcaacttga aaaagtggca ccgagtcggt 660

gcttttggcc ggcatggtcc cagcctcctc gctggcgccg gctgggcaac atgcttcggc 720

atggcgaatg ggaccgtacg agtcag 746

<210> 191

<211> 211

<212> RNA

<213> 人工序列

<220>

<223> pre-sgRNA URA3.3 (RGR-URA3.3)

<400> 191

acaguucuga ugaguccgug aggacgaaac gaguaagcuc gucaacuguu agagguuaga 60

cuaguuuuag agcuagaaau agcaaguuaa aauaaggcua guccguuauc aacuugaaaa 120

aguggcaccg agucggugcu uuuggccggc auggucccag ccuccucgcu ggcgccggcu 180

gggcaacaug cuucggcaug gcgaauggga c 211

<210> 192

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> RHO610

<400> 192

ggcggcttaa ttaagttgcg acacatgtct tgatagtatc ttg 43

<210> 193

<211> 44

<212> DNA

<213> 人工序列

<220>

<223> RHO611

<400> 193

ggcggcttaa ttaacgagta tctgtctgac tcgtcattgc cgcc 44

<210> 194

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> RHO704

<400> 194

catatacttc actgccccag ataaggttcc 30

<210> 195

<211> 39

<212> DNA

<213> 解脂耶氏酵母

<400> 195

aaaccaacct gtgtgcttct ctggatgtta ccaccacca 39

<210> 196

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 来自菌落3的URA3序列的片段

<220>

<221> misc_feature

<222> (17)..(17)

<223> N是a、c、g、或t

<220>

<221> misc_feature

<222> (19)..(23)

<223> N是a、c、g、或t

<400> 196

aaaccaacct gtgttgntnn nnng 24

<210> 197

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 来自菌落4的URA3序列的片段

<220>

<221> misc_feature

<222> (21)..(21)

<223> N是a、c、g、或t

<220>

<221> misc_feature

<222> (24)..(25)

<223> N是a、c、g、或t

<220>

<221> misc_feature

<222> (27)..(29)

<223> N是a、c、g、或t

<400> 197

aaaccaacct gtgtgtttct nggnntnnnc ccccccc 37

<210> 198

<211> 39

<212> DNA

<213> 人工序列

<220>

<223> 来自菌落5的URA3序列的片段

<220>

<221> misc_feature

<222> (38)..(39)

<223> N是a、c、g、或t

<400> 198

aaaccaacct gtgtgtgtct ctggatgtta ccaccacnn 39

<210> 199

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 来自菌落6的URA3序列的片段

<220>

<221> misc_feature

<222> (21)..(22)

<223> N是a、c、g、或t

<220>

<221> misc_feature

<222> (25)..(27)

<223> N是a、c、g、或t

<400> 199

aaaccaacct gtgtgttttc nnggnnnt 28

<210> 200

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> 来自菌落9的URA3序列的片段

<400> 200

aaaccaacct gtgttgcttc tctggatgt 29

<210> 201

<211> 39

<212> DNA

<213> 人工序列

<220>

<223> 来自菌落10的URA3序列的片段

<220>

<221> misc_feature

<222> (14)..(15)

<223> N是a、c、g、或t

<220>

<221> misc_feature

<222> (19)..(22)

<223> N是a、c、g、或t

<220>

<221> misc_feature

<222> (24)..(27)

<223> N是a、c、g、或t

<220>

<221> misc_feature

<222> (29)..(29)

<223> N是a、c、g、或t

<220>

<221> misc_feature

<222> (32)..(32)

<223> N是a、c、g、或t

<220>

<221> misc_feature

<222> (38)..(38)

<223> N是a、c、g、或t

<400> 201

aaaccaacct gtgnnttcnn nngnnnntnc cncccccna 39

<210> 202

<211> 351

<212> DNA

<213> 解脂耶氏酵母

<400> 202

aaaccaacct gtgtgcttct ctggatgtta ccaccaccaa ggagctcatt gagcttgccg 60

ataaggtcgg accttatgtg tgcatgatca agacccatat cgacatcatt gacgacttca 120

cctacgccgg cactgtgctc cccctcaagg agcttgctct taagcacggt ttcttcctgt 180

tcgaggacag aaagttcgca gatattggca acactgtcaa gcaccagtac aagaacggtg 240

tctaccgaat cgccgagtgg tccgatatca ccaacgccca cggtgtaccc ggagccggaa 300

tcattgctgg cctgcgagct ggtgccgagg aaactgtctc tgaacagaag a 351

<210> 203

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> 来自菌落23的URA3序列的片段

<400> 203

aaaccaacct gtgaaactgt ctctgaacag aaga 34

<210> 204

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> 来自菌落24的URA3序列的片段

<400> 204

aaaccaacct gtgaaactgt ctctgaacag aaga 34

<210> 205

<211> 803

<212> DNA

<213> 解脂耶氏酵母

<400> 205

aaaccaacct gtgtgcttct ctggatgtta ccaccaccaa ggagctcatt gagcttgccg 60

ataaggtcgg accttatgtg tgcatgatca agacccatat cgacatcatt gacgacttca 120

cctacgccgg cactgtgctc cccctcaagg agcttgctct taagcacggt ttcttcctgt 180

tcgaggacag aaagttcgca gatattggca acactgtcaa gcaccagtac aagaacggtg 240

tctaccgaat cgccgagtgg tccgatatca ccaacgccca cggtgtaccc ggagccggaa 300

tcattgctgg cctgcgagct ggtgccgagg aaactgtctc tgaacagaag aaggaggacg 360

tctctgacta cgagaactcc cagtacaagg agttcctggt cccctctccc aacgagaagc 420

tggccagagg tctgctcatg ctggccgagc tgtcttgcaa gggctctctg gccactggcg 480

agtactccaa gcagaccatt gagcttgccc gatccgaccc cgagtttgtg gttggcttca 540

ttgcccagaa ccgacctaag ggcgactctg aggactggct tattctgacc cccggggtgg 600

gtcttgacga caagggagac gctctcggac agcagtaccg aactgttgag gatgtcatgt 660

ctaccggaac ggatatcata attgtcggcc gaggtctgta cggccagaac cgagatccta 720

ttgaggaggc caagcgatac cagaaggctg gctgggaggc ttaccagaag attaactgtt 780

agaggttaga ctatggatat gta 803

<210> 206

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> 来自菌落27的URA3序列的片段

<400> 206

aaaccaacct gtgtctatgg atatgta 27

<210> 207

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 来自菌落36的URA3序列的片段

<400> 207

aaaccaacct gtggatatgt a 21

<210> 208

<211> 1346

<212> DNA

<213> 人工序列

<220>

<223> ARS18序列

<400> 208

aattcatgtc acacaaaccg atcttcgcct caaggaaacc taattctaca tccgagagac 60

tgccgagatc cagtctacac tgattaattt tcgggccaat aatttaaaaa aatcgtgtta 120

tataatatta tatgtattat atatatacat catgatgata ctgacagtca tgtcccattg 180

ctaaatagac agactccatc tgccgcctcc aactgatgtt ctcaatattt aaggggtcat 240

ctcgcattgt ttaataataa acagactcca tctaccgcct ccaaatgatg ttctcaaaat 300

atattgtatg aacttatttt tattacttag tattattaga caacttactt gctttatgaa 360

aaacacttcc tatttaggaa acaatttata atggcagttc gttcatttaa caatttatgt 420

agaataaatg ttataaatgc gtatgggaaa tcttaaatat ggatagcata aatgatatct 480

gcattgccta attcgaaatc aacagcaacg aaaaaaatcc cttgtacaac ataaatagtc 540

atcgagaaat atcaactatc aaagaacagc tattcacacg ttactattga gattattatt 600

ggacgagaat cacacactca actgtctttc tctcttctag aaatacaggt acaagtatgt 660

actattctca ttgttcatac ttctagtcat ttcatcccac atattccttg gatttctctc 720

caatgaatga cattctatct tgcaaattca acaattataa taagatatac caaagtagcg 780

gtatagtggc aatcaaaaag cttctctggt gtgcttctcg tatttatttt tattctaatg 840

atccattaaa ggtatatatt tatttcttgt tatataatcc ttttgtttat tacatgggct 900

ggatacataa aggtattttg atttaatttt ttgcttaaat tcaatccccc ctcgttcagt 960

gtcaactgta atggtaggaa attaccatac ttttgaagaa gcaaaaaaaa tgaaagaaaa 1020

aaaaaatcgt atttccaggt tagacgttcc gcagaatcta gaatgcggta tgcggtacat 1080

tgttcttcga acgtaaaagt tgcgctccct gagatattgt acatttttgc ttttacaagt 1140

acaagtacat cgtacaacta tgtactactg ttgatgcatc cacaacagtt tgttttgttt 1200

ttttttgttt tttttttttc taatgattca ttaccgctat gtatacctac ttgtacttgt 1260

agtaagccgg gttattggcg ttcaattaat catagactta tgaatctgca cggtgtgcgc 1320

tgcgagttac ttttagctta tgcatg 1346

<210> 209

<211> 564

<212> DNA

<213> 人工序列

<220>

<223> 经耶氏酵母密码子优化的铜绿假单胞菌Csy4

<400> 209

atggaccact acctggatat cagactccga cccgacccag agttccctcc tgcccagctc 60

atgtccgtct tgtttggcaa gctgcaccaa gctctcgtgg cccagggtgg agaccgaatt 120

ggcgtgtcgt tccccgattt ggacgagtcc cgttctcgac ttggagaaag actccgtatt 180

catgcttctg cagacgatct cagagctctg cttgcccgac cctggctgga gggtctccga 240

gatcatctgc agttcggcga gcctgccgtg gttccccatc ctaccccata ccgacaggtg 300

tctcgggttc aggccaaaag caaccccgag cgactcagac ggcgtcttat gcgaagacac 360

gacctgtccg aggaggaagc ccgaaagcgg atccccgaca ccgttgctcg agcgttggac 420

cttcctttcg tcacactgcg atctcaatcg actggtcagc actttcgact gttcatcaga 480

cacggacccc tgcaggtcac cgcagaggaa ggcggtttta cttgctatgg actgtccaag 540

ggtggctttg tcccctggtt ctaa 564

<210> 210

<211> 530

<212> DNA

<213> 人工序列

<220>

<223> 耶氏酵母FBA1启动子

<400> 210

catcatctaa gggcctcaaa actacctcgg aactgctgcg ctgatctgga caccacagag 60

gttccgagca ctttaggttg caccaaatgt cccaccaggt gcaggcagaa aacgctggaa 120

cagcgtgtac agtttgtctt aacaaaaagt gagggcgctg aggtcgagca gggtggtgtg 180

acttgttata gcctttagag ctgcgaaagc gcgtatggat ttggctcatc aggccagatt 240

gagggtctgt ggacacatgt catgttagtg tacttcaatc gccccctgga tatagccccg 300

acaataggcc gtggcctcat ttttttgcct tccgcacatt tccattgctc ggtacccaca 360

ccttgcttct cctgcacttg ccaaccttaa tactggttta cattgaccaa catcttacaa 420

gcggggggct tgtctagggt atatataaac agtggctctc ccaatcggtt gccagtctct 480

tttttccttt ctttccccac agattcgaaa tctaaactac acatcacacc 530

<210> 211

<211> 659

<212> DNA

<213> 人工序列

<220>

<223> TDH1:28bp-gCAN1-28bp

<400> 211

cggcggactg cgtccgaacc agctccagca gcgttttttc cgggccattg agccgactgc 60

gaccccgcca acgtgtcttg gcccacgcac tcatgtcatg ttggtgttgg gaggccactt 120

tttaagtagc acaaggcacc tagctcgcag caaggtgtcc gaaccaaaga agcggctgca 180

gtggtgcaaa cggggcggaa acggcgggaa aaagccacgg gggcacgaat tgaggcacgc 240

cctcgaattt gagacgagtc acggccccat tcgcccgcgc aatggctcgc caacgcccgg 300

tcttttgcac cacatcaggt taccccaagc caaacctttg tgttaaaaag cttaacatat 360

tataccgaac gtaggtttgg gcgggcttgc tccgtctgtc caaggcaaca tttatataag 420

ggtctgcatc gccggctcaa ttgaatcttt tttcttcttc tcttctctat attcattctt 480

gaattaaaca cacatcaaca atggttcact gccgtatagg cagctaagaa atcaaacgat 540

tacccaccct cgttttagag ctagaaatag caagttaaaa taaggctagt ccgttatcaa 600

cttgaaaaag tggcaccgag tcggtgcttt tgttcactgc cgtataggca gctaagaaa 659

<210> 212

<211> 28

<212> RNA

<213> 铜绿假单胞菌

<400> 212

guucacugcc guauaggcag cuaagaaa 28

<210> 213

<211> 156

<212> RNA

<213> 人工序列

<220>

<223> 与Csy4识别序列侧接的sgRNA

<400> 213

guucacugcc guauaggcag cuaagaaauc aaacgauuac ccacccucgu uuuagagcua 60

gaaauagcaa guuaaaauaa ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg 120

gugcuuuugu ucacugccgu auaggcagcu aagaaa 156

<210> 214

<211> 23

<212> DNA

<213> 解脂耶氏酵母

<400> 214

tcaaacgatt acccaccctc cgg 23

<210> 215

<211> 45

<212> DNA

<213> 解脂耶氏酵母

<400> 215

gaaaagacat tttcaaacga ttacccaccc tccgggactg aggcc 45

<210> 216

<211> 44

<212> DNA

<213> 人工序列

<220>

<223> 来自菌落14的CAN1的片段

<400> 216

gaaaagacat tttcaaacga ttacccacct ccgggactga ggcc 44

<210> 217

<211> 44

<212> DNA

<213> 人工序列

<220>

<223> 来自菌落16的CAN1的片段

<400> 217

gaaaagacat tttcaaacga ttacccacct ccgggactga ggcc 44

<210> 218

<211> 44

<212> DNA

<213> 人工序列

<220>

<223> 来自菌落18的CAN1的片段

<400> 218

gaaaagacat tttcaaacga ttacccacct ccgggactga ggcc 44

<210> 219

<211> 44

<212> DNA

<213> 人工序列

<220>

<223> 来自菌落19的CAN1的片段

<400> 219

gaaaagacat tttcaaacga ttacccacct ccgggactga ggcc 44

<210> 220

<211> 44

<212> DNA

<213> 人工序列

<220>

<223> 来自菌落24的CAN1的片段

<400> 220

gaaaagacat tttcaaacga ttacccacct ccgggactga ggcc 44

<210> 221

<211> 44

<212> DNA

<213> 人工序列

<220>

<223> 来自菌落25的CAN1的片段

<400> 221

gaaaagacat tttcaaacga ttacccacct ccgggactga ggcc 44

<210> 222

<211> 128

<212> RNA

<213> 人工序列

<220>

<223> 由Csy4处理的gRNA

<400> 222

cuaagaaauc aaacgauuac ccacccucgu uuuagagcua gaaauagcaa guuaaaauaa 60

ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg gugcuuuugu ucacugccgu 120

auaggcag 128

<210> 223

<211> 8

<212> RNA

<213> 人工序列

<220>

<223> Csy4切割后的5’旁侧序列

<400> 223

cuaagaaa 8

<210> 224

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> Csy4切割后的3’旁侧序列

<400> 224

guucacugcc guauaggcag 20

使用RNA引导的内切核酸酶在非常规酵母中基因靶向.pdf_第1页
第1页 / 共270页
使用RNA引导的内切核酸酶在非常规酵母中基因靶向.pdf_第2页
第2页 / 共270页
使用RNA引导的内切核酸酶在非常规酵母中基因靶向.pdf_第3页
第3页 / 共270页
点击查看更多>>
资源描述

《使用RNA引导的内切核酸酶在非常规酵母中基因靶向.pdf》由会员分享,可在线阅读,更多相关《使用RNA引导的内切核酸酶在非常规酵母中基因靶向.pdf(270页珍藏版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201580056204.X (22)申请日 2015.07.21 (30)优先权数据 62/036652 2014.08.13 US (85)PCT国际申请进入国家阶段日 2017.04.13 (86)PCT国际申请的申请数据 PCT/US2015/041256 2015.07.21 (87)PCT国际申请的公布数据 WO2016/025131 EN 2016.02.18 (71)申请人 纳幕尔杜邦公司 地址 美国特拉华州 (72)发明人 R.弗里施X.范S-P.洪 (74)专。

2、利代理机构 中国专利代理(香港)有限公 司 72001 代理人 唐华东黄希贵 (51)Int.Cl. C12N 1/19(2006.01) C12N 15/10(2006.01) C12N 15/55(2006.01) C12N 15/113(2010.01) C12N 15/90(2006.01) (54)发明名称 使用RNA引导的内切核酸酶在非常规酵母中 基因靶向 (57)摘要 本文公开了非常规酵母, 其包含至少一种 RNA引导的内切核酸酶(RGEN), 所述RNA引导的内 切核酸酶包含至少一种不具有5 端的RNA组分。 该未封端的RNA组分包含与酵母中的染色体或附 加体中的靶位点序列互补。

3、的序列。 RGEN可结合 到, 并任选地切割靶位点序列处的一个或两个 DNA链。 本文的RGEN的示例是Cas9蛋白质与向导 RNA的复合物。 在某些实施方案中使用核酶以提 供缺乏5 端的RNA组分。 本文还公开了在非常规 酵母中基因靶向的方法。 权利要求书2页 说明书65页 序列表177页 附图25页 CN 107002020 A 2017.08.01 CN 107002020 A 1.一种非常规酵母, 其包含至少一种RNA引导的内切核酸酶(RGEN), 所述RNA引导的内 切核酸酶包含至少一种不具有5 -端的RNA组分, 其中所述RNA组分包含与所述酵母中的染 色体或附加体上的靶位点序列互。

4、补的序列, 其中所述RGEN能够结合到所述靶位点序列。 2.根据权利要求1所述的非常规酵母, 其中所述RGEN能够结合到并切割所述靶位点序 列。 3.根据权利要求1所述的非常规酵母, 其中所述酵母为选自下列的属的成员: 耶氏酵母 属、 毕赤酵母属、 许旺氏酵母属、 克鲁维酵母属、 Arxula属、 丝孢酵母属、 假丝酵母属、 黑粉菌 属、 球拟酵母属、 接合酵母属、 三角酵母属、 隐球酵母属、 红酵母属、 法夫酵母属、 掷孢酵母属 和管囊酵母属。 4.根据权利要求1所述的非常规酵母, 其中所述RGEN包含CRISPR(聚集状规则间隔的短 回文重复序列)-缔合的(Cas)蛋白质-9(Cas9)氨。

5、基酸序列。 5.一种非常规酵母, 其包含Cas内切核酸酶和多核苷酸序列, 所述多核苷酸序列包含可 操作地连接至至少一个核苷酸序列的启动子, 其中所述核苷酸序列包含编码在编码RNA组 分的DNA序列上游的核酶的DNA序列, 其中所述RNA组分包含与所述酵母中的染色体或附加 体上的靶位点序列互补的可变靶向结构域, 其中所述RNA组分和所述Cas内切核酸酶能够形 成RNA-引导的内切核酸酶(RGEN), 其中所述RGEN能够结合到所述靶位点序列。 6.根据权利要求5所述的非常规酵母, 其中所述RGEN能够结合到并切割所述靶位点序 列。 7.根据权利要求5所述的非常规酵母, 其中由所述核苷酸序列转录的。

6、所述RNA自催化地 去除所述核酶以产生所述RNA组分, 其中所述RNA组分不具有5 端。 8.根据权利要求7所述的非常规酵母, 其中所述核酶为锤头核酶、 丁型肝炎病毒核酶、 I 组内含子核酶、 RnaseP核酶、 或发夹型核酶。 9.根据权利要求5所述的非常规酵母, 其中由所述核苷酸序列转录的所述RNA不自催化 地去除所述核酶以产生不具有5 端的核酶-RNA组分融合分子。 10.一种用于修饰非常规酵母中的染色体或附加体上的靶位点的方法, 所述方法包括 向非常规酵母提供第一重组DNA构建体, 所述第一重组DNA构建体包含编码Cas内切核酸酶 的DNA序列, 和第二重组DNA构建体, 所述第二重组。

7、DNA构建体包含编码RNA组分上游的核酶 的DNA序列, 其中由所述第二重组DNA构建体转录的所述RNA自催化地去除所述核酶以产生 所述RNA组分, 其中所述Cas9内切核酸酶在所述靶位点处引入单链或双链断裂。 11.一种用于修饰非常规酵母中的染色体或附加体上的靶位点的方法, 所述方法包括 向非常规酵母提供第一重组DNA构建体, 所述第一重组DNA构建体包含编码Cas内切核酸酶 的DNA序列, 和第二重组DNA构建体, 所述第二重组DNA构建体包含编码核酶-RNA组分融合分 子的DNA序列, 其中所述核酶-RNA组分融合分子和Cas9内切核酸酶能够形成RGEN, 所述RGEN 在所述靶位点处引。

8、入单链或双链断裂。 12.根据权利要求10-11中任一项所述的方法, 所述方法还包括鉴定在所述靶标处具有 修饰的至少一种非常规酵母细胞, 其中所述修饰包括所述靶位点中的一个或多个核苷酸的 至少一个缺失、 添加或替换。 13.根据权利要求10-11中任一项所述的方法, 所述方法还包括向所述酵母提供供体 DNA, 其中所述供体DNA包含目的多核苷酸。 权利要求书 1/2 页 2 CN 107002020 A 2 14.根据权利要求13所述的方法, 所述方法还包括鉴定在其染色体或附加体中包含整 合在所述靶位点处的所述目的多核苷酸的至少一种酵母细胞。 15.一种用于编辑非常规酵母中的染色体或附加体上的。

9、核苷酸序列的方法, 所述方法 包括向非常规酵母提供多核苷酸修饰模板DNA, 第一重组DNA构建体, 所述第一重组DNA构建 体包含编码Cas内切核酸酶的DNA序列, 和第二重组DNA构建体, 所述第二重组DNA构建体包 含编码RNA组分上游的核酶的DNA序列, 其中由所述第二重组DNA构建体转录的所述RNA自催 化地去除所述核酶以产生所述RNA组分, 其中所述Cas9内切核酸酶在所述酵母的所述染色 体或附加体中的靶位点处引入单链或双链断裂, 其中所述多核苷酸修饰模板DNA包含所述 核苷酸序列的至少一个核苷酸修饰。 16.一种用于使非常规酵母中的染色体或附加体上的核苷酸序列沉默的方法, 所述方 。

10、法包括向非常规酵母提供至少第一重组DNA构建体, 所述第一重组DNA构建体包含编码失活 的Cas9内切核酸酶的DNA序列, 和至少第二重组DNA构建体, 所述第二重组DNA构建体包含可 操作地连接至至少一个多核苷酸的启动子, 其中所述至少一个多核苷酸编码核酶-RNA组分 融合分子, 其中所述核酶-RNA组分融合分子和所述失活的Cas9内切核酸酶能够形成RGEN, 所述RGEN结合到所述酵母的所述染色体或附加体中的所述核苷酸序列, 从而阻断所述核苷 酸序列的转录。 17.一种用于生产非常规酵母中的基因修饰用多重向导RNA的高通量方法, 所述方法包 括: a)提供重组DNA构建体, 所述重组DNA。

11、构建体包含以5 至3 的顺序可操作地连接至下列 的启动子: 编码核酶的第一DNA序列、 编码反向选择剂的第二DNA序列、 编码向导RNA的CER结 构域的第三DNA序列和终止子序列; b)向(a)的所述重组DNA构建体提供至少一个寡核苷酸双链体, 其中所述寡核苷酸双链 体源自包含能够编码向导RNA靶序列的可变靶向结构域(VT)的DNA序列的第一单链寡核苷 酸与包含编码所述可变靶向结构域的所述DNA序列的互补序列的第二单链寡核苷酸的组 合; c)将(a)的所述反向选择剂与(b)的所述至少一个寡双链体交换, 从而形成重组DNA构 建体库, 其各自包含能够编码向导RNA的可变靶向结构域的DNA序列;。

12、 以及, d)转录(c)的所述重组DNA构建体库, 从而形成核酶-向导RNA分子库。 18.根据权利要求17所述的方法, 所述方法还包括诱导所述核酶-向导RNA分子库使得 所述分子自催化地去除所述核酶和所述核酶上游的任何RNA序列, 以产生不包含5 端的向 导RNA分子库。 19.根据权利要求17所述的方法, 所述方法还包括诱导所述核酶-向导RNA分子库使得 所述分子切割所述核酶上游的任何RNA序列, 以产生不包含5 端的核酶-gRNA融合分子。 20.一种重组DNA序列, 其包含(i)聚合酶II启动子, 所述聚合酶II启动子可操作地连接 至(ii)编码核酶和向导RNA的核苷酸序列, 其中所述。

13、核酶在所述向导RNA的上游, 其中由 (ii)的所述核苷酸序列转录的RNA自催化地去除所述核酶以产生所述向导RNA, 并且其中所 述向导RNA能够形成RGEN, 所述RGEN能够识别、 结合到和任选地切割非常规酵母的基因组中 的靶位点。 权利要求书 2/2 页 3 CN 107002020 A 3 使用RNA引导的内切核酸酶在非常规酵母中基因靶向 0001 本申请要求2014年8月13日提交的美国临时申请62/036652的权益, 该文献全文以 引用方式并入本文。 技术领域 0002 本发明涉及分子生物学领域。 具体地, 本发明涉及使用RNA引导的内切核酸酶 (RGEN)在非常规酵母中基因靶向。

14、。 0003 以电子方式递交的序列表的引用 0004 通过EFS-Web以电子方式将序列表的正式文本作为ASCII格式的序列表递交, 该文 件名称为 “20150721_CL6272WOPCT_SequenceListing_ST25.txt” , 创建日期为2015年7月21 日, 文件大小为411千字节, 并且该文件与本说明书同时提交。 在这一ASCII格式的文件中包 含的序列表为所述说明书的一部分并且全文以引用方式并入本文。 背景技术 0005 理解基因在生物体内的功能的有效方法是抑制其表达。 基因表达的抑制可例如通 过中断或删除基因的DNA序列, 产生基因的 “敲除” 来实现(Aust。

15、in等人, Nat.Genetics 36: 921-924)。 基因敲除主要通过同源重组(HR)(适用于从细菌到哺乳动物的大量生物体的技 术)来进行。 用于研究基因功能的另一种工具可通过基因 “敲入” , 其也通常由HR来进行。 用 于基因靶向目的的HR(敲除或敲入)可利用外源提供的DNA的存在, 所述DNA具有与靶位点的 同源性。 0006 虽然由HR靶向基因是有效的工具, 但其可能是复杂的劳动密集型程序。 使用HR的 大部分研究通常已经限为敲除路径中的单个基因而不是多个基因, 因为HR通常难以以高性 价比方式放大。 该困难在其中HR不是有效的生物体中加剧。 此类低效率通常迫使实践者依 赖。

16、可选的表型或外源性标记物来帮助鉴定发生期望的HR事件的细胞。 0007 已经示出用于基因靶向的HR在靶向DNA位点包含双链断裂时增强(Rudin等人, Genetics 122: 519-534; Smih等人, Nucl.Acids Res.23: 5012-5019)。 用于引入双链断裂的 策略因此有利于开发HR介导的DNA靶向。 例如, 已将锌指核酸酶工程化来切割特异性DNA位 点, 从而导致当供体DNA存在时在该位点处增强的HR水平(Bibikova等人, Science300: 764; Bibikova等人, Mol.Cell.Biol21: 289-297)。 类似地, 还已经开。

17、发了人造大范围核酸酶(归 位内切核酸酶)和转录激活因子样效应物(TALE)核酸酶用于HR介导的DNA靶向(Epinat等 人, Nucleic Acids Res.31: 2952-2962; Miller等人, Nat.Biotech.29: 143-148)。 0008 编码CRISPR(聚集状规则间隔的短回文重复序列)DNA切割体系的基因座唯一地存 在于约40细菌基因组和大多数古细菌基因组中(Horvath和Barrangou, Science 327: 167-170; Karginov和Hannon, Mol.Cell 37: 7-19)。 具体地讲, 已经开发了II型CRIPSR体。

18、系 的CRISPR缔合的(Cas)RNA引导的内切核酸酶(RGEN), Cas9, 作为引入位点特异性DNA链断裂 的方式(2015年3月19日公布的国专利申请US 2015-0082478 A1和2015年2月26日公布的 US2015-0059010A1, 两者均全文以引用方式并入本文)。 可设计Cas9的RNA组分的序列使得 说明书 1/65 页 4 CN 107002020 A 4 Cas9识别并切割包含下列的DNA: (i)与RNA组分的一部分互补的序列和(ii)前间区序列邻 近基序(PAM)序列。 0009 天然Cas9/RNA复合物包含两个RNA序列, CRISPR RNA(cr。

19、RNA)和反式激活CRISPR RNA(tracrRNA)。 crRNA包含, 在5 -至-3 方向上, 与DNA靶位点互补的独特序列和由CRISPR 基因座(crRNA源自所述基因座)的重复区编码的序列的一部分。 tracrRNA包含, 在5 -至-3 方向上, 与crRNA的重复区退火的序列和包含茎环的部分。 目前的工作已经导致了向导RNA (gRNA)的开发, 所述向导RNA为嵌合序列, 其包含在5 -至-3 方向上连接至tracrRNA的 crRNA(美国临时专利申请61/868,706, 提交于2013年8月22日)。 0010 在真核细胞中表达RNA组分, 诸如gRNA以进行Cas。

20、9介导的DNA靶向的方法已经使用 RNA聚合酶III(Pol III)启动子, 其允许具有预先限定的未修饰的5 -端和3 -端的RNA的转 录(DiCarlo等人, Nucleic Acids Res.41: 4336-4343; Ma等人, Mol.Ther.Nucleic Acids 3: e161)。 该策略已经成功应用于多种不同物种的细胞, 包括玉米和大豆(美国临时专利申 请61/868,706, 2013年8月22日提交), 以及人类、 小鼠、 斑马鱼、 木霉属和酿酒酵母。 0011 然而, 如现在在本专利申请中所公开的, 使用Pol III启动子-转录gRNA在非常规 酵母诸如解脂。

21、耶氏酵母中进行Cas9-介导的DNA靶向已被证明是困难的。 因此, 用于产生 Cas9的RNA组分的其它方式对于在非常规酵母中提供Cas9介导的DNA靶向是有意义的。 发明内容 0012 在一个实施方案中, 本公开涉及一种非常规酵母, 其包含至少一种RNA引导的内切 核酸酶(RGEN), 所述RNA引导的内切核酸酶包含至少一种不具有5 -端的RNA组分, 其中所述 RNA组分包含与酵母中的染色体或附加体上的靶位点序列互补的序列, 其中所述RGEN可结 合到靶位点序列。 RGEN还可结合到并切割靶位点。 0013 在一个实施方案中, 非常规酵母为选自下列属的成员: 耶氏酵母属、 毕赤酵母属、 许。

22、旺氏酵母属、 克鲁维酵母属、 Arxula属、 丝孢酵母属、 假丝酵母属、 黑粉菌属、 球拟酵母属、 接合酵母属、 三角酵母属、 隐球酵母属、 红酵母属、 法夫酵母属、 掷孢酵母属和管囊酵母属。 0014 在一个实施方案中, 所述RGEN包含CRISPR(聚集状规则间隔的短回文重复序列)- 缔合的(Cas)蛋白质-9(Cas9)氨基酸序列。 Cas9蛋白质可以为链球菌Cas9蛋白质, 然而RNA 组分可包含向导RNA(gRNA), 所述向导RNA包含可操作地连接至反式激活CRISPR RNA (tracrRNA)的CRISPR RNA(crRNA)。 PAM(前间区序列邻近基序)序列可邻近靶位。

23、点序列。 RGEN还可结合到并切割靶位点。 由核苷酸序列转录的RNA可自催化地去除核酶以产生所述 RNA组分, 其中所述RNA组分不具有5 端。 所述核酶可包括锤头核酶、 丁型肝炎病毒核酶、 I组 内含子核酶、 RnaseP核酶、 或发夹型核酶。 由核苷酸序列转录的RNA可以为不自催化地去除 核酶从而产生不具有5 端的核酶-RNA组分融合分子的RNA分子。 0015 在一个实施方案中, 本公开涉及一种非常规酵母, 其包含Cas内切核酸酶和多核苷 酸序列, 所述多核苷酸序列包含可操作地连接至至少一个核苷酸序列的启动子, 其中所述 核苷酸序列包含编码在编码RNA组分的DNA序列上游的核酶的DNA序。

24、列, 其中所述RNA组分包 含与酵母中染色体或附加体上的靶位点序列互补的可变靶向结构域, 其中所述RNA组分可 与Cas内切核酸酶形成RNA-引导的内切核酸酶(RGEN), 其中所述RGEN可结合到靶位点序列。 0016 在一个实施方案中, 本文所述的方法包括一种用于修饰非常规酵母中的染色体或 说明书 2/65 页 5 CN 107002020 A 5 附加体上的靶位点的方法, 所述方法包括向非常规酵母提供第一重组DNA构建体, 所述第一 重组DNA构建体包含编码Cas内切核酸酶的DNA序列, 和第二重组DNA构建体, 所述第二重组 DNA构建体包含编码RNA组分上游的核酶的DNA序列, 其中。

25、由第二重组DNA构建体转录的RNA 自催化地去除核酶以产生所述RNA组分, 其中所述Cas9内切核酸酶在所述靶位点处引入单 链或双链断裂。 0017 在一个实施方案中, 本文所述的方法包括一种用于修饰非常规酵母中的染色体或 附加体上的靶位点的方法, 所述方法包括向非常规酵母提供第一重组DNA构建体, 所述第一 重组DNA构建体包含编码Cas内切核酸酶的DNA序列, 和第二重组DNA构建体, 所述第二重组 DNA构建体包含编码核酶-RNA组分融合分子的DNA序列, 其中所述核酶-RNA组分融合分子和 Cas9内切核酸酶可形成RGEN, 所述RGEN在所述靶位点处引入单链或双链断裂。 0018 所。

26、述方法还可包括鉴定在所述靶位点处具有修饰的至少一种非常规酵母细胞, 其 中所述修饰包括所述靶位点中的一个或多个核苷酸的至少一个缺失或替换。 所述方法还可 包括向所述酵母提供供体DNA, 其中所述供体DNA包含目的多核苷酸。 0019 在一个实施方案中, 本文所述的方法包括一种用于编辑非常规酵母中的染色体或 附加体上的核苷酸序列的方法, 所述方法包括向非常规酵母提供多核苷酸修饰模板DNA, 包 含编码Cas内切核酸酶的DNA序列的第一重组DNA构建体, 和包含编码RNA组分上游的核酶的 DNA序列的第二重组DNA构建体, 其中由第二重组DNA构建体转录的RNA自催化地去除核酶以 产生所述RNA组。

27、分, 其中所述Cas9内切核酸酶在所述酵母的染色体或附加体中的所述靶位 点处引入单链或双链断裂, 其中所述多核苷酸修饰模板DNA包含所述核苷酸序列的至少一 个核苷酸修饰。 0020 在一个实施方案中, 本文所述的方法包括一种用于使非常规酵母中的染色体或附 加体上的核苷酸序列沉默的方法, 所述方法包括向非常规酵母提供至少第一重组DNA构建 体, 所述第一重组DNA构建体包含编码失活的Cas9内切核酸酶的DNA序列, 和至少第二重组 DNA构建体, 所述第二重组DNA构建体包含可操作地连接至至少一个多核苷酸的启动子, 其 中所述至少一个多核苷酸编码核酶-RNA组分融合分子, 其中所述核酶-RNA组。

28、分融合分子和 失活的Cas9内切核酸酶可形成RGEN, 所述RGEN结合到所述酵母的染色体或附加体中的所述 核苷酸序列, 从而阻断所述核苷酸序列的转录。 0021 在一个实施方案中, 本文所述的方法包括用于产生非常规酵母中基因修饰用多重 向导RNA的高通量方法, 所述方法包括: a)提供重组DNA构建体, 所述重组DNA构建体包含以 5 至3 的顺序可操作地连接至下列的启动子: 编码核酶的第一DNA序列、 编码反向选择剂的 第二DNA序列、 编码向导RNA的CER结构域的第三DNA序列和终止子序列; b)向(a)的重组DNA 构建体提供至少一个寡核苷酸双链体, 其中所述寡核苷酸双链体源自包含能。

29、够编码向导 RNA靶序列的可变靶向结构域(VT)的DNA序列的第一单链寡核苷酸与包含编码可变靶向结 构域的DNA序列的互补序列的第二单链寡核苷酸的组合; c)将(a)的反向选择剂与(b)的至 少一个寡双链体交换, 从而形成重组DNA构建体库, 其各自包含能够编码向导RNA的可变靶 向结构域的DNA序列; 以及, 0022 d)转录(c)的重组DNA构建体库, 从而形成核酶-向导RNA库。 0023 附图和序列简述 0024 图1: 单向导多核苷酸诸如单向导RNA(sgRNA)的结构模型。 可变靶向(VT)结构域示 说明书 3/65 页 6 CN 107002020 A 6 为灰色。 Cas9内。

30、切核酸酶识别(CER)结构域示为黑色。 0025 图2A: 经耶氏酵母密码子优化的Cas9表达盒。 FBA1启动子示为黑色, 并且编码具有 C末端SV40核定位信号(NLS)的Cas9的开放阅读框示为浅灰色。 0026 图2B: 经耶氏酵母优化的pre-sgRNA RGR表达盒(RGR, 核酶-sgRNA-核酶)。 FBA1启 动子示为黑色, 锤头(HH)核酶示为深灰色, 单向导RNA(sgRNA)示为浅灰色, 并且HDV核酶以 竖条纹形式示出。 0027 图2C: 经耶氏酵母优化的pre-sgRNA RG表达盒(RG, 核酶-sgRNA)。 FBA1启动子示为 黑色, 锤头(HH)核酶示为深。

31、灰色, 单向导RNA(sgRNA)示为浅灰色, 并且Sup4终止子以竖条纹 形式示出。 0028 图3A: pZUFCas9(SEQ ID NO: 14)质粒包含图2A中所示的经耶氏酵母密码子优化的 Cas9表达盒。 复制起点(ARS 18, f1 ori, ColE1)以交叉影线示出, 并且可选标记物(Ura3, Amp)呈灰色。 0029 图3B: pZUFCas9/PolIII-sgRNA质粒包含图2A中所示的经耶氏酵母密码子优化的 Cas9表达盒, 和用于在耶氏酵母中靶向Leu2-3的Yl Snr52(Pol III启动子, 表示为 “Yl52” )-sgRNA表达盒。 尽管未示出, 。

32、但sgRNA盒还包含酿酒酵母Sup4基因转录终止子序列。 复制起点(ARS 18, f1 ori, ColE1)以交叉影线示出, 并且可选标记物(Ura3, Amp)呈灰色。 0030 图3C: pRF38质粒(SEQ ID NO: 19)包含用于靶向解脂耶氏酵母中CAN1基因的序列 SEQ ID NO: 18的经耶氏酵母优化的pre-sgRNA表达盒(FBA1启动子以白色示出, RGR pre- sgRNA以斜条纹示出)。 复制起点(ARS 18, f1 ori, ColE1)以交叉影线示出, 并且可选标记物 (Ura3, Amp)呈灰色。 0031 图4B: 利用(i)仅pZUFCas9(。

33、SEQ ID NO: 14)或者(ii)pZUFCas9和包含SEQ ID NO: 18的经耶氏酵母优化的pre-sgRNA表达盒的线性DNA转化的解脂耶氏酵母细胞中的瞬时靶 向效率(参见实施例3)。 y轴指示利用pZUFCas9转化的细胞的频率(即, Ura+细胞), 所述细胞 也是刀豆氨酸抗性的(CanR)。 误差线表示标准偏差。 0032 图5: 利用pZUFCas9(SEQ ID NO: 14)和包含SEQ ID NO: 18的经耶氏酵母优化的 pre-sgRNA表达盒的线性DNA转化的解脂耶氏酵母细胞的CAN1编码区中的Cas9/sgRNA切割 位点的序列图(参见实施例3)。 参见野。

34、生型(WT)CAN1序列, Can1-1靶位点序列以粗体示出, PAM序列加下划线。 预测切割位点紧接PAM上游的第三核苷酸的5 。 插入的核苷酸以斜体表 示。 每一类突变体(1-18)的数目和频率在右侧表示。 该图中示出的序列以SEQ ID NO: 71-89 包括在序列表中, 如图中所编号的。 0033 图6: 利用(i)仅pZUFCas9(SEQ ID NO: 14), (ii)pZUFCas9和包含SEQ ID NO: 18的 经耶氏酵母优化的pre-sgRNA表达盒(RGR)的线性DNA, 或(iii)pZUFCas9和包含SEQ ID NO: 25的经耶氏酵母优化的pre-sgRN。

35、A表达盒(RG)的线性DNA转化的解脂耶氏酵母细胞中的瞬 时靶向效率(参见实施例4)。 y轴指示利用pZUFCas9转化的细胞的频率(即, Ura+细胞), 所述 细胞也是刀豆氨酸抗性的(CanR)。 误差线表示标准偏差。 0034 图7: 比较通过HR和NHEJ DNA修复路径的突变频率。 测定在转化中提供多核苷酸修 饰模板DNA序列时, 由HR(深灰)和NHEJ(浅灰)进行的Cas9/sgRNA-介导的DNA双链断裂修复 的总频率(参见实施例5)。 误差线表示标准偏差。 0035 图8: 由于多核苷酸修饰模板DNA序列的类型, 在Cas9/sgRNA-介导的DNA双链断裂 说明书 4/65。

36、 页 7 CN 107002020 A 7 位点处的HR频率。 示出使用点突变模板DNA(深灰)、 移码模板DNA(浅灰)、 和大缺失模板DNA (白色)的HR频率(参见实施例5)。 误差线表示标准偏差。 0036 图9: 耶氏酵母中在CAN1基因座处的突变频率(在被Cas9/sgRNA切割的Can1-1位点 处修复)不受多核苷酸修饰模板DNA存在的影响。 由不包括多核苷酸修饰模板DNA(深灰色, 无模板DNA)或包括多核苷酸修饰模板DNA(浅灰色, 具有模板DNA)(两个转化组均包括 pZUFCas9(SEQ ID NO: 14)和RGR表达盒SEQ ID NO: 18)的转化产生的细胞的刀。

37、豆氨酸抗 性频率(参见实施例5)。 y轴指示利用pZUFCas9转化的细胞的频率(即, Ura+细胞), 所述细胞 也是刀豆氨酸抗性的(CanR)。 误差线表示标准偏差。 0037 图10A: pRF84质粒(SEQ ID NO: 41)包含图2A中所示的经耶氏酵母密码子优化的 Cas9表达盒和SEQ ID NO: 18的经耶氏酵母优化的RGR pre-sgRNA盒(RGR pre-sgRNA编码区 “Can1 RGR” 由斜线示出)。 复制起点(ARS 18, f1 ori, ColE1)以交叉影线示出, 并且可选 标记物(Ura3, Amp)呈灰色。 0038 图10B: pRF85质粒(。

38、SEQ ID NO: 42)包含图2A中所示的经耶氏酵母密码子优化的 Cas9表达盒和SEQ ID NO: 25的经耶氏酵母优化的RG pre-sgRNA盒(RG pre-sgRNA编码区 “Can1 RG” 由斜线示出)。 复制起点(ARS 18, f1 ori, ColE1)以交叉影线示出, 并且可选标 记物(Ura3, Amp)呈灰色。 0039 图11: 通过仅表达Cas9(pZUFCas9, SEQ ID NO: 14), 或表达(i)Cas9和(ii)RGR pre-sgRNA(pRF84)或RG sgRNA(pRF85), 在耶氏酵母中在CAN1基因座处的突变频率(参见实 施例6。

39、)。 y轴指示利用每种相应载体转化的细胞的频率(即, Ura+细胞), 所述细胞也是刀豆 氨酸抗性的(CanR)。 误差线表示标准偏差。 0040 图12A-12B: 构建HDV-sgRNA融合表达盒的高通量克隆盒的示例。 图12-A以黑色框 示出启动子序列, 以灰色框示出编码HDV核酶的DNA序列, 以水平阴影框示出的是侧接有II 型限制性位点的克隆菌株的反向可选择标记物, 以黑色虚线框示出的是与Cas9相互作用的 sgRNA的CER结构域, 并且以斜线阴影框示出的是转录终止子。 当包含编码可变靶向结构域 的DNA序列和II型限制性位点的适当突出物的DNA双链体(竖直阴影线框VT)与质粒, 。

40、DNA连 接酶和II型酶混合时, 编码可变靶向结构域(VT)的DNA序列将置换反向可选择标记物, 从而 形成HDV-sgRNA表达盒(启动子-HDV-VT-CER-终止子)。 当转录HDV-sgRNA表达盒时, 其产生 RNA转录物(HDV-VT-CER转录物), 其中HDV核酶切割任何5 序列。 图12-B示出双链DNA分子 (SEQ ID NO: 99和SEQ ID NO: 100的寡聚双链)的一个示例, 其包含编码Can1-1靶位点的DNA 序列和克隆入质粒pRF291中的适当突出物。 0041 图13A-13B: 构建HH-sgRNA表达盒的高通量克隆盒的示例。 图13-以黑色框示出启。

41、 动子序列; 以水平阴影框示出侧接有II型限制性位点的克隆菌株的反向可选择标记物; 以 黑色虚线框示出的是与Cas9相互作用的sgRNA的CER结构域, 以斜线阴影框示出的是转录终 止子。 当包含编码DNA的靶位点特异性锤头核酶的DNA双链体(竖直阴影框HH、 靶向序列和II 型位点的适当突出物(虚线框TS)与质粒、 DNA连接酶和II型酶混合时, HH-靶位点双链体 置换反向可选择标记物, 从而形成HH-sgRNA表达盒。 当转录表达盒时, 其产生转录体并且HH 核酶切除其本身和任何5 序列。 图13B示出双链DNA分子(SEQ ID NO: 162和SEQ ID NO: 163) 的示例,。

42、 其包含用于靶向ds-temp-1靶位点的可变靶向结构域(VT)和编码DNA(HH)的序列特 异性HH核酶, 以及克隆入质粒pRF291中的适当突出物。 说明书 5/65 页 8 CN 107002020 A 8 0042 图14: 来自由pRF303(SEQ ID NO: 103)和Can1短编辑模板(SEQ ID NO: 157)转化的 细胞的Can1基因座的凝胶电泳的示例。 标记MW的泳道是分子量标记物。 泳道1-16表示来自 划线纯化的转化体的单独菌落。 较高MW带是WT Can1基因座(SEQ ID NO: 160)或具有小插入 缺失(indel)突变的Can1基因座的正确尺寸。 较。

43、小分子量带是由短Can1编辑模板(SEQ ID NO: 157)编辑的Can1基因座(SEQ ID NO: 161)的正确尺寸。 0043 图15示出来自菌落PCR的质粒和基因组URA3基因的代表性测序结果及其比对。 虚 线和粗体分别示出缺失和插入。 PAM序列加下划线。 0044 图16-A示出耶氏酵母URA3基因内RGR-URA3.1、 RGR-URA3.2和RGR-URA3.3的靶向序 列的相对位置。 0045 图16-B示出在包含5-FOA的SC培养基上生长的pYRH222转化体的菌落PCR的测序结 果和序列比对。 粗体表示插入。 PAM序列加下划线。“N” 表示混合序列。 图16-C。

44、示出在包含5- FOA的SC培养基上生长的pYRH282转化体的菌落PCR的测序结果和序列比对。 虚线表示缺失。 PAM序列加下划线。“N” 表示混合序列。 图16-D示出在包含5-FOA的SC培养基上生长的 pYRH283转化体的菌落PCR的测序结果和序列比对。 虚线表示缺失。 PAM序列加下划线。“N” 表 示混合序列。 0046 图17示出来自pYRH282(菌落号23和24)和pYRH283(菌落号27和36)转化体的PCR产 物的不同迁移。 来自梯状物的DNA尺寸在右侧示出。 0047 图18示出Can1靶序列的代表性测序结果。 虚线分别指示缺失。 PAM序列以粗体示 出。 0048。

45、 表1 0049 核酸和蛋白质序列号概述 0050 说明书 6/65 页 9 CN 107002020 A 9 0051 说明书 7/65 页 10 CN 107002020 A 10 0052 说明书 8/65 页 11 CN 107002020 A 11 0053 说明书 9/65 页 12 CN 107002020 A 12 0054 说明书 10/65 页 13 CN 107002020 A 13 0055 说明书 11/65 页 14 CN 107002020 A 14 0056 说明书 12/65 页 15 CN 107002020 A 15 0057 说明书 13/65 页 16。

46、 CN 107002020 A 16 0058 具体实施方式 0059 本文引用的所有专利和非专利文献的公开全文以引用方式并入本文。 0060 如本文所用, 术语 “发明” 或 “所公开的本发明” 不旨在限制但一般适用于权利要求 中所限定的或本文所述的任何发明。 这些术语在本文中可互换使用。 0061 本文的术语 “非常规酵母” 是指不是酵母属(Saccharomyces)(例如, 酿酒酵母 (S.cerevisiae)或裂殖(Schizosaccharomyces)酵母物种的任何酵母。 非常规酵母描述于 以下文献中: Non-Conventional Yeasts in Genetics, 。

47、Biochemistry and Biotechnology: Practical Protocols(K.Wolf、 K.D.Breunig、 G.Barth编辑, Springer- Verlag, Berlin, Germany, 2003), 其以引用方式并入本文。 在某些实施方案中, 非常规酵母 可另外(或另选地)为比由同源重组(HR)介导的修复过程更偏好非同源末端接合(NHEJ)DNA 修复过程的酵母。 沿这些线索(比HR优选NHEJ)定义非常规酵母-还由Chen等人(PLoS ONE 8: e57952)公开, 其以引用方式并入本文。 本文优选的非常规酵母为耶氏酵母属(例如, 解。

48、脂 耶氏酵母)的那些。 本文的术语 “酵母” 是指主要以单细胞形式存在的真菌物种。 酵母可另选 地在本文中被称为 “酵母细胞” 。 0062 本文中, 术语 “RNA引导的内切核酸酶” (RGEN)是指包含至少一个CRISPR(聚集状规 则间隔的短回文重复序列)缔合(Cas)蛋白质和至少一种RNA组分的复合物。 简单地讲, RGEN 的RNA组分包含与靶位点序列中的DNA序列互补的序列。 基于该互补性, RGEN可特异性识别 并切割特定DNA靶位点序列。 本文的RGEN可包含四种已知的CRISPR体系(Horvath和 Barrangou, Science 327: 167-170)诸如I型、。

49、 II型或III型CRISPR体系中任一种的一种或多 种Cas蛋白质和一种或多种合适的RNA组分。 在优选的实施方案中, RGEN包含Cas9内切核酸 酶(CRISPR II体系)和至少一种RNA组分(例如, crRNA和tracrRNA, 或gRNA)。 0063 术语 “CRISPR” (聚集状规则间隔的短回文重复序列)是指I类、 II类或III类DNA切 割体系的某些遗传基因座编码因子, 其例如由细菌或古细菌细胞使用以破坏外来DNA (Horvath和Barrangou, Science 327: 167-170)。 本文利用CRISPR体系的组分用于非常规酵 母细胞中的DNA靶向。 0064 本文术语 “II型CRISPR体系” 和 “II型CRISPR-Cas体系” 互换使用并且是指利用与 至少一种RNA组分复合的Cas9内切核酸酶的DNA切割体系。 例如, Cas9可与CRISPR RNA (crRNA)和反式激活CRISPR RNA(tracrRNA)复合。 在另一个示例中, Cas9可与向导RNA复合。 因此, 。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 >


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1