棉蚜APHISGOSSYPII抗性基因.pdf

上传人:小** 文档编号:1625336 上传时间:2018-06-29 格式:PDF 页数:88 大小:3.95MB
返回 下载 相关 举报
摘要
申请专利号:

CN200480004223.X

申请日:

2004.01.13

公开号:

CN1751065A

公开日:

2006.03.22

当前法律状态:

终止

有效性:

无权

法律详情:

专利权的视为放弃IPC(主分类):C07K 14/415放弃生效日:20060322|||实质审查的生效|||公开

IPC分类号:

C07K14/415(2006.01); C12N15/82(2006.01)

主分类号:

C07K14/415

申请人:

基因植物-瓦勒公司;

发明人:

C·多吉蒙; A·邦达马内; M·皮特拉特; E·比尔热-比雅尔; L·阿让; A·勒芒; J·波凯; P·鲁塞尔; M·卡博什; V·肖韦隆

地址:

法国埃夫里

优先权:

2003.01.13 FR 0300287

专利代理机构:

中国国际贸易促进委员会专利商标事务所

代理人:

程泳

PDF下载: PDF下载
内容摘要

本发明涉及Vat基因的克隆,该基因参与对于蚜虫(棉蚜(Aphisgossypii))的抗性和/或对于经该蚜虫的病毒传播的抗性,以及涉及该基因的新型标记的鉴定。

权利要求书

1: 选自下列的分离的多核苷酸: a)编码参与抗棉蚜这种蚜虫和/或抗经该蚜虫的病毒传播的多肽 的多核苷酸,所述多肽与多肽SEQ ID NO:3具有至少80%,优选至少90%, 特别优选至少95%的同一性; b)多核苷酸a)的互补多核苷酸; c)在严紧条件下能够与多核苷酸a)或多核苷酸b)选择性杂交的多 核苷酸。
2: 根据权利要求1的多核苷酸,其选自: a)序列SEQ ID NO:1的多核苷酸; b)序列SEQ ID NO:2的多核苷酸; c)多核苷酸a)或多核苷酸b)的互补多核苷酸; c)在严紧条件下能够与多核苷酸a)、b)或c)中任一个选择性杂交 的多核苷酸。
3: 多核苷酸,其由根据权利要求1或2中任一项的一种多核苷酸的 至少10bp的片段组成。
4: 多核苷酸,其编码参与抗棉蚜这种蚜虫和/或抗经该蚜虫的病毒传 播的多肽,和能够通过借助于由根据权利要求1-3中任一项的多核苷酸获 得的至少一种核酸探针和/或至少一对扩增引物来筛选植物的基因组DNA 库或cDNA库而获得。
5: 可检测有利于抗棉蚜和/或抗经该蚜虫的病毒传播的Vat基因的 等位基因存在与否的遗传标记,其特征在于,该标记选自下列标记:L273、 L246、V681、V1684、V432、GRP805、M8、标记E、标记D,它们分别由下 列引物定义: L273: F2-B2:GGAGAGAGAATCCGGGACTAAGTGACT(SEQ ID NO:7) F2-Br:TAACCACCTTTTCCGATCAAATTTCGTAC(SEQ ID NO:8) L246: F2-B2 Eco:ATTGATGAATCTACACTCCTCGATCTCTTC(SEQ ID NO:9) F2 Eco:GAGTTCAATCCATTTCAATGATTTAAGATA(SEQ ID NO:10) V681: V681:GGAATCTTGTTGAGGCCGAGAGGG(SEQ ID NO:11) V681R:GTTGTATATGGCTTCCCTGTAGCC(SEQ ID NO:12) V1684: V588:CAACAGGCTCAACAGTGTATTCGG(SEQ ID NO:13) V551R:GAAGAAGGTGACGAGAGAGATGCC(SEQ ID NO:14) V432: V432:AACTTCTCCAACTCCCTCCACTGC(SEQ ID NO:15) V432R:TTAGAGTGGCAAAGGGAAGATGGG(SEQ ID NO:16) GRP805: GRP805:ATCCCCTGTTTCCTTCAACAACCC(SEQ ID NO:17) GRP805R:AACCCCCAAGAAGAAGAACAACCC(SEQ ID NO:18) M8: M8:CCGACGCATCTCCCGACGCGTTGTTG(SEQ ID NO:19) M8R:TCGTGAAGGGTTTTGGAGAGTGAGAAA(SEQ ID NO:20) 标记E: LRR1:CCTTAGAAGAAGATGAAGTCTCCC(SEQ ID NO:21) LRR842R:CTCCACTCAGAATTGGTAGGTGCC(SEQ ID NO:22) 标记D: LRR915:AACAACTTAGAACCATCTCCCAGC(SEQ ID NO:23) LRR1R:GTTGTTGAGAGCAATAGTGTACCC(SEQ ID NO:24)。
6: 可扩增出如在权利要求5中所定义的标记之一的引物对,其特征 在于,该引物对选自: -由多核苷酸SEQ ID NO:7和SEQ ID NO:8组成的引物对, -由多核苷酸SEQ ID NO:9和SEQ ID NO:10组成的引物对, -由多核苷酸SEQ ID NO:11和SEQ ID NO:12组成的引物对, -由多核苷酸SEQ ID NO:13和SEQ ID NO:14组成的引物对, -由多核苷酸SEQ ID NO:15和SEQ ID NO:16组成的引物对, -由多核苷酸SEQ ID NO:17和SEQ ID NO:18组成的引物对, -由多核苷酸SEQ ID NO:19和SEQ ID NO:20组成的引物对, -由多核苷酸SEQ ID NO:21和SEQ ID NO:22组成的引物对,和 -由多核苷酸SEQ ID NO:23和SEQ ID NO:24组成的引物对。
7: 用于在植物中检测有利于抗棉蚜这种蚜虫和/或抗经该蚜虫的病 毒传播的Vat基因的等位基因的存在的试剂盒,其特征在于,该试剂盒包 含至少一个如在权利要求6中所定义的引物对。
8: 根据权利要求1-3中任一项的至少一种多核苷酸的用途,其用于 在植物中检测有利于抗棉蚜这种蚜虫和/或抗经该蚜虫的病毒传播的Vat 基因的等位基因的存在。
9: 根据权利要求5的至少一种遗传标记的用途,其用于在植物中检 测有利于抗棉蚜这种蚜虫和/或抗经该蚜虫的病毒传播的Vat基因的等位 基因的存在。
10: 根据权利要求8或9中任一项的用途,其特征在于,所述植物为 葫芦科植物。
11: 检测植物对于棉蚜这种蚜虫的抗性或敏感性和/或对于经该蚜虫 的病毒传播的抗性的方法,其特征在于,该方法包括确定在所述植物中存 在的Vat基因的等位形式。
12: 含有处于合适启动子的转录调控之下的根据权利要求1-3中任一 项的多核苷酸的表达盒。
13: 含有根据权利要求1-3中任一项的多核苷酸或根据权利要求12 的表达盒的重组载体。
14: 用根据权利要求1-3中任一项的多核苷酸遗传转化的细胞。
15: 根据权利要求1或2中任一项的多核苷酸的用途,其用于制备对 于棉蚜这种蚜虫和/或对于经该蚜虫的病毒传播具有抗性的转基因植物。
16: 用根据权利要求1或2中任一项的多核苷酸遗传转化的转基因植 物。
17: 根据权利要求16的转基因植物,其选自葫芦科、锦葵科和茄科植 物。
18: 参与抗棉蚜这种蚜虫和/或抗经该蚜虫的病毒传播的多肽,其特 征在于,该多肽与多肽SEQ ID NO:3具有至少80%的同一性。

说明书


棉蚜(Aphis gossypii)抗性基因

    本发明涉及抵抗有害昆虫,特别是抵抗蚜虫的新型方法。

    有害昆虫是在农业上主要的担忧的问题之一。除了昆虫本身造成的损害之外,昆虫的攻击十分通常地促进细菌、病毒或真菌病害向植物的传播和传染。

    在害虫之中,蚜虫是最普遍的。世界上存在4000多种蚜虫,其中最普遍的是桃蚜(Myzus persicae)和棉蚜(Aphis gossypii)。

    每个物种都具有特殊的生活周期和一组特有的宿主。蚜虫是极有活力的生物,它们能快速地适应环境条件。这种快速适应主要是由于蚜虫所发展出的多样的繁殖策略。根据气候条件,蚜虫通过有性或无性途径进行繁殖,和是卵生的或胎生的。它们可能是有翅的或没有翅的,这由此使得它们容易从一株植物到达另一株植物。正是由于这种强的适应和繁殖能力,在田野中更不必说在温室中,作物的完全侵害是极为迅速的。一个单独的蚜虫个体可产生40-100个这么多的幼虫。

    棉花或甜瓜的蚜虫(棉蚜)存在于全世界的大部分地区,除了最北方的地区。其能够在一个星期之内完成一个完整的发育周期并进行繁殖。正是由于其适应和繁殖能力,因此不管气候条件如何,在一个季节内能产生巨大数量地后代。甜瓜的蚜虫具有大数量的宿主(大约700种种植的或野生的植物,其中有50种在法国)。在这些植物之中,最敏感的是葫芦科植物如甜瓜、小西葫芦、黄瓜,锦葵科植物如棉花或木槿,以及敏感程度较低的茄科植物和芸香科植物如柑橘类。

    甜瓜的蚜虫主要侵袭叶的背面、芽和幼苗。在韧皮部中吸取营养元素的同时,蚜虫剥夺了植物的资源并使得植物变得虚弱。被侵袭的组织变成为缺绿病的,叶子发生卷曲,和光合作用的效率降低。蚜虫分泌一种非常富含糖的蜜露,这种蜜露作为腐生真菌的基质,例如煤污病,这种病在叶片上形成黑色的覆盖物,而且还减少植物的光合作用能力和造成患病的蔬菜和水果的商业价值的大大降低。另外,蚜虫是许多病毒的载体,当蚜虫刺入导管时,其直接将这些病毒引入了植物的韧皮部。

    化学防治目前是最普遍的。然而,这种方法具有许多弊端。所使用的产品常常具有大的作用范围,在杀死蚜虫的同时也杀死了有益的昆虫。环境污染的风险同样是重要的:杀蚜虫剂事实上属于对于人、有用动物和环境最具有毒性的产品(Recueil des effects nonintentionnels des produits phytosanitaires,Acta 1998,256页,BERGER和VAN HOLST,2001,Environ.Sci.Pollut.Res.Int.,8,109-112)。此外,棉蚜这种蚜虫在某些地区形成了对于所使用的化学化合物的抗性,例如有机磷酸盐、氨基甲酸盐、拟除虫菊脂和有机氯化物(LARRY等人,The Journal of Cotton Science,5,22-29,2001;DELORME,Pesticide Science,49,90-96,1997)。

    生物防治在于使用棉蚜的天然捕食者和寄生物,例如瓢虫、某些半翅目昆虫或病原性真菌。但是,这种方法只能用于温室中的作物。

    另一种方法基于对于蚜虫天然具有抗性的品种的研究,和基于使用它们来进行品种改良和产生杂交种。

    因此,已经找到了对于蚜虫具有抗性的品种,特别是小麦、苹果、紫花豌豆、莴苣、西红柿等。

    在甜瓜(香瓜(Cucumis melo))中,于来自远东或印度的甜瓜品系之内发现了存在有一个赋予对于蚜虫(棉蚜)的抗性的显性座位。该座位称为Ag(对于棉蚜抗性)或Vat(对于病毒蚜虫传播抗性),其赋予一种抗性双重表型:对于棉蚜侵害植物的抗性,和对于经蚜虫的病毒传播的抗性,在这种传播中蚜虫是载体(KISHABA等人,J.Econ.Entomol.,64,935-937,1971;BOHN等人,J.Amer.Soc.Hort.Science,98,37-40,1973;LECOQ等人,Phytopathology,69,1223-1225,1979;PITRAT和LECOQ,Phytopathology,70,958-961,1980)。

    有利于抗性的Vat座位已经通过不同的商品化甜瓜品种之间的杂交而被引入;然而,通过常用的品种改良技术来形成抗蚜虫的甜瓜品种依然是漫长和昂贵的。

    因此,看来希望确切地鉴定和克隆Vat基因,特别是以便能够进行以下工作:

    -通过转基因将有利于抗性的Vat等位基因转移至对于棉蚜敏感的甜瓜品种中,和同时也转移至对于这种蚜虫敏感并且没有检测到任何天然抗性的其他物种中,例如小西葫芦、黄瓜或棉花;有利于抗性的Vat等位基因也能够转移至对于经蚜虫的病毒传播敏感的植物品种中,例如茄科植物,尤其是西红柿;

    -在除甜瓜之外的其他物种中研究Vat基因的直向同源基因;

    -定义特别是可在传统品种选择技术范围内使用的新型标记,以便推动抗性品种的鉴定和/或有利于在农学上值得关注的品种中追踪抗性特征的渐渗现象。

    已经确定Vat基因位于甜瓜的染色体V上的近端粒位置(PERIN等人,Theor Appl Genet,104,1017-1034,2002)。在这一区域中已经绘制有几个与抗性基因同源的序列(KLINGER等人,J.Amer.Soc.Hort.Science,126,56-63,2001;BROTMAN等人,Theor.Apl.Genet.,104,1055-1063,2002),这使得能够假设Vat基因属于NBS-LRR的超家族,大量目前所克隆的抗性基因均属于此超家族。

    这一超家族聚集了含有一个与核苷酸连接的位点(NBS,核苷酸结合位点)和富含亮氨酸的重复序列(LRR,富亮氨酸重复序列)的基因。已经观察到,与NBS-LRR同源的序列和Vat座位有关(KLINGLER等人,J.Amer.Soc.Hort.Science,126,56-63,2001)。在这些抗性基因的同源序列中,已经确定NBS-2、NBS46-7、NBS5a和NBS5b分别位于距离Vat 4.75、7.5、10和11cM处;然而,其中没有一个与Vat座位共分离(BROTMAN等人,Theor.Appl.Genet.,104,1055-1063,2002)。

    发明人构建了一个BAC(细菌人工染色体)库,以便从甜瓜纯合体基因组DNA中来获得有利于抗棉蚜和抗通过这一载体的病毒传播的Vat等位基因。同时还定义了比现有技术已知的标记更准确地定位Vat座位的标记。借助于这些标记的BAC库的筛选使得能够鉴定出具有整个Vat座位的克隆。

    这些克隆之一的亚克隆过程使得能够获得含有Vat基因的大约11000bp的基因组DNA片段。这一片段的序列显示在图1中(4个外显子用灰色覆划,3个内含子加了下划线),以及在附件的序列表中其编号为SEQ ID NO:1。相应的cDNA序列同样也已获得,相应的多肽序列已经确定。该cDNA和多肽序列分别显示在附件的序列表中,编号为SEQ IDNO:2和SEQ ID NO:3。

    同样也已经从BAC库中分离得到下文中称为Vat-like的Vat基因的平行进化同源基因。Vat-like基因的序列显示在附件的序列表中,编号为SEQ ID NO:4。cDNA序列和推断出的多肽序列分别显示在附件中,编号为SEQ ID NO:5和SEQ ID NO:6。

    图2显示了Vat的cDNA与Vat-like的cDNA之间的序列比对。Vat的cDNA含有4422bp,而Vat-like的cDNA仅含有4233bp,这是由于缺失了位于Vat序列的3014-3210位之间的195bp,和添加了位于Vat-like序列的3649-3656位之间的6bp。Vat和Vat-like的序列之间具有92.4%的同一性。

    图3显示了推断出的蛋白质VAT和VAT-like序列的比对,它们分别由1473个氨基酸和1410个氨基酸组成。VAT和VAT-like的序列之间具有90%的同一性。

    Vat和Vat-like基因在遗传和物理上是相关的(相距17kb)。通过遗传分析已经鉴定了一些Vat和Vat-like之间的重组植物。只具有Vat-like基因的植物对于棉蚜的侵袭和由棉蚜引起的病毒传播是敏感的。与之相反,只具有Vat基因的植物对于棉蚜的侵袭和由棉蚜引起的病毒传播具有抗性。因此,Vat基因对于赋予上述的双重表型是必需和足够的。

    本发明的目的是一种选自下列的分离的多核苷酸:

    a)编码参与抗蚜虫(棉蚜)和/或抗经该蚜虫的病毒传播的多肽的多核苷酸,所述多肽与多肽SEQ ID NO:3具有至少80%,优选至少90%,十分优选至少95%的同一性;

    b)多核苷酸a)的互补多核苷酸;

    c)在严紧条件下能够与多核苷酸a)或多核苷酸b)选择性杂交的多核苷酸。

    除非另有详细说明,此处对于核苷酸序列或肽序列所指出的序列同一性百分数涉及在由整个参考序列所构成的比较窗口上获得的值,其在由整个参考序列所构成的比较窗口上采用软件套件BLAST(ALTSCHUL等人,Nucleic Acids Res.,25,3389-3402,1997)并使用缺省参数。

    将所有含有使得能够合成所述多肽的遗传信息的多核苷酸定义为“编码”指定多肽的多核苷酸。

    因此,编码参与抗蚜虫(棉蚜)和/或抗经该蚜虫的病毒传播的多肽的本发明多核苷酸尤其包括序列SEQ ID NO:1的多核苷酸和SEQ IDNO:2的多核苷酸。

    本发明同样也包括所有上述多核苷酸a)或b)的至少10bp,优选至少20bp,十分优选至少50bp的片段,或者在严紧条件下能够与上述多核苷酸a)或b)选择性杂交的片段。优选的片段为序列SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:5的多核苷酸中任何一个的片段,或者在严紧条件下能够与这些多核苷酸中的一个或其互补序列选择性杂交的片段。其他优选的片段为在多核苷酸SEQ ID NO:4或SEQ IDNO:5中不存在的多核苷酸SEQ ID NO:1或SEQ ID NO:2中任何一个的片段,或者能够与多核苷酸SEQ ID NO:1或SEQ ID NO:2选择性杂交但不与多核苷酸SEQ ID NO:4或SEQ ID NO:5杂交的片段。

    对于指定的多核苷酸的杂交严紧条件可以由本领域技术人员根据所涉及的多核苷酸的大小和碱基组成以及杂交混合物的组成来确定(特别是pH和离子强度)。一般地,对于指定大小和序列的多核苷酸的严紧条件是如此获得的,即于比在同一个反应混合物中由该多核苷酸和其互补序列形成的杂交物的解链温度(Tm)低大约5℃-10℃的温度下进行操作。

    在此,将所有这样的多核苷酸定义为能够与本发明的多核苷酸a)或b)选择性杂交的多核苷酸,即这样的多核苷酸当在严紧条件下与甜瓜的核酸库(特别是基因组DNA或cDNA库)杂交时与所述多核苷酸产生可检测的(也就是说为背景噪音的至少2倍,优选至少5倍)杂交信号,但是与所述库的其他序列不产生任何可检测的信号,尤其是与编码NBS-LRR家族的其他蛋白质的序列。

    本发明的目的同样也为从本发明的多核苷酸a)或b)或其片段中获得的多核苷酸探针或扩增引物。

    本发明同样也包括所有编码参与抗蚜虫(棉蚜)和/或抗经该蚜虫的病毒传播的多肽的多核苷酸,和能够从植物的基因组DNA或cDNA库中通过借助于本发明的探针或引物筛选所述库而获得的多核苷酸。

    这尤其包括甜瓜的Vat基因的其他等位基因,和尤其包括能够赋予对于蚜虫(棉蚜)和/或对于经该蚜虫的病毒传播的抗性的其他等位基因,以及在除甜瓜之外的其他植物中的,特别是在其他葫芦科植物如小西葫芦和黄瓜中的,一般在易被棉蚜感染的植物(例如锦葵科植物如棉花)和/或对于经该蚜虫的病毒传播敏感的植物(例如茄科植物如西红柿)中的Vat基因的直向同源基因。

    本发明同样也包括使得能够在植物中,特别是在甜瓜中检测Vat基因的等位基因存在与否的遗传标记,该Vat基因的等位基因有利于抗蚜虫(棉蚜)的侵袭和/或抗经该蚜虫的病毒传播。

    本发明的遗传标记特别包括下列标记:L273、L246、V681、V1684、V432、GRP805、M8、标记E、标记D。

    标记E和D最特别地可用于在PI161375中区分Vat基因和Vat-like基因。

    这些标记尤其可在葫芦科植物中使用,特别是甜瓜。它们同样也可以在其他植物中使用,例如锦葵科植物如棉花或木槿,或者茄科植物如西红柿。

    本发明的标记分别由下列引物定义:

    L273:

    F2-B2:GGAGAGAGAATCCGGGACTAAGTGACT(SEQ ID NO:7)

    F2-Br:TAACCACCTTTTCCGATCAAATTTCGTAC(SEQ ID NO:8)

    L246:

    F2-B2 Eco:ATTGATGAATCTACACTCCTCGATCTCTTC(SEQ ID NO:9)

    F2 Eco:GAGTTCAATCCATTTCAATGATTTAAGATA(SEQ ID NO:10)

    V681:

    V681:GGAATCTTGTTGAGGCCGAGAGGG(SEQ ID NO:11)

    V681R:GTTGTATATGGCTTCCCTGTAGCC(SEQ ID NO:12)

    V1684:

    V588:CAACAGGCTCAACAGTGTATTCGG(SEQ ID NO:13)

    V551R:RGAGAAGGTGACGAGAGAGATGCC(SEQ ID NO:14)

    V432:

    V432:AACTTCTCCAACTCCCTCCACTGC(SEQ ID NO:15)

    V432R:TTAGAGTGGCAAAGGGAAGATGGG(SEQ ID NO:16)

    GRP805:

    GRP805:ATCCCCTGTTTCCTTCAACAACCC(SEQ ID NO:17)

    GRP805R:AACCCCCAAGAAGAAGAACAACCC(SEQ ID NO:18)

    M8:

    M8:CCGACGCATCTCCCGACGCGTTGTTG(SEQ ID NO:19)

    M8R:TCGTGAAGGGTTTTGGAGAGTGAGAAA(SEQ ID NO:20)

    标记E:

    LRR1:CCTTAGAAGAAGATGAAGTCTCCC(SEQ ID NO:21)

    LRR842R:CTCCACTCAGAATTGGTAGGTGCC(SEQ ID NO:22)

    标记D:

    LRR915:AACAACTTAGAACCATCTCCCAGC(SEQ ID NO:23)

    LRR1R:GTTGTTGAGAGCAATAGTGTACCC(SEQ ID NO:24)。

    对于蚜虫(棉蚜)和/或对于经该蚜虫的病毒传播的抗性的其他遗传标记同样也可通过下列方法从序列SEQ ID NO:1和SEQ ID NO:2中加以确定,即将这些序列与从对于棉蚜和/或对于经该蚜虫的病毒传播敏感的植物中获得的它们的同源序列进行比较,以便检测在这些序列之间存在的多态性,和确定与抗性相关的形式和与敏感性相关的形式。

    这些多态性可以位于Vat基因的编码区,并通过VAT蛋白质的肽序列的修饰而表现出来。同样也可以涉及位于Vat基因的5′非编码区或内含子中的多态性,或者位于编码区中但不表现为VAT蛋白质的序列修饰的多态性。 

    当已经如此鉴定了多态性时,就可能使用其作为抗性或敏感性的遗传标记,和定义使得能够区分它们的不同形式的工具(核酸探针、扩增引物、限制性酶)。

    本发明同样也包括将本发明的至少一种多核苷酸或至少一种遗传标记用于在植物中检测Vat基因的等位基因的存在的用途,该Vat基因的等位基因有利于抗蚜虫(棉蚜)和/或抗经该蚜虫的病毒传播。

    特别地,本发明的目的为评价植物对于蚜虫(棉蚜)和/或对于经该蚜虫的病毒传播的抗性或敏感性的方法,其特征在于,该方法包括确定在所述植物中存在的Vat基因的等位形式。

    本发明的目的同样也为可用于实施上述检测方法的寡核苷酸引物。

    特别地,本发明的目的为:

    -所有使得能够扩增出Vat基因的一个区域的引物对,该Vat基因的区域包含至少一种与对于棉蚜和/或对于经该蚜虫的病毒传播的抗性或敏感性相关的多态性;

    -所有使得能够扩增出上述L273、L246、V681、V1684、V432、GRP805、M8、标记E或标记D这些标记之一的引物对。

    本发明的目的同样也为实施本发明的方法的试剂盒。这些试剂盒含有至少一种本发明的引物对,可选地还联合有使得能够进行扩增反应的反应物,检测扩增产物的工具,一种或多种限制性酶,和/或扩增的阳性对照和/或阴性对照。

    本发明的目的还为:

    -表达盒,其含有本发明的多核苷酸,特别是编码参与抗蚜虫(棉蚜)和/或抗经该蚜虫的病毒传播的多肽的多核苷酸,该多核苷酸置于合适的启动子的转录调控之下;

    -重组载体,其是通过将本发明的多核苷酸或表达盒插入宿主载体中而获得的。

    本发明同样还包括制备重组多肽的方法,其特征在于,该方法包括用编码参与抗蚜虫(棉蚜)和/或抗经该蚜虫的病毒传播的多肽的本发明多核苷酸转化宿主细胞,包括原核细胞或真核细胞,并回收由所述细胞产生的所述多肽。

    本发明的目的还为参与抗蚜虫(棉蚜)和/或抗经该蚜虫的病毒传播的多肽,该多肽与多肽SEQ ID NO:3具有至少80%,优选至少90%,十分优选至少95%的同一性,以及所述多肽的至少5个,优选至少10个,十分优选至少15个连续氨基酸的片段。

    本发明还包括用本发明的多核苷酸或表达盒遗传转化的宿主细胞。

    宿主细胞可以为真核细胞或原核细胞。作为实例,可以举例出细菌特别是大肠杆菌(E.coli)或土壤杆菌(Agrobacterium),酵母如糖酵母(Saccharomyces),动物细胞,或者优选脊椎动物细胞。

    本发明同样也包括用本发明的多核苷酸转化的转基因植物。

    构建重组载体、转化宿主细胞或生物体以及产生重组蛋白质的常规技术可用于本发明的实施。

    宿主载体和表达调控序列的选择将根据所选择的宿主细胞或宿主生物体和所预期的应用来进行。

    用本发明的多核苷酸遗传转化植物使得能够获得抗蚜虫(棉蚜)和/或抗经该蚜虫的病毒传播的转基因植物。

    本发明的目的还为将本发明的多核苷酸用于增强植物对于蚜虫(棉蚜)的抗性。

    更特别地,本发明的目的还为制备抗蚜虫(棉蚜)和/或抗经该蚜虫的病毒传播的转基因植物的方法,其特征在于,该方法包括用本发明的多核苷酸遗传转化所述植物。

    所述植物有利地选自对于棉蚜敏感的物种,特别是葫芦科物种如甜瓜、黄瓜或小西葫芦,或者锦葵科植物如棉花或木槿,或者选自对于由棉蚜传播的病毒敏感的物种,特别是茄科植物如西红柿或辣椒。

    而且,高水平的Vat基因的过表达能够在甜瓜或其他植物品种(葫芦科、茄科或锦葵科植物)中导致植物对于更多样化的病原体的组成型抗性。例如,这种过表达可以使得植物能够识别在系统发生方面远离棉蚜的蚜虫,或者赋予通常将会延缓病原体的感染周期的弱组成型抗性。为此,可以制备这样的转基因植物,即该转基因植物在强启动子(35S)调控下表达Vat基因,因此将会以比当Vat基因处于其本来的启动子调控之下时所具有的水平高的水平表达Vat基因。然而,必须将基因的表达控制为其更适当的水平,以避免在植物生物学上有害的影响(例如细胞死亡)。

    植物的遗传转化可以通过本领域技术人员本身已知的常规方法来进行。

    作为非限制性的实例,对于葫芦科植物特别是甜瓜的转化,可以使用GUIS等人所描述的技术(Biotechnology and Genetic EngineeringReviews,15,289-311,1998;Scientia horticulturae,84,91-99,2000)。对于棉花的转化,可以使用PANNETIER等人所描述的技术(Euphytica,96,163-166,1997)。对于西红柿的转化,可以使用HAMZA和CHUPEAU所描述的方案(J.Exp.Bot.,44,1837-1845,1993)。

    作为另一种选择,对于蚜虫(棉蚜)和/或对于经该蚜虫的病毒传播具有增强的抗性的植物可以通过定向诱变而获得,以便在这些植物中存在的Vat基因等位基因之中引入对于赋予这种抗性所必需的修饰。

    在本发明的范围内可以使用的定向诱变方法是本领域技术人员本身已知的;这些方法例如描述于D.TAGU的著作(eds INRA 1999)中。

    本发明同样也涉及通过本发明的转基因或定向诱变方法而获得的转化植物,以及这些植物的后代。本发明同样还包括从这些植物获得的产品,例如植物的器官或组织、细胞、种子等。

    借助于下面的补充描述将会更好地理解本发明,其涉及非限制性实施例,这些实施例举例说明了与Vat基因相关的标记的定义,该基因的克隆,和将所述基因用于获得抗蚜虫(棉蚜)和/或抗病毒传播的植物。

    实施例1:通过遗传学方法鉴定Vat基因

    -BAC库的形成

    已经构建了一个甜瓜(对于棉蚜和对于经该蚜虫的病毒传播具有抗性的品种PI161375)基因组DNA的BAC库,其代表大约29个相当的基因组。该BAC库的第一部分含有66048个克隆(用BamHI、HindIII消化的DNA),第二部分含有56448个克隆(用EcoRI消化的DNA)。

    -BAC库的筛选及携带有Vat座位的BAC克隆的选择

    为了鉴定携带Vat座基因的克隆,借助于位于Vat座位两侧的标记来筛选库。已经鉴定和排列了几个覆盖Vat座位的BAC克隆。从这些BAC克隆中产生了新的标记。选择出携带有包含Vat座位的170kb插入的BAC克隆3.18.9,以鉴定Vat基因和序列。该克隆含有围绕Vat座位的标记L273和L246。在6000株来自回交种群[(Védrantais(敏感的)×PI161375(抗性的))×Védrantais]的植物中,在标记L273和Vat基因之间鉴定了10株植物,而在标记L246和Vat基因之间只鉴定了1株植物。

    标记L273由下列引物定义:

    F2-B2:GGAGAGAGAATCCGGGACTAAGTGACT(SEQ ID NO:7)

    和

    F2-Br:TAACCACCTTTTCCGATCAAATTTCGTAC(SEQ ID NO:8)

    从Védrantais品种(Vilmorin)(对于棉蚜敏感)或PI161375品种(由INRA繁殖的高丽来源的引进种)(对于棉蚜具有抗性)的基因组DNA中获得的扩增产物长210bp。该扩增产物在PI161375品种中具有一个BsiWI限制酶切位点,从而导致获得181bp和29bp的两个片段。相反地,使用酶BsrGI的消化将Védrantais的扩增物减小为三个片段:153bp、28bp和29bp,和将PI161375的扩增物减小为182bp和28bp的两个片段。

    标记L246由下列引物定义:

    F2-B2 Eco:ATTGATGAATCTACACTCCTCGATCTCTTC(SEQ ID NO:9)

    和

    F2 Eco:GAGTTCAATCCATTTCAATGATTTAAGATA(SEQ ID NO:10)

    从Védrantais品种或PI161375品种的基因组DNA中获得的扩增产物长173bp。PI161375品种的扩增产物具有一个对于酶EcoRV的限制酶切位点,从而导致获得分别为144bp和29bp的两个片段。

    从具有两个标记L273和L246的BAC克隆3-18-9中,已经在位于这两个标记之间的区域中指定了一些寡核苷酸(表1),以便减少它们之间的间隔和确定Vat基因的界限。

    标记V432由下列引物定义:

    V432:AACTTCTCCAACTCCCTCCACTGC(SEQ ID NO:15)

    和

    V432R:TTAGAGTGGCAAAGGGAAGATGGG(SEQ ID NO:16)

    从Védrantais品种或PI161375品种的基因组DNA中获得的扩增产物长432bp。PI161375品种的扩增产物具有一个对于酶HaeII的限制酶切位点,从而导致获得分别为223bp和209bp的两个片段。

    该限制酶切位点在Védrantais品种中不存在。

    标记V681由下列引物定义:

    V681:GGAATCTTGTTGAGGCCGAGAGGG(SEQ ID NO:11)

    和

    V681R:GTTGTATATGGCTTCCCTGTAGCC(SEQ ID NO:12)

    从Védrantais品种或PI161375品种的基因组DNA中获得的扩增产物长681bp。PI161375品种的扩增产物具有两个对于酶RsaI的限制酶切位点,从而导致获得分别为435b、221bp和25bp的三个片段。这些限制酶切位点在Védrantais品种中不存在。

    标记V1684由下列引物定义:

    V588:CAACAGGCTCAACAGTGTATTCGG(SEQ ID NO:13)

    和

    V551R:GAAGAAGGTGACGAGAGAGATGCC(SEQ ID NO:14)

    在Védrantais品种中扩增出的片段长大约1300bp,而在PI161375品种中,扩增物长1684bp。在这种情况下,涉及大小的多态性。

    这些标记以及标记D、E和M8(参见下文中的实施例4),和定义这些标记的寡核苷酸显示在下面的表1中:

                               表1    标记  寡核苷酸             5′-寡核苷酸序列-3′    L273    F2-B2 GGAGAGAGAATCCGGGACTAAGTGACT(SEQ ID NO:7)    F2-Br TAACCACCTTTTCCGATCAAATTTCGTAC(SEQ ID NO:8)    L246    F2-B2    Eco ATTGATGAATCTACACTCCTCGATCTCTTC(SEQ ID NO:9)    F2 Eco GAGTTCAATCCATTTCAATGATTTAAGATA(SEQ ID NO:10)    V681    V681 GGAATCTTGTTGAGGCCGAGAGGG(SEQ ID NO:11)    V681R GTTGTATATGGCTTCCCTGTAGCC(SEQ ID NO:12)    V1684    V588 CAACAGGCTCAACAGTGTATTCGG(SEQ ID NO:13)    V551R GAAGAAGGTGACGAGAGAGATGCC(SEQ ID NO:14)    V432    V432 AACTTCTCCAACTCCCTCCACTGC(SEQ ID NO:15)    V432R TTAGAGTGGCAAAGGGAAGATGGG(SEQ ID NO:16)    GRP805    GRP805 ATCCCCTGTTTCCTTCAACAACCC(SEQ ID NO:17)    GRP805R AACCCCCAAGAAGAAGAACAACCC(SEQ ID NO:18)    M8    M8 CCGACGCATCTCCCGACGCGTTGTTG(SEQ ID NO:19)    M8R TCGTGAAGGGTTTTGGAGAGTGAGAAA(SEQ ID NO:20)    标记E    LRR1 CCTTAGAAGAAGATGAAGTCTCCC(SEQ ID NO:21)    LRR842R CTCCACTCAGAATTGGTAGGTGCC(SEQ ID NO:22)    标记D    LRR915 AACAACTTAGAACCATCTCCCAGC(SEQ ID NO:23)    LRR1R GTTGTTGAGAGCAATAGTGTACCC(SEQ ID NO:24)

    这些寡核苷酸的组合(表2)已经用于扩增来自杂交的回交植物[F1(Védrantais×PI161375)×Védrantais]的DNA,这些植物在Vat座位附近出现重组事件。

                                                                        表2    标记    L273    GRP805    V432    V1684  Vat     V681     L246    M8    Oligo1    F2-B2    GRP805    V432    V588  表型:  对于棉  蚜的侵  袭和对  于病毒  传播的  抗性     V681     F2-B2     Eco    M8    Oligo2    F2-Br    GRP805R    V432R    V551R     V681R     F2 Eco    M8R 消 化 之 后 扩 增    消化    BsrGI    SapI    HaeII    没有消    化     RsaI     EcoRV    Aat II    Vé       drantais    153bp    +28bp    29bp    805bp    432bp    大约    1300bp     681bp     173bp    228bp    PI161375    182bp    +28bp    805bp    +508bp    297bp    223bp    +209bp    1684bp     435bp     +221bp     +25bp     144bp     +29bp    195bp    +33bp 植 物 的 编 号    P20 82    -    +    +    +  R     +     +    +    P6 93    -    -    +    +  R     +     +    +    P1 47    -    -    +    +  R     +     +    +    848    -    -    -    -  S     -     -    +    P4 23    +    -    -    -  S     -     -    -    P11 74    +    -    -    -  S     -     -    -    P35 35    +    -    -    -  S     -     -    -    P35 53    +    +    -    -  S     -     -    -    310    +    +    -    -  S     -     -    -    P26 64    +    +    +    -  S     -     -    -    P10 35    +    +    +    -  S     -     -    -    P49 40    +    +    +    +  R     +     -    -

    这些结果表明:

    植物P26 64在标记V432和Vat基因之间出现一个重组事件。

    植物P49 40在标记L246和Vat基因之间出现一个重组事件。

    植物P10 35在标记V1684和Vat基因之间出现一个重组事件。由于标记V1684包含Vat基因的ATG,所以这一植物显现出破坏该基因功能的基因内重组。

    标记V681与Vat基因共分离。

    因此,这些资料使得能够在遗传上鉴定出Vat基因。

    实施例2:Vat基因序列的亚克隆和检查

    在载体pGEM3Zf+(Promega)中进行Vat基因的亚克隆。为了这一操作,用限制性酶MscI消化BAC克隆3-18-9。将这样产生的每一个片段连接入载体pGEM3Zf+(Promega)中,然后用围绕Vat基因或位于该基因内的标记进行筛选。

    鉴定出了一个包含Vat基因的18185bp的克隆(克隆C7.1)。克隆C7.1的末端和核酸内切酶限制性的测序以及具有表1的寡核苷酸的Vat基因的测序使得能够确认与Vat基因非常相关。该克隆的11097bp的一部分序列显示在图1中,以及显示在附件的序列表中(SEQ ID NO:1)。

    实施例3:Vat基因的cDNA的获得

    通过使用Marathon cDNA clone kit(Clontech)这一试剂盒获得了cDNA。该cDNA显示在附件的序列表中,编号为SEQ ID NO:2。

    Vat基因具有4个外显子和3个内含子:

    第一个外显子有2367bp,并从起始密码子ATG的碱基1(相当于SEQ ID NO:1的2344位)延伸至碱基2367(相当于SEQ ID NO:1的4710位)。

    第一个内含子从碱基2368延伸至碱基2921(SEQ ID NO:1的4711至5264)。

    第二个外显子从碱基2922延伸至碱基4055(SEQ ID NO:1的5265至6398)。

    第二个内含子从碱基4056延伸至碱基4876(SEQ ID NO:1的6399至7219)。

    第三个外显子从碱基4877延伸至碱基5734(SEQ ID NO:1的7220至8077)。

    第三个内含子从碱基5735延伸至碱基5833(SEQ ID NO:1的8078至8176)。

    第四个外显子从碱基5834延伸至碱基5896(SEQ ID NO:1的8177至8239)。

    实施例4:Vat基因和Vat-like基因之间的差异

    在先前的筛选期间,鉴定出了一个具有Vat基因的同源物(Vat-like)的克隆(在核酸水平上具有93.8%的同一性,和在蛋白质水平上具有89.9%的同一性)。Vat-like的序列显示在附件的序列表中,编号为SEQ ID NO:4。

    由于Vat基因和Vat-like基因相距17kb,所以它们在遗传和物理上是相关的。

    两个标记(标记D和标记E)使得能够在PI161375中区分Vat基因和Vat-like基因。

    标记E由下列引物定义:

    LRR1:CCTTAGAAGAAGATGAAGTCTCCC(SEQ ID NO:21)

    和

    LRR842R:CTCCACTCAGAATTGGTAGGTGCC(SEQ ID NO:22)

    该标记使得能够在PI161375中扩增出一个相应于Vat基因的1722bp的片段,和一个相应于Vat-like基因的1527bp的片段。

    从Védrantais品种的基因组DNA中获得的扩增产物在琼脂糖凝胶上具有大约1.3kb的长度。

    标记D由下列引物定义:

    LRR915:AACAACTTAGAACCATCTCCCAGC(SEQ ID NO:23)

    和

    LRR1R:GTTGTTGAGAGCAATAGTGTACCC(SEQ ID NO:24)

    该标记使得能够在PI161375中扩增出一个相应于Vat基因的1549bp的片段,和一个相应于Vat-like基因的1372bp的片段。在Védrantais中,该标记使得能够扩增出4个大约750bp、900bp、1100bp、1300bp的DNA片段。

    标记L246和M8使得能够表征Vat基因和Vat-like基因之间的重组体,和在遗传上区分这两个基因。

    标记M8由下列引物定义:

    M8:CCGACGCATCTCCCGACGCGTTGTTG(SEQ ID NO:19)

    和

    M8R:TCGTGAAGGGTTTTGGAGAGTGAGAAA(SEQ ID NO:20)

    从Védrantais品种和PI161375品种的基因组DNA中获得的扩增产物长228bp。PI161375品种的扩增产物具有一个对于酶AatII的限制酶切位点,从而导致获得分别为195bp和33bp的两个片段。

    事实上,在回交种群[F1(Védrantais×PI161375)×Védrantais]中已经鉴定出了Vat基因和Vat-like基因之间的重组植物。这些只具有Vat-like基因的植物对于棉蚜是敏感的,例如植物848(表2)。相反地,不具有Vat-like基因的植物对于蚜虫(棉蚜)是有抗性的,例如植物P4940(表2)。

    实施例5:含有Vat基因的表达载体的构建

    将没有其启动子的Vat基因的基因组DNA引入双元载体pBin 61(BENDAHMANE等人,The Plant Journal 32,195-204,2002;该序列也能够在以下网址获得:http://www.sainsbury-laboratory.ac.uk/david-baulcombe/Services/pBin61.doc)中,该双元载体特别地含有嵌合基因NOS/NPTII、卡那霉素抗性选择标记和启动子p35S。将Vat基因以有义方向引入至启动子p35S之后。将载体pBin 61导入根癌土壤杆菌(Agrobacterium tumefaciens)的不同菌株(LBA4404、C58C1-pch32)中。

    作为另一种选择,将完整的基因组DNA在游离端引入载体SLJ7292(JONES等人,Transgenic Research,1,285-30 297,1992)和pBin19(BEVAN等人,Nucleic Acids Res 12:8711-8721,1984)中,该完整的基因组DNA含有Vat基因的上游和下游大约2.5kb,以确保启动子和调控序列的存在。将含有Vat基因的双元载体SLJ7292和pBin 19导入根癌土壤杆菌的不同菌株(LBA4404、C58C1-pch32、C58C1-pMP90(SCHWEITZER等人,Plasmid,4(2),196-204,1980;GOODNER等人,Science,294(5550),2323-2328,2001)或C58pGV2260(DEBLAERE等人,Nucleic Acids Res.13,4777-4788,1985))中。

    表3显示了根据植物所使用的构建体。

                                           表3   名称   启动子   菌株  质粒    抗生素   植物   B1-1   Vat   C58C1-pch32  pBin 19    卡那霉素(50mg/L)   甜瓜,   西红柿   B1-3   Vat   C58C1-pMP90  pBin 19    卡那霉素(50mg/L)    艮他霉素(20mg/L)   甜瓜,   西红柿,   棉花   pGV2260   Vat-Vat   Vat   C58C1-pGV2260  pBin 19    卡那霉素(50mg/L)    羧苄青霉素(50    mg/L)    利福平(50mg/L)   棉花   Vat   11.1   Vat   LBA4404  SLJ7292    四环素(5mg/L)    链霉素(300mg/L)    利福平(50mg/L)   棉花   A6-3   35S   C58C1-pch32  pBin 61    卡那霉素(50mg/L)    四环素(5mg/L)   甜瓜,   西红柿,   棉花   35C   35S-GUS   LBA4404  pBI121    卡那霉素(50mg/L)   甜瓜

    实施例6:在甜瓜中的功能验证

    -遗传转化的甜瓜植物的获得

    下面的方案是从GUIS等人的方案(Scientia horticulturae,84,91-99,2000)开始进行调整的。

    将Védrantais品种(VILMORIN)的敏感性甜瓜的叶的幼外植体在根癌土壤杆菌的悬浮液(106-108细胞/mL)中搅拌培养30分钟。用实施例5中所述的构建体实施转化。

    然后将潜在转化的外植体转移到1号Whatman纸上10分钟,随后在含有1μM 6-苄氨基嘌呤(BAP)、1μM 6-(g,g-二甲基烯丙基氨基)-嘌呤(2iP)、0.2mM乙酰丁香酮和0.7g/L琼脂的协同培养培养基中于27℃暗培养2天。

    叶外植体的再生是通过采用KATHAL等人(Plant Cell Reports,7,449-451,1988)所述的条件并作某些改动而完成的。将这些叶外植体转移至再生培养基上,该再生培养基由添加有1μM 6-苄氨基嘌呤(BAP)、1μM 6-(g,g-二甲基烯丙基氨基)-嘌呤(2iP)的MURASHIGE和SKOOG(MS)培养基(Physiol.Plant,15,473-497,1962)组成,且含有100mg/L卡那霉素和225mg/L特美汀,并在0.7g/L的琼脂中凝固。

    在培养3个星期之后,将在叶外植体上形成的芽切除,并在生长培养基上培育,该生长培养基由添加有1μM BAP和0.3μM赤霉酸(GA3)的MS培养基组成,且含有100mg/L卡那霉素和225mg/L特美汀,并在0.7g/L的琼脂中凝固。

    然后,将芽置于生根培养基中,该生根培养基由没有生长调节剂并含有同样数量的抗生素和琼脂的MS培养基组成。

    一旦出现根,就根据GUIS等人的方法(Scientia horticulturae,69,199-206,1997)使这些植物幼苗(plantule)适应气候,并依照AYUB等人(Nature Biotechnology,14,862-866,1996)所述的培养实践经验转移至温室中。

    将经再生和生根的植物通过流式细胞计量法进行分析。只保留二倍体植物,并在分子水平上用PCR进行研究以检验转基因的存在。

    为了揭示Vat基因的存在,使用如实施例1所述的位于Vat启动子水平的引物对V1684(SEQ ID NO:13和14)和位于Vat基因中的引物对D(SEQ ID NO:23和24)。

    PCR的条件如下:

    反应混合物:水补足至10μL;10×缓冲液1μL;dNTP’s(4mM)0.6μL;引物1(10pM)0.4μL和引物2(10pM)0.4μL;Taq Takara(5U/μL)0.08μL;DNA 1.2μL。

    -所使用的PCR的条件:

    阶段1:94℃2分钟

    阶段2(变性):94℃30秒

    阶段3(配对):60℃45秒

    阶段4(延伸):72℃2分钟

    阶段5:30个循环的阶段2至阶段4

    阶段6:72℃10分钟

    b-为了揭示卡那霉素抗性基因nptII的存在,使用引物

    Kana II:5′-CCGGCTACCTGCCCATTC-3′(SEQ ID NO:25)

    和Kana III:5′-GCGATAGAAGGCGATGCG-3′(SEQ ID NO:26)

    其条件为:

    -反应混合物:水补足至10μL;10×缓冲液1μL;MgCl2(25mM)0.6μL;dNTP’s(4mM)0.2μL;引物1(10pM)0.4μL和引物2(10pM)0.4μL;Taq Promega(5U/μL)0.04μL;DNA 1.2μL。

    -所使用的PCR的条件:

    阶段1:94℃2分钟

    阶段2(变性):94℃30秒

    阶段3(配对):53℃1分钟

    阶段4(延伸):72℃1分钟

    阶段5:30个循环的阶段2至阶段4

    阶段6:72℃10分钟

    c-为了检验没有任何扩增是由于在所研究的组织存在残留的细菌而引起的,将植物同样地用PCR进行测试,该PCR使用对于根癌土壤杆菌的菌株C58的染色体DNA特异的引物PicA+(ATGCGCATGAGGCTCGTCTTCGAG;SEQ ID NO:27)和PicA-(GACGCAACGCATCCTCGATCAGCT;SEQ ID NO:28);反应混合物和PCR的反应条件与对于nptII基因所使用的相同。

    从实施例5中所示的不同的构建体开始,对于甜瓜进行几个系列的转化。这些转化的结果概括在表4中。

                                              表4    基因型  构建体  培养的  外植体  的数量 生根的 二倍体 植物的 数量        PCR阳性的二倍体植物的数量   nptII Vat 标记V1684   Vat   标记D    PicA+/    PicA-  Védrantais  B1-1   100   2   2* 2*   2*    0  Védrantais  B1-3   106   0   0 0   0    0  Védrantais  A6-3   112   0   0 0   0    0            Védrantais敏感性的对照   0 0   0    0            PI161375抗性的对照(Vat)   0 +   +    0

    *将从构建体B1-1开始在同样的外植体上获得的两个Védrantais甜瓜二倍体植物(M1和M4)鉴定为携带有包含nptII和Vat基因的插入片段。

    通过这第一方案已经获得了两个携带有Védrantais基因型的Vat基因的转化体。

    将生根的二倍体植物于体外扦插在没有抗生素的培养基上,然后分株并于4个星期内在气候室中适应气候(于18℃黑暗8小时-于24℃光照16小时),之后进行生物测试。

    作为另一种选择,同样也可以采用在专利EP0412912(LIMAGRAIN)中所述的子叶外植体的遗传转化方法。已经将大约10000个C1Tz1甜瓜基因型的外植体用携带有pVat-Vat基因这一构建体的细菌C58C1pmp90进行接种。将在具有100mg/L卡那霉素的培养基上再生并生根的植物用PCR进行分析以检验转基因的存在:nptII和Vat。所使用的引物和PCR条件如上所述。27个转化事件鉴定为nptIl基因的携带者。

    总之,通过第一方案获得了2个携带有Védrantais基因型的Vat基因的转化体,和通过第二方案获得了27个转化体。

    -对于棉蚜侵袭的抗性的测量

    使用在甜瓜上收集的并被描述为克隆13(LUPOLI等人,Entomologia Experimentalis et Applicata,65,291-300,1992)的克隆Nm1(G.LABONNE,INRA,Montpellier)。于培养室中在Védrantais甜瓜上饲养蚜虫(棉蚜)(于24℃光照16小时,和于18℃黑暗8小时)。

    将来自遗传转化试验的植物以及来自对照植物进行体外发芽的植物进行10天的体内适应气候。

    对于棉蚜侵袭的抗性的测试从PITRAT和LECOQ(Phytopathology,70,958-961,1980)的方案进行了调整。用细的刷子将无翅的成虫取出,并置于培养皿中禁食1小时。将10只蚜虫放置在每株待测试的植物的两片展开的叶子上。在放置之后48小时,计量定居在叶子上的蚜虫数量。在48小时,在敏感的植物上定居有10只放置的蚜虫,然而在抗性的植物上只有几只蚜虫(通常少于5只)停留在叶子上。在侵害之后7天,观察成体蚜虫和幼虫的数量以及它们的发育阶段。在这一时期之后,在敏感的植物上产生新一代的蚜虫(平均存在超过100只蚜虫)和存在大量的幼虫(同样超过100只)。在抗性的植物上,几只成虫(通常少于5只)残留在叶子上,和只存在有几只发育不良的幼虫(少于30只)。在每个测试中,所使用的敏感性的对照是Védrantais栽培种,和抗性的对照是对于Vat座位纯合的Margot栽培种。

    所得的结果显示在表5和6中:

                                      表5    植物 测试的植 物数量      于48小时观察    于7天观察 抗性的植 物数量 敏感的植 物数量 抗性的植 物数量 敏感的植 物数量    Védrantais    敏感性的对照    10    0    10    0    10    Margot抗性的    对照    10    10    0    10    0    M1    8    7    1    7    1    M4    12    12    0    12    0

                                       表6        植物于48小时的个体的平均数量于7天的个体的平均数量    成虫     幼虫   成虫    幼虫    Védrantais敏感性    的对照    9.7     84   116    128    Margot抗性的对照    2.5     3.2   1.1    18    M1    3.6     17*   8.7*    34*    M4    3.2     10   4.5    30

    *在抗性的植物上进行估算的

    作为另一种选择,可以在每株待测试的植物的叶子上放置3只蚜虫而不是10只。蚜虫可以放在笼中也可以不放。在放置蚜虫7天之后。计数存在于植物上的成体蚜虫和幼虫的数量。

    所得的结果显示在表7中:

                                            表7   克隆的编   号 经适应气 候的植物 幼苗数量 经接种的 植物幼苗 数量 抗性的植 物幼苗数 量  “中间  的”植物  幼苗数量 敏感的植 物幼苗数 量   备注    C1Tz1    5     5   0     0     5  敏感的对照    C1Tz3    5     5   5     0     0  抗性的对照    V2.3    9     9   0     0     9  敏感    V2.4    6     4   2     2     0  存在花蕾    V2.12    12     11   0     0     11  敏感    V2.15    6     6   6     0     0  抗性    V3.1    12     12   12     0     0  抗性    V3.6    4     4   4     0     0  抗性    V4.18    7     7   7     0     0  抗性    V4.45    7     7   0     0     7  敏感    V7.19    7     7   7     0     0  抗性    V7.25    7     7   0     0     7  敏感    V8.26    8     7   0     0     7  敏感

    这些结果显示,克隆M1、M4、V2.15、V3.1、V3.6、V4.18和V7.19对于蚜虫具有抗性。

    -对于经棉蚜的病毒传播的抗性的测量

    病毒传播的测试基本上如PITRAT和LECOQ(Phytopathology,70,958-961,1980)所述来进行。可以将CMV(黄瓜花叶病毒)的毒株I17F用于在转化的植物和Védrantais与Margot对照品系中测试经棉蚜的传播。病毒通过机械接种而在Védrantais甜瓜上增殖。在禁食1小时之后,将成体蚜虫放置在置于培养皿中的经病毒感染的叶子上以获取病毒5分钟。然后将蚜虫转移至待测试的植物上。在放置了带病毒的蚜虫大约15分钟之后,用刷子回收蚜虫,然后用杀虫剂处理植物并置于培养室(于24℃光照12小时,和于18℃黑暗12小时)中。在接种15天之后,对于经棉蚜的CMV传播敏感的植物形成严重的花叶症状。抗性的植物不显示出任何的症状,而且在这些植物中用ELISA没有检测到病毒。ELISA测试根据CLARK和ADAMS(J.Gen.Virol.,34,475-483,1977)所述的方案用抗CMV的衣壳蛋白的抗体(ADGEN,fourni par la sociétéLCA,Bordeaux,France)来进行。

    实施例7:在西红柿中的功能验证

    -西红柿的转化

    转化方案由P.Rousselle(INRA,Montfavet,France)从HAMZA和CHUPEAU(J.Exp.Bot.,44,1837-1845,1993)的方案进行了调整,该转化方案是从几个基因型Férum(INRA品系)和Montfavet63.5(杂交F1代)的子叶开始的。

    用于转化的菌株为在实施例5中所描述的那些。将经再生和生根的植物通过流式细胞计量法进行分析,并只保留二倍体植物。

    通过PCR和RT-PCR进行分子分析,以检验包含nptII基因和Vat基因的插入片段的存在,以及其在再生植物的基因组中的表达。所采用的PCR条件与在实施例6中所述的相同。使用4对引物:位于Vat启动子水平的V1684(SEQ ID NO:13和SEQ ID NO:14),位于Vat基因中的标记D(SEQ ID NO:23和SEQ ID NO:24)和E(SEQ ID NO:21和SEQ IDNO:22)的引物对,和扩增出位于该基因3′端的片段的引物对V632。引物对V632的序列如下:

    Vat 632R:CTGGTGATGACATTCATATCTTCC(SEQ ID NO:29)

    Vat 632F:CCCAGCAACATACTGATTCCAAGC(SEQ ID NO:30)

    从不同的构建体(表8)开始,对于西红柿进行几个系列的转化,这是对于两个不同的基因型Ferum和Montfavet(INRA)来进行的。

                                           表8  基因  型  构建体 培养的外植 体的数量  生根的二  倍体植物  的数量                         PCR阳性的植物的数量   nptI   I  Vat标记  V1684   Vat   标记   E   Vat   标记   D   Vat标记   V632   PicA+/   PicA-  Ferum   B1-1    120    0    0    0    0    0    0    0  Ferum   B1-2    105    3    3    3    2*    2*    2*    0  Ferum   B1-3    90    0    0    0    0    0    0    0  Ferum   A6-3    120    0    0    0    0    0    0    0  Montf  avet   B1-1    90    1    1    1    1    1    1    0  Montf  avet   B1-2    80    6    6    3    4    4    4    0  Montf  avet   B1-3    80    3    3    3    2    2    2    0  Montf  avet   A6-3    91    11    10    **    9    10    10    0              Ferum非转化的敏感性的对照    0    0    0    0    0    0              Montfavet敏感性的对照    0    0    0    0    0    0

    *两株植物(T2和T7)中整个地整合有插入片段。在第三株植物中,只整合有nptII基因和Vat基因的一部分(包括标记V1684)。

    **构建体A6-3含有位于35S启动子调控之下的Vat基因;引物对V1684(位于Vat启动子的一个区域)不能允许筛选转化体。

    用标记D的引物对通过RT-PCR对于植物T7和Ferum对照进行分子分析(根据实施例6中所述的条件)使得能够揭示Vat基因在转化的植物(T7)中的表达。

    全部的用于Montfavet基因型的转化植物的引物使得能够确定14株来自不同外植体的植物整合有完整的转基因。

    总之,2株Ferum基因型的植物和14株Montfavet 63.5基因型的植物整合有Vat基因。

    只将经转化的植物扦插、分株和于4个星期内在气候室中适应气候(于18℃黑暗8小时-于24℃光照16小时),之后进行生物测试。当天只分析2株Ferum植物。

    -病毒传播的测量

    使用与对于在甜瓜上测试病毒传播抗性相同的棉蚜品种(Nm1)和同样的经棉蚜的传播方案。所选择的病毒为CMV(黄瓜花叶病毒)毒株I17F,其感染甜瓜和西红柿。该毒株在通过机械接种或经桃蚜传播时能有效地传播至西红柿中(JACQUEMOND等人,Molecular Breeding,8(1),85-94,2001)。该病毒在Védrantais甜瓜的植物幼苗上增殖。棉蚜获取CMV是在感染的甜瓜的这些植物幼苗上完成的。在处于5叶阶段的来自体外培养的西红柿植物幼苗上,或者在处于2叶阶段的来自播种的植物幼苗(播种之后大约5个星期)上,通过将10只带病毒的蚜虫放置在每株植物上完成了传播过程。对于每个基因型(对照西红柿和转化的西红柿)的传播率通过20株植物的至少2次重复来进行评测。敏感性的对照品种为Férum品种。

    ELISA测试根据CLARK和ADAMS(J.Gen.Virol.,34,475-483,1977)所述的方案用抗CMV的衣壳蛋白的抗体(ADGEN,fourni par lasociétéLCA,Bordeaux,France)来进行。

    对于少数植物所获得的主要结果描述于表9中。

                                    表9      植物 测试植物的数量          侵染后21天所进行的评测 感染的植物数量  未感染的植物数量Ferum敏感性的对照    6    6    0Ferum T1    9    9    0Ferum T2    3    2    1Ferum T7    6    3    3

    *没有症状且经ELISA未检测到病毒

    携带有截短的Vat基因的编号T1的植物和敏感的对照植物100%被感染。在编号T12和T7的某些转化植物中,病毒没有传播,这表明Vat基因可能在具有完整的Vat的转基因西红柿中在对于经棉蚜的病毒传播的抗性方面发挥着作用。

    实施例8:在棉花中的功能验证

    -棉花的转化

    棉花(陆地棉(Gossypium hirsutum L.))的遗传转化基于由SHOEMAKER等人(Plant Cell Reports,3,178-181,1986)以及TROLINDER和GOODIN(Plant Cell Reports,6,231-234,1987)发表的通过体细胞胚胎发生过程的转化体再生。该转化方法根据UMBECK等人(Biotechnology,5,263-266,1987)以及FIROOZABADY等人(PlantMolecular Biology,10,105-116,1987)所述使用细菌根癌土壤杆菌作为转化载体,但相对于所提及的出版物作了某些修改和调整。用于转化的土壤杆菌菌株与在实施例5中所述的菌株相同,特别是LBA4404、C58C1pGV2260和C58C1pMP90菌株。第一个菌株或者含有质粒pSLJ7292,或者含有质粒pBin 61,质粒pSLJ7292除了其他之外由处于Nos启动子调控之下的卡那霉素抗性基因和处于其本来的启动子调控之下的Vat基因构成,质粒pBin 61含有处于35S启动子调控之下的Vat基因。另两个菌株携带有质粒pBin 19,该质粒除了其他之外由处于Nos启动子调控之下的卡那霉素抗性基因和处于其本来的启动子调控之下的Vat基因构成。

    -棉花的再生

    使用下胚轴的外植体(Coker 310品种),其是在于无菌条件下培育的幼小植物上采集的。将这些外植体在土壤杆菌存在下放置20分钟,然后在培养基(基础培养基)上培养48小时,该培养基由MURASHIGE和SKOOG(MS)的矿物元素、30g/L葡萄糖、MOREL和WETMORE(Am.J.Bot.38,141-143,1951)的维生素、0.1-0.05mg/L 2,4-二氯苯氧乙酸和0.1-0.01mg/L激动素组成。该培养基既不含有选择试剂,也不含有为了阻止细菌增长的抗生素。在该协同培养时期之后,将这些外植体移栽至添加有25mg/L卡那霉素和500mg/L头孢氨噻肟的同样的培养基上。然后,每隔15天将这些外植体移栽至这一同样的培养基上。在培养3-5个星期之后,出现来自转化细胞增殖的愈伤组织。当愈伤组织的大小达到大约0.5cm的直径时,将它们分离并移栽至同样的培养基上,在该培养基中头孢氨噻肟的浓度降低一半,和生长物质(2,4-二氯苯氧乙酸和激动素)的浓度同样也降低。然后每隔2个星期进行一次移栽,直至出现胚胎组织。根据愈伤组织的情况,可以应用一系列在生长物质浓度方面变化的培养基。在没有添加生长物质的基础培养基上分离胚胎组织。在该培养基上,一定比例的原胚发育成植物幼苗。将这些植物幼苗用管转移至由液体基础培养基“浇灌的”蛭石支持物之上,该液体基础培养基不含生长物质,和其中蔗糖代替了葡萄糖。当它们达到大约4-6cm大小时,将它们直接转移至S2型温室中。

    通过PCR进行分子分析,以检验Vat基因的存在,以及其在再生植物的基因组中的表达。使用一对引物用于扩增npt II基因。对于Vat基因使用两对引物:第一对指定的引物632扩增位于Vat基因3′端的Vat片段,第二对指定的引物LRR扩增位于Vat基因之中的片段。

    用于扩增npt II基因的引物对的序列如下:

    Kana III:GCGATAGAAGGCGATGCG(SEQ ID NO:26)

    Kana R:CCGGCTACCTGCCATTCG(SEQ ID NO:31)

    引物对632的序列如下:

    Vat 632F:CCCAGCAACATACTGATTCCAAGC(SEQ ID NO:30)

    Vat 632R:CTGGTGATGACATTCATATCTTCC(SEQ ID NO:29)

    引物对LRR的序列如下:

    LRR F:GTTGTTGAGAGCAATAGTGTAC(SEQ ID NO:32)

    LRR R:CCTTAGAGAAGAATGAAGTCTC(SEQ ID NO:33)

    无论使用何种引物,PCR的条件如下:

    对于25μL的反应介质:

    水9.5μL

    10×缓冲液:2.5μL

    dNTP(2.5mM):2μL

    Oligo 1(10μM):2.5μL

    Oligo 2(10μM):2.5μL

    Taq(5U/μL):0.25μL

    DNA:5μL

    程序:

    94℃3分钟

    然后35个循环:94℃30秒-59℃45秒-72℃45秒。

    总之,在8个月之后,将12株转化的植物转移至温室中;它们来自5个不同的胚胎发生来源。在这些之中,2株植物来自2个不同的来源,对于这2个来源在上述PCR条件下扩增出了Vat基因。其他的植物来自这样的来源,即对于这些来源扩增出了npt II基因而不是Vat基因。它们在这样的情况下可能表现为假阴性,即随着基质(matrice)量的改变可能用原先证明为阴性的提取物获得大小适当的扩增。

    -对于棉蚜的侵害的抗性的测量

    使用在棉花(留尼汪岛地区)上提取的棉蚜的一个克隆,并让其保留在棉花上。事实上,已经证明了,根据宿主植物棉蚜种群在遗传上具有紧密的结构(VANLERBERGHE-MASUTTI和CHAVIGNY,Molecular Ecology,7,905-914,1998)。测试根据与对于甜瓜同样的方案来进行,但培养条件是调整为棉花的植物的培养条件。将棉花于28℃-30℃的温度下保持在S2型温室中,并在强度和持续时间方面提供补充照明以达到12-12的光周期。

    除了如对于甜瓜测试所进行的抗性评测之外,同样还可以进行有关转化植物上的蚜虫生活史(幼虫不同阶段的持续时间,成虫存活的时间,内在增长率,...)(XIA等人,Entomologia Experimentalis et Applicata,90,25-35,1999)的更精确的评测,以便检测在异源情况下Vat基因对于棉蚜可能更弱的作用。

                               序列表

    <110>GENOPLANTE-VALOR

    DOGIMONT,Catherine

    BENDAHMANE,Abdelhafid

    PITRAT,Michel

    BURGET-BIGEARD,Emilie

    HAGEN,Lynda

    LE MENN,Aline

    PAUQUET,Jérme

    ROUSSELLE,Patrick

    CABOCHE,Michel

    CHOVELON,Véronique

    <120>对棉蚜的抗性基因

    <130>MJPbv1516/11

    <150>FR 03 00287

    <151>2003-01-13

    <160>33

    <170>PatentIn version 3.1

    <210>1

    <211>10922

    <212>DNA

    <213>香瓜

    <220>

    <221>外显子

    <222>(2344)..(4710)

    <223>

    <220>

    <221>内含子

    <222>(4711)..(5264)

    <223>

    <220>

    <221>外显子

    <222>(5265)..(6398)

    <223>

    <220>

    <221>内含子

    <222>(6399)..(7219)

    <223>

    <220>

    <221>外显子

    <222>(7220)..(8077)

    <223>

    <220>

    <221>内含子

    <222>(8078)..(8176)

    <223>

    <220>

    <221>外显子

    <222>(8177)..(8239)

    <223>

    <400>1

    ccggagtgta cataataagg agacaccatc acaagtcttg aagctttggc gctcttgaaa    60

    ttcagctttt aaattaatta gtcatgtttt tcaaatatat aacataggag aatatgagtt    120

    ttgcgtcaaa tcccatcttg gcagagtgta ttttgatgaa attccttatt ggaaggaact    180

    gccatatttt tagaatttgg aatctgtaaa gttattctca tgtggttttt tgggcagtgg    240

    agggagttgg agaagttgat tggtgtgcag atctatgtat aggacagatc attgaagagg    300

    aaaaaagaat tggaatatta gggatttggt taattaagca atatgggaag ttggatttca    360

    gaattgcaat tcatgattgg gtttcgattt aggaagaatg gacttgcaaa ttcaatttaa    420

    cataaaattt cttttttttt tcctaaatta atttttattt gatcttcgga ctcatccaat    480

    gcaatttaca ggtcactaca aacaatatcc atgtcagcac acataacgtg tctagtagac    540

    attacgttaa cttaatgtag gaaacaaaaa gaaaaacgaa aaaggcaaga aatgaaaaag    600

    gaaacgttgt gtatgatgat taaaatgtac gttgatagct aaattcaact ttgttcttca    660

    ttagcaacaa caagggacaa caaaatgaaa atttcagcac agttatggaa tgttgaagaa    720

    gaaggtgacg agagagatgc cacatcataa aaaattaata ttataatcat ttttgtcaca    780

    tcagttttct gattacttat atttaaccta cacatcattt tgccgttact caactaacga    840

    tcgatatgac ctttaaagct cgatgattaa aatgtttatt ttgaactttc agggactata    900

    taaatgtata tatatcaact tcaaatctta gcggtcaaaa gtgcattttg ttttagttta    960

    aaacaccgag atgtgacgat taataatgcc tacacactca cgtactcaca catgcagtga    1020

    gttttttatg ttttttttac acacattaga cgcaaattga attcctaatt ccattcccta    1080

    agacaagttt ctaatgactt atacaattca cataggcatg catgcagaac aagcgaaaaa    1140

    cgacgaattt accttaagaa aatggcccaa ccaaccactt acacaatctc aggcatacca    1200

    ttccccggga tgaaagaatt ttgcctgtaa ttcattcgat ctcaggcata caatgcatcg    1260

    agaagacgca aaatgaaaga caaaagtata gaacaacaca atcctgtact tcattttaaa    1320

    cgatagtttt caaatttaac gatcgtgtag atcatgatac acgatctcga gccttagtgg    1380

    caccgagatg gcccgagatg aaagaattat gtctttattt tattcgatat taagcataca    1440

    ttacttcgag atgaaagacc tctaccttta gttattcgat ctcgagcctt aattgaatcg    1500

    agatgaccca agattgatag atcgcaaaga agatatatat cgtaagggca tatatgaaat    1560

    ttatgaaaat acgatcatgt gtcataaact tttcttattt tgttatatag accgtaaata    1620

    ttatagattt tggttacatt tgtgtaaatt actctatttt tttttagtaa aacaaatgaa    1680

    ttaaattttt taaaaaaaaa ttattgagag ttgaagtaat tgggtgtttt ctaaaagatt    1740

    gaaataaata cctttattaa ctttgcaaat atattttcaa agaggctaac aaatcaaata    1800

    tattttctaa aaaaatcaca ttgcgttggg gataaggtaa gagtaatgga aaaatgaaag    1860

    gttgtgaaca attcgtactc ttacttatga gatttgacag aacaaatatt tttcaaatac    1920

    tctttttacg ttttcttttt taaaattaaa taacaaatac ttttccactg cttttctttt    1980

    cttccattga ctcctcaact aataattttg gtcttcccat tattatcttc ttcttcttca    2040

    tttttctctg cactgtctct tctccatttc aacatcttct tatatcttca ttcaggttaa    2100

    atatttcatc ccttaccatt tttatttaca ttttccatct gatcatttct atacttataa    2160

    actcgataat ttgtttagac tttctttaga tagtttttac ttggtgatct gtatgtgttc    2220

    actcctactt ttctgttagg caaaatcttc aaaattatta tggttcattc ctcgtggttt    2280

    tttagctctt caagtatttt tgtaggtttt gatccttttc aagctcaaga acagaggata    2340

    ata atg gac atc ctt att tca gtc act gca aaa att gcc gaa tac act      2388

        Met Asp Ile Leu Ile Ser Val Thr Ala Lys Ile Ala Glu Tyr Thr

        1               5                   10                  15

    gtt gag cct gtt gga cgc caa ctt ggt tat gta ttt ttc att cgt tcc      2436

    Val Glu Pro Val Gly Arg Gln Leu Gly Tyr Val Phe Phe Ile Arg Ser

                    20                  25                  30

    aac ttt caa aaa ctt aag act caa gta gaa aag ctg aag att aca aga      2484

    Asn Phe Gln Lys Leu Lys Thr Gln Val Glu Lys Leu Lys Ile Thr Arg

                35                  40                  45

    gag tct gtg caa cac aag atc cat agt gca aga aga aat gct gaa gac      2532

    Glu Ser Val Gln His Lys Ile His Ser Ala Arg Arg Asn Ala Glu Asp

            50                  55                  60

    ata aaa cct gcc gtt gag gaa tgg ttg aaa aag gtc gat gac ttt gtc      2580

    Ile Lys Pro Ala Val Glu Glu Trp Leu Lys Lys Val Asp Asp Phe Val

        65                  70                  75

    cga gaa tct gac gag ata tta gcc aat gaa ggt gga cat ggt gga ctc      2628

    Arg Glu Ser Asp Glu Ile Leu Ala Asn Glu Gly Gly His Gly Gly Leu

    80                  85                  90                  95

    tgt tcc acc tat ttg gtc caa cga cac aag tta agt aga aaa gca agc      2676

    Cys Ser Thr Tyr Leu Val Gln Arg His Lys Leu Ser Arg Lys Ala Ser

                    100                 105                 110

    aaa atg gta gat gag gtt ctt gag atg aaa aat gag ggg gaa agt ttt      2724

    Lys Met Val Asp Glu Val Leu Glu Met Lys Asn Glu Gly Glu Ser Phe

                115                 120                 125

    gat atg gta tcc tat aaa agt gtt atc cca tca gtt gat tgt tca ctt      2772

    Asp Met Val Ser Tyr Lys Ser Val Ile Pro Ser Val Asp Cys Ser Leu

            130                 135                 140

    cca aaa gtg cct gac ttt ctt gac ttt gag tca aga aag tcg att atg      2820

    Pro Lys Val Pro Asp Phe Leu Asp Phe Glu Ser Arg Lys Ser Ile Met

        145                 150                 155

    gaa caa atc atg gat gca cta tct gat ggt aat gtc cat agg att gga      2868

    Glu Gln Ile Met Asp Ala Leu Ser Asp Gly Asn Val His Arg Ile Gly

    160                 165                 170                 175

    gta tat ggg atg ggg ggt gtt ggc aaa aca atg cta gtg aag gat att      2916

    Val Tyr Gly Met Gly Gly Val Gly Lys Thr Met Leu Val Lys Asp Ile

                    180                 185                 190

    tta aga aaa att gtg gag agt aag aag cct ttt gat gag gtg gta aca      2964

    Leu Arg Lys Ile Val Glu Ser Lys Lys Pro Phe Asp Glu Val Val Thr

                195                 200                 205

    tcc acg atc agc caa aca cca gat ttt aga agt atc caa gga caa cta      3012

    Ser Thr Ile Ser Gln Thr Pro Asp Phe Arg Ser Ile Gln Gly Gln Leu

            210                 215                 220

    gct gac aag cta ggt ttg aaa ttc gaa caa gaa aca ata gaa gga agg      3060

    Ala Asp Lys Leu Gly Leu Lys Phe Glu Gln Glu Thr Ile Glu Gly Arg

        225                 230                 235

    gct act att cta cga aag agg tta aag atg gag aga agt atc cta gtt      3108

    Ala Thr Ile Leu Arg Lys Arg Leu Lys Met Glu Arg Ser Ile Leu Val

    240                 245                 250                 255

    gtg ttg gat gat gtt tgg gag tat att gat ttg gaa act ata gga att      3156

    Val Leu Asp Asp Val Trp Glu Tyr Ile Asp Leu Glu Thr Ile Gly Ile

                    260                 265                 270

    cca agt gtt gaa gat cat acg ggg tgc aag atc ttg ttt acc act agg      3204

    Pro Ser Val Glu Asp His Thr Gly Cys Lys Ile Leu Phe Thr Thr Arg

                275                 280                 285

    att aaa cat ttg atc tca aat caa atg tgc gcc aat aaa att ttt gag      3252

    Ile Lys His Leu Ile Ser Asn Gln Met Cys Ala Asn Lys Ile Phe Glu

            290                 295                 300

    ata aaa gtt tta gga aaa gat gag tca tgg aat tta ttt aag gca atg      3300

    Ile Lys Val Leu Gly Lys Asp Glu Ser Trp Asn Leu Phe Lys Ala Met

        305                 310                 315

    gca ggt gac att gtt gat gca agt gat ttg aag cct ata gcc att cga      3348

    Ala Gly Asp Ile Val Asp Ala Ser Asp Leu Lys Pro Ile Ala Ile Arg

    320                 325                 330                 335

    att gtg aga gaa tgt gca ggt ttg cct att gct att act act gtt gct      3396

    Ile Val Arg Glu Cys Ala Gly Leu Pro Ile Ala Ile Thr Thr Val Ala

                    340                 345                 350

    aag gca tta cga aat aaa cct tcc gac att tgg aat gat gcc tta gat      3444

    Lys Ala Leu Arg Asn Lys Pro Ser Asp Ile Trp Asn Asp Ala Leu Asp

                355                 360                 365

    cag ctt aaa act gtt gat gtg ggt atg gca aac att gga gaa atg gaa      3492

    Gln Leu Lys Thr Val Asp Val Gly Met Ala Asn Ile Gly Glu Met Glu

            370                 375                 380

    aag aaa gtg tat ttg tca cta aaa ctg agt tac gat tgc ttg gga tat      3540

    Lys Lys Val Tyr Leu Ser Leu Lys Leu Ser Tyr Asp Cys Leu Gly Tyr

        385                 390                 395

    gaa gag gtg aag tta tta ttc ttg tta tgc agc atg ttt cca gaa gac      3588

    Glu Glu Val Lys Leu Leu Phe Leu Leu Cys Ser Met Phe Pro Glu Asp

    400                 405                 410                 415

    ttt agc att gac gtg gaa ggg ttg cat gta tat gcc atg ggc atg gga      3636

    Phe Ser Ile Asp Val Glu Gly Leu His Val Tyr Ala Met Gly Met Gly

                    420                 425                 430

    ttc tta cat ggt gtt gat act gtg gta aaa gga cga cgt agg ata aaa      3684

    Phe Leu His Gly Val Asp Thr Val Val Lys Gly Arg Arg Arg Ile Lys

                435                 440                 445

    aaa ttg gtt gat gat ctt ata tct tct tct ttg ctt caa caa tat tct      3732

    Lys Leu Val Asp Asp Leu Ile Ser Ser Ser Leu Leu Gln Gln Tyr Ser

            450                 455                 460

    gag tat ggg tgc aat tat gtg aaa atg cat gat atg gtt cgt gat gta      3780

    Glu Tyr Gly Cys Asn Tyr Val Lys Met His Asp Met Val Arg Asp Val

        465                 470                 475

    gcc cta tta att gca tct aag aat gaa cac gta cgt aca ttg agc tat      3828

    Ala Leu Leu Ile Ala Ser Lys Asn Glu His Val Arg Thr Leu Ser Tyr

    480                 485                 490                 495

    gtg aaa aga tcg aat gaa gaa tgg gaa gaa gag aaa cta ttg ggt aat      3876

    Val Lys Arg Ser Asn Glu Glu Trp Glu Glu Glu Lys Leu Leu Gly Asn

                    500                 505                 510

    cat acc gca gtg ttc att gat ggt tta cat tat cct ctc ccg aag tta      3924

    His Thr Ala Val Phe Ile Asp Gly Leu His Tyr Pro Leu Pro Lys Leu

                515                 520                 525

    acg tta ccc aaa gtt caa tta tta agg tta gtt gca aaa tat tgt tgg      3972

    Thr Leu Pro Lys Val Gln Leu Leu Arg Leu Val Ala Lys Tyr Cys Trp

            530                 535                 540

    gaa cat aat aag cgt gtg tcg gtg gta gaa act ttt ttt gaa gaa atg      4020

    Glu His Asn Lys Arg Val Ser Val Val Glu Thr Phe Phe Glu Glu Met

        545                 550                 555

    aaa gag ctc aaa ggt tta gta gta gaa aac gta aat ata tca ttg atg      4068

    Lys Glu Leu Lys Gly Leu Val Val Glu Asn Val Asn Ile Ser Leu Met

    560                 565                 570                 575

    caa cga cca tct gat gtt tac tcc tta gca aac atc aga gta tta cgt      4116

    Gln Arg Pro Ser Asp Val Tyr Ser Leu Ala Asn Ile Arg Val Leu Arg

                    580                 585                 590

    ttg gaa aga tgt caa tta tta ggg agc ata gat tgg att ggt gaa tta      4164

    Leu Glu Arg Cys Gln Leu Leu Gly Ser Ile Asp Trp Ile Gly Glu Leu

                595                 600                 605

    aaa aag ctt gaa att ctt gat ttt agt gaa tct aac atc aca caa att      4212

    Lys Lys Leu Glu Ile Leu Asp Phe Ser Glu Ser Asn Ile Thr Gln Ile

            610                 615                 620

    cct aca acc atg agc caa ttg aca cag cta aaa gtg ttg aat tta tct      4260

    Pro Thr Thr Met Ser Gln Leu Thr Gln Leu Lys Val Leu Asn Leu Ser

        625                 630                 635

    tct tgt gaa caa ctt gag gta att cca cca aat att ctt tca aag ttg      4308

    Ser Cys Glu Gln Leu Glu Val Ile Pro Pro Asn Ile Leu Ser Lys Leu

    640                 645                 650                 655

    aca aaa ttg gaa gaa tta gat ctg gaa act ttt gat gga tgg gaa gga      4356

    Thr Lys Leu Glu Glu Leu Asp Leu Glu Thr Phe Asp Gly Trp Glu Gly

                    660                 665                 670

    gaa gaa tgg tat gaa gga agg aaa aat gct agc ctt tct gaa ctc aag      4404

    Glu Glu Trp Tyr Glu Gly Arg Lys Asn Ala Ser Leu Ser Glu Leu Lys

                675                 680                 685

    tgc ttg cga cac ctt tat gct tta aac tta acc att caa gat gaa gaa      4452

    Cys Leu Arg His Leu Tyr Ala Leu Asn Leu Thr Ile Gln Asp Glu Glu

            690                 695                 700

    att atg cca gaa aac ttg ttc tta gtt ggg aag ttg aag ctt caa aaa      4500

    Ile Met Pro Glu Asn Leu Phe Leu Val Gly Lys Leu Lys Leu Gln Lys

        705                 710                 715

    ttc aac att tgt att ggt tgc gaa agc aaa tta aag tat act ttt gca      4548

    Phe Asn Ile Cys Ile Gly Cys Glu Ser Lys Leu Lys Tyr Thr Phe Ala

    720                 725                 730                 735

    tac aag aac aga atc aaa aac ttc att gga atc aag atg gaa tca gga      4596

    Tyr Lys Asn Arg Ile Lys Asn Phe Ile Gly Ile Lys Met Glu Ser Gly

                    740                 745                 750

    agg tgc ttg gat gat tgg ata aaa aat ttg tta aag agg tcg gac aat      4644

    Arg Cys Leu Asp Asp Trp Ile Lys Asn Leu Leu Lys Arg Ser Asp Asn

                755                 760                 765

    gtg ctt ttg gaa gga tca gtt tgt tca aag gtt ctc cac tca gaa ttg      4692

    Val Leu Leu Glu Gly Ser Val Cys Ser Lys Val Leu His Ser Glu Leu

            770                 775                 780

    gta ggt gcc aat aac ttc gtaagtttgc agtatctcta cctttatgat             4740

    Val Gly Ala Asn Asn Phe

        785

    aattcaaaat ttcaacattt tatcaacgtt agcaatacca tcaacattga agaatcattt    4800

    tttagtgaaa tggtaaattt catcaacaca tttttctatg tttctatata cacatcaaaa    4860

    tttataaatc acctgtttgt tcatttttat tgttccttcc acaagttcct tctaacattt    4920

    gtggttagta atgatattag ggataagatt ctattcttct ttgttttaga aggctcttct    4980

    cttggtgtag agagactctt tcttgtttca tacattaatg ataatatata attttagact    5040

    tctaaaatat ataaatgcat gtcaggtgat attccaagaa aatttaaaga agtttattag    5100

    atatttccta tctaaggaag caaatttgaa gtaatcattt tacacaattt gttatggtaa    5160

    ttttaaaaca ctatataaat tatatgttgt tagttagcat cagttgtgat gatatggtta    5220

    attacgttgt cacaaactga acttttaagg acgtaaattt gtag gta tca ctt cct     5276

                                                     Val Ser Leu Pro

                                                     790

    aat ttg gag aag ttg gaa att gtg aat gca aag agt ttg aag atg ata      5324

    Asn Leu Glu Lys Leu Glu Ile Val Asn Ala Lys Ser Leu Lys Met Ile

        795                 800                 805

    tgg agc aat aac gtg cca att ctt aat tcc ttt tcc aaa ctc gag gaa      5372

    Trp Ser Asn Asn Val Pro Ile Leu Asn Ser Phe Ser Lys Leu Glu Glu

    810                 815                 820                 825

    ata aaa att tat tca tgc aac aat ctt caa aaa gta tta ttt cct cca      5420

    Ile Lys Ile Tyr Ser Cys Asn Asn Leu Gln Lys Val Leu Phe Pro Pro

                    830                 835                 840

    aat atg atg gac att ctc aca tgc ctt aaa gtc tta gag atc aaa aat      5468

    Asn Met Met Asp Ile Leu Thr Cys Leu Lys Val Leu Glu Ile Lys Asn

                845                 850                 855

    tgt gat ttg ttg gaa ggg ata ttt gaa gcg caa gag cca att agt gtt      5516

    Cys Asp Leu Leu Glu Gly Ile Phe Glu Ala Gln Glu Pro Ile Ser Val

            860                 865                 870

    gtt gag agc aat aat tta ccc att ctt aat tcc ttt tcc aaa ctc gag      5564

    Val Glu Ser Asn Asn Leu Pro Ile Leu Asn Ser Phe Ser Lys Leu Glu

    875                     880                 885

    gaa ata aga att tgg tca tgc aac aat ctt caa aaa gta tta ttt cct      5612

    Glu Ile Arg Ile Trp Ser Cys Asn Asn Leu Gln Lys Val Leu Phe Pro

    890                 895                 900                 905

    tca aat atg atg ggc att ctt cca tgc ctt aaa gtc tta gat att aga      5660

    Ser Asn Met Met Gly Ile Leu Pro Cys Leu Lys Val Leu Asp Ile Arg

                    910                 915                 920

    ggt tgt gaa ttg ttg gaa ggg ata ttt gaa gtg caa gag cca att agt      5708

    Gly Cys Glu Leu Leu Glu Gly Ile Phe Glu Val Gln Glu Pro Ile Ser

                925                 930                 935

    gtt gtt gag agc aat agt gta ccc att ctt aat tcc ttt tcc aaa ctc      5756

    Val Val Glu Ser Asn Ser Val Pro Ile Leu Asn Ser Phe Ser Lys Leu

            940                 945                 950

    gag aaa ata aga att tgg tca tgc aac aat ctt caa aaa ata tta ttt      5804

    Glu Lys Ile Arg Ile Trp Ser Cys Asn Asn Leu Gln Lys Ile Leu Phe

        955                 960                 965

    cct tca aat atg atg ggc att ctt aca tgc ctt aaa gtc tta gag atc    5852

    Pro Ser Asn Met Met Gly Ile Leu Thr Cys Leu Lys Val Leu Glu Ile

    970                 975                 980                 985

    aga gat tgt gaa ttg ttg gaa ggg ata ttt gaa gtg caa gag cca att    5900

    Arg Asp Cys Glu Leu Leu Glu Gly Ile Phe Glu Val Gln Glu Pro Ile

                    990                 995                 1000

    agt gtt gtt gag  agc aat aat tta ccc  att ctt aat tcc ttt  tcc     5945

    Ser Val Val Glu  Ser Asn Asn Leu Pro  Ile Leu Asn Ser Phe  Ser

                1005                 1010                 1015

    aaa ctc gag gaa  ata aga att ggg tca  tgc aac aat ctt caa  aaa     5990

    Lys Leu Glu Glu  Ile Arg Ile Gly Ser  Cys Asn Asn Leu Gln  Lys

                1020                 1025                 1030

    gta tta ttt cct  cca aat atg atg ggc  att ctt aca tgc ctt  aaa     6035

    Val Leu Phe Pro  Pro Asn Met Met Gly  Ile Leu Thr Cys Leu  Lys

                1035                 1040                 1045

    gtc tta gag att  aga cat tgt aat ttg  ttg gaa ggg ata ttt  gaa     6080

    Val Leu Glu Ile  Arg His Cys Asn Leu  Leu Glu Gly Ile Phe  Glu

                1050                 1055                 1060

    gtg caa gag cca  att agt att gtt gaa  gcg agt cct atc ttg  ctc     6125

    Val Gln Glu Pro  Ile Ser Ile Val Glu  Ala Ser Pro Ile Leu  Leu

                1065                 1070                 1075

    caa aat tta tct  tcg ttg atg tta tgt  aat ctt cca aac ctt  gag     6170

    Gln Asn Leu Ser  Ser Leu Met Leu Cys  Asn Leu Pro Asn Leu  Glu

                1080                 1085                 1090

    tac gtg tgg agc  aaa aat cct tat gaa  ctt ctg agt ttg gaa  aat     6215

    Tyr Val Trp Ser  Lys Asn Pro Tyr Glu  Leu Leu Ser Leu Glu  Asn

                1095                 1100                 1105

    ata aaa agt ttg  acc att gat aaa tgt  cca aga ctt aga aga  gaa     6260

    Ile Lys Ser Leu  Thr Ile Asp Lys Cys  Pro Arg Leu Arg Arg  Glu

                1110                 1115                 1120

    tac tca gtc aaa  att cta aag caa ctt  gaa gat gta agc ata  gat     6305

    Tyr Ser Val Lys  Ile Leu Lys Gln Leu  Glu Asp Val Ser Ile  Asp

                1125                 1130                 1135

    atc aaa caa ttg  atg aag gtt att gag  aag gaa aag tca gca  cat     6350

    Ile Lys Gln Leu  Met Lys Val Ile Glu  Lys Glu Lys Ser Ala  His

                1140                 1145                 1150

    cat aat atg ttg  gaa tca aag caa tgg  gag act tca tct tct  tct     6395

    His Asn Met Leu  Glu Ser Lys Gln Trp  Glu Thr Ser Ser Ser  Ser

                1155                 1160                 1165

    aag gtacgtatat attctacaag aaaacatgtt tgttcaattt aattttcaga           6448

    Lys

    aaataaattg ttttcaagaa ttagttgaac agaattggtt ctgttagttg aacagagttt    6508

    taaagaaaac aaattattat gtttgttcta gaaacctatg gaaattagtg ttattagggg    6568

    ttaattattt acctgaatta aaaaagaata agcaagtaaa ccgcttaatt ttaatatgtt    6628

    tatcaataga aattaggatc cgtttggatt gacttgaatg atatgttttc ctggaaagaa    6688

    actcattttt gtttgaactc atttttatga aaattggcta aaatatattt aaaaaattag    6748

    gtggctttca aatattcaat ttttttttta aaataactta ttttttgaat taaacactcc    6808

    aaaatgtaat tcaaaaacac ccctaagtta attagatata taattaatac ataaattaat    6868

    taattttatt tagttgagtt aaattagttt taatgcaaac aataatatat ttttatagcc    6928

    aatatacaag aatgaaagta agaaaagaag acaaaaaaaa atgatatgtt aattagaatt    6988

    ttacataaag aatgatctga ttaaaagcta atctctatcg atatagtttt ttaattatat    7048

    taaatatagt aagtagtcca ttataataat tgaatttttt tgtaccaaat taattaaact    7108

    aattcttttt actaattatt gaatatttaa gatatttttg gctaattaat taataatttg    7168

    tgtgcaaata taagttatta ttgcatttat ttaatagatt ttgatcatca g gat ggg     7225

                                                             Asp Gly

    gtt  cta cgg ctg gga gat  ggt tct aag ttg ttt  cca aat ctt aaa       7270

    Val  Leu Arg Leu Gly Asp  Gly Ser Lys Leu Phe  Pro Asn Leu Lys

    1170                 1175                 1180 

    agt  ttg aag cta tat ggt  ttt gtt gat tat aac  tca acc cat tta       7315

    Ser  Leu Lys Leu Tyr Gly  Phe Val Asp Tyr Asn  Ser Thr His Leu

    1185                 1190                 1195

    cca  atg gaa atg ttg caa  atc tta ttc caa ctt  gta gtc ttt gaa       7360

    Pro  Met Glu Met Leu Gln  Ile Leu Phe Gln Leu  Val Val Phe Glu

    1200                 1205                 1210

    ttg  gaa gga gca ttt ctt  gaa gaa att ttc ccc  agc aac ata ctg       7405

    Leu  Glu Gly Ala Phe Leu  Glu Glu Ile Phe Pro  Ser Asn Ile Leu

    1215                 1220                 1225

    att  cca agc tat atg gtt  tta aga aga tta gct  cta tct aaa cta       7450

    Ile  Pro Ser Tyr Met Val  Leu Arg Arg Leu Ala  Leu Ser Lys Leu

    1230                 1235                 1240

    ccc  aag ctt aag cat ttg  tgg agt gaa gaa tgc  tca caa aac aat       7495

    Pro  Lys Leu Lys His Leu  Trp Ser Glu Glu Cys  Ser Gln Asn Asn

    1245                 1250                 1255

    atc  acc tca gtt ctt caa  cat ttg att tct cta  aga att tca gaa    7540

    Ile  Thr Ser Val Leu Gln  His Leu Ile Ser Leu  Arg Ile Ser Glu

    1260                 1265                 1270

    tgt  gga aga ttg agt agt  tta ctg tcg tca ata  gtg tgt ttt aca    7585

    Cys  Gly Arg Leu Ser Ser  Leu Leu Ser Ser Ile  Val Cys Phe Thr

    1275                 1280                 1285

    aac  ttg aaa cat ctt cgg  gtt tat aaa tgt gat  gga cta acc cat    7630

    Asn  Leu Lys His Leu Arg  Val Tyr Lys Cys Asp  Gly Leu Thr His

    1290                 1295                 1300

    ttg  ctg aat cct tcg gtg  gct aca acg ctt gtg  caa ctt gag tct    7675

    Leu  Leu Asn Pro Ser Val  Ala Thr Thr Leu Val  Gln Leu Glu Ser

    1305                 1310                 1315

    ttg  aca ata gaa gaa tgc  aaa agg atg agt agt  gta att gag gga    7720

    Leu  Thr Ile Glu Glu Cys  Lys Arg Met Ser Ser  Val Ile Glu Gly

    1320                 1325                 1330

    gga  tca acc gaa gaa gat  gga aat gat gaa atg  gtt gta ttc aac    7765

    Gly  Ser Thr Glu Glu Asp  Gly Asn Asp Glu Met  Val Val Phe Asn

    1335                 1340                 1345

    aac  cta caa cat tta tac  att ttt aat tgt tcc  aac cta aca agc    7810

    Asn  Leu Gln His Leu Tyr  Ile Phe Asn Cys Ser  Asn Leu Thr Ser

    1350                 1355                 1360

    ttt  tat tgt ggg aga tgc  att att aaa ttt cca  tgt ttg agg caa    7855

    Phe  Tyr Cys Gly Arg Cys  Ile Ile Lys Phe Pro  Cys Leu Arg Gln

    1365                 1370                 1375

    gta  gac att tgg aac tgt  tct gaa atg aag gtc  ttt tcg ctt gga    7900

    Val  Asp Ile Trp Asn Cys  Ser Glu Met Lys Val  Phe Ser Leu Gly

    1380                 1385                 1390

    att  gta agc aca cct cga  ttg aaa tat gaa aat  ttt tct tta aag    7945

    Ile  Val Ser Thr Pro Arg  Leu Lys Tyr Glu Asn  Phe Ser Leu Lys

    1395                 1400                 1405

    aat  gat tac gat gat gaa  cgg tgt cat cca aaa  tat ccc aaa gat    7990

    Asn  Asp Tyr Asp Asp Glu  Arg Cys His Pro Lys  Tyr Pro Lys Asp

    1410                 1415                 1420

    atg  ttg gtg gaa gat atg  aat gtc atc acc aga  gaa tat tgg gag    8035

    Met  Leu Val Glu Asp Met  Asn Val Ile Thr Arg  Glu Tyr Trp Glu

    1425                 1430                 1435

    gat  aat gtt gat acc gga  att cca aat tta ttt  gcc gaa cag           8077

    Asp  Asn Val Asp Thr Gly  Ile Pro Asn Leu Phe  Ala Glu Gln

    1440                 1445                 1450

    gtttgtatat ttaattacct tttcatattt ggtaataatt aatttttatt atttgtgtgt    8137

    tagagtatga actttaatga atttatttaa ttaatgcag agt ttg  gag gaa aac      8191

                                               Ser Leu  Glu Glu Asn

                                                   1455

    cga tct  gaa aat tct tct tct  tcg aag aat aat gtt  gag aaa gaa       8236

    Arg Ser  Glu Asn Ser Ser Ser  Ser Lys Asn Asn Val  Glu Lys Glu

        1460                 1465                 1470

    taa ggaattatat ggatattgtt gtacactact taatatatca tttcatccac           8289

    aaggaaaagg tcagaatctt gaaatcctcc attctttttt atgagagaat atcatccaat    8349

    gtcaaattga aaagtctcga tagatttgtt aaattaactt ttgatacaag tcataaaatg    8409

    ttaattagta taataataat atatctgatc ccatcaaatt aattagaagt aacgacaaat    8469

    ttaacttctg taatatcaat tcaatttgat gtctcaatca actgcataaa atttgatgtc    8529

    acaaatttaa cttctgtaat gtgaatcttt tttttttttc cctttgcaca taaaaccaac    8589

    aagttaaaat agatataaca aagaatttaa ttcacatata ataaattcat ccaatataat    8649

    gttctttcac ctttttctct ctttcacaaa actgtaataa taatatctac cacaaaaggt    8709

    aaaccattaa tatgattctt caagaaggtt gtttatttgg tcaaattttc atgaaagtat    8769

    taatacagtg tatgttttgc aaaggaagct gccaaatacc tacctcaatc ctagcagatg    8829

    cgttctttgc aagttggctg tcaaagactt gaaccatatt ttcacaacct gtgccaattc    8889

    gcaaatagcc tctgggtcaa actgcacgac aaaattggtg gaaactttga tacaaacagt    8949

    ateaaagccc tctgttggtc tcttggctcg ctgaaacaat caaacagaaa gaacatcatt    9009

    ctctcgatgt aggtgtggat cttctttagt ccatttgggt ggaaagaaac aataggattt    9069

    tcatagacac agaaagaagc ttagtcacat ttgggaagat atcgaaactt tgattggacc    9129

    atggtcgagt agaaacaaaa tgttcaaaga ctacaatcca acatcaatct ttaaacttta    9189

    gagctttgtt agattaatgt ttgttgtata tggcttccct gtagccaaag aaatatacat    9249

    tgtaacaatg gtttgatgaa atgataatga agtggtatgg tgtgtttcaa ttgcaaaaaa    9309

    tatgattctt caagaaaggc cgagaggata agattgtgat cgtgccatgc gcttgggttg    9369

    tgatttaatt acaaatatat tcatatagta tttggagcaa aacagtccta attaattaaa    9429

    tataatgcgt tattttattt ttctgaataa gttaaattta accactagaa atttttttac    9489

    taagtgaaca ttttcatagc actttcataa tccccacttc attaaaatga atcaataaag    9549

    ttcaaggaaa gtgtagaatg atgaatctaa aagaaacaaa aaaeaaggta tataagttta    9609

    aagcaacggt ggtagcactg taatgatccg agggagtaca cattttttca taaattattt    9669

    tattatcatc aatagaagaa ttcgaatttc ttttatcttt taattgataa tataatttca    9729

    taattagcta taagtggatt tttcaaatga ttggatccac atacatatca acttcgatca    9789

    aattattaaa ggtataattt taaatcacta agaagaaaag gattgatggt gggccttatg    9849

    ctattataca ctttgagtac cctctcggcc tcaacaagat tcccaagttc aataattgaa    9909

    actttgaaaa atgtgtgcaa tcacatgtat tcaatttcta tgtcggtatc acatattttc    9969

    atgtttccat acgtttaatt tccatataaa agtgaatcca taattttatt atattgcgaa    10029

    aaaatctacc aaacatggaa attagctatg aaaatattag taatataaat aatggatatg    10089

    ttgacttatt tgaaaaaaat taaaaaaata ttcatttatg ggtttaaatt tatttttaaa    10149

    ttttttgttt ttatatatta ttttaaaaat atatattgaa attaatattt tattgatatt    10209

    atatcatcaa aatttttgta aaattaagat cattaatata acgccccaga cccaagattt    10269

    ggaattcgga tccctgacat tcttttgcat ccactgtgat ctgataacat catctttact    10329

    tgtcttaaat tattagactg aaagttctct ccacaaaaca ataggagtca tttcaacata    10389

    ctttgtcctc actcacagca tccctatcac tcataattaa tgtaaaattt tattatattt    10449

    gtaaatatgt tttggtgtac tttgccatat attaaaacat actactaaac aaaacgaaat    10509

    gattaaaaag gaagggaagg tattaaaaat tataaatttt aagaaaggaa aagaagaaga    10569

    aggaaaaaaa aaaaaaaaag agaatgatga gtgagaggca ccaagtgagg acatatacta    10629

    ctctttgagt acataaccta atggttaaga aaaaaaaaaa tctcatatca aattcaaagt    10689

    gccatgctat tattacttaa tattttatat ggaagttaaa taaattgtta gagagaagtc    10749

    ttgttttctg tctgtttgtt aactcatttt tgtaattaat gtttaatttg atcattgtca    10809

    ttccaattaa ttgtaacata attttctgcc caatttatct cttttgcttt cgtttttgtt    10869

    tagataccct actcggctac tcctcaactt ttcctcattt cattttcagt tgg           10922

    <210>2

    <211>5085

    <212>DNA

    <213>香瓜

    <400>2

    attattatgg ttcattcctc gtggtttttt agctcttcaa gtatttttgt aggttttgat    60

    ccttttcaag ctcaagaaca gaggataata atggacatcc ttatttcagt cactgcaaaa    120

    attgccgaat acactgttga gcctgttgga cgccaacttg gttatgtatt tttcattcgt    180

    tccaactttc aaaaacttaa gactcaagta gaaaagctga agattacaag agagtctgtg    240

    caacacaaga tccatagtgc aagaagaaat gctgaagaca taaaacctgc cgttgaggaa    300

    tggttgaaaa aggtcgatga ctttgtccga gaatctgacg agatattagc caatgaaggt    360

    ggacatggtg gactctgttc cacctatttg gtccaacgac acaagttaag tagaaaagca    420

    agcaaaatgg tagatgaggt tcttgagatg aaaaatgagg gggaaagttt tgatatggta    480

    tcctataaaa gtgttatccc atcagttgat tgttcacttc caaaagtgcc tgactttctt    540

    gactttgagt caagaaagtc gattatggaa caaatcatgg atgcactatc tgatggtaat    600

    gtccatagga ttggagtata tgggatgggg ggtgttggca aaacaatgct agtgaaggat    660

    attttaagaa aaattgtgga gagtaagaag ccttttgatg aggtggtaac atccacgatc    720

    agccaaacac cagattttag aagtatccaa ggacaactag ctgacaagct aggtttgaaa    780

    ttcgaacaag aaacaataga aggaagggct actattctac gaaagaggtt aaagatggag    840

    agaagtatcc tagttgtgtt ggatgatgtt tgggagtata ttgatttgga aactatagga    900

    attccaagtg ttgaagatca tacggggtgc aagatcttgt ttaccactag gattaaacat    960

    ttgatctcaa atcaaatgtg cgccaataaa atttttgaga taaaagtttt aggaaaagat    1020

    gagtcatgga atttatttaa ggcaatggca ggtgacattg ttgatgcaag tgatttgaag    1080

    cctatagcca ttcgaattgt gagagaatgt gcaggtttgc ctattgctat tactactgtt    1140

    gctaaggcat tacgaaataa accttccgac atttggaatg atgccttaga tcagcttaaa    1200

    actgttgatg tgggtatggc aaacattgga gaaatggaaa agaaagtgta tttgtcacta    1260

    aaactgagtt acgattgctt gggatatgaa gaggtgaagt tattattctt gttatgcagc    1320

    atgtttccag aagactttag cattgacgtg gaagggttgc atgtatatgc catgggcatg    1380

    ggattcttac atggtgttga tactgtggta aaaggacgac gtaggataaa aaaattggtt    1440

    gatgatctta tatcttcttc tttgcttcaa caatattctg agtatgggtg caattatgtg    1500

    aaaatgcatg atatggttcg tgatgtagcc ctattaattg catctaagaa tgaacacgta    1560

    cgtacattga gctatgtgaa aagatcgaat gaagaatggg aagaagagaa actattgggt    1620

    aatcataccg cagtgttcat tgatggttta cattatcctc tcccgaagtt aacgttaccc    1680

    aaagttcaat tattaaggtt agttgcaaaa tattgttggg aacataataa gcgtgtgtcg    1740

    gtggtagaaa ctttttttga agaaatgaaa gagctcaaag gtttagtagt agaaaacgta    1800

    aatatatcat tgatgcaacg accatctgat gtttactcct tagcaaacat cagagtatta    1860

    cgtttggaaa gatgtcaatt attagggagc atagattgga ttggtgaatt aaaaaagctt    1920

    gaaattcttg attttagtga atctaacatc acacaaattc ctacaaccat gagccaattg    1980

    acacagctaa aagtgttgaa tttatcttct tgtgaacaac ttgaggtaat tccaccaaat    2040

    attctttcaa agttgacaaa attggaagaa ttagatctgg aaacttttga tggatgggaa    2100

    ggagaagaat ggtatgaagg aaggaaaaat gctagccttt ctgaactcaa gtgcttgcga    2160

    cacctttatg ctttaaactt aaccattcaa gatgaagaaa ttatgccaga aaacttgttc    2220

    ttagttggga agttgaagct tcaaaaattc aacatttgta ttggttgcga aagcaaatta    2280

    aagtatactt ttgcatacaa gaacagaatc aaaaacttca ttggaatcaa gatggaatca    2340

    ggaaggtgct tggatgattg gataaaaaat ttgttaaaga ggtcggacaa tgtgcttttg    2400

    gaaggatcag tttgttcaaa ggttctccac tcagaattgg taggtgccaa taacttcgta    2460

    tcacttccta atttggagaa gttggaaatt gtgaatgcaa agagtttgaa gatgatatgg    2520

    agcaataacg tgccaattct taattccttt tccaaactcg aggaaataaa aatttattca    2580

    tgcaacaatc ttcaaaaagt attatttcct ccaaatatga tggacattct cacatgcctt    2640

    aaagtcttag agatcaaaaa ttgtgatttg ttggaaggga tatttgaagc gcaagagcca    2700

    attagtgttg ttgagagcaa taatttaccc attcttaatt ccttttccaa actcgaggaa    2760

    ataagaattt ggtcatgcaa caatcttcaa aaagtattat ttccttcaaa tatgatgggc    2820

    attcttccat gccttaaagt cttagatatt agaggttgtg aattgttgga agggatattt    2880

    gaagtgcaag agccaattag tgttgttgag agcaatagtg tacccattct taattccttt    2940

    tccaaactcg agaaaataag aatttggtca tgcaacaatc ttcaaaaaat attatttcct    3000

    tcaaatatga tgggcattct tacatgcctt aaagtcttag agatcagaga ttgtgaattg    3060

    ttggaaggga tatttgaagt gcaagagcca attagtgttg ttgagagcaa taatttaccc    3120

    attcttaatt ccttttccaa actcgaggaa ataagaattg ggtcatgcaa caatcttcaa    3180

    aaagtattat ttcctccaaa tatgatgggc attcttacat gccttaaagt cttagagatt    3240

    agacattgta atttgttgga agggatattt gaagtgcaag agccaattag tattgttgaa    3300

    gcgagtccta tcttgctcca aaatttatct tcgttgatgt tatgtaatct tccaaacctt    3360

    gagtacgtgt ggagcaaaaa tccttatgaa cttctgagtt tggaaaatat aaaaagtttg    3420

    accattgata aatgtccaag acttagaaga gaatactcag tcaaaattct aaageaactt    3480

    gaagatgtaa gcatagatat caaacaattg atgaaggtta ttgagaagga aaagtcagca    3540

    catcataata tgttggaatc aaagcaatgg gagacttcat cttcttctaa ggatggggtt    3600

    ctacggetgg gagatggttc taagttgttt ccaaatctta aaagtttgaa gctatatggt    3660

    tttgttgatt ataactcaac ccatttacca atggaaatgt tgcaaatctt attccaactt    3720

    gtagtctttg aattggaagg agcatttctt gaagaaattt tccccagcaa catactgatt    3780

    ccaagctata tggttttaag aagattagct ctatctaaac tacccaagct taagcatttg    3840

    tggagtgaag aatgctcaca aaacaatatc acctcagttc ttcaacattt gatttctcta    3900

    agaatttcag aatgtggaag attgagtagt ttactgtcgt caatagtgtg ttttacaaac    3960

    ttgaaacatc ttcgggttta taaatgtgat ggactaaccc atttgctgaa tccttcggtg    4020

    gctacaacgc ttgtgcaact tgagtctttg acaatagaag aatgcaaaag gatgagtagt    4080

    gtaattgagg gaggatcaac cgaagaagat ggaaatgatg aaatggttgt attcaacaac    4140

    ctacaacatt tatacatttt taattgttcc aacctaacaa gcttttattg tgggagatgc    4200

    attattaaat ttccatgttt gaggcaagta gacatttgga actgttctga aatgaaggtc    4260

    ttttcgcttg gaattgtaag cacacctcga ttgaaatatg aaaatttttc tttaaagaat    4320

    gattacgatg atgaacggtg tcatccaaaa tatcccaaag atatgttggt ggaagatatg    4380

    aatgtcatca ceagagaata ttgggaggat aatgttgata ccggaattcc aaatttattt    4440

    gccgaacaga gtttggagga aaaccgatct gaaaattctt cttcttcgaa gaataatgtt    4500

    gagaaagaat aaggaattat atggatattg ttgtacacta cttaatatat catttcatcc    4560

    acaaggaaaa ggaagctgcc aaatacctac ctcaatccta gcagatgcgt tctttgcaag    4620

    ttggctgtca aagacttgaa ccatattttc acaacctgtg ccaattcgca aatagcctct    4680

    gggtcaaact gcacgacaaa attggtggaa actttgatac aaacagtatc aaagccctct    4740

    gttggtctct tggetcgctg aaacaatcaa acagaaagaa catcattctc tcgatgtagg    4800

    tgtggatctt ctttagtcca tttgggtgga aagaaacaat aggattttca tagacacaga    4860

    aagaagctta gtcacatttg ggaagatatc gaaactttga ttggaccatg gtcgagtaga    4920

    aacaaaatgt tcaaagacta caatccaaca tcaatcttta aactttagag ctttgttaga    4980

    ttaatgtttg ttgtatatgg cttccctgta gccaaagaaa tatacattgt aacaatggtt    5040

    tgatgaaatg ataatgaagt ggtatggtgt gtttcaattg caaaa                    5085

    <210>3

    <211>1473

    <212>PRT

    <213>香瓜

    <400>3

    Met Asp Ile Leu Ile Ser Val Thr Ala Lys Ile Ala Glu Tyr Thr Val

    1               5                   10                  15

    Glu Pro Val Gly Arg Gln Leu Gly Tyr Val Phe Phe Ile Arg Ser Asn

                20                  25                  30

    Phe Gln Lys Leu Lys Thr Gln Val Glu Lys Leu Lys Ile Thr Arg Glu

            35                  40                  45

    Ser Val Gln His Lys Ile His Ser Ala Arg Arg Asn Ala Glu Asp Ile

        50                  55                  60

    Lys Pro Ala Val Glu Glu Trp Leu Lys Lys Val Asp Asp Phe Val Arg

    65                  70                  75                  80

    Glu Ser Asp Glu Ile Leu Ala Asn Glu Gly Gly His Gly Gly Leu Cys

                    85                  90                  95

    Ser Thr Tyr Leu Val Gln Arg His Lys Leu Ser Arg Lys Ala Ser Lys

                100                 105                 110

    Met Val Asp Glu Val Leu Glu Met Lys Asn Glu Gly Glu Ser Phe Asp

            115                 120                 125

    Met Val Ser Tyr Lys Ser Val Ile Pro Ser Val Asp Cys Ser Leu Pro

        130                 135                 140

    Lys Val Pro Asp Phe Leu Asp Phe Glu Ser Arg Lys Ser Ile Met Glu

    145                 150                 155                 160

    Gln Ile Met Asp Ala Leu Ser Asp Gly Asn Val His Arg Ile Gly Val

                    165                 170                 175

    Tyr Gly Met Gly Gly Val Gly Lys Thr Met Leu Val Lys Asp Ile Leu

                180                 185                 190

    Arg Lys Ile Val Glu Ser Lys Lys Pro Phe Asp Glu Val Val Thr Ser

            195                 200                 205

    Thr Ile Ser Gln Thr Pro Asp Phe Arg Ser Ile Gln Gly Gln Leu Ala

        210                 215                 220

    Asp Lys Leu Gly Leu Lys Phe Glu Gln Glu Thr Ile Glu Gly Arg Ala

    225                 230                 235                 240

    Thr Ile Leu Arg Lys Arg Leu Lys Met Glu Arg Ser Ile Leu Val Val

                    245                 250                 255

    Leu Asp Asp Val Trp Glu Tyr Ile Asp Leu Glu Thr Ile Gly Ile Pro

                260                 265                 270

    Ser Val Glu Asp His Thr Gly Cys Lys Ile Leu Phe Thr Thr Arg Ile

            275                 280                 285

    Lys His Leu Ile Ser Asn Gln Met Cys Ala Asn Lys Ile Phe Glu Ile

        290                 295                 300

    Lys Val Leu Gly Lys Asp Glu Ser Trp Asn Leu Phe Lys Ala Met Ala

    305                 310                 315                 320

    Gly Asp Ile Val Asp Ala Ser Asp Leu Lys Pro Ile Ala Ile Arg Ile

                    325                 330                 335

    Val Arg Glu Cys Ala Gly Leu Pro Ile Ala Ile Thr Thr Val Ala Lys

                340                 345                 350

    Ala Leu Arg Asn Lys Pro Ser Asp Ile Trp Asn Asp Ala Leu Asp Gln

            355                 360                 365

    Leu Lys Thr Val Asp Val Gly Met Ala Asn Ile Gly Glu Met Glu Lys

        370                 375                 380

    Lys Val Tyr Leu Ser Leu Lys Leu Ser Tyr Asp Cys Leu Gly Tyr Glu

    385                 390                 395                 400

    Glu Val Lys Leu Leu Phe Leu Leu Cys Ser Met Phe Pro Glu Asp Phe

                    405                 410                 415

    Ser Ile Asp Val Glu Gly Leu His Val Tyr Ala Met Gly Met Gly Phe

                420                 425                 430

    Leu His Gly Val Asp Thr Val Val Lys Gly Arg Arg Arg Ile Lys Lys

            435                 440                 445

    Leu Val Asp Asp Leu Ile Ser Ser Ser Leu Leu Gln Gln Tyr Ser Glu

        450                 455                 460

    Tyr Gly Cys Asn Tyr Val Lys Met His Asp Met Val Arg Asp Val Ala

    465                 470                 475                 480

    Leu Leu Ile Ala Ser Lys Asn Glu His Val Arg Thr Leu Ser Tyr Val

                    485                 490                 495

    Lys Arg Ser Asn Glu Glu Trp Glu Glu Glu Lys Leu Leu Gly Asn His

                500                 505                 510

    Thr Ala Val Phe Ile Asp Gly Leu His Tyr Pro Leu Pro Lys Leu Thr

            5l5                 520                 525

    Leu Pro Lys Val Gln Leu Leu Arg Leu Val Ala Lys Tyr Cys Trp Glu

        530                 535                 540

    His Asn Lys Arg Val Ser Val Val Glu Thr Phe Phe Glu Glu Met Lys

    545                 550                 555                 560

    Glu Leu Lys Gly Leu Val Val Glu Asn Val Asn Ile Ser Leu Met Gln

                    565                 570                 575

    Arg Pro Ser Asp Val Tyr Ser Leu Ala Asn Ile Arg Val Leu Arg Leu

                580                 585                 590

    Glu Arg Cys Gln Leu Leu Gly Ser Ile Asp Trp Ile Gly Glu Leu Lys

            595                 600                 605

    Lys Leu Glu Ile Leu Asp Phe Ser Glu Ser Asn Ile Thr Gln Ile Pro

        610                 615                 620

    Thr Thr Met Ser Gln Leu Thr Gln Leu Lys Val Leu Asn Leu Ser Ser

    625                 630                 635                 640

    Cys Glu Gln Leu Glu Val Ile Pro Pro Asn Ile Leu Ser Lys Leu Thr

                    645                 650                 655

    Lys Leu Glu Glu Leu Asp Leu Glu Thr Phe Asp Gly Trp Glu Gly Glu

                660                 665                 670

    Glu Trp Tyr Glu Gly Arg Lys Asn Ala Ser Leu Ser Glu Leu Lys Cys

            675                 680                 685

    Leu Arg His Leu Tyr Ala Leu Asn Leu Thr Ile Gln Asp Glu Glu Ile

        690                 695                 700

    Met Pro Glu Asn Leu Phe Leu Val Gly Lys Leu Lys Leu Gln Lys Phe

    705                 710                 715                 720

    Asn Ile Cys Ile Gly Cys Glu Ser Lys Leu Lys Tyr Thr Phe Ala Tyr

                    725                 730                 735

    Lys Asn Arg Ile Lys Asn Phe Ile Gly Ile Lys Met Glu Ser Gly Arg

                740                 745                 750

    Cys Leu Asp Asp Trp Ile Lys Asn Leu Leu Lys Arg Ser Asp Asn Val

            755                 760                 765

    Leu Leu Glu Gly Ser Val Cys Ser Lys Val Leu His Ser Glu Leu Val

        770                 775                 780

    Gly Ala Asn Asn Phe Val Ser Leu Pro Asn Leu Glu Lys Leu Glu Ile

    785                 790                 795                 800

    Val Asn Ala Lys Ser Leu Lys Met Ile Trp Ser Asn Asn Val Pro Ile

                    805                 810                 815

    Leu Asn Ser Phe Ser Lys Leu Glu Glu Ile Lys Ile Tyr Ser Cys Asn

                820                 825                 830

    Asn Leu Gln Lys Val Leu Phe Pro Pro Asn Met Met Asp Ile Leu Thr

            835                 840                 845

    Cys Leu Lys Val Leu Glu Ile Lys Asn Cys Asp Leu Leu Glu Gly Ile

        850                 855                 860

    Phe Glu Ala Gln Glu Pro Ile Ser Val Val Glu Ser Asn Asn Leu Pro

    865                 870                 875                 880

    Ile Leu Asn Ser Phe Ser Lys Leu Glu Glu Ile Arg Ile Trp Ser Cys

                    885                 890                 895

    Asn Asn Leu Gln Lys Val Leu Phe Pro Ser Asn Met Met Gly Ile Leu

                900                 905                 910

    Pro Cys Leu Lys Val Leu Asp Ile Arg Gly Cys Glu Leu Leu Glu Gly

            915                 920                 925

    Ile Phe Glu Val Gln Glu Pro Ile Ser Val Val Glu Ser Asn Ser Val

        930                 935                 940

    Pro Ile Leu Asn Ser Phe Ser Lys Leu Glu Lys Ile Arg Ile Trp Ser

    945                 950                 955                 960

    Cys Asn Asn Leu Gln Lys Ile Leu Phe Pro Ser Asn Met Met Gly Ile

                    965                 970                 975

    Leu Thr Cys Leu Lys Val Leu Glu Ile Arg Asp Cys Glu Leu Leu Glu

                980                 985                 990

    Gly Ile Phe Glu Val Gln Glu Pro  Ile Ser Val Val Glu  Ser Asn Asn

            995                 1000                 1005

    Leu Pro  Ile Leu Asn Ser Phe  Ser Lys Leu Glu Glu  Ile Arg Ile

        1010                 1015                 1020

    Gly Ser  Cys Asn Asn Leu Gln  Lys Val Leu Phe Pro  Pro Asn Met

        1025                 1030                 1035

    Met Gly  Ile Leu Thr Cys Leu  Lys Val Leu Glu Ile  Arg His Cys

        1040                 1045                 1050

    Asn Leu  Leu Glu Gly Ile Phe  Glu Val Gln Glu Pro  Ile Ser Ile

        1055                 1060                 1065

    Val Glu  Ala Ser Pro Ile Leu  Leu Gln Asn Leu Ser  Ser Leu Met

        1070                 1075                 1080

    Leu Cys  Asn Leu Pro Asn Leu  Glu Tyr Val Trp Ser  Lys Asn Pro

        1085                 1090                 1095

    Tyr Glu  Leu Leu Ser Leu Glu  Asn Ile Lys Ser Leu  Thr Ile Asp

        1100                 1105                 1110

    Lys Cys  Pro Arg Leu Arg Arg  Glu Tyr Ser Val Lys  Ile Leu Lys

        1115                 1120                 1125

    Gln Leu  Glu Asp Val Ser Ile  Asp Ile Lys Gln Leu  Met Lys Val

        1130                 1135                 1140

    Ile Glu  Lys Glu Lys Ser Ala  His His Asn Met Leu  Glu Ser Lys

        1145                 1150                 1155

    Gln Trp  Glu Thr Ser Ser Ser  Ser Lys Asp Gly Val  Leu Arg Leu

        1160                 1165                 1170

    Gly Asp  Gly Ser Lys Leu Phe  Pro Asn Leu Lys Ser  Leu Lys Leu

        1175                 1180                 1185

    Tyr Gly  Phe Val Asp Tyr Asn  Ser Thr His Leu Pro  Met Glu Met

        1190                 1195                 1200

    Leu Gln  Ile Leu Phe Gln Leu  Val Val Phe Glu Leu  Glu Gly Ala

        1205                 1210                 1215

    Phe Leu  Glu Glu Ile Phe Pro  Ser Asn Ile Leu Ile  Pro Ser Tyr

        1220                 1225                 1230

    Met Val  Leu Arg Arg Leu Ala  Leu Ser Lys Leu Pro  Lys Leu Lys

        1235                 1240                 1245

    His Leu  Trp Ser Glu Glu Cys  Ser Gln Asn Asn Ile  Thr Ser Val

        1250                 1255                 1260

    Leu Gln  His Leu Ile Ser Leu  Arg Ile Ser Glu Cys  Gly Arg Leu

        1265                 1270                 1275

    Ser Ser  Leu Leu Ser Ser Ile  Val Cys Phe Thr Asn  Leu Lys His

        1280                 1285                 1290

    Leu Arg  Val Tyr Lys Cys Asp  Gly Leu Thr His Leu  Leu Asn Pro

        1295                 1300                 1305

    Ser Val  Ala Thr Thr Leu Val  Gln Leu Glu Ser Leu  Thr Ile Glu

        1310                 1315                 1320

    Glu Cys  Lys Arg Met Ser Ser  Val Ile Glu Gly Gly  Ser Thr Glu

        1325                 1330                 1335

    Glu Asp  Gly Asn Asp Glu Met  Val Val Phe Asn Asn  Leu Gln His

        1340                 1345                 1350

    Leu Tyr  Ile Phe Asn Cys Ser  Asn Leu Thr Ser Phe  Tyr Cys Gly

        1355                 1360                 1365

    Arg Cys  Ile Ile Lys Phe Pro  Cys Leu Arg Gln Val  Asp Ile Trp

        1370                 1375                 1380

    Asn Cys  Ser Glu Met Lys Val  Phe Ser Leu Gly Ile  Val Ser Thr

        1385                 1390                 1395

    Pro Arg  Leu Lys Tyr Glu Asn  Phe Ser Leu Lys Asn  Asp Tyr Asp

        1400                 1405                 1410

    Asp Glu  Arg Cys His Pro Lys  Tyr Pro Lys Asp Met  Leu Val Glu

        1415                 1420                 1425

    Asp Met  Asn Val Ile Thr Arg  Glu Tyr Trp Glu Asp  Asn Val Asp

        1430                 1435                 1440

    Thr Gly  Ile Pro Asn Leu Phe  Ala Glu Gln Ser Leu  Glu Glu Asn

        1445                 1450                 1455

    Arg Ser  Glu Asn Ser Ser Ser  Ser Lys Asn Asn Val  Glu Lys Glu

        1460                 1465                 1470

    <210>4

    <211>10773

    <212>DNA

    <213>香瓜

    <400>4

    tcaacctccc aattaccata agtgcaaaat tcttttgtcg tccatattat tgttaatgaa      60

    gaacaaagat gaatttaacc aatcaccata cattttattt agatcgtatg caacattttc      120

    tttttcattt ctagcctaaa tccctcatat tttcccctaa aattcctctg tttttctctt      180

    cttcttctaa ttcttgatct ctctctctct ctttttggtt tcttcttcta actcttctct      240

    cttcctcgca aatccaagaa aaagaaccat agaatagttt caagattttt ttcaggggaa      300

    ggggggttgg attttaattt tcaaagtggg ttattaattt gttctattta tgtttttgtt      360

    aatgattatt agatgacgaa gttgttttgg gctacctaaa gtcgaatctt caaagctgta      420

    agttttgtta ttaagagtgg atgagaaaga aacttccagg caaatttcca atgattttta      480

    cgcttacaca tactgatatt accttcttaa cttactcttg ccatttctca ctctattaac      540

    aacaaaatga gtgtatgtaa gtgataatat tggttggacg aaaaagaaaa aaaaaaaaaa      600

    aggttctagg aaacaaaaag aaaaacgaaa aaggcaagaa atggaaaagg aaacgttgtg      660

    tatgatgatt aaaatgtacg ttgatagcta aattcaactt tgttcttcat tagcaacaac      720

    aagggacaac aaaatgaaaa tttcagcaca gttatggagg gttgaagaag aaggtgacga      780

    gagagatgcc acatcataaa aaattaatat tataatcatt tttgtcacat tagttttctg      840

    attacttata tttaacctac acatcatttt gccgttactc aactaacgat caatatgacc      900

    tttaaagctc gatgattaaa atgtttattt tgaactttca gggactatat aaatgtatat      960

    atatcaactt caaatcttag cggtcaaaag tgcattttgt tttagtttaa aagaccgaga      1020

    tgtgaccatt aataatgcct acacacacat atccccgtac tcacacatgc agtgagtttt      1080

    ttatgttttt tttacacaca ttagacagca aattgaattc ctaattccat tccctaagac      1140

    aagtttctaa tgacttatac aattcacata ggcatgcatg cagaacaagc gaaaaacgac      1200

    gaatttacct taagaaaatg gcccaaccaa ccacttacac aatctcaggc ataccattcc      1260

    ccgggatgaa agaatttttc ctgtaattca ttcgatctca ggcatacaat gcatcgagaa      1320

    gacgcaaaat gaaagacaaa agtatagaac aacacaatcc tgtacttcat tttaaacgat      1380

    agttttcaaa tttaacgatc gtgtagatca tgatacacga tctcgagcct tagtggcacc      1440

    gagatggccc gagatgaaag acctctacct ttagttattc gatctcgagc cttaattgaa      1500

    tcgagatgac ccaagattaa tagatcggaa agaagatata tatcgtaagg gcatatatga      1560

    aatttatgaa aatacgatca tgtgtcataa acttttctta ttttgttata tagaccgtaa      1620

    atattataga ttttggttac atttgtgtaa attactctat ttttttttag taaaacaaat      1680

    gaattaaatt aaaaaaaaaa ttattaagag ttgaagtaat tgggtgtttt ctaaaagatt      1740

    gaaataaata cctttattaa ctttgcaaat atattttcaa agaggctaac aaatcaaata    1800

    tattttctaa aaaaatcaca ttgcgttggg gataaggtaa gagtaatgga aaaatgaaag    1860

    gttgtgaaca attcgtactc ttacttatga gatttgacag aacaaatatt tttcaaatac    1920

    tctttttacg ttttcttttt taaaattaaa taacaaatac ttttccactg cttttctttt    1980

    cttccattga ctcctcaact aataattttg gtcttcccat tattatcttc ttcttcttca    2040

    tttttctctg cactgtctct tctccatttc aacatcttct tatatcttca ttcaggttaa    2100

    atatttcatc ccttaccatt tttatttaca ttttccatct gatcatttct atacttataa    2160

    actcgataat ttgtttagac tttctttaga tagtttttac tcggtgatct gtatgtgttc    2220

    actcctactt ttctgttagg caaaatcttc aaaattatta tggttcattc ctcgtggttt    2280

    tttagctctt caagtatttt tgtaggtttt gatccttttc aagctcaaga acagaggata    2340

    ataatggaca tccttatttc agtcactgca aaaattgctg aatacactgt tgagcctgtt    2400

    ggacgccaac ttggttatgt atttttcatt cgttccaact ttcaaaaact taagactcaa    2460

    gtagaaaagc tgaagattac aagagagtct gtgcaacaca agatccatag tgcaagaaga    2520

    aatgctgaag acataaaacc tgccgttgag gaatggttga aaaaggtcga tgactttgtt    2580

    cgagaatctg acgagatatt agccaatgaa ggtggacatg gtggactctg ttccacctat    2640

    ttggtccaac gacacaagtt aagtagaaaa gcaagcaaaa tggtagatga ggttcttgag    2700

    atgaaaaatg agggggaaag ttttgatatg gtatcctata aaagtgttat cccatcagtt    2760

    gattgttcac ttccaaaagt gcctgacttt attgactttg agtcaagaaa gtcgattatg    2820

    gaacaaatca tggatgcact atctgatggt aatgtccata ggattggagt atatgggatg    2880

    gggggtgttg gcaaaacaat gctagtgaag gatattttaa gaaaaattgt ggagagtaag    2940

    aagccttttg atgaggtggt aacatccacg atcagccaaa caccagattt tagaagtatc    3000

    caaggacaac tagctgacaa gctaggtttg aaattcgaac aagaaacaat agaaggaagg    3060

    gctactattc tacgaaagag gttaaagatg gagagaagta tcctagttgt gttggatgat    3120

    gtttgggagt atattgattt ggaaactata ggaattccaa gtgttgaaga tcatacgggg    3180

    tgcaagatct tgtttaccac taggattaaa catttgatct caaatcaaat gtgcgccaat    3240

    aaaatttttg agataaaagt tttaggaaaa gatgagtcat ggaatttatt taaggcaatg    3300

    gcaggtgaca ttgttgatgc aagtgatttg aagcctatag ccattcgaat tgtgagagaa    3360

    tgtgcaggtt tgcctattgc tattactact gttgctaagg cattacgaaa taaaccttcc    3420

    gacatttgga atgatgcctt agatcagctt aaaagtgttg atgtgggtat ggcaaacatt    3480

    ggagaaatgg aaaagaaagt gtatttgtca ctaaaactga gttacgattg cttgggatat    3540

    gaagaggtga agttattatt cttgttatgc agcatgtttc cagaagactt tagcattgac    3600

    gtggaagggt tgcatgtata tgccatgggc atgggattct tacatggtgt tgatactgtg    3660

    gtaaaaggac gacgtaggat aaaaaaattg gttgatgatc ttatatcttc ttctttgctt    3720

    caacaatatt ctgagtatgg gtgcaattat gtgaaaatgc atgatatggt tcgtgatgta    3780

    gccctattaa ttgcatctaa gaatgaacac gtacgtacat tgagctatgt gaaaagatcg    3840

    aatgaagaat gggaagaaga gaaactattg ggtaatcata ctgcagtgtt cattgatggt    3900

    ttacattatc ctctcccgaa gttaacgtta cccaaagttc aattattaag gttagttgca    3960

    caagattgtt gggaacataa taagcgtgtg tcggtggtag aaactttttt tgaagaaatg    4020

    aaagagctca aaggtttagt attagcaaac gtaaatatat cattgatgca acgaacatct    4080

    gatctttact ccttagcaaa catcagagta ttacgtttgc aaagctgtaa tttattaggg    4140

    agcatagatt ggattggtga attaaaaaag cttgaaattc ttgattttat aggatctaac    4200

    atcacacaaa ttcctacaac catgagccaa ttgacacaac tcaaagtgtt aaatttatct    4260

    tcttgtcatc aactcaaggt aattccacca aatattcttt caaagttgac aaaactggaa    4320

    gaattaagtc tggaaacttt tgatagatgg gaaggagaag aatggtatga aggaaggaaa    4380

    aatgctagcc tttctgaact caagtgcttg cgacatcttt atgctttaaa tttaaccatt    4440

    caagatgaag aaattatgcc aaaagatttg tttttagctg aggagttgaa gcttcaaaaa    4500

    ttcaacattt gtattggtta ccaaagcaaa ttaaagtata cttttggacc cacaaacaga    4560

    atcaaaaact tcattgcaat caagatggaa tcaggaaggt gcttggataa ttggataaaa    4620

    aatttgttaa agaggtcgga caatgtgttt ttggaaggat caatttgttc aaaggttcte    4680

    cactcagaat tggtaggtgc aaatgacttc gtaaatttga agtatctcta cctttattat    4740

    aattcaaaat ttcaacattt tatcaacgtt agcaatacca tcaacattga agaatcattt    4800

    tttagtgaaa tggtaaattt catcaacaca tttttctatg tttctatata cacatcaaaa    4860

    tttataaatc acctgtttgt tcatttttat tgttccttcc acaagttcct tctaacattt    4920

    gtggttagta atgatagtag ggataagatt ctattcttct ttgttttaga aggctcttct    4980

    cttggtgtag agagactctt tcttgtttca tacattaatg ataatatata attttagact    5040

    tctaaaatat ataaatgcat gtcaggtgat attccaagaa aatttaaaga agtttattag    5100

    atatttccta tctaaggaag cagatttgaa gtaatcattt tacacaattt gttatggtaa    5160

    ttttaaaaca ctatataaat tatatgttgt tagttagcat cagttgtgat gatatggtta    5220

    attacgttgt cacaaactga acttttaagg acgtaaattt gtaggtatcg cttcctaatt    5280

    tggagaagtt ggaaattgtg aatgcaaaga gtttgaagat gatatggagc aataacgtgc    5340

    caattcttaa ttccttttcc aaactcgagg aaataaaaat ttattcatgc aacaatcttc    5400

    aaaaagtatt atttcctcca aatatgatgg acattetcac atgccttaaa gtcttagaga    5460

    tcaaaaattg tgatttgttg gaagggatat ttgaagcgca agagccaatt agtgttgttg    5520

    agagcaataa tttacccatt cttaattcct tttccaaact cgaggaaata agaatttggt    5580

    catgcaacaa tcttcaaaaa gtattatttc cttcaaatat gatgggcatt cttccatgcc    5640

    ttaaagtctt agatattaga ggttgtgaat tgttggaagg gatatttgaa gtgcaagagc    5700

    caattagtgt tgttgagagc aatagtgtac ccattcttaa ttccttttcc aaactcgaga    5760

    aaataagaat ttggtcatgc aacaatcttc aaaaaatatt atttccttca aatatgatgg    5820

    gcattcttac atgccttaaa gtcttagaga tcagagattg tgaattgttg gaagggatat    5880

    ttgaagtgca agagccaatt agtgttgttg aagcgagtcc tatcgtgctc caaaatttaa    5940

    ttaggttgga attatataat cttccaaacc ttgagtacgt gtggagcaaa aatccttgtg    6000

    agcttctgag tttggaaaat ataaaaagtt tgaccattga ggaatgtcca agacttagaa    6060

    gagaatactc agtcaaaatt ttcaagccac ttcaatatgt aagcatagat atcaaacaat    6120

    tgatgaaggt tattgagaag gaaaagtcag cagatcataa tatgttggaa tcaaagcaat    6180

    gggagacttc ttcttcttct aaggtacgta tatattctac aacaaaacat gtttgttcaa    6240

    tttaattttc agaaaatata taaattgttt tcaagacctt agttgaacag aattggttct    6300

    gttagttgaa cagagtttta aagaaaacaa attattatgt ttgttctaga aacctatgga    6360

    aattagtgtt attaggggtt aattatttac ctgaattaaa aaagaataag caacgtaaac    6420

    cgcttaattt taatatgttt atcaatagaa attaggatcc gtttggattg acttgaatga    6480

    tatgttttcc tggaaagaaa ctcatttttg tttgaactca tttttatgaa aattggctaa    6540

    aatacattta aaaaatgagg tggctttcaa atattcaatt ttttttttaa ataacttatt    6600

    ttttgaatta aacactccaa aatgtaattc aaaaacaccc atataagtta attagatata    6660

    taattaatac ataaattaat taattttatt tagtttgagt taaattagtt ttaatgcaaa    6720

    caataatata tttttatagc caatatacaa gaatgaaagt aagaaaagaa gacaaaaaaa    6780

    aaaaaaaaaa tgatatgtta attagaattt tacataaaga atgatctgat taaagctaat    6840

    ctctatcgat atagtttttt aattatatta aatatagtaa gtagtccatt ataataattg    6900

    aatttttttg taccaaatta attaaactaa ttctttttac taattattga atatttaaga    6960

    tatttttggc taattaatta ataatttgtg tggatatata agttattatt gcatttattt    7020

    aatagatatt tttgatcatc aggatggggt tctacggctg ggagatggtt ctaagttgtt    7080

    tccaaatctt aaaagtttga agctatatgg ttttgttgat tataactcaa cccatttacc    7140

    aatggaaatg ttgcaaatct tattccaact taaacacttt gaattggaag gagcatttat    7200

    tgaagaaatt ttccccagca atatactgat ttcaagctct atggatttac agagtttggc    7260

    tctatataaa ctacccaagc ttaagcattt gtggagtgaa gaatgctcac gaaacaatat    7320

    cacctcagtt cttcaacatt tgatttttct aagaatttca gattgtggaa gattgagtag    7380

    tttaacttta gtgtcatcat tagtgtgttt tacaaacttg aaaagtcttg cggtttataa    7440

    atgtgataga ctaacccatt tgctgaatcc ttcgatggct acaacgcttg tgcaacttca    7500

    agatttgaca ataaaagaat gcaaaagaat gagaagtgta attgaggaag gatcaaccga    7560

    agaagatgga aatgatgaaa tggttgtatt caacaaccta cgacatttat acatttttaa    7620

    ttgttccaac ctaacaagct tttattgtgg gagatgcatc gttaaattcc catgtttgga    7680

    aagagtattc attcaaaatt gtcctgaaat gaaggtcttt tcacttggaa ttgtaagcac    7740

    gcctcgtttg aaatatgaaa agtttacttt aatgaatgat tacgatgata aatggtgtca    7800

    tctgaaatat cccaaatata tgttggtgga agatatgaat gtcatcacca gagaatattg    7860

    ggaggataat gttgataccg gaattccaaa tttatttgcc gaacaggttt gtatatttaa    7920

    ttaccttttc atatttggta ataattaatt tttattattt gtgtgttaga gtatgaactt    7980

    taatgaattt atttaattaa tgcagagttt ggaggaaaac cgatctgaaa attcttcttc    8040

    ttcaaagaat aatgttgaga aagaataagg aattatatgg atattgttgt acactactta    8100

    atatatcatt tcatccacaa ggaaaaggtc agactcttga aatcctccat tcttttttat    8160

    gagagaatat catccaatgt caaattgaaa agtctcgata gatttgttaa attaattttt    8220

    gatacaagtc ataaaatgtt aattagtata ataataatat atctgatccc atcaaattaa    8280

    ttagaagtaa cgacaaattt aacttctgta atatcaattc aatttgatgt ctgcataaaa    8340

    tttgatgtca caaatttaac ttctgtaatg tgaatctttt ttttttcctt tggacataaa    8400

    accaacaagt taaaatagat ataacaatga atttaactca catataataa attcatccaa    8460

    tataatgttc tttcaccttt ttctctcttt cacaaaactg taataataat atctaccaca    8520

    aaaggtaaac aattaatatg attcttcaag aaggttgttt atttggtcaa attttcatga    8580

    aagtattaat acagtgtatg ttttgcaaag gaagctgcca aataacctac tcaatcctag    8640

    cagatgcgtt ctttgcaagc cggctgtcga agacttgaac catattttca caacctgtgc    8700

    caattcgcaa atagcctctg ggtcaaactg cacgacaaaa ttggtggaaa ctttgataca    8760

    aacagtatca aagccctctg ttggtctctt ggctcgctga aacaatcaaa cagaaagaac    8820

    atcattctct cgatgtaggt gtggatcttc ttttgtccat ttgggtggaa agaaacaata    8880

    ggattttcat agacatagaa agaagcttag tcacatttgg gaagatatcg aaactttgat    8940

    tggaccatgg tcgagtagaa acaaaatgtt caaagactac aatccaacat caatctttaa    9000

    actttagagc tttgttagat taatgtttgt tgtatatggc ttccctgtgg ccaaagaaat    9060

    atacattgta acaatggttt gatgaaatga taatgaagtg gtatggtgtt aaaatcacct    9120

    ttatcactct gtgtttcaat ttcaaaaaat atgattttga acattttcat agtactttca    9180

    taatccccac ttcattgata tgaatcaata aagtctaagg aaagtggaga atgatgaatc    9240

    aataaagttc atgaaaagtg cagaatgatg aatccaaaat gaaaaaaaaa caaggtcgat    9300

    aagtttaaag taacggtggt agcattgtaa tgatcacaag ggagcacaca tttccccaca    9360

    aattatttta ttatcattca cataacaatt caaatttctt atcttttaat tgatatataa    9420

    tttcataatc agttataatt gaatttttca aatgattgga tccatatatc aacgtcaatc    9480

    aaatttttaa aggtaaagtt ttaaatttta aaatgtttaa ttagtataaa attgagaaat    9540

    cacaaagaat aatttctctt cgatatatga gatttgaacc aacctttttg tttggagact    9600

    aaatgtgcaa tataatttta tataatttta taaacatgca aatattgaaa ttagattcaa    9660

    aagtatgtat aataacaatt tttttttttt aaatcgtaaa tgtagcaaaa tttattagag    9720

    tatttattaa taattgaaat gtgaaccata ttgcaaaaat tggttctatc actaatagat    9780

    cataagagtc tttaaaaaaa atgattaaaa atagtttgtt gctaacaaac tttgttattt    9840

    ttataatttt tttttaaata ttattatata cttaattaaa tgtctaaaat tattaccatt    9900

    ataattaatg agatattaca cgtggattga tggtgggccc ttatatgcta ttatacactt    9960

    tgcctaccct cttcccaaca agattcccaa gttaaataat tgaaactttt aacatctttc    10020

    attacagttt gataaatgaa cgcaaacatg tgttgtttat tttactgaat tcgcgatcga    10080

    ttattaaaat agacatgcag ttgatagcaa gcacacgaca ttaaataaaa atcatgaagt    10140

    atttaatatc taatgaataa ccacataaac aatgaaacga aaatataaac taagaaaagt    10200

    caaatcatgt gcatattgat gaatetacac ttctcgatct cttcaaaacc tagcaaaatc    10260

    aatagaattg aacattaaca atctaagcat acttgtgaat ataacaattt ttcggaaaaa    10320

    taaaaattag gcaagagaat aagaacttgt gggtaaatta aattattgaa atggattgaa    10380

    atctaaatgt tgtgtgattg ctactatctg attttcattt gatactgact gttttctatt    10440

    acattatgat atactaattt tcatggatat tgattgcatg tcgtctaatt aatatctgat    10500

    ttgtatattt gatatttgat tgttatttta tactatattt gttatttaat agttgtttga    10560

    ttgctattta ttattgattg ttctaatgat atcaattgtt gtttgattaa gatctaataa    10620

    tattggttgt caattataga aattgttata tgataatgat tgtaaaattg ttgatgatac    10680

    tgattgttgt ttgaatataa caatcaatga tattgattgt tgtttgattg ctctcagatt    10740

    actatctaeg cctttaaact aatattaatt gat                                 10773

    <210>5

    <211>4919

    <212>DNA

    <213>香瓜

    <400>5

    attattatgg ttcattcctc gtggtttttt agctcttcaa gtatttttgt aggttttgat    60

    ccttttcaag ctcaagaaca gaggataata atggacatcc ttatttcagt cactgcaaaa    120

    attgctgaat acactgttga gcctgttgga cgccaacttg gttatgtatt tttcattcgt    180

    tccaactttc aaaaacttaa gactcaagta gaaaagctga agattacaag agagtctgtg    240

    caacacaaga tccatagtgc aagaagaaat gctgaagaca taaaacctgc cgttgaggaa    300

    tggttgaaaa aggtcgatga ctttgttcga gaatctgacg agatattagc caatgaaggt    360

    ggacatggtg gactctgttc cacctatttg gtccaacgac acaagttaag tagaaaagca    420

    agcaaaatgg tagatgaggt tcttgagatg aaaaatgagg gggaaagttt tgatatggta    480

    tcctataaaa gtgttatccc atcagttgat tgttcacttc caaaagtgcc tgactttatt    540

    gactttgagt caagaaagtc gattatggaa caaatcatgg atgcactatc tgatggtaat    600

    gtccatagga ttggagtata tgggatgggg ggtgttggca aaacaatgct agtgaaggat    660

    attttaagaa aaattgtgga gagtaagaag ccttttgatg aggtggtaac atccacgatc    720

    agccaaacac cagattttag aagtatccaa ggacaactag ctgacaagct aggtttgaaa    780

    ttcgaacaag aaacaataga aggaagggct actattctac gaaagaggtt aaagatggag    840

    agaagtatcc tagttgtgtt ggatgatgtt tgggagtata ttgatttgga aactatagga    900

    attccaagtg ttgaagatca tacggggtgc aagatcttgt ttaccactag gattaaacat    960

    ttgatctcaa atcaaatgtg cgccaataaa atttttgaga taaaagtttt aggaaaagat    1020

    gagtcatgga atttatttaa ggcaatggca ggtgacattg ttgatgcaag tgatttgaag    1080

    cctatagcca ttcgaattgt gagagaatgt gcaggtttgc ctattgctat tactactgtt    1140

    gctaaggcat tacgaaataa accttccgac atttggaatg atgccttaga tcagcttaaa    1200

    agtgttgatg tgggtatggc aaacattgga gaaatggaaa agaaagtgta tttgtcacta    1260

    aaactgagtt acgattgctt gggatatgaa gaggtgaagt tattattctt gttatgcagc    1320

    atgtttccag aagactttag cattgacgtg gaagggttgc atgtatatgc catgggcatg    1380

    ggattcttac atggtgttga tactgtggta aaaggacgac gtaggataaa aaaattggtt    1440

    gatgatctta tatcttcttc tttgcttcaa caatattctg agtatgggtg caattatgtg    1500

    aaaatgcatg atatggttcg tgatgtagcc ctattaattg catctaagaa tgaacacgta    1560

    cgtacattga gctatgtgaa aagatcgaat gaagaatggg aagaagagaa actattgggt    1620

    aatcatactg cagtgttcat tgatggttta cattatcctc tcccgaagtt aacgttaccc    1680

    aaagttcaat tattaaggtt agttgcacaa gattgttggg aacataataa gcgtgtgtcg    1740

    gtggtagaaa ctttttttga agaaatgaaa gagctcaaag gtttagtatt agcaaacgta    1800

    aatatatcat tgatgcaacg aacatctgat ctttactcct tagcaaacat cagagtatta    1860

    cgtttgcaaa gctgtaattt attagggagc atagattgga ttggtgaatt aaaaaagctt    1920

    gaaattcttg attttatagg atctaacatc acacaaattc ctacaaccat gagccaattg    1980

    acacaactca aagtgttaaa tttatcttct tgtcatcaac tcaaggtaat tccaccaaat    2040

    attctttcaa agttgacaaa actggaagaa ttaagtctgg aaacttttga tagatgggaa    2100

    ggagaagaat ggtatgaagg aaggaaaaat gctagccttt ctgaactcaa gtgcttgcga    2160

    catctttatg ctttaaattt aaccattcaa gatgaagaaa ttatgccaaa agatttgttt    2220

    ttagctgagg agttgaagct tcaaaaattc aacatttgta ttggttacca aagcaaatta    2280

    aagtatactt ttggacccac aaacagaatc aaaaacttca ttgcaatcaa gatggaatca    2340

    ggaaggtgct tggataattg gataaaaaat ttgttaaaga ggtcggacaa tgtgtttttg    2400

    gaaggatcaa tttgttcaaa ggttctccac tcagaattgg taggtgcaaa tgacttcgta    2460

    tcgcttccta atttggagaa gttggaaatt gtgaatgcaa agagtttgaa gatgatatgg    2520

    agcaataacg tgccaattct taattccttt tccaaactcg aggaaataaa aatttattca    2580

    tgcaacaatc ttcaaaaagt attatttcct ccaaatatga tggacattct cacatgcctt    2640

    aaagtcttag agatcaaaaa ttgtgatttg ttggaaggga tatttgaagc gcaagagcca    2700

    attagtgttg ttgagagcaa taatttaccc attcttaatt ccttttccaa actcgaggaa    2760

    ataagaattt ggtcatgcaa caatcttcaa aaagtattat ttccttcaaa tatgatgggc    2820

    attcttccat gccttaaagt cttagatatt agaggttgtg aattgttgga agggatattt    2880

    gaagtgcaag agccaattag tgttgttgag agcaatagtg tacccattct taattccttt    2940

    tccaaactcg agaaaataag aatttggtca tgcaacaatc ttcaaaaaat attatttcct    3000

    tcaaatatga tgggcattct tacatgcctt aaagtcttag agatcagaga ttgtgaattg    3060

    ttggaaggga tatttgaagt gcaagagcca attagtgttg ttgaagcgag tcctatcgtg    3120

    ctccaaaatt taattaggtt ggaattatat aatcttccaa accttgagta cgtgtggagc    3180

    aaaaatcctt gtgagcttct gagtttggaa aatataaaaa gtttgaccat tgaggaatgt    3240

    ccaagactta gaagagaata ctcagtcaaa attttcaagc cacttcaata tgtaagcata    3300

    gatatcaaac aattgatgaa ggttattgag aaggaaaagt cagcagatca taatatgttg    3360

    gaatcaaagc aatgggagac ttcttcttct tctaaggatg gggttctacg gctgggagat    3420

    ggttctaagt tgtttccaaa tcttaaaagt ttgaagctat atggttttgt tgattataac    3480

    tcaacccatt taccaatgga aatgttgcaa atcttattcc aacttaaaca ctttgaattg    3540

    gaaggagcat ttattgaaga aattttcccc agcaatatac tgatttcaag ctctatggat    3600

    ttacagagtt tggctctata taaactaccc aagcttaagc atttgtggag tgaagaatgc    3660

    tcacgaaaca atatcacctc agttcttcaa catttgattt ttctaagaat ttcagattgt    3720

    ggaagattga gtagtttaac tttagtgtca tcattagtgt gttttacaaa cttgaaaagt    3780

    cttgcggttt ataaatgtga tagactaacc catttgctga atccttcgat ggctacaacg    3840

    cttgtgcaac ttcaagattt gacaataaaa gaatgcaaaa gaatgagaag tgtaattgag    3900

    gaaggatcaa ccgaagaaga tggaaatgat gaaatggttg tattcaacaa cctacgacat    3960

    ttatacattt ttaattgttc caacctaaca agcttttatt gtgggagatg catcgttaaa    4020

    ttcccatgtt tggaaagagt attcattcaa aattgtcctg aaatgaaggt cttttcactt    4080

    ggaattgtaa gcacgcctcg tttgaaatat gaaaagttta ctttaatgaa tgattacgat    4140

    gataaatggt gtcatctgaa atatcccaaa tatatgttgg tggaagatat gaatgtcatc    4200

    accagagaat attgggagga taatgttgat accggaattc caaatttatt tgccgaacag    4260

    agtttggagg aaaaccgatc tgaaaattct tcttcttcaa agaataatgt tgagaaagaa    4320

    taaggaatta tatggatatt gttgtacact acttaatata tcatttcatc cacaaggaaa    4380

    aggaagctgc caaataacct actcaatcct agcagatgcg ttctttgcaa gccggctgtc    4440

    gaagacttga accatatttt cacaacctgt gccaattcgc aaatagcctc tgggtcaaac    4500

    tgcacgacaa aattggtgga aactttgata caaacagtat caaagccctc tgttggtctc    4560

    ttggctcgct gaaacaatca aacagaaaga acatcattct ctcgatgtag gtgtggatct    4620

    tcttttgtcc atttgggtgg aaagaaacaa taggattttc atagacatag aaagaagctt    4680

    agtcacattt gggaagatat cgaaactttg attggaccat ggtcgagtag aaacaaaatg    4740

    ttcaaagact acaatccaac atcaatcttt aaactttaga gctttgttag attaatgttt    4800

    gttgtatatg gcttccctgt ggccaaagaa atatacattg taacaatggt ttgatgaaat    4860

    gataatgaag tggtatggtg ttaaaatcac ctttatcact ctgtgtttca atttcaaaa     4919

    <210>6

    <211>1410

    <212>PRT

    <213>香瓜

    <400>6

    Met Asp Ile Leu Ile Ser Val Thr Ala Lys Ile Ala Glu Tyr Thr Val

    1               5                   10                  15

    Glu Pro Val Gly Arg Gln Leu Gly Tyr Val Phe Phe Ile Arg Ser Asn

                20                  25                  30

    Phe Gln Lys Leu Lys Thr Gln Val Glu Lys Leu Lys Ile Thr Arg Glu

            35                  40                 45

    Ser Val Gln His Lys Ile His Ser Ala Arg Arg Asn Ala Glu Asp Ile

        50                  55                  60

    Lys Pro Ala Val Glu Glu Trp Leu Lys Lys Val Asp Asp Phe Val Arg

    65                  70                  75                  80

    Glu Ser Asp Glu Ile Leu Ala Asn Glu Gly Gly His Gly Gly Leu Cys

                    85                  90                  95

    Ser Thr Tyr Leu Val Gln Arg His Lys Leu Ser Arg Lys Ala Ser Lys

                100                 105                 110

    Met Val Asp Glu Val Leu Glu Met Lys Asn Glu Gly Glu Ser Phe Asp

            115                 120                 125

    Met Val Ser Tyr Lys Ser Val Ile Pro Ser Val Asp Cys Ser Leu Pro

        130                 135                 140

    Lys Val Pro Asp Phe Ile Asp Phe Glu Ser Arg Lys Ser Ile Met Glu

    145                 150                 155                 160

    Gln Ile Met Asp Ala Leu Ser Asp Gly Asn Val His Arg Ile Gly Val

                    165                 170                 175

    Tyr Gly Met Gly Gly Val Gly Lys Thr Met Leu Val Lys Asp Ile Leu

                180                 185                 190

    Arg Lys Ile Val Glu Ser Lys Lys Pro Phe Asp Glu Val Val Thr Ser

            195                 200                 205

    Thr Ile Ser Gln Thr Pro Asp Phe Arg Ser Ile Gln Gly Gln Leu Ala

        210                 215                 220

    Asp Lys Leu Gly Leu Lys Phe Glu Gln Glu Thr Ile Glu Gly Arg Ala

    225                 230                 235                 240

    Thr Ile Leu Arg Lys Arg Leu Lys Met Glu Arg Ser Ile Leu Val Val

                    245                 250                 255

    Leu Asp Asp Val Trp Glu Tyr Ile Asp Leu Glu Thr Ile Gly Ile Pro

                260                 265                 270

    Ser Val Glu Asp His Thr Gly Cys Lys Ile Leu Phe Thr Thr Arg Ile

            275                 280                 285

    Lys His Leu Ile Ser Asn Gln Met Cys Ala Asn Lys Ile Phe Glu Ile

        290                 295                 300

    Lys Val Leu Gly Lys Asp Glu Ser Trp Asn Leu Phe Lys Ala Met Ala

    305                 310                 315                 320

    Gly Asp Ile Val Asp Ala Ser Asp Leu Lys Pro Ile Ala Ile Arg Ile

                    325                 330                 335

    Val Arg Glu Cys Ala Gly Leu Pro Ile Ala Ile Thr Thr Val Ala Lys

                340                 345                 350

    Ala Leu Arg Asn Lys Pro Ser Asp Ile Trp Asn Asp Ala Leu Asp Gln

            355                 360                 365

    Leu Lys Ser Val Asp Val Gly Met Ala Asn Ile Gly Glu Met Glu Lys

        370                 375                 380

    Lys Val Tyr Leu Ser Leu Lys Leu Ser Tyr Asp Cys Leu Gly Tyr Glu

    385                 390                 395                 400

    Glu Val Lys Leu Leu Phe Leu Leu Cys Ser Met Phe Pro Glu Asp Phe

                    405                 410                 415

    Ser Ile Asp Val Glu Gly Leu His Val Tyr Ala Met Gly Met Gly Phe

                420                 425                 430

    Leu His Gly Val Asp Thr Val Val Lys Gly Arg Arg Arg Ile Lys Lys

            435                 440                 445

    Leu Val Asp Asp Leu Ile Ser Ser Ser Leu Leu Gln Gln Tyr Ser Glu

        450                 455                 460

    Tyr Gly Cys Asn Tyr Val Lys Met His Asp Met Val Arg Asp Val Ala

    465                 470                 475                 480

    Leu Leu Ile Ala Ser Lys Asn Glu His Val Arg Thr Leu Ser Tyr Val

                    485                 490                 495

    Lys Arg Ser Asn Glu Glu Trp Glu Glu Glu Lys Leu Leu Gly Asn His

                500                 505                 510

    Thr Ala Val Phe Ile Asp Gly Leu His Tyr Pro Leu Pro Lys Leu Thr

            515                 520                 525

    Leu Pro Lys Val Gln Leu Leu Arg Leu Val Ala Gln Asp Cys Trp Glu

        530                 535                 540

    His Asn Lys Arg Val Ser Val Val Glu Thr Phe Phe Glu Glu Met Lys

    545                 550                 555                 560

    Glu Leu Lys Gly Leu Val Leu Ala Asn Val Asn Ile Ser Leu Met Gln

                    565                 570                 575

    Arg Thr Ser Asp Leu Tyr Ser Leu Ala Asn Ile Arg Val Leu Arg Leu

                580                 585                 590

    Gln Ser Cys Asn Leu Leu Gly Ser Ile Asp Trp Ile Gly Glu Leu Lys

            595                 600                 605

    Lys Leu Glu Ile Leu Asp Phe Ile Gly Ser Asn Ile Thr Gln Ile Pro

        610                 615                 620

    Thr Thr Met Ser Gln Leu Thr Gln Leu Lys Val Leu Asn Leu Ser Ser

    625                 630                 635                 640

    Cys His Gln Leu Lys Val Ile Pro Pro Asn Ile Leu Ser Lys Leu Thr

                    645                 650                 655

    Lys Leu Glu Glu Leu Ser Leu Glu Thr Phe Asp Arg Trp Glu Gly Glu

                660                 665                 670

    Glu Trp Tyr Glu Gly Arg Lys Asn Ala Ser Leu Ser Glu Leu Lys Cys

            675                 680                 685

    Leu Arg His Leu Tyr Ala Leu Asn Leu Thr Ile Gln Asp Glu Glu Ile

        690                 695                 700

    Met Pro Lys Asp Leu Phe Leu Ala Glu Glu Leu Lys Leu Gln Lys Phe

    705                 710                 715                 720

    Asn Ile Cys Ile Gly Tyr Gln Ser Lys Leu Lys Tyr Thr Phe Gly Pro

                    725                 730                 735

    Thr Asn Arg Ile Lys Asn Phe Ile Ala Ile Lys Met Glu Ser Gly Arg

                740                 745                 750

    Cys Leu Asp Asn Trp Ile Lys Asn Leu Leu Lys Arg Ser Asp Asn Val

            755                 760                 765

    Phe Leu Glu Gly Ser Ile Cys Ser Lys Val Leu His Ser Glu Leu Val

        770                 775                 780

    Gly Ala Asn Asp Phe Val Ser Leu Pro Asn Leu Glu Lys Leu Glu Ile

    785                 790                 795                 800

    Val Asn Ala Lys Ser Leu Lys Met Ile Trp Ser Asn Asn Val Pro Ile

                    805                 810                 815

    Leu Asn Ser Phe Ser Lys Leu Glu Glu Ile Lys Ile Tyr Ser Cys Asn

                820                 825                 830

    Asn Leu Gln Lys Val Leu Phe Pro Pro Asn Met Met Asp Ile Leu Thr

            835                 840                 845

    Cys Leu Lys Val Leu Glu Ile Lys Asn Cys Asp Leu Leu Glu Gly Ile

        850                 855                 860

    Phe Glu Ala Gln Glu Pro Ile Ser Val Val Glu Ser Asn Asn Leu Pro

    865                 870                 875                 880

    Ile Leu Asn Ser Phe Ser Lys Leu Glu Glu Ile Arg Ile Trp Ser Cys

                    885                 890                 895

    Asn Asn Leu Gln Lys Val Leu Phe Pro Ser Asn Met Met Gly Ile Leu

                900                 905                 910

    Pro Cys Leu Lys Val Leu Asp Ile Arg Gly Cys Glu Leu Leu Glu Gly

            915                 920                 925

    Ile Phe Glu Val Gln Glu Pro Ile Ser Val Val Glu Ser Asn Ser Val

        930                 935                 940

    Pro Ile Leu Asn Ser Phe Ser Lys Leu Glu Lys Ile Arg Ile Trp Ser

    945                 950                 955                 960

    Cys Asn Asn Leu Gln Lys Ile Leu Phe Pro Ser Asn Met Met Gly Ile

                    965                 970                 975

    Leu Thr Cys Leu Lys Val Leu Glu Ile Arg Asp Cys Glu Leu Leu Glu

                980                 985                 990

    Gly Ile Phe Glu Val Gln Glu Pro  Ile Ser Val Val Glu  Ala Ser Pro

            995                 1000                 1005

    Ile Val  Leu Gln Asn Leu Ile  Arg Leu Glu Leu Tyr  Asn Leu Pro

        1010                 1015                 1020

    Asn Leu  Glu Tyr Val Trp Ser  Lys Asn Pro Cys Glu  Leu Leu Ser

        1025                 1030                 1035

    Leu Glu  Asn Ile Lys Ser Leu  Thr Ile Glu Glu Cys  Pro Arg Leu

        1040                 1045                 1050

    Arg Arg  Glu Tyr Ser Val Lys  Ile Phe Lys Pro Leu  Gln Tyr Val

        1055                 1060                 1065

    Ser Ile  Asp Ile Lys Gln Leu  Met Lys Val Ile Glu  Lys Glu Lys

        1070                 1075                 1080

    Ser Ala  Asp His Asn Met Leu  Glu Ser Lys Gln Trp  Glu Thr Ser

        1085                 1090                 1095

    Ser Ser  Ser Lys Asp Gly Val  Leu Arg Leu Gly Asp  Gly Ser Lys

        1100                 1105                 1110

    Leu Phe  Pro Asn Leu Lys Ser  Leu Lys Leu Tyr Gly  Phe Val Asp

        1115                 1120                 1125

    Tyr Asn  Ser Thr His Leu Pro  Met Glu Met Leu Gln  Ile Leu Phe

        1130                 1135                 1140   

    Gln Leu  Lys His Phe Glu Leu  Glu Gly Ala Phe Ile  Glu Glu Ile

        1145                 1150                 1155

    Phe Pro  Ser Asn Ile Leu Ile  Ser Ser Ser Met Asp  Leu Gln Ser

        1160                 1165                 1170

    Leu Ala  Leu Tyr Lys Leu Pro  Lys Leu Lys His Leu  Trp Ser Glu

        1175                 1180                 1185

    Glu Cys  Ser Arg Asn Asn Ile  Thr Ser Val Leu Gln  His Leu Ile

        1190                 1195                 1200

    Phe Leu  Arg Ile Ser Asp Cys  Gly Arg Leu Ser Ser  Leu Thr Leu

        1205                 1210                 1215

    Val Ser  Ser Leu Val Cys Phe  Thr Asn Leu Lys Ser  Leu Ala Val

        1220                 1225                 1230

    Tyr Lys  Cys Asp Arg Leu Thr  His Leu Leu Asn Pro  Ser Met Ala

        1235                 1240                 1245

    Thr Thr  Leu Val Gln Leu Gln  Asp Leu Thr Ile Lys  Glu Cys Lys

        1250                 1255                 1260

    Arg Met  Arg Ser Val Ile Glu  Glu Gly Ser Thr Glu  Glu Asp Gly

        1265                 1270                 1275

    Asn Asp  Glu Met Val Val Phe  Asn Asn Leu Arg His  Leu Tyr Ile

        1280                 1285                 1290

    Phe Asn  Cys Ser Asn Leu Thr  Ser Phe Tyr Cys Gly  Arg Cys Ile

        1295                 1300                 1305

    Val Lys  Phe Pro Cys Leu Glu  Arg Val Phe Ile Gln  Asn Cys Pro

        1310                 1315                1320

    Glu Met  Lys Val Phe Ser Leu  Gly Ile Val Ser Thr  Pro Arg Leu

        1325                 1330                 1335

    Lys Tyr  Glu Lys Phe Thr Leu  Met Asn Asp Tyr Asp  Asp Lys Trp

        1340                 1345                 1350

    Cys His  Leu Lys Tyr Pro Lys  Tyr Met Leu Val Glu  Asp Met Asn

        1355                 1360                 1365

    Val Ile  Thr Arg Glu Tyr Trp  Glu Asp Asn Val Asp  Thr Gly Ile

        1370                 1375                 1380

    Pro Asn  Leu Phe Ala Glu Gln  Ser Leu Glu Glu Asn  Arg Ser Glu

        1385                 1390                 1395

    Asn Ser  Ser Ser Ser Lys Asn  Asn Val Glu Lys Glu

        1400                 1405                 1410

    <210>7

    <211>27

    <212>DNA

    <213>人工序列

    <220>

    <223>标记L273的PCR引物F2-B2

    <400>7

    ggagagagaa tccgggacta agtgact                                 27

    <210>8

    <211>29

    <212>DNA

    <213>人工序列

    <220>

    <223>标记L273的PCR引物F2-Br

    <400>8

    taaccacctt ttccgatcaa atttcgtac                               29

    <210>9

    <211>30

    <212>DNA

    <213>人工序列

    <220>

    <223>标记L246的PCR引物F2-B2 Eco

    <400>9

    attgatgaat ctacactcct cgatctcttc                              30

    <210>10

    <211>30

    <212>DNA

    <213>人工序列

    <220>

    <223>标记L246的PCR引物F2 Eco

    <400>10

    gagttcaatc catttcaatg atttaagata                              30

    <210>11

    <211>24

    <212>DNA

    <213>人工序列

    <220>

    <223>标记V681的PCR引物V681

    <400>11

    ggaatcttgt tgaggccgag aggg                                    24

    <210>12

    <211>24

    <212>DNA

    <213>人工序列

    <220>

    <223>标记V681的PCR引物V681R

    <400>12

    gttgtatatg gcttccctgt agcc                                    24

    <210>13

    <211>24

    <212>DNA

    <213>人工序列

    <220>

    <223>标记V1684的PCR引物V588

    <400>13

    caacaggctc aacagtgtat tcgg                                    24

    <210>14

    <211>24

    <212>DNA

    <213>人工序列

    <220>

    <223>标记V1684的PCR引物V551R

    <400>14

    gaagaaggtg acgagagaga tgcc                                    24

    <210>15

    <211>24

    <212>DNA

    <213>人工序列

    <220>

    <223>标记V432的PCR引物V432

    <400>15

    aacttctcca actccctcca ctgc                                    24

    <210>16

    <211>24

    <212>DNA

    <213>人工序列

    <220>

    <223>标记V432的PCR引物V432R

    <400>16

    ttagagtggc aaagggaaga tggg                                    24

    <210>17

    <211>24

    <212>DNA

    <213>人工序列

    <220>

    <223>标记GRP805的PCR引物GRP805

    <400>17

    atcccctgtt tccttcaaca accc                                    24

    <210>18

    <211>24

    <212>DNA

    <213>人工序列

    <220>

    <223>标记GRP805的PCR引物GRP805R

    <400>18

    aacccccaag aagaagaaca accc                                    24

    <210>19

    <211>26

    <212>DNA

    <213>人工序列

    <220>

    <223>标记M8的PCR引物M8

    <400>19

    ccgacgcatc tcccgacgcg ttgttg                                  26

    <210>20

    <211>27

    <212>DNA

    <213>人工序列

    <220>

    <223>标记M8的PCR引物M8R

    <400>20

    tcgtgaaggg ttttggagag tgagaaa                                 27

    <210>21

    <211>24

    <212>DNA

    <213>人工序列

    <220>

    <223>标记E的PCR引物LRR1

    <400>21

    ccttagaaga agatgaagtc tccc                                    24

    <210>22

    <211>24

    <212>DNA

    <213>人工序列

    <220>

    <223>标记E的PCR引物LRR842R

    <400>22

    ctccactcag aattggtagg tgcc                                    24

    <210>23

    <211>24

    <212>DNA

    <213>人工序列

    <220>

    <223>标记D的PCR引物LRR915

    <400>23

    aacaacttag aaccatctcc cagc                                    24

    <210>24

    <211>24

    <212>DNA

    <213>人工序列

    <220>

    <223>标记D的PCR引物LRR1

    <400>24

    gttgttgaga gcaatagtgt accc                                    24

    <210>25

    <211>18

    <212>DNA

    <213>人工序列

    <220>

    <223>PCR引物Kana II

    <400>25

    ccggctacct gcccattc                                           18

    <210>26

    <211>18

    <212>DNA

    <213>人工序列

    <220>

    <223>PCR引物Kana III

    <400>26

    gcgatagaag gcgatgcg                                           18

    <210>27

    <211>24

    <212>DNA

    <213>人工序列

    <220>

    <223>PCR引物PicaA+

    <400>27

    atgcgcatga ggctcgtctt cgag                                    24

    <210>28

    <211>24

    <212>DNA

    <213>人工序列

    <220>

    <223>PCR引物PicaA-

    <400>28

    gacgcaacgc atcctcgatc agct                                    24

    <210>29

    <211>24

    <212>DNA

    <213>人工序列

    <220>

    <223>PCR引物Vat 632R

    <400>29

    ctggtgatga cattcatatc ttcc                                    24

    <210>30

    <211>24

    <212>DNA

    <213>人工序列

    <220>

    <223>PCR引物Vat 632F

    <400>30

    cccagcaaca tactgattcc aagc                                    24

    <210>31

    <211>18

    <212>DNA

    <213>人工序列

    <220>

    <223>PCR引物Kana R

    <400>31

    ccggctacct gccattcg                                           18

    <210>32

    <211>22

    <212>DNA

    <213>人工序列

    <220>

    <223>PCR引物LRR F

    <400>32

    gttgttgaga gcaatagtgt ac                                      22

    <210>33

    <211>22

    <212>DNA

    <213>人工序列

    <220>

    <223>PCR引物LRR R

    <400>33

    ccttagagaa gaatgaagtctc                                       22

棉蚜APHISGOSSYPII抗性基因.pdf_第1页
第1页 / 共88页
棉蚜APHISGOSSYPII抗性基因.pdf_第2页
第2页 / 共88页
棉蚜APHISGOSSYPII抗性基因.pdf_第3页
第3页 / 共88页
点击查看更多>>
资源描述

《棉蚜APHISGOSSYPII抗性基因.pdf》由会员分享,可在线阅读,更多相关《棉蚜APHISGOSSYPII抗性基因.pdf(88页珍藏版)》请在专利查询网上搜索。

本发明涉及Vat基因的克隆,该基因参与对于蚜虫(棉蚜(Aphisgossypii)的抗性和/或对于经该蚜虫的病毒传播的抗性,以及涉及该基因的新型标记的鉴定。。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 化学;冶金 > 有机化学〔2〕


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1