新颖的雌激素受体 本发明涉及属于核激素受体总科的受体,特别是甾类受体领域。本发明涉及编码新颖甾类受体的DNA,所述受体的制备,该受体蛋白及其应用。
甾类激素受体属于基因表达的配体依赖转录控制中所涉及的核激素受体总科。此外,此总科由非甾类激素如维生素D、甲状腺激素和类视黄素的受体所组成(Giguere等人《自然》(Nature)330,624-629,1987;Evans,R.M.,《科学》(Science)240,889-895,1988)。而且,核受体样序列的范围业已鉴定,它编码所谓的“孤独”受体:这些受体结构上与核受体相关,因此划分入核受体,虽然还没有推断的配体被鉴定出来(B.W.O'Malley,《内分泌学》(Endocrinology)125,1119-1170,1989;O.J.Mangelsdorf和R.M.Evans,《细胞》(细胞)83,841-850-1995)。
核激素受体总科共享有这样一种组件结构,在该结构中显示六个截然不同的结构与功能区,A至F(Evans,《科学》(Science)240,889-895,1988)。核激素受体的特征在于,可变N-末端区(A/B功能区),接着是位于中央的,高度保守的DNA-结合功能区(下文称作DBD;C功能区),可变铰链区(D功能区),保守的配体结合功能区(下文称作LBD;E功能区)和可变C-末端区(F功能区)。
N-末端区在大小和序列上高度可变,在该总科的不同成员间保守性差。受体的这一部分参与转录活化的调控(Bocquel等人,《核酸研究》(Nucl.Acid Res),17,2581-2595,1989;Tora等人),《细胞》(Cell)59,477-487,1989)。
DBD由大致66至70个氨基酸组成,且主管DNA结合活性:它使受体定向于称作激素效应元件(下文称作HRE)的特异性DNA序列,而HRE在染色质上的特异性靶基因之转录控制单位内(Martinez和Wahli,《核激素受体》(Nuclear Hormone Receptors),Acad.Press,125-153,1991)。
LBD位于受体的C-末端部分,且主管配体结合活性。以这种方式,LBD是识别和结合激素配体所必需的,且此外具有转录活化功能,因此决定受体激素应答的特异性和选择性。虽然在结构上中度保守,但已知LBD在核激素受体总科的各个成员间地同源性上有相当大的变化(Evans,《科学》(Science)240,889-895,1988;P.J.Fuller,FASEB J.,5,3092-3099,1991;Mangelsdorf等人,《细胞》(Cell),Vol.83,835-839,1995)。
存在于N-末端区、LBD和DBD上的功能可相互独立地操作,且业已显示,这些功能区可以在核受体间交换(Green等人,《自然》(Nature),Vol.325,75-78,1987)。这就导致嵌合核受体,如在例如WO-A-8905355中所描述的。
当核受体的激素配体通过扩散进入细胞并被LBD识别时,它将结合到特异性受体蛋白上,因此起动受体蛋白的变构变化。这种变化的结果是,配体/受体配合物变换至转录活性状态,且因此而能够通过存在的高亲合性DBD结合到在染色质DNA上的相应HRE上(Martinez和Wahli,NuclearHormone Receptors,125-153,Acad.Press,1991)。以这种方式,配体/受体配合物调控特异性靶基因的表达。通过此科的受体获得的变异是其应答不同配体能力的结果。
甾类激素受体是截然不同的一类核受体总科,其特征在于配体是甾类激素。糖皮质激素(GR)、盐皮质激素(MR)、孕甾酮(PR)、雄激素(AR)和雌激素(ER)的受体是典型的甾类受体。再者,活化时,甾类受体具有结合至回文DNA序列的独特的能力,回文DNA序列被称作HRE,为同型二聚体。GR、MR、PR和AR识别相同的DNA序列,而ER识别不同的DNA序列(Beato等人,Cell,Vol,83,851-857,1995)。结合DNA后,甾类受体被认为是与基础转录机制的组分相互作用,且带有序列特异的转录因子,因此调控特异性靶基因的表达。
业已鉴定出几种HRE,它们应答激素/受体配合物。这些HRE位于下列各种靶基因的转录控制单位内,靶基因如哺乳动物生长激素基因(应答糖皮质激素、雌激素、睾甾酮)、哺乳动物催乳素基因和孕甾酮受体基因(应答雌激素)、鸟类卵清蛋白基因(应答孕甾酮)、哺乳动物金属硫蛋白基因(应答糖皮质激素)和哺乳动物肝α2u-球蛋白基因(应答雌激素、睾甾酮、糖皮质激素)。
业已知道,胚胎发育、成年体内平衡以及器官生理学中涉及甾类激素受体。各种疾病和异常归因于甾类激素途径紊乱。由于甾类激素行使其作为激素活化的转录调控器的作用,因此可以预料到,这些受体的突变和缺陷,以及这些受体的过刺激或阻遏或许是这种改变类型的潜在原因。对于这些受体,其作用机制和结合所述受体的配体机制的更好的了解,会有助于更好地认识激素信号转录途径的潜在机制,最终将实现对与改变的激素/受体功能有关的疾病和异常更好的治疗。
因为这种原因,几种哺乳动物包括人的甾类和几种其它核受体的cDNA业已被分离出来,且相应的氨基酸序列已被推导出来,例如人甾类受体PR、ER、GR、MR和AR,维生素D的人非甾类受体、甲状腺激素、和类视黄素如视黄醇A和视黄酸。此外,业已分离出编码超过100种哺乳动物孤独受体的cDNA,但对于它们而言,推断配体仍是未知的(Mangelsdorf等人,Cell,Vol.83,835-839,1995)。然而,为了阐明这些受体在正常的生理学和病理学上所起的各种作用,对其它核受体的阐述仍有着极大的需求。
本发明提供这样的新颖核受体。更具体地说,本发明提供新颖的具有雌激素介导活性的甾类受体。所说的新颖甾类受体是新颖的雌激素受体,该雌激素受体能够结合并被例如雌甾二醇、雌甾酮和雌甾三醇活化。
根据本发明,业已发现,新颖的雌激素受体作为8kb转录物在人胸腺、脾、外周血淋巴细胞(PBL)、卵巢和精巢中表达。再者,业已鉴定另外的转录物。另一大约10kb的转录物在卵巢,胸腺和脾中鉴定。在精巢中,检测到一另外的1.3kb的转录物。这些转录物或许是通过编码根据本发明的新颖雌激素受体之基因的交替拼接而产生的。
克隆编码本发明之新颖雌激素受体的cDNA揭示,可以区别出所述受体的几种拼接变异体。在蛋白质水平上,这些变异体只是在C-末端部分上有所不同。
编码ER的cDNA业已分离出来(Green等人,Nature,320,134-139,1986;Gveene等人,Science 231,1150-1154,1986),且相应的氨基酸序列业已推导出。然而,这种受体和本发明受体是截然不同的,且由不同核酸序列的不同基因所编码。现有技术中的ER(下文称作典型的ER)与本发明ER不仅是在氨基酸序列上有所不同,它们也位于不同的染色体上。编码典型ER的基因位于染色体6上,而发现编码本发明ER的基因位于染色体14上。本发明ER与典型的ER之不同还在于组织分布上的不同,这表明,这些受体在雌激素发信号水平上可能会有重大的区别。
此外,业已描述二种具有雌激素受体相关结构的孤独受体,ERRα和ERRβ(Giguere等人,Nature 331,91-94,1988)。然而,没有报道说这些孤独受体能够结合雌甾二醇或任何其它的结合至典型的ER上的激素,且尚未发现与这些受体结合的其它配体。本发明之新颖雌激素受体与这些受体有着明显的区别,因为已发现它结合雌激素。
已发现的本发明之新颖ER的事实全然出乎人的意料之外,因为在科学文献中没有任何另外的雌激素受体存在的迹象:分离的典型ER或者孤独受体ERRα和ERRβ均未给出迹象或暗示另外的雌激素受体如本发明之受体的存在。另外的ER之鉴定将会是朝向现今之临床治疗迈进的一大步,而现今之临床治疗是以一种ER的存在为基础的,且因此将含有雌激素介导的异常和/或疾病归因于这一受体。本发明受体会在开发激素类似物上有用,所述的激素类似物选择性地活化典型的ER或者本发明之新颖雌激素受体。这点应被认为是本发明的主要优点之一。
因此,本发明的另一方面提供分离的编码新颖甾类受体的cDNA。尤其是,本发明提供分离的编码新颖雌激素受体的cDNA。
根据本发明的这一方面,提供一种分离的cDNA,该cDNA编码具有N-末端功能区、DNA结合功能区和配体结合功能区的甾类受体蛋白,其中所述的受体蛋白的所述DNA结合功能区之氨基酸序列显示与示于SEQ ID NO:3中的氨基酸序列至少80%同源性,而所述受体蛋白的所述配体结合功能区之氨基酸序列显示与示于SEQ ID NO:4中的氨基酸序列至少70%同源性。
尤其是,该分离的DNA编码具有N-末端功能区、DNA结合功能区和配体结合功能区之甾类受体蛋白,其中所述受体蛋白的所述DNA结合功能区之氨基酸序列显示与示于SEQ ID NO:3中的氨基酸序列至少90%,优选95%,更优选98%,最优选100%同源性。
更具体的是,该分离的DNA编码具有N-末端功能区、DNA结合功能区和配体结合功能区的甾类受体蛋白,其中所述受体蛋白的所述配体结合功能区之氨基酸序列显示与示于SEQ ID NO:4中的氨基酸序列至少75%,优选80%,更优选90%,最优选100%同源性。
本发明之优选的分离的DNA编码具有示于SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:21或SEQ ID NO:25中的氨基酸序列的甾类受体蛋白。
本发明之更优选的分离的DNA是一种这样的分离的DNA,该DNA包含示于SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:20或SEQ ID NO:24之核苷酸序列。
本发明之DNA可由cDNA获得。另外,该编码序列也许是基因组DNA,或采用DNA合成技术制备。
本发明之DNA在以充分量和以基本上纯的形式体内表达本发明之新颖受体蛋白上将会是非常有用的。
本发明的另一方面提供包含被上述DNA分子编码的氨基酸序列之甾类受体。
本发明之甾类受体具有N-末端功能区、DNA结合功能区和配体结合功能区,其中所述受体的所述DNA结合功能区之氨基酸序列显示与示于SEQ ID NO:3中的氨基酸序列至少80%同源性,且所述受体的所述配体结合功能区之氨基酸序列显示与示于SEQ ID NO:4中的氨基酸序列至少70%同源性。
尤其是,本发明之甾类受体具有N-末端功能区、DNA结合功能区和配体结合功能区,其中所述受体的所述DNA结合功能区之氨基酸序列与示于SEQ ID NO:3中的氨基酸序列至少90%、优选95%、更优选98%、最优选100%同源性。
更特别的是,本发明之甾类受体具有N-末端功能区、DNA结合功能区和配体结合功能区,其中所述受体的配体结合功能区之氨基酸序列与示于SEQ ID NO:4中的氨基酸序列至少75%、优选80%、更优选90%、最优选100%同源性。
包含组合的DBD和LBD的甾类受体蛋白优选,且编码这些受体的DNA是本发明之主题,这两点对本领域技术人员而言是显而易见的。
优选的是,本发明甾类受体包含示于SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:21或SEQ ID NO:25之氨基酸序列。
甾类受体蛋白也在本发明的范围内,该甾类受体蛋白包含DBD和LBD的氨基酸序列变化,而不减损其各自的DNA结合或配体结合活性。这些可以发生在氨基酸序列上的变化包括所述序列上的一或多个氨基酸缺失、取代、插入、倒位或增加,所述的变化导致在整个序列上的氨基酸不同。这些氨基酸不同导致氨基酸序列与它们所从中衍生的天然氨基酸序列不同但仍同源,这点是蛋白和肽领域中所熟知的。
预料基本上不改变生物和免疫活性的氨基酸取代业已由例如DayhofM.D.描述于“蛋白质序列和结构图表册”,《天然生物药学研究·实践》(Atlas of protein sequence and structure,Nat.Biomed.Res.Found.),Washington D.C.1978,VOl.5,suppl 3中。相关氨基酸间的氨基酸替代或在进化时已频繁发生的替代是,其中包括Ser/Ala、Ser/Gly、Asp/Gly、Arg/Lys、Asp/Asn、Ile/Val。根据这一信息,Lipman和Pearson开发出一种迅速灵敏的蛋白比较法(Science227,1435-1441,1985),并且测定同源多肽间的功能相似性。
本发明DBD之氨基酸序列上的变化产生与SEQ ID NO:3序列至少80%同源的氨基酸序列,这种变化将导致受体仍具有足够的DNA结合活性。本发明LBD之氨基酸序列上的变化产生与SEQ IDNO:4序列至少70%同源的氨基酸序列,这种变化将导致受体仍具有足够的配体结合活性。
本文中所定义的同源性用百分率表示,由PCGENE确定。同源性以排列上与本发明序列有相同残基的百分率计算。允许有缺口以获得最大的排列。
典型ER和本发明ER之氨基酸序列的比较揭示它们在各自的DBD上有高度的相似性。主管典型ER与靶DNA元件的实际相互作用的P-框(氨基酸E-G-X-X-A)的保守性(Zilliacus等人,Mol.Endo9,389,1995;Glass,End,Rev.15,391,1994),表示雌激素效应元件(ERE)被本发明之ER识别。本发明受体确实显示出在含ERE报道基因构建体上的配体依赖反式激活作用。因此,典型ER和本发明新颖ER也许具有重叠靶基因特异性。这或许表示,在其共用表达各自ER的组织中,这些受体竞争ERE。本发明ER可调节靶基因的转录,它不同于典型的ER调节,或者本发明ER可通过占有雌激素效应元件而简单地阻遏典型ER起作用。另外,转录也许会受不同受体的异二聚化作用影响。
因此,本发明之优选甾类受体包含DNA结合功能区之一P-框内的氨基酸序列E-G-X-X-A,其中X是指任一氨基酸。分离的编码这一受体的DNA也在本发明范围内。
制备本发明受体的方法是本领域已知的(Sambrook等,MolecularCloning:a Laboratory Manual,Cold Spring HarborLaboratory Press,Cold Spring Harbor,1989)。最实际的方法是通过表达编码所需蛋白之DNA来生产这些受体。
各种各样的宿主细胞和克隆载体组合可用于克隆编码本发明受体之核酸序列。例如,有用的克隆载体可包括染色体的、非染色体的和合成的DNA序列,如各种已知的细菌质粒和由质粒与噬菌体或病毒DNA组合所衍生的更宽的宿主范围质粒和载体。有用的宿主可包括细菌宿主、酵母和其它真菌、植物或动物宿主。如中华仓鼠卵巢(CHO)细胞或猴细胞和其它宿主。
用于表达本发明配体结合功能区的载体还进一步包含可操作地连于编码配体结合功能区之核酸序列的控制序列。这类控制序列通常包含启动子序列和调节和/或提高表达水平的序列。再者复制起点和/或域选择标记经常存在于这些载体上。当然控制序列和其它序列可以根据所选择的宿主细胞而变化。
转化或转染宿主细胞的技术是本领域所熟知的(参见,例如,Sambrook等人,Molecular Cloning:A Laboratory Manual,Cold SpringHarborLaboratony,1989)。
包含本发明DNA的重组表达载体以及用所述DNA或所述表达载体转化的细胞也构成本发明的一部分。
本发明的再一方面提供具有N-末端功能区、DNA结合功能区和配体结合功能区的嵌合受体蛋白,其特征在于这些功能区之至少一个来源于本发明受体蛋白,且所述嵌合蛋白的其它功能区之至少一个来源于另一来自核受体总科的受体蛋白,其条件是,所述嵌合受体蛋白的DNA结合功能区和配体结合功能区来源于不同的蛋白。
尤其是,本发明之嵌合受体包含本发明之LBD,所述LBD具有这样一种氨基酸序列,该氨基酸序列显示出与示于SEQ ID NO:4中的氨基的序列至少70%同源性。在这种情况下,N-末端功能区和DBD应衍生自另一核受体,如PR。以这种方式,构建嵌合受体,且它被本发明之ER的配体活化,并以孕甾酮效应元件控制下的基因为靶体。具有本发明之LBD的嵌合受体可用于筛选这样的一类化合物,其可鉴别能够活化本发明ER的新颖配体或激素类似物。
此外,包含本发明DBD和LBD以及(任选的)衍生自另一核受体的N-末端功能区之嵌合受体可以成功地用于鉴定所述核受体之新颖配体或激素类似物,上述DBD所具有的氨基酸序列显示出与示于SEQ ID NO:3中的氨基酸序列至少80%同源性。这些嵌合受体特别是在鉴定孤独受体的各个配体上有用。
由于甾类受体有具有不同功能的三种功能区,这些功能或多或少是独立的,因此所有这三种功能区衍生自该甾类受体总科的不同受体,这点是可能的。
含有不同起源之部分的分子称作嵌合。这样的包含本发明配体结合功能区和/或DNA结合功能区的嵌合受体可由化学键产生,但最优选的是在DNA水平,用标准的分子生物学方法,通过融合编码所需甾类受体功能区之核酸序列来完成这种偶联。这样,编码本发明嵌合受体蛋白的DNA也是本发明的主题。
这些嵌合蛋白可以通过将编码这些嵌合受体蛋白的DNA转染至适合的宿主细胞,并在适合的条件下培养这些细胞来制备。
如果紧接在表达甾类受体的信息之后,宿主细胞也可用载有报道分子信息的载体来转化或转染是极其实用的。这种编码报道分子的载体其特征在于具有启动子序列,该启动子序列含有功能性地连接于可操作报道基因的一或多个激素效应元件(HRE)。这种HRE是活化的甾类受体之DNA靶标,且结果是,它提高对编码报道分子的DNA的转录。在甾类受体的体内环境中,报道分子包含对配体刺激的细胞应答。然而,也可能在体外,将受体的配体结合功能区结合至其它甾类受体的DNA结合功能区和转录活化功能区上,因此而能够应用其它HRE和报道分子体系。一种这样的体系是通过存在于MMTV-LTR中的HRE建立的(MMTV-LTR-鼠乳肿瘤病毒长末端重复序列,与象荧火虫荧光素酶基因或CAT(氯霉素转移酶)的细菌基因一样的报道分子相连)。其它的可用HRE是大鼠催产素启动子、视黄酸效应元件、甲状腺激素效应元件、雌激素效应元件,以及合成效应元件,以上HRE均已被描述(例如Fuller,同前,p3096)。可以使用相似于CAT和荧光素酶β-半乳糖苷酶的报道分子。
本发明的甾类激素受体和嵌合受体可以用于新颖配体或激素类似物的体外鉴定。为此目的,可以用本发明DNA转化的细胞或包含本发明DNA的表达载体进行结合研究,所述细胞表达本发明的甾类受体或嵌合受体。
本发明之新颖甾类激素受体和嵌合受体以及本发明配体结合功能区,可以用在鉴定核受体的功能配体或激素类似物的测定中。
因此,本发明提供鉴定本发明之甾类受体和嵌合受体的功能配体的方法,所述的方法包括如下步骤:a)向适合的宿主细胞引入1)本发明之DNA或表达载体,和2)功能性地连接于可操作激素效应元件的报道基因,所述的HRE能够被由所述DNA编码的受体蛋白之DNA-结合功能区所活化;b)将来自步骤a)的宿主细胞与潜在的配体接触,所述的配体将可能结合至由来自步骤a)的所述DNA编码的受体蛋白的配体结合功能区上;c)监控由来自步骤a)的所述DNA编码的受体蛋白表达。
如果对于基础表达(无配体)而言报道基因的表达被诱导,则功能配体可被认为是兴奋剂;如果报道基因的表达未变或对于基础表达而言被降低,则功能配体可以是适合的(部分)拮抗剂。
在进行这类调研时,业已用编码功能甾类受体的载体和具有激素效应元件信息和连接的报道分子的载体两者转化或转染的宿主细胞,在适合的培养基中培养。加入将活化受体的适合的配位体后,报道分子的产量将会提高,其产量可简单地通过对报道分子具有敏感性的测定来确定。参见例如WO-A-8803168。使用已知甾类受体的测定业已有描述(例如S.Tsai等人,Cell57,443,1989;M.Meyer等人,Cell57,433,1989)。附图简述图1
新颖的雌激素受体(ERβ)的Northern分析。使用ERβ的特异性探针与两种不同多组织Northern印迹(Clontech)杂交(见实施例)。表明人组织是RNA的来源和在以千个碱基(Kb)计的大小标记的位置。图2
显示17β-雌甾二醇,雌甾三醇和雌甾酮对由ERβ介导的荧光素酶活性有3至4倍刺激效果的柱形图。编码ERβ的表达载体,与含有在荧火虫荧光素酶编码序列前的大鼠催产素启动子的报道基因构建体一起,瞬时转染入CHO细胞(参见实施例)。图3
17β-雌甾二醇(E2)单独或与抗-雌激素ICI-164384(ICI)结合对ERα和ERβ的作用。ERα(典型的ER)和ERβ的表达构建体与描述于实施例中的大鼠催产素启动子-荧光素酶报道基因构建体一起瞬时转染入CHO细胞。测定荧光素酶活性,重复三次,且通过在相同的溶胞产物中测定β-半乳糖苷酶来使转染效率正常化。图4
用RT-PCR分析测定在多种细胞系中ERα和ERβ的表达(参见实施例)。所用的细胞系衍生自不同的组织/细胞类型:子宫内膜(ECCl,Ishikawa,HEC-1A,RL95-2),骨肉瘤(SA DS-2,U2-OS,HOS,MG63);乳房肿瘤(MCF-7,T47D);内皮(HUV-EC-C,BAEC-1);平滑肌(HISM,PAC-1,A7R5,A10,RASMC,Cava SMC);肝(HepG2),结肠(CaCo2);和阴道(Hs-760T,SW-954)。
所有的细胞系均为人的,除了PAC-1,A7R5,A10和RASMC,它们是鼠源,BAEC-1为牛源和CavaSMC为豚鼠源。图5
使用表达ERα或ERβ的稳定转染CHO细胞系与大鼠催产素-萤光素酶雌激素效应报道基因一起做的反式激活检测(详情参见实施例)。测定了17β-雌甾二醇和Org4094的激素依赖的反式激活曲线。对于ER拮抗剂雷洛昔芬,将细胞用2×10-10mol/L 17β-雌甾二醇与持续增加的雷洛昔 芬浓度一起处理。最大应答值人为地设定为100%。实施例A 新颖雌激素受体的分子克隆
两种含有肌苷的简并寡核苷酸(I)是以人甾类激素受体的DNA-结合功能区和配体结合功能区的保守区为基础的。
引物#1:5'-GGIGA(C/T)GA(A/G)GC(A/T)TCIGGITG(C/T)CA(C/T)TA(C/T)GG-3'(SEQ ID NO:7)
引物#2:5'-AAGCCTGG(C/G)A(C/T)IC(G/T)(C/T)TTIGCCCAI(C/T)TIAT-3'(SEQ ID NO:8)
作为模板,采用的是来自人EBV刺激的PBL(外周血白细胞)的cDNA。将1微克总RNA在含下列物质的20μl反应物中反转录:50mM KCl、10mM Tris-HCl pH8.3,4mM MgCl2,1mM dNTP(Pharmacia)、100pmol随机六核苷酸(Pharmacia),30单位RNAse抑制剂(Pharmacia)和200单位M-MLV反转录酶(Gibco BRL)。反应混合物在37℃温育30分钟,并在100℃热灭活5分钟。所得的cDNA用于含下列物质的100μl PCR反应中:10mM Tris-HCL pH8.3,50mM KCl,1.5mMMg Cl2、0.001%明胶(w/v),3%DMSO、1微克引物#1和引物#2和2.5单位的Amplitaq DNA聚合酶(Perkin Elmer)。PCR反应在Perkin Elmer 9600热循环器中进行。初始变性(94℃下4分钟)后,接着用下列条件进行35次循环:30秒94℃,30秒45℃,1分钟72℃和7分钟后72℃,将反应物贮存于4℃下。这些反应物的等份试样在1.5%琼脂糖凝胶上分析。感兴趣的片段从凝胶上切下,用相同的PCR条件再扩增,并用QiaexII(Qiagen)纯化。在pCRII载体上克隆片段,并用TA克隆试剂盒(Invitrogen)转化入细菌。采用Qiagen质粒midi方案(Qiagen)将质粒DNA分离用于核苷酸序列分析。核苷酸序列分析是利用具有载体特异性或片段特异性引物的T7 DNA测序试剂盒(Pharmacia)用ALF自动测序仪(Pharmacia)来进行的。
一种克隆片段相对于与典型雌激素受体非常相关的新颖雌激素受体(ER)。克隆的新颖雌激素受体片段部分(SEQ ID 1中的核苷酸466至797)通过采用寡核苷酸#3 TGTTACGAAGTGGGAATGGTGA(SEQ ID 79O:9)和寡核苷酸#2的PCR(Clontech#HL1010b)中的人精巢cDNA库。将重组噬菌体以每135mm平皿40.000pfu(噬菌斑形成单位)的密度制成平板(采用生长于添加有0.2%麦芽糖的LB培养基上的Y1090细菌),并用供应商描述的方法制作复制滤膜(Hybond-N,Amersham)。滤膜在65℃下于含有0.5M磷酸缓冲液(pH7.5)和7%SDS的溶液中预杂交至少30分钟。DNA探针用Qiaex II(.Qiagen)纯化,用Decaprime试剂盒(Ambion)进行32P-标记,且加入预杂交作用的溶液中。滤膜在65℃下杂交过夜,之后在65℃下于0.5×SSC/0.1%SDS中洗涤。鉴定出两阳性噬菌斑,这两噬菌斑可能显示是相同的。这些克隆通过再筛选一次来纯化。在噬菌体上的PCR反应用λgt 11-特异的引物#4:5'-TTGACACCAGACCAACTGGTAATG-3'(SEQ IDNO:10)和#5:5'-GGTGGCGACGACTCCTGGAGCCCG-3'(SEQ ID NO:11)洗脱,产生在两种克隆上的1700个碱基对的片段。随后的PCR反应采用带有λgt11引物#4的基因特异引物#6:5'-GTACACTGATTTGTAGCTGGAC-3'(SEQ ID NO:12)与带有λgt11引物#5的基因特异引物#7:5'-CCATGATGATGTCCCTGACC-3'(SEQ ID NO:13)结合,分别产生大致为450bp和1000bp的片段,这些片段克隆于pCRH载体中,并用于核苷酸序列分析。这些PCR反应的条件除了引物浓度(200ng的各引物)和退火温度(60℃)如上文所描述。由于在此cDNA克隆中与ER的同源性在相应于ER上的外显子7/外显子8界限的位点处(在SEQ ID NO:1的核苷酸1247和1248间)完全损失,这就示意这一序列相应于新颖ER基因的内含子7。为了确定此cDNA克隆的核苷酸序列,采用校正pfu聚合酶(Stratagene),在带有相应于外显子7的3'端:5'-TCGCATGCCTGACGTGGGAC-3'(SEQ ID NO:14)的基因特异引物#8的λgt11引物#4的cDNA克隆上产生一1200bp的片段。此片段也克隆于pCRII载体中,并完全测序,该片段与前面获得的序列相同。
为获得外显子7之新颖ER下游的核苷酸序列,与采用精巢cDNA作模板(Marathon ready精巢cDNA,Clontech Cat#7414-1)的基因特异寡核苷酸#10:5'-GGAAGCTGGCTCACTTGCTG-3'(SEQID NO:16)一起,使用以典型ER的AF-2区(#9:5'-GGC(C/G)TCCAGCATCTCCAG(C/G)A(A/G)CAG-3';SEQ ID NO:15)为基础的简并寡核苷酸。将相应于SEQ ID NO:1中的核苷酸1112至1332的特异220bp片段克隆并测序。核苷酸1112至1247与cDNA克隆的相应序列相同。其序列下游与典型ER中的相应区高度同源。为了获得此AF-2区的新颖ER下游之序列,采用Marathon ready精巢cDNA(Clontech)作模板进行RACE(快速扩增cDNA末端)PCR反应。采用寡核苷酸#11:5'-TCTTGTTCTGGACAGGGATG-3'(SEQ ID NO:17)与提供于试剂盒中的AP1引物组合,进行起始PCR。采用寡核苷酸#10(SEQ ID NO:16)与提供于试剂盒中的寡dT引物组合,在此反应的等份小样上进行嵌套式PCR。随后,将此反应的等份小样用于采用与寡dT引物组合的寡核苷酸#12:5'-GCATGGAACATCTGCTCAAC-3'(SEQ ID NO:18)的嵌套式PCR中。所获得的特异片段(相应于SEQ ID NO:1中的核苷酸1256至1431)的核苷酸序列分析揭示出编码新颖配体结合功能区的羧基末端的序列,该序列包括F功能区和翻译终止密码子和不包括在SEQ ID NO:1中的3'未翻译序列的一部分。推演的氨基酸序列示于SEQ ID NO:5中。
为了研究新颖雌激素受体具有附加的上游翻译起始密码子的可能性,采用Marathon ready精巢cDNA(C1ontech Cat.#7414-1)进行RACE-PCR实验。首先采用寡核苷酸SEQ ID NO:12(相应于SEQ ID NO:1中核苷酸416-395的反义)和AP-1(提供于试剂盒)中进行一次PCR。之后采用具有SEQ ID NO:27的寡核苷酸(相应于SEQ ID NO:1中核苷酸254-231的反义)与AP-2(提供于试剂盒中)进行嵌套式PCR。从获得的涂片上,将相应于大于300碱基对的片段的区切下,用Geneclean II试剂盒(Bio101)纯化,并用TA-克隆试剂盒(Clontech)克隆。通过采用基因特异的引物:SEQ ID NO:22和SEQ ID NO:28筛选这些克隆。将含最大插入物的克隆测序。核苷酸序列相当于SEQ ID NO:24中的核苷酸1至490。由此序列清楚可知,第一框内上游翻译起始密码子存在于SEQ ID NO:24中的77-79的位置。此翻译起始密码子的上游存在一框内终止密码子(SEQ ID NO:24中的11-13)。所以,新颖雌激素受体的读框是530个氨基酸(示于SEQ ID NO:25)且具有59.234KD的计算分子量。
为确认通过5'RACE获得的核苷酸序列,获得并分析了人基因组克隆。在λEMBL3(Clontech HL 1067J)中的人基因组库用相当于SEQ ID NO:1中核苷酸1-416的探针筛选。噬菌斑纯化强杂交克隆,并用标准方案分离DNA(Sambrook等人,1989)。DNA用几种限制性内切酶消化,在琼脂糖凝胶上电穿孔,并印迹到尼龙滤膜上。与相当于上述RACE片段(SEQ ID NO:24中的核苷酸1-490)探针的印迹杂交揭示了大约800碱基对的杂交Sau 3A片段。将此片段克隆到pGEM3Z的BamH1位点并测序。该核苷酸序列含有一个碱基差异,该差异或许是RACE片段上的PCR-诱导的点突变。核苷酸172为5'RACE片段的G残基,但在几种独立的基因组亚克隆中为A残基。B 新颖雌激素受体的两种拼接变体的鉴定
用相当于SEQ ID NO:1中的核苷酸918至1246的探针重筛选精巢cDNA库,产生两种杂交克隆,其3'端用PCR(基因特异引物#10:5'-GGAAGCTGGCTCACTTGCTG-3'(SEQ ID NO:16)与引物#4,SEQ ID NO:10一起)扩增、克隆并测序。一个克隆显示含有新颖ER的替代外显子8(外显子8B)。在SEQ ID NO.2中,示出了此拼接变体的编码蛋白的部分和终止密码子。作为通过替代拼接反应引入此外显子的结果是,编码此新颖ER的读框立即终止,由此产生新颖ER羧基末端的截短(SEQ ID NO:6)。
用相应于SEQ ID NO:1中的核苷酸918至1246的探针筛选人胸腺cDNA库(Clontech HL 1074a),得到另一拼接变体。用带λgt10特异引物#13:5'-AGCAAGTTCAGCCTGTTAAGT-3'(SEQ ID NO:19)的引物#10(SEQ ID NO:16)将一杂交克隆之3'端扩增,克隆并测序。获得的外显子7/外显子8界限的核苷酸序列上游与前面鉴定的克隆相同。然而,替代外显子8(外显子8C)存在于编码两个C一末端氨基酸的3'-端处,紧接着一个终止密码子。此拼接变体的蛋白编码部分的核苷酸序列示于SEQ ID NO:20中,相应的蛋白序列是SEQ ID NO:21。
新颖雌激素受体的这两种变体不含有AF-2区,且因此可能缺乏调控以配体依赖方式转录靶基因的能力。然而,这些变体可能潜在地干扰野生型典型ER和/或野生型新颖ER的功能,这种干扰是通过异二聚合作用或通过占据雌激素效应元件或通过与其它转录因子相互作用。业已描述了一种典型ER(ER1-530)的突变体,该突变体与上面描述的新颖雌激素受体的两种变体非常相似。ER1-530业已显示出有负显性受体的行为,即它可以调控野生型ER的细胞内活性(Ince等人,J.Biol,Chem,268,14026-14032,1993)。C Northern印迹分析
从Clontech购得人多组织Northern印迹(MTN-印迹),并在65℃下于含7% SDS的0.5M磷酸缓冲液pH7.5中预杂交至少1小时。采用标记试剂盒(Ambion)将用作探针的DNA片段(相应于SEQ ID NO:1中的核苷酸466至797)32P-标记,经煮沸变性,并加入预杂交溶液中。洗涤条件是室温下3×SSC,接着65℃下3×SSC,最好65℃下1×SSC。之后将滤膜暴露于X射线膜一周。在胸腺、脾、卵巢和精巢中检测到两个大约8kb和10kb的转录物。此外,在精巢中检测到1.3kb的转录物。D 在细胞系中表达ERα和ERβ的RT-PCR分析
采用RNA zol B(Cinna/Biotecx)由许多人和动物细胞系分离出RNA。按照厂家的说明采用Superscript II试剂盒(BRL)用2.5微克总RAN制作cDNA。一部分cDNA用于片段的特异PCR扩增,所述的片段相应于编码ER的mRNA或是相应于新颖雌激素受体。(应强调的是所用的引物是以人或大鼠序列为基础的,而某些细胞系不是大鼠或人的,参见图4简述)。对ERα用的引物是:有义-GATGGGCTTACTGACCAACC-3'和反义5'-AGATGCTCCATGCCTTT G-3',它们产生相应于LBD部分的548个碱基对片段。对于ERβ:有义5'-TTCACCGAGGCCTCCATGATG-3'和反义5'-CAGATGTTCCATGCCCTTGTT-3',它们产生相应于LBD部分的565个碱基对片断。将PCR样品在琼脂糖上分析,印迹到尼龙膜上。采用标准实验方法(Sambrook等人,1989)将这些印迹与用上述的ERα和ERβ质粒DNA上的引物产生的32P-标记PCR片段杂交。E 由新颖雌激素受体蛋白活化的配体依赖转录
细胞培养
由ATCC(CCL61)得到中华仓鼠卵巢(CHO K1)细胞,并将它于37℃润湿气氛(5%CO2)中作为单层培养物在无fenolred的M505培养基中保持。后者培养基由Dulbecco改进Eagle培养基(DMEM,Gibco 074-200)和添加下列物质的营养基F12(Ham's F12,Gibco 074-1700)的混合物(1∶1)组成:2.5mg/ml碳酸钠(Baker)、55μg/ml丙酮酸钠(Fluka)、2.3μg/ml β-巯基乙醇(Baker)、1.2μg/ml乙醇胺(Baker)、360μg/ml L-谷氨酸(Merck、0.45μg/ml亚硒酸钠(Fluka)、62.5μg/ml青霉素(Mycopharm)、62.5μg/ml链霉素(Serva)和5%木炭处理的小牛血清(Hyclone)。
重组载体
ERβ编码序列示于SEQ ID NO:1中,该序列通过采用寡核苷酸5'-CTTGGATCCATAGCCCTGCTGTGATGAATTACAG-3'(SEQ ID NO:22,下划线是翻译起始密码子)与5'-GATGGATCCTCACCTCAGGGCCAGGCGTCACTG-3'(SEQ IDNO:23)(下划线是翻译终止密码子,反义)结合的PCR扩增。之后将所得的BamHl片段(大约1450个碱基对)克隆于哺乳动物细胞表达载体pNGV1(Genbank登记号X99274)中。
编码示于SEQ ID NO:24中的ERβ读框的表达构建体通过用相应于SEQ ID NO:24中的核苷酸77-316的BamH1-MsC1片段替换BamH1-Msc1片段(SEQ ID NO:1中的核苷酸1-81)来制备。后一片段是用SEQ ID:26与采用上述5'RACE片段的SEQ ID NO:28组合的PCR来制备的。
报道载体以连于荧火虫荧光素酶编码序列的大鼠催产素基因调节区(位置-363/+16,为HindIII/MboI片段;R.Ivell和D.Richter,Proc.Natl.Acad.Sci.USA 81,2006-2010,1984)为基础;该催产素基因的调节区显示具有体外对大鼠(R.Adan等人Biochem.Biophys.Res.Comm.175.117-122,1991)和人(S.Richard和H.Zingg J.Biol.Chem.265,6098-6103,1990)的功能雌激素效应元件。
瞬时转染
将1×105个CHO细胞接种在6孔Nunclon组织培养板上,利用脂质转染(Lipofectin)(Gibco BRL)引入DNA。将此DNA(在250μLOptimem中的1μg受体和报道载体,Gibco BRI)与等体积的脂质转染试剂(在250μL Optimem中7μL,Gibco)混合,并让其在室温下静置15分钟。用无血清培养基(M505)将细胞洗涤两遍后,将新培养基(500μl Optimem,Gibco)加入此细胞中,接着滴加此DNA-脂质转染混合物。在37℃温育5小时后,用无fenolred M505+5%木炭处理的小牛血清将细胞洗涤两遍,并在37℃温育过夜。24小时后,将激素加入此培养基(10-7mol/L)中。转染后48小时,通过加入200μL溶细胞缓冲液(0.1M磷酸缓冲液pH7.8,0.2% Triton X-100)制备细胞提取液。在37℃温育5分钟后,将细胞悬浮液离心(Eppendorf离心机,5分钟),并将20μl样品加到50μL荧光素酶测定试剂(Promega)中。用发光计(Berthold Biolumat)于562nm处测量光发射量10秒钟。
新颖雌激素受体的稳定转染
如先前所描述的(Theunissen等人,J.Biol.Chem.268,9035-9040,1993),将编码全长ERβ1-530(参见上述)的表达质粒在CHOK1细胞中稳定地转染。这种方式所获得的单细胞克隆用上面描述的报道质粒(大鼠催产素-荧光素酶)的瞬时转染来筛选。选择出的克隆用于大鼠催产素-荧光酶素报道质粒与含有用于选择的潮霉素抗性基因的质粒pDR2A一起的第三次稳定转染。测试所获得的单细胞克隆对17β-雌甾二醇的应答。随后,将选择出的单细胞克隆用于反式激活研究。简洁地说,将细胞以(1.6×104细胞/孔)的密度接种于96孔板上。24小时后,不同浓度的激素用培养基稀释,并加入这些孔中。作拮抗实验时,将2×10-10M的17β-雌甾二醇加入各个孔,并加入不同浓度的拮抗剂。温育24小时后,用PBS将细胞洗涤一次,之后通过加入40微升溶细胞缓冲液(参见上述)来溶细胞。向各个孔中加入荧光素酶试剂(50微升),并用Topcount(Packard)测量光发射量。
结果
于CHO细胞中瞬时转染的两种表达构建体(SEQ ID NO:1和SEQ ID NO:24)之比较显示出对许多兴奋剂和拮抗剂应答的相同反式激活作用。用ERβ表达载体和报道质粒瞬时转染的CHO细胞显示出在对17β-雌甾二醇应答上有比未处理细胞高出3至4倍的荧光素酶活性增加(参见图2)。在用雌甾三醇和雌甾酮的处理上,获得相似的反式激活作用。这些结果表明,不仅新颖ER(ERβ)可以结合雌激素,而且此配体活化的受体可以结合到在大鼠催产素启动子内的雌激素效应元件(ERE)上,并活化荧光素酶报道基因的转录。图3显示,独立的相似实验中,10-9mol/L 17β-雌甾二醇用ERα给出18倍的刺激,而用ERβ给出7倍的刺激。此外,抗雌激素ICI-164384当用17β-雌甾二醇活化时为ERα和ERβ的拮抗剂,而此拮抗剂单独使用时则无效果。在此实验中,用0.25μg β-半乳糖苷酶载体共转染,以便转染效力上的差异正常化。
在稳定转染的ERα和ERβ细胞系上进行的反式激活研究给出相似的绝对荧光素酶值。17β-雌甾二醇的曲线非常相似,显示出与ERβ相比,对于ERα用较低浓度的激素就可达到半最大反式激活(图5)。对于Org 4094也是这种情况,但是所观察到的效果更显著。雷洛昔芬的曲线显示此拮抗剂在阻遏对ERα反式激活上的效力要比其阻遏ERβ反式激活上的效力要更大。
序列表(1)一般信息: (i)申请人:
(A)名称:Akzo nobeI n.v.
(B)街道:Velperweg 76
(C)城市:Arnhem
(E)国家:荷兰
(F)邮编(ZIP):6824 BM
(G)电话:0412-666379
(H)电传:0412-650592
(I)电报:37503 akpha nl (ii)发明名称:新颖的雌激素受体 (iii)序列数:28 (iv)计算机可读形式
(A)介质类型:软盘
(B)计算机:IBM PC兼容机
(C)操作系统:PC-DOS/MS-DOS
(D)软件:PatentIn Release#1.0,Version#1.30(EPO)(2)SEQ ID NO:1信息: (i)序列特征:
(A)长度:1434碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑学:直链 (ii)分子类型:cDNA (xi)SEQ ID NO:1序列描述:ATGAATTACA GCATTCCCAG CAATGTCACT AACTTGGAAG GTGGGCCTGG TCGGCAGACC 60ACAAGCCCAA ATGTGTTGTG GCCAACACCT GGGCACCTTT CTCCTTTAGT GGTCCATCGC 120CAGTTATCAC ATCTGTATGC GGAACCTCAA AAGAGTCCCT GGTGTGAAGC AAGATCGCTA 180GAACACACCT TACCTGTAAA CAGAGAGACA CTGAAAAGGA AGGTTAGTGG GAACCGTTGC 240GCCAGCCCTG TTACTGGTCC AGGTTCAAAG AGGGATGCTC ACTTCTGCGC TGTCTGCAGC 300GATTACGCAT CGGGATATCA CTATGGAGTC TGGTCGTGTG AAGGATGTAA GGCCTTTTTT 360AAAAGAAGCA TTCAAGGACA TAATGATTAT ATTTGTCCAG CTACAAATCA GTGTACAATC 420GATAAAAACC GGCGCAAGAG CTGCCAGGCC TGCCGACTTC GGAAGTGTTA CGAAGTGGGA 480ATGGTGAAGT GTGGCTCCCG GAGAGAGAGA TGTGGGTACC GCCTTGTGCG GAGACAGAGA 540AGTGCCGACG AGCAGCTGCA CTGTGCCGGC AAGGCCAAGA GAAGTGGCGG CCACGCGCCC 600CGAGTGCGGG AGCTGCTGCT GGACGCCCTG AGCCCCGAGC AGCTAGTGCT CACCCTCCTG 660GAGGCTGAGC CGCCCCATGT GCTGATCAGC CGCCCCAGTG CGCCCTTCAC CGAGGCCTCC 720ATGATGATGT CCCTGACCAA GTTGGCCGAC AAGGAGTTGG TACACATGAT CAGCTGGGCC 780AAGAAGATTC CCGGCTTTGT GGAGCTCAGC CTGTTCGACC AAGTGCGGCT CTTGGAGAGC 840TGTTGGATGG AGGTGTTAAT GATGGGGCTG ATGTGGCGCT CAATTGACCA CCCCGGCAAG 900CTCATCTTTG CTCCAGATCT TGTTCTGGAC AGGGATGAGG GGAAATGCGT AGAAGGAATT 960CTGGAAATCT TTGACATGCT CCTGGCAACT ACTTCAAGGT TTCGAGAGTT AAAACTCCAA 1020CACAAAGAAT ATCTCTGTGT CAAGGCCATG ATCCTGCTCA ATTCCAGTAT GTACCCTCTG 1080GTCACAGCGA CCCAGGATGC TGACAGCAGC CGGAAGCTGG CTCACTTGCT GAACGCCGTG 1140ACCGATGCTT TGGTTTGGGT GATTGCCAAG AGCGGCATCT CCTCCCAGCA GCAATCCATG 1200CGCCTGGCTA ACCTCCTGAT GCTCCTGTCC CACGTCAGGC ATGCGAGTAA CAAGGGCATG 1260GAACATCTGC TCAACATGAA GTGCAAAAAT GTGGTCCCAG TGTATGACCT GCTGCTGGAG 1320ATGCTGAATG CCCACGTGCT TCGCGGGTGC AAGTCCTCCA TCACGGGGTC CGAGTGCAGC 1380CCGGCAGAGG ACAGTAAAAG CAAAGAGGGC TCCCAGAACC CACAGTCTCA GTGA 1434(2)SEQ ID NO:2信息: (i)序列特征:
(A)长度:1251碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑学:直链 (ii)分子类型:cDNA (xi)SEQ ID NO:2:序列描述ATGAATTACA GCATTCCCAG CAATGTCACT AACTTGGAAG GTGGGCCTGG TCGGCAGACC 60ACAAGCCCAA ATGTGTTGTG GCCAACACCT GGGCACCTTT CTCCTTTAGT GGTCCATCGC 120CAGTTATCAC ATCTGTATGC GGAACCTCAA AAGAGTCCCT GGTGTGAAGC AAGATCGCTA 180GAACACACCT TACCTGTAAA CAGAGAGACA CTGAAAAGGA AGGTTAGTGG GAACCGTTGC 240GCCAGCCCTG TTACTGGTCC AGGTTCAAAG AGGGATGCTC ACTTCTGCGC TGTCTGCAGC 300GATTACGCAT CGGGATATCA CTATGGAGTC TGGTCGTGTG AAGGATGTAA GGCCTTTTTT 360AAAAGAAGCA TTCAAGGACA TAATGATTAT ATTTGTCCAG CTACAAATCA GTGTACAATC 420GATAAAAACC GGCGCAAGAG CTGCCAGGCC TGCCGACTTC GGAAGTGTTA CGAAGTGGGA 480ATGGTGAAGT GTGGCTCCCG GAGAGAGAGA TGTGGGTACC GCCTTGTGCG GAGACAGAGA 540AGTGCCGACG AGCAGCTGCA CTGTGCCGGC AAGGCCAAGA GAAGTGGCGG CCACGCGCCC 600CGAGTGCGGG AGCTGCTGCT GGACGCCCTG AGCCCCGAGC AGCTAGTGCT CACCCTCCTG 660GAGGCTGAGC CGCCCCATGT GCTGATCAGC CGCCCCAGTG CGCCCTTCAC CGAGGCCTCC 720ATGATGATGT CCCTGACCAA GTTGGCCGAC AAGGAGTTGG TACACATGAT CAGCTGGGCC 780AAGAAGATTC CCGGCTTTGT GGAGCTCAGC CTGTTCGACC AAGTGCGGCT CTTGGAGAGC 840TGTTGGATGG AGGTGTTAAT GATGGGGCTG ATGTGGCGCT CAATTGACCA CCCCGGCAAG 900CTCATCTTTG CTCCAGATCT TGTTCTGGAC AGGGATGAGG GGAAATGCGT AGAAGGAATT 960CTGGAAATCT TTGACATGCT CCTGGCAACT ACTTCAAGGT TTCGAGAGTT AAAACTCCAA 1020CACAAAGAAT ATCTCTGTGT CAAGGCCATG ATCCTGCTCA ATTCCAGTAT GTACCCTCTG 1080GTCACAGCGA CCCAGGATGC TGACAGCAGC CGGAAGCTGG CTCACTTGCT GAACGCCGTG 1140ACCGATGCTT TGGTTTGGGT GATTGCCAAG AGCGGCATCT CCTCCCAGCA GCAATCCATG 1200CGCCTGGCTA ACCTCCTGAT GCTCCTGTCC CACGTCAGGC ATGCGAGGTG A 1251(2)SEQ ID NO:3:信息: (i)序列特征:
(A)长度:66氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑学:直链 (ii)分子类型:肽 (xi)SEQ ID NO:3序列描述:Cys Ala Val Cys Ser Asp Tyr Ala Ser Gly Tyr His Tyr Gly Val Trp1 5 10 15Ser Cys Glu Gly Cys Lys Ala Phe Phe Lys Arg Ser Ile Gln Gly His
20 25 30Asn Asp Tyr Ile Cys Pro Ala Thr Asn Gln Cys Thr Ile Asp Lys Asn
35 40 45Arg Arg Lys Ser Cys Gln Ala Cys Arg Leu Arg Lys Cys Tyr Glu Val
50 55 60Gly Mer65(2)SEQ ID No:4信息: (i)序列特征:
(A)长度:233氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑学:直链 (ii)分子类型:肽 (xi)SEQ ID No:4序列描述:Leu Val Leu Thr Leu Leu Glu Ala Glu Pro Pro His Val Leu Ile Ser1 5 10 15Arg Pro Ser Ala Pro Phe Thr Glu Ala Ser Met Met Met Ser Leu Thr
20 25 30Lys Leu Ala Asp Lys Glu Leu Val His Met Ile Ser Trp Ala Lys Lys
35 40 45Ile Pro Gly Phe Val Glu Leu Ser Leu Phe Asp Gln Val Arg Leu Leu
50 55 60Glu Ser Cys Trp Met Glu Val Leu Met Met Gly Leu Met Trp Arg Ser65 70 75 80Ile Asp His Pro Gly Lys Leu Ile Phe Ala Pro Asp Leu Val Leu Asp
85 90 95Arg Asp Glu Gly Lys Cys Val Glu Gly Ile Leu Glu Ile Phe Asp Met
100 105 110Leu Leu Ala Thr Thr Ser Arg Phe Arg Glu Leu Lys Leu Gln His Lys
115 120 125Glu Tyr Leu Cys Val Lys Ala Met Ile Leu Leu Asn Ser Ser Met Tyr
130 135 140Pro Leu Val Thr Ala Thr Gln Asp Ala Asp Ser Ser Arg Lys Leu Ala145 150 155 160His Leu Leu Asn Ala Val Thr Asp Ala Leu Val Trp Val Ile Ala Lys
165 170 175Ser Gly Ile Ser Ser Gln Gln Gln Ser Met Arg Leu Ala Asn Leu Leu
180 185 190Met Leu Leu Ser His Val Arg His Ala Ser Asn Lys Gly Met Glu His
195 200 205Leu Leu Asn Met Lys Cys Lys Asn Val Val Pro Val Tyr Asp Leu Leu
210 215 220Leu Glu Met Leu Asn Ala His Val Leu225 230(2)SEQ ID No:5信息: (i)序列特征:
(A)长度:477氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑学:未知 (ii)分子类型:蛋白 (xi)SEQ ID NO:5序列描述:Met Asn Tyr Ser Ile Pro Ser Asn Val Thr Asn Leu Glu Gly Gly Pro1 5 10 15Gly Arg Gln Thr Thr Ser Pro Asn Val Leu Trp Pro Thr Pro Gly His
20 25 30Leu Ser Pro Leu Val Val His Arg Gln Leu Ser His Leu Tyr Ala Glu
35 40 45Pro Gln Lys Ser Pro Trp Cys Glu Ala Arg Ser Leu Glu His Thr Leu
50 55 60Pro Val Asn Arg Glu Thr Leu Lys Arg Lys Val Ser Gly Asn Arg Cys65 70 75 80Ala Ser Pro Val Thr Gly Pro Gly Ser Lys Arg Asp Ala His Phe Cys
85 90 95Ala Val Cys Ser Asp Tyr Ala Ser Gly Tyr His Tyr Gly Val Trp Ser
100 105 110Cys Glu Gly Cys Lys Ala Phe Phe Lys Arg Ser Ile Gln Gly His Asn
115 120 125Asp Tyr Ile Cys Pro Ala Thr Asn Gln Cys Thr Ile Asp Lys Asn Arg
130 135 140Arg Lys Ser Cys Gln Ala Cys Arg Leu Arg Lys Cys Tyr Glu Val Gly145 150 155 160Met Val Lys Cys Gly Ser Arg Arg Glu Arg Cys Gly Tyr Arg Leu Val
165 170 175Arg Arg Gln Arg Ser Ala Asp Glu Gln Leu His Cys Ala Gly Lys Ala
180 185 190Lys Arg Ser Gly Gly His Ala Pro Arg Val Arg Glu Leu Leu Leu Asp
195 200 205Ala Leu Ser Pro Glu Gln Leu Val Leu Thr Leu Leu Glu Ala Glu Pro
210 215 220Pro His Val Leu Ile Ser Arg Pro Ser Ala Pro Phe Thr Glu Ala Ser225 230 235 240Met Met Met Ser Leu Thr Lys Leu Ala Asp Lys Glu Leu Val His Met
245 250 255Ile Ser Trp Ala Lys Lys Ile Pro Gly Phe Val Glu Leu Ser Leu Phe
260 265 270Asp Gln Val Arg Leu Leu Glu Ser Cys Trp Met Glu Val Leu Met Met
275 280 285Gly Leu Met Trp Arg Ser Ile Asp His Pro Gly Lys Leu Ile Phe Ala
290 295 300Pro Asp Leu Val Leu Asp Arg Asp Glu Gly Lys Cys Val Glu Gly Ile305 310 315 320Leu Glu Ile Phe Asp Met Leu Leu Ala Thr Thr Ser Arg Phe Arg Glu
325 330 335Leu Lys Leu Gln His Lys Glu Tyr Leu Cys Val Lys Ala Met Ile Leu
340 345 350Leu Asn Ser Ser Met Tyr Pro Leu Val Thr Ala Thr Gln Asp Ala Asp
355 360 365Ser Ser Arg Lys Leu Ala His Leu Leu Asn Ala Val Thr Asp Ala Leu
370 375 380Val Trp Val Ile Ala Lys Ser Gly Ile Ser Ser Gln Gln Gln Ser Met385 390 395 400Arg Leu Ala Asn Leu Leu Met Leu Leu Ser His Val Arg His Ala Ser
405 410 415Asn Lys Gly Met Glu His Leu Leu Asn Met Lys Cys Lys Asn Val Val
420 425 430Pro Val Tyr Asp Leu Leu Leu Glu Met Leu Asn Ala His Val Leu Arg
435 440 445Gly Cys Lys Ser Ser Ile Thr Gly Ser Glu Cys Ser Pro Ala Glu Asp
450 455 460Ser Lys Ser Lys Glu Gly Ser Gln Asn Pro Gln Ser Gln465 470 475(2)SEQ ID NO:6信息: (i)序列特征
(A)长度:416氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑学:未知 (ii)分子类型:蛋白 (xi)SEQ ID NO:6序列描述:Met Asn Tyr Ser Ile Pro Ser Asn Val Thr Asn Leu Glu Gly Gly Pro1 5 10 15Gly Arg Gln Thr Thr Ser Pro Asn Val Leu Trp Pro Thr Pro Gly His
20 25 30Leu Ser Pro Leu Val Val His Arg Gln Leu Ser His Leu Tyr Ala Glu
35 40 45Pro Gln Lys Ser Pro Trp Cys Glu Ala Arg Ser Leu Glu His Thr Leu
50 55 60Pro Val Asn Arg Glu Thr Leu Lys Arg Lys Val Ser Gly Asn Arg Cys65 70 75 80Ala Ser Pro Val Thr Gly Pro Gly Ser Lys Arg Asp Ala His Phe Cys
85 90 95Ala Val Cys Ser Asp Tyr Ala Ser Gly Tyr His Tyr Gly Val Trp Ser
100 105 110Cys Glu Gly Cys Lys Ala Phe Phe Lys Arg Ser Ile Gln Gly His Asn
115 120 125Asp Tyr Ile Cys Pro Ala Thr Asn Gln Cys Thr Ile Asp Lys Asn Arg
130 135 140Arg Lys Ser Cys Gln Ala Cys Arg Leu Arg Lys Cys Tyr Glu Val Gly145 150 155 160Met Val Lys Cys Gly Ser Arg Arg Glu Arg Cys Gly Tyr Arg Leu Val
165 170 175Arg Arg Gln Arg Ser Ala Asp Glu Gln Leu His Cys Ala Gly Lys Ala
180 185 190Lys Arg Ser Gly Gly His Ala Pro Arg Val Arg Glu Leu Leu Leu Asp
195 200 205Ala Leu Ser Pro Glu Gln Leu Val Leu Thr Leu Leu Glu Ala Glu Pro
215 220Leu Ile Ser Arg Pro Ser Ala Pro Phe Thr Glu Ala Ser
230 235 240Ser Leu Thr Lys Leu Ala Asp Lys Glu Leu Val His Met
245 250 255Ala Lys Lys Ile Pro Gly Phe Val Glu Leu Ser Leu Phe160 265 270Arg Leu Leu Glu Ser Cys Trp Met Glu Val Leu Met Met
280 285 Grp Arg Ser Ile Asp His Pro Gly Lys Leu Ile Phe Ala
295 300Val Leu Asp Arg Asp Glu Gly Lys Cys Val Glu Gly Ile
310 315 320Phe Asp Mer Leu Leu Ala Thr Thr Ser Arg Phe Arg Glu
325 330 335Gln His Lys Glu Tyr Leu Cys Val Lys Ala Met Ile Leu340 345 350Ser Met Tyr Pro Leu Val Thr Ala Thr Gln Asp Ala Asp
360 365Lys Leu Ala His Leu Leu Asn Ala Val Thr Asp Ala Leu
375 380Ile Ala Lys Ser Gly Ile Ser Ser Gln Gln Gln Ser Met
390 395 400Ash Leu Leu Met Leu Leu Ser His Val Arg His Ala Arg
405 410 415(2)SEQ ID NO:7信息: (i)序列特征:
(A)长度:29碱基对
(B)类型:核酸
(C)链型:两种
(D)拓扑学:未知 (ii)分子类型:cDNA (xi)SEQ ID NO:7序列描述:
GGIGAYGARG CWTCIGGITG YCAYTAYGG(2)SEQ ID NO:8信息: (i)序列特征:
(A)长度:29碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:直链 (ii)分子类型:cDNA (xi)SEQ ID NO:8序列描述:
AAGCCTGGSA YICKYTTIGC CCAIYTIAT(2)SEQ ID NO:9信息: (i)序列特征:
(A)长度:22碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:直链 (ii)分子类型:cDNA (xi)SEQ ID NO:9序列描述:
TGTTACGAAG TGGGAATGGT GA(2)SEQ ID NO:10信息: (i)序列特征:
(A)长度:24碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:直链 (ii)分子类型:cDNA (xi)SEQ ID NO:10序列描述:
TTGACACCAG ACCAACTGGT AATG(2)SEQ ID NO:11信息: (i)序列特征:
(A)长度:24碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:直链 (ii)分子类型:cDNA (xi)SEQ ID NO:11序列描述:
GGTGGCGACGACTCCTGGAGCCCG(2)SEQ ID NO:12信息: (i)序列特征:
(A)长度:22碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:直链 (ii)分子类型:cDNA (xi)SEQ ID NO:12序列描述:
GTACACTGAT TTGTAGCTGG AC(2)SEQ ID NO:13信息: (i)序列特征:
(A)长度:20碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:直链 (ii)分子类型:cDNA (xi)SEQ ID NO:13序列描述:
CCATGATGAT GTCCCTGACC(2)SEQ ID NO:14信息: (i)序列特征
(A)长度:20碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:直链 (ii)分子类型:cDNA (xi)SEQ ID NO:14序列描述: TCGCATGCCT GACGTGGGAC(2)SEQ ID NO:15信息: (i)序列特征P:
(A)长度:24碱基对
(B)类型:核酸
(C)链型:核酸
(D)拓扑学:直链 (ii)分子类型 (xi)SEQ ID NO:15序列描述: GGCSTCCAGC ATCTCCAGSA RCAG(2)SEQ ID NO:16信息: (i)序列特征:
(A)长度:20碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:直链 (ii)分子类型:cDNA (xi)SEQ ID NO:16序列描述: GGAAGCTGGC TCACTTGCTG(2)SEQ ID NO:17信息: (i)序列特征:
(A)长度:20碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:直链 (ii)分子类型:cDNA (xi)SEQ ID NO:17序列描述: TCTTGTTCTG GACAGGGATG(2)SEQ ID NO:18信息: (i)序列特征:
(A)长度:20碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:直链 (ii)分子类型:cDNA (xi)SEQ ID NO:18序列描述: GCATGGAACA TCTGCTCAAC(2)SEQ ID NO:19信息: (i)序列特征:
(A)长度:21碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:直链 (ii)分子类型:cDNA (xi)SEQ ID NO:19序列描述: AGCAAGTTCA GCCTGTTAAG T(2)SEQ ID NO:20信息: (i)序列特征:
(A)长度:1257碱基对
(B)类型:核酸
(C)链型:链
(D)拓扑学:直链 (ii)分子类型:cDNA (xi)SEQ ID NO:20序列描述:ATGAATTACA GCATTCCCAG CAATGTCACT AACTTGGAAG GTGGGCCTGG TCGGCAGACC 60ACAAGCCCAA ATGTGTTGTG GCCAACACCT GGGCACCTTT CTCCTTTAGT GGTCCATCGC 120CAGTTATCAC ATCTGTATGC GGAACCTCAA AAGAGTCCCT GGTGTGAAGC AAGATCGCTA 180GAACACACCT TACCTGTAAA CAGAGAGACA CTGAAAAGGA AGGTTAGTGG GAACCGTTGC 240GCCAGCCCTG TTACTGGTCC AGGTTCAAAG AGGGATGCTC ACTTCTGCGC TGTCTGCAGC 300GATTACGCAT CGGGATATCA CTATGGAGTC TGGTCGTGTG AAGGATGTAA GGCCTTTTTT 360AAAAGAAGCA TTCAAGGACA TAATGATTAT ATTTGTCCAG CTACAAATCA GTGTACAATC 420GATAAAAACC GGCGCAAGAG CTGCCAGGCC TGCCGACTTC GGAAGTGTTA CGAAGTGGGA 480ATGGTGAAGT GTGGCTCCCG GAGAGAGAGA TGTGGGTACC GCCTTGTGCG GAGACAGAGA 540AGTGCCGACG AGCAGCTGCA CTGTGCCGGC AAGGCCAAGA GAAGTGGCGG CCACGCGCCC 600CGAGTGCGGG AGCTGCTGCT GGACGCCCTG AGCCCCGAGC AGCTAGTGCT CACCCTCCTG 660GAGGCTGAGC CGCCCCATGT GCTGATCAGC CGCCCCAGTG CGCCCTTCAC CGAGGCCTCC 720ATGATGATGT CCCTGACCAA GTTGGCCGAC AAGGAGTTGG TACACATGAT CAGCTGGGCC 780AAGAAGATTC CCGGCTTTGT GGAGCTCAGC CTGTTCGACC AAGTGCGGCT CTTGGAGAGC 840TGTTGGATGG AGGTGTTAAT GATGGGGCTG ATGTGGCGCT CAATTGACCA CCCCGGCAAG 900CTCATCTTTG CTCCAGATCT TGTTCTGGAC AGGGATGAGG GGAAATGCGT AGAAGGAATT 960CTGGAAATCT TTGACATGCT CCTGGCAACT ACTTCAAGGT TTCGAGAGTT AAAACTCCAA 1020CACAAAGAAT ATCTCTGTGT CAAGGCCATG ATCCTGCTCA ATTCCAGTAT GTACCCTCTG 1080GTCACAGCGA CCCAGGATGC TGACAGCAGC CGGAAGCTGG CTCACTTGCT GAACGCCGTG 1140ACCGATGCTT TGGTTTGGGT GATTGCCAAG AGCGGCATCT CCTCCCAGCA GCAATCCATG 1200CGCCTGGCTA ACCTCCTGAT GCTCCTGTCC CACGTCAGGC ATGCGAGGTC TGCCTGA 1257(2)SEQ ID NO:21信息: (i)序列特征:
(A)长度:418氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑学:直链 (ii)分子类型:蛋白质 (xi)SEQ ID NO:21序列描述:Met Asn Tyr Ser Ile Pro Ser Asn Val Thr Asn Leu Glu Gly Gly Pro1 5 10 15Gly Arg Gln Thr Thr Ser Pro Asn Val Leu Trp Pro Thr Pro Gly His
20 25 30Leu Ser Pro Leu Val Val His Arg Gln Leu Ser His Leu Tyr Ala Glu
35 40 45Pro Gln Lys Ser Pro Trp Cys Glu Ala Arg Ser Leu Glu His Thr Leu
50 55 60Pro Val Asn Arg Glu Thr Leu Lys Arg Lys Val Ser Gly Asn Arg Cys65 70 75 80Ala Ser Pro Val Thr Gly Pro Gly Ser Lys Arg Asp Ala His Phe Cys
85 90 95Ala Val Cys Ser Asp Tyr Ala Ser Gly Tyr His Tyr Gly Val Trp Ser
100 105 110Cys Glu Gly Cys Lys Ala Phe Phe Lys Arg Ser Ile Gln Gly His Asn
115 120 125Asp Tyr Ile Cys Pro Ala Thr Asn Gln Cys Thr Ile Asp Lys Asn Arg
130 135 140Arg Lys Ser Cys Gln Ala Cys Arg Leu Arg Lys Cys Tyr Glu Val Gly145 150 155 160Met Val Lys Cys Gly Ser Arg Arg Glu Arg Cys Gly Tyr Arg Leu Val
165 170 175Arg Arg Gln Arg Ser Ala Asp Glu Gln Leu His Cys Ala Gly Lys Ala
180 185 190Lys Arg Ser Gly Gly His Ala Pro Arg Val Arg Glu Leu Leu Leu Asp
195 200 205Ala Leu Ser Pro Glu Gln Leu Val Leu Thr Leu Leu Glu Ala Glu Pro
210 215 220Pro His Val Leu Ile Ser Arg Pro Ser Ala Pro Phe Thr Glu Ala Ser225 230 235 240Met Met Met Ser Leu Thr Lys Leu Ala Asp Lys Glu Leu Val His Met
245 250 255Ile Ser Trp Ala Lys Lys Ile Pro Gly Phe Val Glu Leu Ser Leu Phe
260 265 270Asp Gln Val Arg Leu Leu Glu Ser Cys Trp Met Glu Val Leu Met Met
275 280 285Gly Leu Met Trp Arg Ser Ile Asp His Pro Gly Lys Leu Ile Phe Ala
290 295 300Pro Asp Leu Val Leu Asp Arg Asp Glu Gly Lys Cys Val Glu Gly Ile305 310 315 320Leu Glu Ile Phe Asp Met Leu Leu Ala Thr Thr Ser Arg Phe Arg Glu
325 330 335Leu Lys Leu Gln His Lys Glu Tyr Leu Cys Val Lys Ala Met Ile Leu
340 345 350Leu Asn Ser Ser Met Tyr Pro Leu Val Thr Ala Thr Gln Asp Ala Asp
355 360 365Ser Ser Arg Lys Leu Ala His Leu Leu Asn Ala Val Thr Asp Ala Leu
370 375 380Val Trp Val Ile Ala Lys Ser Gly Ile Ser Ser Gln Gln Gln Ser Met385 390 395 400Arg Leu Ala Asn Leu Leu Met Leu Leu Ser His Val Arg His Ala Arg
405 410 415Ser Ala(2)SEQ ID NO:22信息: (i)序列特征:
(A)长度:34碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:直链 (ii)分子类型:cDNA (xi)SEQ ID NO:22序列描述: CTTGGATCCA TAGCCCTGCT GTGATGAATT ACAG(2)SEQ ID NO:23信息: (i)序列特征:
(A)长度:33碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:直链 (ii)分子类型:cDNA (xi)SEQ ID NO:23序列描述: GATGGATCCT CACCTCAGGG CCAGGCGTCA CTG(2)SEQ ID NO:24信息: (i)序列特征:
(A)长度:1898碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:直链 (ii)分子类型:cDNA (xi)SEQ ID NO:24序列描述:CACGAATCTT TGAGAACATT ATAATGACCT TTGTGCCTCT TCTTGCAAGG TGTTTTCTCA 60GCTGTTATCT CAAGACATGG ATATAAAAAA CTCACCATCT AGCCTTAATT CTCCTTCCTC 120CTACAACTGC AGTCAATCCA TCTTACCCCT GGAGCACGGC TCCATATACA TACCTTCCTC 180CTATGTAGAC AGCCACCATG AATATCCAGC CATGACATTC TATAGCCCTG CTGTGATGAA 240TTACAGCATT CCCAGCAATG TCACTAACTT GGAAGGTGGG CCTGGTCGGC AGACCACAAG 300CCCAAATGTG TTGTGGCCAA CACCTGGGCA CCTTTCTCCT TTAGTGGTCC ATCGCCAGTT 360ATCACATCTG TATGCGGAAC CTCAAAAGAG TCCCTGGTGT GAAGCAAGAT CGCTAGAACA 420CACCTTACCT GTAAACAGAG AGACACTGAA AAGGAAGGTT AGTGGGAACC GTTGCGCCAG 480CCCTGTTACT GGTCCAGGTT CAAAGAGGGA TGCTCACTTC TGCGCTGTCT GCAGCGATTA 540CGCATCGGGA TATCACTATG GAGTCTGGTC GTGTGAAGGA TGTAAGGCCT TTTTTAAAAG 600AAGCATTCAA GGACATAATG ATTATATTTG TCCAGCTACA AATCAGTGTA CAATCGATAA 660AAACCGGCGC AAGAGCTGCC AGGCCTGCCG ACTTCGGAAG TGTTACGAAG TGGGAATGGT 720GAAGTGTGGC TCCCGGAGAG AGAGATGTGG GTACCGCCTT GTGCGGAGAC AGAGAAGTGC 780CGACGAGCAG CTGCACTGTG CCGGCAAGGC CAAGAGAAGT GGCGGCCACG CGCCCCGAGT 840GCGGGAGCTG CTGCTGGACG CCCTGAGCCC CGAGCAGCTA GTGCTCACCC TCCTGGAGGC 900TGAGCCGCCC CATGTGCTGA TCAGCCGCCC CAGTGCGCCC TTCACCGAGG CCTCCATGAT 960GATGTCCCTG ACCAAGTTGG CCGACAAGGA GTTGGTACAC ATGATCAGCT GGGCCAAGAA 1020GATTCCCGGC TTTGTGGAGC TCAGCCTGTT CGACCAAGTG CGGCTCTTGG AGAGCTGTTG 1080GATGGAGGTG TTAATGATGG GGCTGATGTG GCGCTCAATT GACCACCCCG GCAAGCTCAT 1140CTTTGCTCCA GATCTTGTTC TGGACAGGGA TGAGGGGAAA TGCGTAGAAG GAATTCTGGA 1200AATCTTTGAC ATGCTCCTGG CAACTACTTC AAGGTTTCGA GAGTTAAAAC TCCAACACAA 1260AGAATATCTC TGTGTCAAGG CCATGATCCT GCTCAATTCC AGTATGTACC CTCTGGTCAC 1320AGCGACCCAG GATGCTGACA GCAGCCGGAA GCTGGCTCAC TTGCTGAACG CCGTGACCGA 1380TGCTTTGGTT TGGGTGATTG CCAAGAGCGG CATCTCCTCC CAGCAGCAAT CCATGCGCCT 1440GGCTAACCTC CTGATGCTCC TGTCCCACGT CAGGCATGCG AGTAACAAGG GCATGGAACA 1500TCTGCTCAAC ATGAAGTGCA AAAATGTGGT CCCAGTGTAT GACCTGCTGC TGGAGATGCT 1560GAATGCCCAC GTGCTTCGCG GGTGCAAGTC CTCCATCACG GGGTCCGAGT GCAGCCCGGC 1620AGAGGACAGT AAAAGCAAAG AGGGCTCCCA GAACCCACAG TCTCAGTGAC GCCTGGCCCT 1680GAGGTGAACT GGCCCACAGA GGTCACAAGC TGAAGCGTGA ACTCCAGTGT GTCAGGAGCC 1740TGGGCTTCAT CTTTCTGCTG TGTGGTCCCT CATTTGGTGA TGGCAGGCTT GGTCATGTAC 1800CATCCTTCCC TCCACCTTCC CAACTCTCAG GAGTCGGTGT GAGGAAGCCA TAGTTTCCCT 1860TGTTAGCAGA GGGACATTTG AATCGAGCGT TTCCACAC 1898(2)SEQ ID NO:25信息: (i)序列特征:
(A)长度:530氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑学:直链 (ii)分子类型:肽 (xi)SEQ ID NO:25序列描述:Met Asp Ile Lys Asn Ser Pro Ser Ser Leu Asn Ser Pro Ser Ser Tyr1 5 10 15Ash Cys Ser Gln Ser Ile Leu Pro Leu Glu His Gly Ser Ile Tyr Ile
20 25 30Pro Ser Ser Tyr Val Asp Ser His His Glu Tyr Pro Ala Met Thr Phe
35 40 45Tyr Ser Pro Ala Val Met Asn Tyr Ser Ile Pro Ser Asn Val Thr Asn
50 55 60Leu Glu Gly Gly Pro Gly Arg Gln Thr Thr Ser Pro Asn Val Leu Trp65 70 75 80Pro Thr Pro Gly His Leu Ser Pro Leu Val Val His Arg Gln Leu Ser
85 90 95His Leu Tyr Ala Glu Pro Gln Lys Ser Pro Trp Cys Glu Ala Arg Ser
100 105 110Leu Glu His Thr Leu Pro Val Asn Arg Glu Thr Leu Lys Arg Lys Val
115 120 125Ser Gly Asn Arg Cys Ala Ser Pro Val Thr Gly Pro Gly Ser Lys Arg
130 135 140Asp Ala His Phe Cys Ala Val Cys Ser Asp Tyr Ala Ser Gly Tyr His145 150 155 160Tyr Gly Val Trp Ser Cys Glu Gly Cys Lys Ala Phe Phe Lys Arg Ser
165 170 175Ile Gln Gly His Asn Asp Tyr Ile Cys Pro Ala Thr Asn Gln Cys Thr
180 185 190Ile Asp Lys Asn Arg Arg Lys Ser Cys Gln Ala Cys Arg Leu Arg Lys
195 200 205Cys Tyr Glu Val Gly Met Val Lys Cys Gly Ser Arg Arg Glu Arg Cys
210 215 220Gly Tyr Arg Leu Val Arg Arg Gln Arg Ser Ala Asp Glu Gln Leu His225 230 235 240Cys Ala Gly Lys Ala Lys Arg Ser Gly Gly His Ala Pro Arg Val Arg
245 250 255Glu Leu Leu Leu Asp Ala Leu Ser Pro Glu Gln Leu Val Leu Thr Leu
260 265 270Leu Glu Ala Glu Pro Pro His Val Leu Ile Ser Arg Pro Ser Ala Pro
275 280 285Phe Thr Glu Ala Ser Met Met Met Ser Leu Thr Lys Leu Ala Asp Lys
290 295 300Glu Leu Val His Met Ile Ser Trp Ala Lys Lys Ile Pro Gly Phe Val305 310 315 320Glu Leu Ser Leu Phe Asp Gln Val Arg Leu Leu Glu Ser Cys Trp Met
325 330 335Glu Val Leu Met Met Gly Leu Met Trp Arg Ser Ile Asp His Pro Gly
340 345 350Lys Leu Ile Phe Ala Pro Asp Leu Val Leu Asp Arg Asp Glu Gly Lys
355 360 365Cys Val Glu Gly Ile Leu Glu Ile Phe Asp Met Leu Leu Ala Thr Thr
370 375 380Ser Arg Phe Arg Glu Leu Lys Leu Gln His Lys Glu Tyr Leu Cys Val385 390 395 400Lys Ala Met Ile Leu Leu Asn Ser Ser Met Tyr Pro Leu Val Thr Ala
405 410 415Thr Gln Asp Ala Asp Ser Ser Arg Lys Leu Ala His Leu Leu Asn Ala
420 425 430Val Thr Asp Ala Leu Val Trp Val Ile Ala Lys Ser Gly Ile Ser Ser
435 440 445Gln Gln Gln Ser Met Arg Leu Ala Asn Leu Leu Met Leu Leu Ser His
450 455 460Val Arg His Ala Ser Asn Lys Gly Met Glu His Leu Leu Asn Met Lys465 470 475 480Cys Lys Asn Val Val Pro Val Tyr Asp Leu Leu Leu Glu Met Leu Asn
485 490 495Ala His Val Leu Arg Gly Cys Lys Ser Ser Ile Thr Gly Ser Glu Cys
500 505 510Ser Pro Ala Glu Asp Ser Lys Ser Lys Glu Gly Ser Gln Asn Pro Gln
515 520 525Set Gln(2)SEQ ID NO:26信息: (i)序列特征:
(A)长度:30碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:直链 (ii)分子类型:其它核酸 (xi)SEQ ID NO:26序列描述: GTGCGGATCC TCTCAAGACA TGGATATAAA(2)SEQ ID NO:27信息: (i)序列特征:
(A)长度:25碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:直链 (ii)分子类型:其它核酸 (xi)SEQ ID NO:27序列描述: AGTAACAGGG CTGGCGCAAC GGTTC(2)SEQ ID NO:28信息: (i)序列特征:
(A)长度:22碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:直链 (ii)分子类型:其它核酸(xi)SEQ ID NO:28序列描述:ACTGGCGATG GACCACTAAA GG