GASCI基因.pdf

上传人:小** 文档编号:1382143 上传时间:2018-06-12 格式:PDF 页数:73 大小:3.21MB
返回 下载 相关 举报
摘要
申请专利号:

CN01811036.3

申请日:

2001.06.12

公开号:

CN1436236A

公开日:

2003.08.13

当前法律状态:

撤回

有效性:

无权

法律详情:

发明专利申请公布后的视为撤回|||实质审查的生效|||公开

IPC分类号:

C12N15/12; C12N1/15; C12N1/19; C12N1/21; C12N5/00; C12Q1/68; C07K14/82; C07K16/32; G01N33/574

主分类号:

C12N15/12; C12N1/15; C12N1/19; C12N1/21; C12N5/00; C12Q1/68; C07K14/82; C07K16/32; G01N33/574

申请人:

大塚制药株式会社

发明人:

稻泽让治; 井本逸势

地址:

日本东京

优先权:

2000.06.12 JP 174946/2000

专利代理机构:

中原信达知识产权代理有限责任公司

代理人:

丁业平;王维玉

PDF下载: PDF下载
内容摘要

本发明提供例如基因,其包括编码具有SEQ ID NO:1所示氨基酸序列的多肽的多核苷酸。该基因显示在9p23-24区域中的扩增,具有PX结构域和PHD指状结构基元,在细胞生长和分化以及肿瘤发生中发挥了重要作用,以及用于阐明各种由蛋白导致的疾病的病理学,所述蛋白参与恶性肿瘤等中的细胞分化,并用于这些疾病的诊断和治疗。

权利要求书

1: 一种被分离的DNA分子,其包括下列多核苷酸(a)-(d)中 的一种: (a)编码多肽的多核苷酸,所述多肽由SEQ ID NO:1所示的氨 基酸序列组成; (b)与SEQ ID NO:2所示核苷酸序列比较具有至少95%同源性 的多核苷酸; (c)在严格条件下,能与SEQ ID NO:2所示的核苷酸序列杂交 的多核苷酸; (d)与上述多核苷酸(a)或(b)互补的多核苷酸。
2: 根据权利要求1所述的被分离的DNA分子,其是编码由SEQ ID NO:1所示氨基酸序列组成的多肽的多核苷酸。
3: 根据权利要求2所述的被分离的DNA分子,其具有SEQ ID NO:2所示的核苷酸序列。
4: 一种表达产物,其包括SEQ ID NO:1所示的氨基酸序列。
5: 一种重组表达载体,其包括根据权利要求1或3所述的被分 离的DNA分子。
6: 一种重组表达载体,其包括根据权利要求3所述的被分离的 DNA分子。
7: 一种宿主细胞,其内含根据权利要求5所述的重组表达载体。
8: 一种宿主细胞,其内含根据权利要求6所述的重组表达载体。
9: 一种GASC1检测用探针,其具有包括SEQ ID NO:2所示核苷 酸序列中的至少15个连续核苷酸的序列。
10: 根据权利要求9所述的GASC1检测用探针,其具有包括SEQ ID NO:2所示核苷酸序列中的至少30个连续核苷酸的序列。
11: 一种癌症诊断剂,其包括根据权利要求9所述的探针作为活 性成分。
12: 一种癌症诊断剂,其包括根据权利要求10所述的探针作为 活性成分。
13: 一种癌症诊断试剂盒,其包括根据权利要求9所述的探针作 为活性成分。
14: 一种癌症诊断试剂盒,其包括根据权利要求10所述的探针 作为活性成分。
15: 一种抗体或抗体片段,其能够与根据权利要求1所述的被分 离的DNA分子的表达产物结合。
16: 一种诊断癌症的方法,其包括下列步骤:制备生物样品,制 备根据权利要求15所述的抗体或抗体片段,以及将所述样品与所述 抗体或抗体片段免疫反应并且检测样品中的免疫反应产物。

说明书


GASC1基因

    【技术领域】

    本发明涉及新基因,更具体涉及位于人食道鳞状细胞中的染色体p23-24区域的新基因,并通过这些细胞的恶变可观察到所述基因的扩增和过量的基因产物的表达。背景技术

    肿瘤细胞中能经常观察到基因扩增。这种扩增构成了影响肿瘤发展的原癌基因激活的机理之一(Stark,G.R.等,Cell,57,901-908(1989))。对扩增区域中出现的靶基因扩增的鉴定和对该基因的表征为阐明癌症的发生和发展的分子机理提供了重要信息。

    食道癌在全世界癌症死因中排名第6(Pisani,P.等,Int.J.Cancer,83,18-29(1999))。食道癌组织中所发现的两个主要组织病理学类型的肿瘤是鳞状细胞癌和腺癌。鳞状细胞癌在日本和其他国家一样是最常见的类型(公共福利白皮书(Public Welfare White Paper)1999)。

    已经鉴定出有若干种基因修饰涉及食道鳞状细胞癌的发生、发展和转移(包括MYC、EGFR和CCND1的扩增)(Lu,S.H.等,Int.J.Cancer,42,502-505(1988);Jiang,W.等,Cancer Res.,52,2980-2983(1992))。

    基于比较基因组杂交技术(CGH;Kallioniemi等,Science,258,818-821(1992))地最新研究已揭示出食道鳞状细胞癌中至少有10个扩增区域(Pack,S.D.,Genes Chromosomes Cancer,25,160-168(1999);Shinomiya,T.等,Genes Chromosomes Cancer,24,337-344(1999);DuPlessis,L.等,Cancer Res.,59,1877-1883(1999))。然而,在那些被检测的染色体扩增区域中未鉴定出涉及食道鳞状细胞癌的基因。

    本发明人在29种食道鳞状细胞癌细胞系中搜索异常DNA拷贝数,结果检测到数种新的扩增区域。这些扩增区域在染色体区域9p23-24中频繁出现可得到证实。

    另一方面,有报道染色体区域9p23-24中的基因组变化与各种恶性肿瘤相关,如非小细胞肺癌、肝癌、卵巢癌、子宫颈癌、乳腺癌、骨肉瘤以及纵隔B细胞淋巴瘤(Knuutila,S.等,Am.J.Pathol.,152,1107-1123(1998))。

    从此报告可推断出不管什么组织类型在上述染色体区域9p23-24中可发现由于扩增激活一个或几个基因作为致癌基因起作用的可能性。发明公开

    本发明人对上述食道鳞状细胞癌细胞系中的染色体区域9p23-24进行了深入的研究,包括以高频被识别的扩增区域。结果本发明人成功地筛选并分离了9p23-24扩增区域中出现的新肿瘤相关的基因及其转录物。被分离的基因之一是编码具有PHD和PX结构域的蛋白的基因(DNA分子)(Aasland,R.等,Trends Biochem.Sci.,20,56-59(1995);Lock,P.等,EMBO J.,17,4346-4357(1998))。本发明人把此基因命名为GASC1(鳞状细胞癌1中扩增的基因)。

    在该说明书中,本发明的基因(DNA分子)有时称为“GASC1基因”,由GASC1基因所编码的蛋白称为“GASC1蛋白”,以及此蛋白的功能活性称为“GASC1活性”。

    基于上述研究结果所开发的本发明提供了下列主题(1)-(20):

    (1)包含下列多核苷酸(a)-(d)中一种的被分离的DNA分子。

    (a)编码由SEQ ID NO:1所示的氨基酸序列组成的多肽的多核苷酸;

    (b)与SEQ ID NO:2所示核苷酸序列比较具有至少95%同源性的多核苷酸;

    (c)在严格条件下能与SEQ ID NO:2所示的核苷酸序列杂交的多核苷酸;

    (d)与上述多核苷酸(a)或(b)互补的多核苷酸。

    (2)如上(1)所述的被分离的DNA分子,其是编码由SEQ IDNO:1所示的氨基酸序列组成的多肽的多核苷酸。

    (3)如上(2)所述的被分离的DNA分子,其具有SEQ ID NO:2所示的核苷酸序列。

    (4)包含SEQ ID NO:1所示的氨基酸序列的表达产物。

    (5)包含如上(1)或(3)所述的被分离的DNA分子的重组表达载体。

    (6)内含如上(5)所述的重组表达载体的宿主细胞。

    (7)一种GASC1检测用探针,其具有包含来自SEQ ID NO:2所示核苷酸序列的至少15个连续核苷酸的序列。

    (8)如上(7)所述的GASC1检测用探针,其具有包含来自SEQ ID NO:2所示核苷酸序列的至少30个连续核苷酸的序列。

    (9)癌症诊断剂,其包含如上(7)或(8)所述的探针作为活性成分。

    (10)癌症诊断试剂盒,其包含如上(7)或(8)所述的探针。

    (11)抗体或抗体片段,其能与如上(1)所述的被分离的DNA分子的表达产物结合。

    (12)诊断癌症的方法,其包含下列步骤:制备生物样品,制备如上(11)所述的抗体或其片段,以及将上述样品与上述抗体或片段进行免疫反应并且检测样品中的免疫反应产物。

    本发明还提供下列主题(13)-(20):

    (13)能表达如上(4)所述的表达产物的克隆的cDNA及其等价物,例如,对上述表达产物的修饰进行编码的cDNA,所述修饰通过在表达产物的氨基酸序列中缺失、替换或添加一个或多个氨基酸残基而衍生并与上述表达产物具有相同的活性,以及与这种cDNA具有某种水平的同源性的同系物。

    (14)一种序列的反义核苷酸,该序列包含来自SEQ ID NO:2所示核苷酸序列的至少15个连续核苷酸。

    (15)如上(14)所述的反义核苷酸,其反义于一种序列,该序列包含来自SEQ ID NO:2所示核苷酸序列的至少30个连续核苷酸。

    (16)基因治疗剂,其包含如上(14)或(15)所述的反义核苷酸作为活性成分。

    (17)(a)包含SEQ ID NO:1所示的氨基酸序列的蛋白或(b)包含修饰的氨基酸序列的蛋白,所述修饰的氨基酸序列通过缺失、替换或添加一个或多个氨基酸残基而衍生自SEQ ID NO:1所示的氨基酸序列,所述蛋白在活性上等价于包含SEQ ID NO:1所示氨基酸序列的蛋白。

    (18)筛选一种或多种物质(激动剂和/或拮抗剂)的方法,所述一种或多种物质能与如上(1)所述的被分离的DNA分子的表达产物相互作用,所述方法包含下列步骤:在含有待筛选的测试物质的培养基中对含有如上(1)所述的被分离的DNA分子的宿主细胞进行培养,然后定量如上(1)所述的被分离的DNA分子的表达产物。

    (19)如上(1)所述的被分离的DNA分子的同源染色体,其分离自选自人、狗、猴、马、猪、羊和猫物种的哺乳动物。

    (20)用于癌症的治疗剂,其包含有效量的如上(11)所述的抗体或其片段以及可药用载体。

    说明书中氨基酸、肽、核苷酸序列、核酸(核苷酸)等以缩写表示,与IUPAC-IUB建议的规则、“专利说明书中核苷酸序列和/或氨基酸序列撰写指南(Guideline for drafting patent specifications etc.relativeto nucleotide sequences and/or amino acid sequences)”(日本专利局编写)以及本领域中有关密码或符号用途的惯例一致。

    本发明人采用29种食道鳞状细胞癌细胞系实施了CGH(比较基因组杂交(comparative genomic hybridization)),结果证实在这些细胞系中的染色体区域9p23-24出现了新肿瘤相关的基因。

    本发明人还以YAC(酵母人工染色体)和PAC(P1人工染色体)为探针进行了荧光原位杂交(FISH)以及DNA印迹分析,为9p23-24扩增子(扩增区域)绘制基因图谱。

    本发明人进一步进行了RNA印迹分析用于筛选扩增子或其转录物中出现的靶基因。以这种方式,本发明人成功克隆了在若干种食道鳞状细胞癌细胞系中扩增和过量表达的新基因,并因此获得了GASC1基因的克隆。

    在从外科手术切除的肿瘤中建立了食道鳞状细胞癌细胞系(KYSE系列)的CGH之后,本发明的GASC1基因在染色体区域9p23-24中显示了高水平的扩增。根据RNA印迹结果,仅IMAGE克隆131865(cDNA克隆含有部分GASC1序列)在9p23-24上表现扩增的细胞系中显示了过量的表达。

    本发明GASC1基因的核苷酸序列的确定按下列程序进行。从胃癌细胞系(HSC39)-衍生的RNA中构建两个cDNA文库,使用IMAGE克隆131865作为探针筛选cDNA文库,然后确定如此分离的阳性克隆的核苷酸序列。

    本发明的GASC1基因指定为具有编码SEQ ID NO:1所示的1056个氨基酸残基的可读框的基因。

    根据由本发明的GASC1基因编码的氨基酸序列所计算的分子量为120.0kDa。

    根据先前报道,在大范围的人类癌症包括食道鳞状细胞癌中都观察到染色体区域9p中的遗传改变。基于较早对食道鳞状细胞癌的分子遗传学研究的结果,区域9p23-24引人关注。该区域尤其包括编码细胞周期蛋白依赖的激酶4/6的抑制剂的MTS1(p16/CDKN2A),所述细胞周期蛋白依赖的激酶4/6阻遏地调节增殖细胞的G1/S过渡阶段(Tanaka,H.等,Int.J.Cancer,70,437-442(1997))。

    使用CGH和FISH(Inazawa,J.等,Jpn J.Cancer Res.,83,1248-1252(1992))的最新研究已表明如同在其他种类的肿瘤中,DNA扩增也经常在食道鳞状细胞癌中的区域9p23-24中出现(Sonoda,G.等,GenesChromosomes Cancer,20,320-328(1997);Taguchi,T.等,GenesChromosomes Cancer,20,208-212(1997);Giollant,M.等,Hum.Genet.,98,265-270(1996);Fischer,U.等,Eur.J.Cancer,30,1124-1127(1994);Sevelyeva,L.等,Cancer Res.,58,863-866(1998))。

    在对上述区域9p23-24中的DNA扩增的各种报道及相关报道中,有下列发现和文献记载等。

    人卵巢癌的CGH分析已揭示出9p21-pter是那些位点之一,其中容易出现拷贝数的增加。该分析的结果还说明九分之一的情况显示了特异的9p24扩增,并进一步说明上述扩增更倾向于在肿瘤的发展阶段频繁出现(Sonoda,G.等,Genes Chromosomes Cancer,20,320-328(1997))。

    在乳腺癌、肺癌、晚期星细胞瘤以及成胶质细胞瘤中也观察到了9p23-24区域扩增(Taguchi,T.等,Genes Chromosomes Cancer,20,208-212(1997);Giollant,M.等,Hum.Genet.,98,265-270(1996);Fischer,U.等,Eur.J.Cancer,30,1124-1127(1994);Sevelyeva,L.等,Cancer Res.,58,863-866(1998))。

    乳腺癌细胞系COLO824显示DNA拷贝数增加了大约10倍,其出现在p16/CDKN2A终端的9p23-24区域中(Sevelyeva,L.等,CancerRes.,58,863-866(1998))。此外,在患有乳腺癌的三个兄弟中报道了9p23-24区域的丰余以及BRCA2的突变(Sevelyeva,L.等,Cancer Res.,58,863-866(1998))。

    考虑这些报告暗示区域9p23-24与多种肿瘤种类有关,并具有至少一种肿瘤相关基因。

    GASC1蛋白具有一个PX结构域和两个PHD指状结构。

    PX结构域以各种蛋白出现。该基元可参与蛋白-蛋白的相互作用(Lock,P.,EMBO J.,17,4346-4357(1998))。然而,其功用仍未得到充分鉴定。

    PHD指状结构是一种锌指状序列,已被广泛发现在与染色质-介导的转录调节相关的核蛋白中,如果蝇tr1基因产物和pc1基因产物(Aasland,R.等,Trends Biochem.Sci.,20,56-59(1995))。

    近来,转录辅激活蛋白TIF1(转录中介因子1)、染色质-相关的乙酰基转移酶MOZ(单核细胞白血病锌指蛋白)以及若干种含有皮肌炎特异的自身抗原Mi2的含PHD指状结构蛋白已被鉴定(Venturini,L.等,18,1209-1217(1999);Borrow,J.等,Nat.Gene,14m 33-41(1996);Zhang,Y.,Cell,95,279-289(1998))。

    TIF1家族蛋白(α,β,γ)被认为在细胞分化、肿瘤发生以及信号转导中发挥重要作用(Venturini,L.等,18,1209-1217(1999))。另一方面,在拥有组蛋白脱乙酰基转移酶和改变核小体活性的复合体中发现了Mi2,并参与了染色质改组。Mi2中的PHD指状结构似乎要求Mi2和组蛋白脱乙酰基转移酶的直接相互作用(Zhang,Y.,Cell,95,279-289(1998))。

    PHD基元也保留在若干原癌基因中。HRX/ALL1/MLL(HRX:人trithorax;ALL:急性原淋巴细胞白血病;MLL:混合血统白血病)是trx的人同源染色体,经常在儿童的急性淋巴细胞白血病中发生变化(Tkachuk,D.C.等,Cell,71,691-700(1992))。而且,trx的另一人同源染色体MLL2的扩增已在衍生自各种实体组织的肿瘤细胞系中被观察到(Huntsman,D.G.等,Oncogene,18,7975-7984(1999))。

    在乳腺癌中始终如一地被观察到PLU-1的表达;然而,其表达在正常组织中受到高度限制(Lu,P.等,J.Biol.Chem.,274,15633-15645(1999))。

    在来自患有自身免疫疾病如APECED(自身免疫的多内分泌病-白假丝酵母病-外胚层的营养不良)的病人的DNA中已发现AIRE基因的PHD指状结构内的突变(The Finnish-German APECED Consortium.Nat.Genet.,17,399-403(1997))。

    在急性骨髓白血病的情况下,发现MOZ基因与CBP基因融合[t(8;16)(p11;p14)](Borrow,J.等,Nat.Genet.,14,33-41(1996))。已有报道在儿童乳头状甲状腺癌的情况下,RET受体酪氨酸激酶基因与Tif1的融合(Klugbauer,S.,Rabes,H.M.,Oncogene,18,4388-4393(1999))。

    具有由本发明GASC1基因编码推导的氨基酸序列的GASC1蛋白包含两个PHD指状结构基元。如上所述,由于PHD指状结构基元存在于染色质-介导的转录区域相关的核蛋白以及许多原癌基因中,因此过量表达的GASC1蛋白被认为在肿瘤发生和/或各种肿瘤包括食道鳞状细胞癌的发展中发挥重要作用。

    进一步,根据以下这些事实即PHD基元存在于许多原癌基因中,经常发现食道鳞状细胞癌中有9p23-24区域的扩增,具有9p23-24区域扩增的倾向,尤其在肿瘤发展阶段是普遍现象,以及如上所述在乳腺癌、肺癌、晚期星细胞瘤以及成胶质细胞瘤中也观察到了9p23-24区域扩增,可以认为本发明的GASC1基因编码含PHD基元的GASC1蛋白,在多种肿瘤的发生和发展中发挥着重要作用。

    另外,如本发明下文所述,GASC1蛋白与鳞状细胞癌如食道癌相关,因此依据推测本发明的基因属于与这些癌症相关的基因组别。

    本发明的基因可调节各种细胞或在其中的增殖、分化、肿瘤发生以及转录激活等,并且依据这些活性,其可用于与这些活性相关疾病如恶性肿瘤的病理学解释、诊断和治疗等。

    本发明基因的全部或部分可用于生产能够与基因表达产物(蛋白)结合的抗体或其片段。所得的抗体或其片段可用于诊断本发明基因参与其中的上述疾病。

    本发明基因的反义片段及其表达产物可用于控制上述疾病(如肿瘤发生)的发作。

    本发明基因的全部或部分还可用作探针。通过使用该探针,诊断癌症和制备用于癌症诊断的试剂盒是可能的。

    在肿瘤中观察到本发明基因的扩增和增加表达,因此,本发明基因不仅可用于癌症诊断中而且可用于判断癌症是否是恶性的。

    本发明基因另外可用于筛选能够与GASC1基因或GASC1蛋白相互作用的物质。

    本发明基因的例子属于人癌症细胞起源。通过使用这种基因,获得各种哺乳动物包括人的同源基因也是可能的。进一步,利用本发明基因使得鉴定编码蛋白的基因成为可能,所述蛋白与具有由本发明基因编码的氨基酸序列的蛋白在其C末端结合。本发明基因

    下文将详细描述本发明的基因(DNA分子)。

    在本说明书中,术语“基因(DNA分子)”不仅包括双链DNA而且包括其组成的单链DNA,不管是有义还是无义,以及其片段。因此,除非另有说明,术语“本发明基因”包括含有人基因组DNA的双链DNA、包括cDNA的单链DNA(有义链)、具有与有义链互补的序列的单链DNA(反义链)以及它们的片段。

    本发明基因可含有前导序列、编码区、外显子和内含子。多核苷酸包括RNA和DNA。所述DNA包括cDNA、基因组DNA以及合成DNA。多肽包括其片段、同源物和突变体。突变体包括天然发生的等位基因突变体,非天然存在的突变体,含有通过缺失、替换、添加和/或插入而修饰的氨基酸序列的突变体,以及功能上等同于修饰的氨基酸序列的突变体。

    本发明基因的特定例子是从DNA序列中推导出的基因,下文实施例章节中所示的被命名为GASC1的克隆拥有该DNA序列。

    在该克隆中掺入的基因(GASC1基因)具有包含3168个核苷酸以及编码GASC1蛋白的可读框(SEQ ID NO:2所示的核苷酸序列),所述GASC1蛋白含有如SEQ ID NO:1所示的1056个氨基酸残基。从衍生自阳性克隆的单向cDNA序列中,含有上述3168个核苷酸单个可读框的4235个核苷酸的转录物得到确认。在此转录物中,翻译起始的共有序列(“Kozak”规则)是高度保守的,因此,证实了起始密码位于核苷酸第146-148位。此转录物的全长cDNA的核苷酸序列如SEQ ID NO:3所示。

    从本发明的GASC1基因中推导出的表达产物在其C末端含有两个PHD指状结构基元(残基第687-749和残基第807-867)和一个PX结构域(残基第950-1047)。

    本发明基因包括具有编码蛋白的核苷酸序列的DNA分子和这种DNA分子的同源物,所述蛋白具有SEQ ID NO:1所示的氨基酸序列。

    上述同源物是多核苷酸,其与编码具有SEQ ID NO:1所示氨基酸序列的多肽的多核苷酸比较或与具有SEQ ID NO:2所示序列的多核苷酸比较具有至少70%同源性,优选至少90%同源性,更优选至少95%同源性,最优选至少97%同源性。

    这些同源基因包括具有核苷酸序列的基因,所述核苷酸序列在严格杂交条件下能够与具有SEQ ID NO:2所示序列的核苷酸第238-638位的序列的DNA杂交,所述严格杂交条件是在含有0.1% SDS的0.2×SCC中50℃或者在含有0.1%SDS的0.1×SCC中60℃。

    具有与本发明基因同源的序列的DNA分子包括一系列相关基因,根据其结构特征、基因表达模式以及生物功能(包括表达产物蛋白的功能)与本发明基因的共同性或相似性,这些相关基因可识别为组成一个基因家族。当然,它们包括GASC1基因的等位基因。

    具有序列同源性的DNA分子的特定例子是编码蛋白的基因,所述蛋白对SEQ ID NO:1所示的氨基酸序列进行某种修饰并且与含有那种指定氨基酸序列的蛋白具有相同活性。    

    “某种修饰”在其意思内包括“一种或若干种氨基酸序列或多种氨基酸残基的缺失、替换或添加”。氨基酸缺失、替换或添加的范围和位点不受特别限制,条件是修饰蛋白可充当等同物,其具有与含有SEQ ID NO:1所示氨基酸序列的蛋白(GASC1蛋白)相同的GASC1活性。

    具体而言,GASC1活性包括调节细胞增殖和分化的能力以及调节肿瘤发生和转录激活的能力。

    氨基酸序列修饰(突变)可自然发生,例如通过自发突变或转录后修饰。根据天然基因(例如人GASC1基因),修饰也可人工诱导。

    人工的意思包括例如遗传工程技术如位点专一诱变[Methods inEnzymology,154,350,367-382(1987);ibid,100,468(1983);NucleicAcids Res.,12,9441(1984);Zoku Seikagaku Jikken Koza(Experiments inBiochemistry,Second Series)1:“Idenshi Kenkyuho(Methods in GeneResearch)II”,Japanese Biochemical Society(编),第105页(1986)],化学合成方法如磷酸三酯法和磷酰胺法(phosphoamidite method)[J.Am.Chem.Soc.,89,4801(1967);同上,91,3350(1969);Science,150,178(1968);Tetrahedron Lett.,22,1859(1981);同上,24,245(1983)]以及这类方法的组合。

    更具体而言,DNA可由化学方法如磷酰胺法或磷酸三酯法合成,此合成可在市售的全自动寡核苷酸合成仪上实施。通过在适当条件下合成互补链并将这些链退火,或通过加入互补链利用适当的引物序列和DNA聚合酶,双链片段可从化学合成的单链产物中获得。

    本发明基因包括编码具有GASC1活性的修饰或突变的氨基酸序列的任何基因(修饰基因),不管这类修饰/突变的理由和手段。

    编码此类突变的氨基酸序列的基因包括对氨基酸替换沉默的基因,即基因的核苷酸序列不影响其所编码的氨基酸序列,以及包括编码保守替换的氨基酸残基的密码的基因。术语“保守替换的氨基酸残基”是指除原始氨基酸残基以外的替换的氨基酸残基,在原始氨基酸残基替换后,具有原始氨基酸残基的多肽的活性仍将保留。这类替换的氨基酸残基与相应的原始氨基酸残基一起的例子如下显示。

    原始氨基酸残基                 保守替换的氨基酸残基

    Ala                                     Ser

    Arg                                     Lys

    Asn                                     Gln或His

    Asp                                     Glu

    Cys                                     Ser

    Gln                                     Asn

    Glu                                     Asp

    Gly                                     Pro

    His                                     Asn或Gln

    Ile                                     Leu或Val

    Leu                                     Ile或Val

    Lys                                     Arg或Glu

    Met                                     Leu或Ile

    Phe                                     Met、Leu或Tyr

    Ser                                     Thr

    Thr                                     Ser

    Trp                                     Tyr

    Tyr                                     Trp或Phe

    Val                                     Ile或Leu

    此外,Cys可被各种氨基酸残基如Ser、Ala或Val所替换。

    在下列情况下,例如,由于组成多肽的氨基酸残基的替换而产生的多肽一般都可预期较好地修饰其特征。

    a)将例如Leu、Ile、Phe、Val或Ala替换成亲水残基如Ser或Thr;

    b)将任何其他各种氨基酸替换成Cys或Pro;

    c)将负电荷的氨基酸残基如Val或Asp替换成带有正电荷侧链的氨基酸残基如Lys、Arg或His;

    d)将无侧链的氨基酸残基如Gly替换成带有庞大侧链的氨基酸残基如Phe。

    上述修饰的氨基酸序列具有序列同源性,包括那些在运用FASTA或BLAST程序对其整个氨基酸序列检索后而揭示出的具有至少约45%,优选至少约50%的同一性水平的氨基酸序列(Clustal,V.,MethodsMol.Biol.,25,307-318(1994))。对于PX结构域和PHD基元结构域来说,还包括显示至少35%,优选至少45%的同一性水平的氨基酸序列。

    本发明基因的特定实施方案是具有SEQ ID NO:2所示的核苷酸序列的基因。该核苷酸序列的编码区代表密码子的组合的例子,所述密码子针对SEQ ID NO:1所示的氨基酸序列中的各自氨基酸残基。

    本发明基因中密码子的组合不限于SEQ ID NO:2所示的一种。密码子的任意组合可用于各自的氨基酸残基。密码子的选择可以常规方式进行。例如,参考宿主中密码子的使用频率可选择适当的密码子备用[Nucleic Acids Res.,9,43(1981)]。本发明基因的生产

    依据在此公开的本发明基因的序列信息,采用一般的遗传工程技术[例如分子克隆第二版(Molecular Cloning 2nd Ed),Cold Spring HarborLab.Press(1989);Zoku Seikagaku Jikken Koza(Experiments inBiochemistry,Second Series):“Idenshi Kenkyuho(Methods in GeneResearch)I、II、III,Japanese Biochemical Society(ed.),(1986)],可容易地生产和分离本发明基因。

    更具体而言,本发明基因的生产方法是从其中表达本发明基因的适当来源中以常规程序制备cDNA文库,并且使用适当的探针或特异于本发明基因的抗体从该文库中筛选所需的克隆。

    这种生产程序可根据文献中所述的方法进行实施[例如Proc.Natl.Acad.Sci.,USA.,78,6613(1981);Science,222,778(1983)]。

    适合用作cDNA来源的是例如表达本发明基因的各种细胞和组织以及从中衍生的培养细胞。来自这种来源的总RNA的分离、mRNA的分离和纯化以及cDNA的获取和克隆也可以常规方式进行。

    此外,市售的cDNA文库例如从Clotech Lab.公司获得的各种cDNA文库可用于本发明基因的生产。

    从cDNA文库生产的本发明基因,其筛选方法没有特别的限制,可应用常规的方法。

    筛选方法的例子包括使用针对由cDNA所产生的蛋白的特异抗体来筛选相应cDNA克隆的免疫筛选方法,使用探针选择性地与目的DNA序列结合的方法,如噬菌斑杂交方法或菌落杂交方法,以及这些方法的组合。

    作为用于上述方法的探针,一般可使用依据本发明基因的核苷酸序列的信息而化学合成的DNA。已获得的本发明基因或其片段也可有利地用作探针。依据本发明基因的核苷酸信息而设计的有义引物和反义引物可用作筛选的探针。

    用作上述探针的核苷酸序列可以是对应于SEQ ID NO:2并包含至少15个连续核苷酸,优选20个连续核苷酸,更优选30个连续核苷酸,最优选50个连续核苷酸的部分核苷酸序列。此外,照此具有SEQID NO:2所示序列的阳性克隆可用作探针。

    在获得本发明基因中,可有利地使用通过PCR的DNA/RNA扩增[Science,230,1350(1985)]。特别是当全长cDNA几乎不能从文库中得到时,可有利地使用RACE方法[cDNA末端的快速扩增(Rapidamplification of cDNA ends);Jikken Igaku(Experimental Medicine),12(6),35(1994)],尤其是5’-RACE方法[M.A.Frohman等,Proc.Natl.Acad.Sci.,USA.,8,8998(1988)]。

    用于这些PCR方法中的引物可参考在此公开的本发明基因的序列信息而进行明智的设计,并可通过常规程序而合成。扩增的DNA/RNA的分离和纯化可以如上所述的常规方式进行,例如通过凝胶电泳方法。

    根据双脱氧方法[Proc.Natl.Acad.Sci.,USA.,74,5463(1977)]或Maxam和Gilbert方法[Methods in Enzymology,65,499(1980)]或通过市售的测序试剂盒更快速地对如以上述方式获得的本发明基因或其各种DNA片段进行测序。

    本发明基因在单独或给定组织中的表达或非表达通过使用部分或全部如上述方式获得的本发明基因的核苷酸序列可特异地进行检测。

    上述检测可通过常规程序进行,如通过RT-PCR[逆转录聚合酶链式反应;E.S.Kawasaki等,RNA扩增。PCR方案,方法和应用指南(PCR Protocol,A Guide to Methods and Applications),Academic Press,Inc.,SanDiego,21-27(1991)]的RNA扩增、RNA印迹分析[MolecularCloning,Cold Spring Harbor Lab.(1989)]、通过例如原位RT-PCR[Nucl.Acids Res.,21,3159-3166(1993)]或原位杂交对细胞水平进行测定、NASBA[基于核酸序列的扩增(nucleic acid sequence-basedamplification),Nature,350,91-92(1991)]等。可明智地使用RT-PCR检测方法。

    当选择PCR方法用于上述检测时,有待使用的引物可以是仅能导致本发明基因选择性扩增的任何引物,并依据本发明基因的序列信息可被巧妙地设计和合成。通常,本发明基因的部分序列长度约是10-35个核苷酸,优选约15-30个核苷酸,可用作引物。

    因此,本发明基因包括DNA片段,可用作检测本发明基因的特异引物和/或特异探针。

    上述DNA片段可定义成在严格条件下能与具有SEQ ID NO:2所示核苷酸序列的DNA杂交的DNA。上述的严格条件可以是引物或探针在其下使用的普通条件。例如,上述条件即在含有0.1%SDS的0.2×SCC中50℃或者在含有0.1%SDS的0.1×SCC中60℃可被提及。

    通过使用本发明基因和常规遗传工程技术,方便和稳定地大量生产本发明基因的表达产物或含有同样表达产物的蛋白成为可能。本发明蛋白及其生产

    本发明进一步提供由本发明基因编码的蛋白;生产该蛋白的载体,例如含有本发明基因的重组表达载体;用该载体转化的宿主细胞以及生产本发明蛋白的方法,该方法包括培养宿主细胞。

    本发明蛋白的特定实施方案是具有SEQ ID NO:1所示氨基酸序列的GASC1蛋白。本发明蛋白还包括其任何同系物。所述同系物可以是具有氨基酸序列并保留GASC1活性的蛋白,所述氨基酸序列通过缺失、替换或添加一种或若干种或多种氨基酸而衍生自SEQ ID NO:1所示氨基酸序列。同系物的特定例子是SEQ ID NO:3所示GASC1基因的同系物的表达产物(GASC1等同基因包括其等位基因)。

    另外,本发明的GASC1蛋白的同系物包括具有与GASC1蛋白活性或功能相同的蛋白,所述GASC1蛋白具有SEQ ID NO:1所示的氨基酸序列,如同衍生自人、马、羊、牛、犬、猿、猫和其他哺乳动物物种以及啮齿动物如大鼠、小鼠和兔。

    本发明蛋白可通过常规重组DNA技术[Science,224,1431(1984);Biochem.Biophys.Res.Comm.,130,692(1985);Proc.Natl.Acad.Sci.,USA.,80,5990(1983)]依据如本发明所提供的GASC1基因的序列信息来制备。

    更具体而言,本发明蛋白的生产方法如下:构建重组DNA(表达载体),其允许在宿主细胞中编码目的蛋白基因的表达,通过向其中转导载体转化宿主细胞,使所得的转化子生长,以及从培养液中收集蛋白。

    宿主细胞可以是任何原核细胞和真核细胞。通常用作原核宿主最多的是大肠杆菌(Escherichia coli)和枯草芽孢杆菌(Bacillus subtilis)等。可有利地使用尤其包括在大肠杆菌K12菌株的大肠杆菌菌株。真核宿主细胞包括脊椎动物细胞和酵母,前者包括猿细胞系COS[Cell,23:175(1981)]、中国仓鼠卵巢细胞及其二氢叶酸还原酶-缺陷的细胞[Proc.Natl.Acad.Sci.,USA.,77:4216(1980)]。后者包括酵母属的酵母细胞,但这些不是专有的选择。

    当原核细胞用作宿主细胞时,表达质粒的构建方法是使用在宿主细胞中可复制的载体,并在本发明基因的上游添加启动子和SD(Shine和Dalgarno)序列,以便该基因可在其中表达,以及可有利地采用对起始蛋白合成是必须的起始密码子(例如ATG)。作为上述载体,经常使用衍生自大肠杆菌的质粒,如pBR322、pBR325、pUC12和pUC13等。然而,这些不是专有的选择,还可使用各种已知的载体。市售用于大肠杆菌表达系统的载体的例子包括pGEX-4T(AmershamPharmacia Biotech)、pMAL-C2、pMA1-P2(New England Biolabs)、pET-21、pET-21/lacq(Invitrogen)和pBAD/His(Invitrogen)。

    作为用于宿主细胞是脊椎动物细胞时的表达载体,准备使用的载体一般在待表达的本发明基因的上游具有启动子、RNA剪接位点、多腺苷酸化位点和转录终止序列。如果需要,该载体可进一步具有复制起点。表达载体的特定例子是具有SV40早期启动子的pSV2dhfr[Mol.Cell.Biol.,1:854(1981)]。除上述载体以外,可使用各种市售的已知载体。市售用于动物细胞表达系统中的载体的例子包括动物细胞的载体,如pEGFP-N、pEGFP-C(Clontech)、pIND(Invitrogen)和pcDNA3.1/His(Invitrogen)等,以及昆虫细胞的载体,如pFastBac HT(Gibco BRL)、pAcGHLT(PharMingen)、pAc5/V5-His、pMT/V5-His、pMT/Bip/V5-His(全部为Invitrogen)。

    pAM82具有酸性磷酸酶基因的启动子[Proc.Natl.Acad.Sci.,USA.,80:1(1983)],是酵母细胞用作宿主细胞时表达载体的特定例子。市售酵母细胞的表达载体包括pPICZ(Invitrogen)和pPICZα(Invitrogen)。

    启动子同样不受到特别限制,本领域已知的任何一个启动子均可使用。当大肠属的菌株用作宿主时,可有利地使用色氨酸(trp)启动子、lpp启动子、lac启动子、recA启动子、PL/PR启动子等。当宿主是芽孢杆菌属的菌株时,优选使用SP01启动子、SP02启动子、penP启动子等。当酵母菌株用作宿主时,可有利地使用pH05启动子、PGK启动子、GAP启动子、ADH启动子等。当宿主细胞是动物细胞时,优选的启动子包括SV40衍生的启动子、反转录病毒启动子、金属硫蛋白启动子、热休克启动子、巨细胞病毒启动子以及SRα启动子。这些启动子可单独使用,也可它们中的两个或多个组合使用,例如以连接形式。

    作为本发明基因的表达载体,可有利地使用任何常规融合蛋白表达载体。用于表达谷胱甘肽-S-转移酶(GST)-融合蛋白的pGENX(Promega)就是这种载体的特定的例子。

    将所需的重组DNA(表达载体)导入到宿主细胞中的方法以及相关的转化方法不受特别限制,可使用各种标准化的方法。可将所得的转化子以常规方式培养,由此本发明的目的蛋白在转化子的细胞内、细胞外或细胞膜上表达和产生(积累/分泌)。

    准备用于上述培养的培养基根据所采用宿主细胞的种类可明智地从各种常规的培养基中选择,而且培养也可在有利于宿主细胞生长的条件下进行。

    如此获得的本发明的重组蛋白通过各种分离技术利用其物理和/或化学特性可被任选分离和纯化,例如[″Seikagaku Data Book(Biochemical Data Book)II″,1175-1259,第一版,第一次印刷,1980年6月23日Tokyo Kagaku Dozin K.K.出版;Biochemistry,25(25),8274(1986);Eur.J.Biochem.,163,313(1987)等]。

    上述技术具体包括一些常规方法,如重建处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透压休克方法、超声破碎、超滤、各种类型的层析如分子筛层析(凝胶过滤)、吸附层析、离子交换层析、亲和层析和高效液相层析(HPLC)、透析以及这些方法的组合。特别优选的技术是使用柱的亲和层析,针对本发明蛋白的特异抗体已偶联到该柱上。

    在设计编码本发明蛋白的目的基因时,可有利地使用如SEQ IDNO:2所示的GASC1基因的核苷酸序列。如果需要,该基因可经适当选择和变更指定各自氨基酸残基的密码子后才被使用。此外,当由GASC1基因编码的氨基酸序列的任意氨基酸残基或部分序列通过替换、缺失或添加而必须被修饰时,这些修饰可通过上述的各种方法进行,例如通过位点专一诱变。

    根据SEQ ID NO:1所示的氨基酸序列通过化学合成的标准方案也可生产本发明蛋白。该方法包括常规合成肽的液相方法和固相方法。

    更具体而言,合成肽的方法包括所谓的逐步延伸方法,其中为了链延长组成的氨基酸一个接一个地被偶联,以及片段缩合方法,该方法包括合成片段并将片段偶联在一起,各片段预先由若干氨基酸所组成。本发明蛋白可通过上述两种方法的任一种合成。

    用于上述肽合成的缩合的方法也可以是一种常规方法,包括叠氮化物方法、混合酸酸酐方法、DCC方法、活性酯方法、氧还方法、DPPA(二苯基磷酰叠氮)方法、DCC+添加剂(1-羟基苯并三噻唑,N-羟基琥珀酰亚胺、N-羟基-5-降冰片烯-2,3-二羧酰亚胺等)方法以及伍德瓦德试剂方法。

    这些方法中所用的溶剂也可明智地选自本领域熟知的用于这类肽形成缩合反应的常用溶剂。溶剂的例子包括二甲基甲酰胺(DMF)、二甲亚砜(DMSO)、六甲基磷酰胺、二噁烷、四氢呋喃(THF)、乙酸乙酯等以及它们的混合物。

    在进行肽合成反应中,任何不应参与反应的氨基酸或片段肽的羧基可预先被保护,一般采用酯化以低级烷酯的形式,如甲酯、乙酯或叔丁酯,或芳烷酯如苯甲酸酯、对甲氧基苯甲酸酯、对硝基苯甲酸酯等。

    关于在其侧链具有功能基团的任意氨基酸,例如酪氨酸残基的羟基可预先用例如乙酰基、苄基、苄氧基羰基或叔丁基保护,尽管此种保护不是必不可少的。此外,精氨酸残基的胍基可用适当的保护基保护,如硝基、甲苯磺酰基、对甲氧基苯磺酰基、亚甲基-2-磺酰基、苄氧基羰基、异龙脑氧基羰基、金刚烷氧基羧基等。

    从本发明的被保护的氨基酸、肽或终产物蛋白中消除这些保护性基因的反应也可以常规方式进行,例如通过催化还原或通过使用液氨/钠、氟化氢、溴化氢、氯化氢、三氟乙酸、乙酸、甲酸、甲磺酸等。

    如此生产的本发明蛋白可按需要通过上述各种技术被纯化,例如离子交换树脂层析法、分配色谱法、凝胶层析法、逆流分配法以及肽化学领域中常用的类似方法。抗本发明蛋白的抗体

    本发明蛋白或其片段可有利地用作制备特异抗体的免疫原。使用该免疫原,可提供所需的抗血清(多克隆抗体)和单克隆抗体。

    生产抗体的技术对本领域技术人员来说是众所周知的,这些常规程序也可用于操作本发明[例如Zoku Seikagaku Jikken Koza(Experiments in Biochemistry,second series)″Men-eki SeikagakuKenkyuho(Methods in Immunobiochemistry)″,edited by JapaneseBiochemical Society(1986)]。

    如此得到的抗体通过免疫学技术等可有利地用于本发明蛋白的纯化及其测定或鉴定。更具体而言,由于本发明基因的扩增和增加的表达已在癌细胞中得到证实,因此该抗体可用于癌症诊断或癌症是否是恶性的判断。此外,上述抗体可用于生产包含相同抗体作为活性成分的药品,例如用于癌症的诊断剂。本发明的药物组合物

    本发明进一步提供了药物组合物,例如用于癌症的治疗剂,其包含针对本发明蛋白的抗体作为活性成分或其片段,以及生产这种组合物或药剂的方法。

    本发明的药物组合物的制备方法是采用包含有效量的针对本发明蛋白的抗体或其片段和可药用载体一起(包括稀释剂)的形式。

    根据待制备制剂的用途方式、其剂量形式以及其他因素可适当选择能用于该药物组合物(药物制剂)中的载体。其包括例如稀释剂或赋形剂如填充剂、体积构件、粘合剂、湿润剂、崩解剂、表面活性剂和润滑剂。

    最优选的是本发明药物组合物的制备采用各种成分,这些成分可制成普通的蛋白制剂,如稳定剂、生物杀灭剂、缓冲液、等渗剂、螯合剂、pH控制剂以及表面活性剂。

    稳定剂包括例如人血清白蛋白、普通的L-氨基酸、糖或糖类以及纤维素衍生物。这些稳定剂可单独使用或与表面活性剂等组合使用。特别是与表面活性剂的组合使用可导致活性成分更有效的稳定。

    L-氨基酸不受到特别地限制,例如可采用甘氨酸、半胱氨酸和谷氨酸的任一种。

    糖不受特别限制,其包括单糖如葡萄糖、甘露糖、半乳糖和果糖,糖醇如甘露醇、肌醇以及木糖醇;二糖如蔗糖、麦芽糖和乳糖;多糖如葡聚糖、羟丙基淀粉、硫酸软骨素和透明质酸;以及它们的衍生物。

    表面活性剂也不受特别限制,离子和非离子的表面活性剂均可被采用。特定的例子是聚乙二醇、山梨聚糖醇烷酯、聚氧乙烯烷基醚、山梨聚糖醇单酰酯以及脂肪酸甘油酯。

    可用的纤维素衍生物也不受特别限制,其包括甲基纤维素、乙基纤维素、羟乙基纤维素、羟丙基纤维素、羟丙基甲基纤维素以及羧甲基纤维素钠。

    糖的添加量为每微克(μg)活性成分不少于约0.0001mg,优选在约0.01-约10mg的范围内。表面活性剂的添加量为每μg活性成分不少于约0.00001mg,优选在约0.0001-约0.01mg的范围内。人血清白蛋白的添加量为每μg活性成分不少于约0.0001mg,优选在约0.001-约0.1mg的范围内。氨基酸使用的量为每μg活性成分约0.001-约10mg的范围内。纤维素衍生物的添加量为每μg活性成分不少于约0.00001mg,优选在约0.001-约0.1mg的范围内。

    本发明的药物制剂中活性成分的量可不受限制地选自宽的范围。一般而言,根据药物制剂的重量其按重量计在约0.00001-约70%的范围内,优选约0.0001-约5%的范围内。

    本发明的药物组合物可进一步补充各种添加剂如缓冲液、等渗剂以及螯合剂。缓冲液包括硼酸、磷酸、乙酸、柠檬酸、ε-氨基己酸、谷氨酸和/或其对应盐(它们的碱金属或碱土金属盐,如钠盐、钾盐、钙盐和镁盐)。等渗剂包括氯化钠、氯化钾、糖和甘油等。螯合剂包括乙二胺四乙酸钠和柠檬酸等。

    本发明的药物制剂可采用溶液的形式,或从其衍生的冻干形式,以便储存。这种冻干制剂可临时溶解于例如缓冲液中至适当的施用浓度,包括水、生理盐水等。

    包含在药物制剂及其剂量中的活性成分的量不受特别限制,依据所期望的治疗效果、给药方法、治疗期限、患者背景如年龄和性别以及其他因素,可选自宽的范围。一般而言,活性成分所推荐的常用剂量是每kg体重约0.01μg-约10mg/天,优选约0.1μg-约1mg/天。制剂的施用可每天一次或剂量分开两次-若干次。用于基因治疗的反义寡核苷酸和载体

    本发明进一步提供能产生具有与细胞内mRNA互补的序列的RNA的反义药物,从而抑制能够表达GASC1基因的细胞中GASC1基因的翻译和表达,以及提供使用该反义药物对癌症进行基因治疗的方法。

    治疗的基本原理在于抑制靶GASC1基因的表达。这种表达抑制例如通过下列步骤来实现:产生与对应于靶基因的mRNA互补的反义核苷酸,并将同样的反义核苷酸供给具有靶GASC1基因的癌细胞。该反义核苷酸结合到与拥有核苷酸的靶细胞中的GASC1基因相对应的mRNA上,或插入到靶细胞的DNA双螺旋中从而形成三链。由此,GASC1基因的转录或翻译受到抑制。通过抑制GASC1基因的表达功能,受体细胞/靶细胞中的肿瘤或赘生物的增殖可被抑制。

    通过将染色体外地含有核苷酸的载体或质粒引入靶细胞中并在其中保持不变,反义核苷酸可被供给靶细胞。更具体而言,将反义核苷酸插入到从反转录病毒、腺病毒或AAV中衍生的载体中,并用所得的载体感染靶癌细胞,由此把反义核苷酸供给靶细胞。在被感染的细胞中,反义核苷酸过量表达从而产生所需的抗肿瘤效应。

    在包含将反义核苷酸引入具有GASC1基因的细胞中以抑制GASC1蛋白的表达的基因治疗中,对于反义核苷酸来说,没必要具有与全长的GASC1基因相对应的序列。其可具有对应于编码上述某些或其他修饰的基因的序列或具有包含部分GASC1基因的序列,条件是保留与GASC1基因表达抑制相同的功用。

    既为了将目的基因导入靶细胞又为了染色体外维持该目的基因,可用向其中引入目的基因的起始载体或起源载体对本领域是已知的。任何这些已知的起始载体可用于本发明的操作中。合适的起始载体是例如在USP 5,252,479和PCT国际公开说明书WO 93/07282中公开的载体(pWP-7A、pWP-19、pWU-1、pWP-8A、pWP-21、pRSVL等)或市售的载体pRC/CMV(Invitrogen)。在下文描述的各种病毒载体也是优选的载体。

    将目的基因引入这些起始载体中可以常规方式进行。用于给靶细胞提供目的基因的载体或质粒(导入载体)可由如此引入获得。这些是含有GASC1基因的反义核苷酸拷贝如连接到表达调节元件上的病毒载体或质粒载体,并能在靶细胞中生成反义核苷酸产物。如在上文所述的含有本发明基因的表达载体也可用作导入载体。

    作为用于基因治疗的导入载体的启动子序列,那些启动子对各种疾病中待处理的受侵袭组织是固有的,可优选采用。

    例如对于肝脏,其特定的例子是白蛋白、α-胎蛋白、α1-抗胰蛋白酶、运铁蛋白和运甲状腺素蛋白的启动子序列。

    对于结肠,碳酸酐酶和癌胚抗原的启动子序列可如实施例所叙述。

    对于子宫和胎盘,雌激素、芳化酶(aromatase)、细胞色素P450、胆固醇侧链切割酶P450以及17α-羟化酶P450的启动子序列可如实施例所叙述。

    对于前列腺,前列腺抗原、gp91-fox基因以及前列腺特异的激肽释放酶的启动子序列可如实施例所叙述。

    对于乳腺,erb-B2、erb-B3、β-酪蛋白、β-乳球蛋白以及乳清蛋白的启动子序列可如实施例所叙述。

    对于肺,表面活性物质蛋白C以及尿球蛋白(uroglobulin)的启动子序列可如实施例所叙述。

    对于皮肤,K-14-角蛋白、人角蛋白1或6以及leucline的启动子序列可如实施例所叙述。

    对于大脑,胶质细胞原纤维酸性蛋白、成熟星细胞特异蛋白、髓磷脂碱性蛋白以及酪氨酸羟化酶的启动子序列可如实施例所叙述。

    对于胰腺,绒毛蛋白、胰高血糖素以及朗格汉斯小岛淀粉状蛋白多肽的启动子序列可如实施例所叙述。

    对于甲状腺,甲状腺球蛋白和降钙素的启动子序列可如实施例所叙述。

    对于骨骼,α1胶原蛋白、骨钙蛋白以及骨唾液酸糖蛋白的启动子序列可如实施例所叙述。

    对于肾脏,肾素、肝脏/骨骼/肾脏碱性磷酸酶以及促红细胞生成素的启动子序列可如实施例所叙述。

    对于胰腺,淀粉酶和PAP1的启动子序列可如实施例所叙述。

    此外,依据如上文所述的本发明GASC1基因的核苷酸序列的信息,通过标准的遗传工程技术,可容易地产生和获得准备用于引入载体生产的反义核苷酸(对应于GASC1基因序列的全部或部分互补序列)。

    通过本领域已知的把DNA导入细胞的各种技术,可将这种导入载体转移到细胞中。其例子是电穿孔、磷酸钙共沉淀、病毒转导等。

    作为导入载体转移的结果,用GASC1基因的反义核苷酸转导或转染的细胞,如同在分离状态,也可用作药物研发的模型系统和抑制癌症或预防癌症转移的治疗研究模型。

    在基因治疗中,通过将该载体局部或全身注射到患者的一个或多个肿瘤部位,上述导入载体可被导入患者的肿瘤细胞中。当全身施用的情况下,其可到达所有肿瘤细胞,包括可能出现在另一部位或其他部位的转移性肿瘤细胞。一般而言,在以上述方式给药后,转导的基因将永久吸收在各个靶肿瘤细胞的染色体中。在不足的情形下,通过周期性地重复给药可保证目的基因的吸收。基因治疗

    根据本发明,基因治疗的方法既包括体内技术也包括离体技术,体内技术包括将用于引入上述反义核苷酸(反义核苷酸导入载体)的物质直接施用给身体,离体技术包括从患者身体中切除一些靶细胞,身体外将基因转移其中,然后再将细胞返回到身体中。

    根据本发明,基因治疗的方法也包括基因疗法,其包括将GASC1基因的反义核苷酸直接导入细胞中,并利用核酶,这些核酶是剪切RNA链的活性分子。

    根据本发明,基因治疗的药剂包括含有全部或部分对应于本发明基因的反义核苷酸的基因导入载体或者如通过所述载体的手段而导入的携带本发明基因的反义核苷酸的细胞作为活性成分。

    根据本发明,用于基因治疗的药剂主要指明在癌症情况下,虽然其也可用于治疗(处理)其他遗传性疾病中,例如病毒性疾病如AIDS。根据本发明所述的基因治疗剂可进一步用于标记基因目的。

    在根据本发明所述的基因治疗中,反义核苷酸必定要被导入的靶细胞可依据基因治疗(处理)的目的明智地选择。靶细胞不仅包括癌细胞或肿瘤组织,而且包括淋巴细胞、成纤维细胞、肝细胞以及造血细胞等。

    在上述基因治疗中引入反义核苷酸的方法包括病毒导入技术和非病毒导入技术。

    至于病毒导入技术,考虑到GASC1基因的反义核苷酸是正常细胞中表达的外源物质的事实,可提及例如使用反转录病毒载体的方法。其他病毒载体也可使用,并包括腺病毒载体、HIV(人免疫缺陷病毒)载体、腺伴随病毒(AAV)载体、疱疹病毒载体、单纯疱疹病毒(HSV)载体以及EB病毒(EBV)载体等。

    非病毒导入方法包括下列方法。

    ·磷酸钙共沉淀方法;

    ·膜融合脂质体方法;该方法包括通过使含DNA的脂质体与灭活仙台病毒融合来制备膜融合脂质体,该灭活仙台病毒通过用紫外线破坏基因制备,直接将该脂质体与细胞膜融合,以及将融合产物导入细胞中[Kato,K.等,J.Biol.Chem.,266,22071-22074(1991)];

    ·包含用金包被质粒DNA并将该DNA通过高压放电手段物理地导入到细胞中的方法[Yang,N.S.等,Proc.Natl.Acad.Sci.,87,9568-9572(1990)];

    ·裸DNA方法;该方法包括将质粒DNA直接注射到体内器官或肿瘤中[Wolff,J.A.等,Science,247,1465-1467(1990)];

    ·阳离子脂质体方法;该方法包括将包埋在正电荷多层脂质体中的基因导入到细胞中[Yagi,Kunio,Igaku no Ayumi(Advances inMedicine),Vol.175,No.9,635-637(1995)];

    ·配体-DNA复合体方法;该方法包括将DNA与配体结合,所述配体结合到在靶细胞中表达的受体上,以及施用该结合产物,由此该基因仅被导入到特异的细胞中而不可能被导入到其他细胞中[Frindeis等,Trends Biotechnol.,11,202(1993);Miller等,FASEB J.,9,190(1995)]。

    上述的配体-DNA复合体方法包括以唾液酸糖蛋白作为配体和例如以肝细胞中表达的唾液酸糖蛋白受体作为靶子的方法[Wu等,J.Biol.Chem.,266,14338(1991);Ferkol等,FASEB J.,7,1081-1091(1993)],以及包括以运铁蛋白作为配体和以由肿瘤细胞强表达的运铁蛋白受体作为靶子的方法[Wagner等,Proc.Natl.Acad.Sci.,USA,87,3410(1990)]等。

    基因导入或转移方法可存在于一种或多种生物的和/或如上述的一种或多种物理的基因转移方法适当的组合。在这种组合的例子中,具有一定大小的质粒DNA与特异于腺病毒六邻体蛋白的聚赖氨酸-结合的抗体相组合。根据此方法,抗体复合体偶联到腺病毒载体上,因此,通过用如此获得的三分子复合体感染细胞来实施反义核苷酸导入成为可能。在偶联到腺病毒载体上的DNA受到损伤之前,该方法使得有效结合、整合和核内体分解。病毒载体构建和基因转移方法

    构建用于反义核苷酸转移的病毒载体的方法以及用于将反义核苷酸转移至靶细胞或靶组织上的方法现在具体描述。

    反转录病毒载体系统由病毒载体和辅助细胞(包装细胞)组成。辅助细胞指一种细胞已预先表达了编码反转录病毒的结构蛋白gag(病毒颗粒内的结构蛋白)、pol(反转录酶)、env(外壳蛋白)等的基因,但还未形成病毒颗粒。另一方面,病毒载体具有包装信号和LTR(长末端重复序列),但缺乏病毒复制必需的结构基因,如gag、pol、env等。包装信号是病毒颗粒的组装中作为尾起作用的序列。将连接在克隆位点中的选择性基因(neo、hyg)和目的反义核苷酸(GASC1基因的反义核苷酸的全部或片段)插入以代替病毒基因。为了能获得高效价的病毒颗粒,重要的是使用尽可能短的插入,提供广的包装信号,所述包装信号包括部分gag基因,并小心使用不遗留gag基因的ATG。

    当内含目的GASC1基因的反义核苷酸的载体DNA被转移给辅助细胞时,载体基因组RNA被辅助细胞所形成的病毒结构蛋白包装,由此病毒颗粒形成并分泌。病毒颗粒作为重组病毒感染靶细胞,结果使从病毒基因组RNA中反转录的DNA序列整合到细胞核中,因而插入到载体中的反义基因表达。

    还有可能采用含有细胞粘着结构域、肝素结合位点和结合区段的纤连蛋白片段的技术[Hanenberg,H.等,Exp.Hemat.,23,747(1995)],为增强目的基因转移的效率。

    用于上述反转录病毒载体系统中的反转录病毒载体的例子是衍生自小鼠白血病病毒的反转录病毒[McLachlin,J.R.等,Proc.Natl.Acad.Res.Molec.Biol.,38,91-135(1990)]。

    利用腺病毒载体的方法现在详细描述。根据由Berkner[Berkner,K.L.,Curr.Topics Microbiol.Immunol.,158,39-66(1992)]、YasuhiroSetoguchi等[Setoguchi,Y.等,Blood,84,2946-2953(1994)]、HiromiKanegae等[Kanegae,H.等,Jikken Igaku(Experimental Medicine),12,28-34(1994)]和Ketner等[Ketner,G.等,Proc.Natl.Acad.Sci.,USA.,91,6186-6190(1994)]描述的方法,可构建腺病毒载体。

    非增殖性腺病毒载体的构建可按下列方式进行。因此,腺病毒的早期基因区域E1和/或E3首先被切除。然后,将含有所需外源基因表达单位(表达单位由下列成员组成:待转移的反义核苷酸,即GASC1基因的反义核苷酸;转录所述反义核苷酸的启动子;确保被转录基因稳定性的聚腺苷酸(Poly A))和部分腺病毒基因组DNA的质粒载体和含有腺病毒基因组的质粒用于共转染例如293细胞。当它们之间导致发生同源性重组以取代E1的基因表达单位时,非增殖性腺病毒载体作为内含目的GASC1基因的反义核苷酸的载体得到并适合用于根据本发明的基因治疗。加有末端蛋白的3’-端腺病毒载体也可通过连接粘粒载体中的腺病毒基因组DNA而构建。此外,YAC载体也可用于重组腺病毒载体的构建。

    现在简述腺伴随病毒(AAV)载体的产生。据发现AAV是污染了腺病毒培养系统的小病毒。关于该病毒,细小病毒属(Parvovirus)和依赖病毒属(Dependovirus)的存在已得到鉴定,对于病毒复制,细小病毒属能在宿主细胞内自主增殖而无需要求辅助病毒,而依赖病毒属需要辅助病毒。该AAV具有广泛的宿主范围,是感染各种细胞的普通病毒之一。该病毒基因组是线性单链DNA,由4680个核苷酸组成,在其两端带有145个核苷酸,具有已知为ITR(末端反向重复序列)的特征序列。该ITR区域起着复制起点的作用并具有引物的作用。该ITR对包装病毒颗粒和将AAV整合到宿主细胞的染色体DNA中也是必需的。关于病毒蛋白,基因组的左半部分编码非结构蛋白,这是调节蛋白Rep,控制复制和转录。

    利用AAV整合到染色体DNA中的特性可进行重组AAV的构建,由此能制备目的基因转移载体。更具体而言,该方法包括首先构建在野生型AVV的5′-和3′-端保留ITR并内含待转移如介入其中的反义核苷酸(GASC1反义核苷酸)的质粒(AAV载体质粒)。另一方面,对病毒复制和病毒颗粒形成必需的病毒蛋白从分开的辅助质粒中提供。必须保证没有共有的核苷酸存在于两个质粒之间,因此野生型病毒将不出现在DNA重组上。所以,通过转染将两个质粒转移到例如293细胞中,而且进一步用腺病毒作为辅助病毒感染细胞(当采用293细胞时,该腺病毒可以是非增殖性病毒),从而生产所需的非增殖性重组AAV。由于该重组AAV存在于细胞核中,然后将细胞进行冻融和回收,并在56℃加热使掺杂的腺病毒灭活。另外,如果需要,通过使用氯化铯超速离心分离和浓缩重组AAV。以此方式,可获得用于基因转移的所需重组AAV。

    EBV载体的生产可例如通过Shimidzu等的方法[Shimidzu,N.等,Saibo Kogaku(Cell Technology),14(3),280-287(1995)]进行。

    用于转移反义核苷酸的EBV载体的生产现在简要描述。

    EB病毒(埃巴二氏病毒:EBV)是单纯疱疹病毒属家族的病毒,其首先由Epstein和其同事从衍生自非洲淋巴瘤的培养细胞中分离[Kieff,E.和Liebowitz,D.:Virology,2nd ed.Raven Press,New York,1990,pp.1889-1920]。该EBV具有细胞转化活性,为了将其用作基因转移载体,有必要制备缺少这种转化活性的病毒。可如下完成此项行为。

    因此,首先将邻近靶DNA的EBV基因组克隆,在所述靶DNA中所需外源基因将要插入。然后,将外源基因的DNA片段和药物抗性基因插入其中,从而构建用于制备重组病毒的载体。接着,将用于重组病毒构建的载体用适当的限制酶切除后转染到EBV阳性的Akata细胞中。通过抗表面免疫球蛋白处理刺激病毒生产,把由同源重组形成的重组病毒与野生型Akata EBV一起回收。重组病毒感染到EBV阴性Akata细胞,在药物存在下选择抗药物的克隆子,由此可获得仅有重组病毒感染而不含野生型EBV的Akata细胞。进一步,通过在重组病毒感染的Akata细胞中诱导病毒活性,目的重组病毒载体可大量生产。

    无需使用任何重组病毒载体就能将所需反义核苷酸导入靶细胞中的非病毒载体可通过基因转移方法例如使用膜融合脂质体来生产。该方法是将脂质体内容物通过与细胞膜的融合活性直接导入细胞,如同给定的是膜脂质体(具有脂双层的小细胞器)。

    例如通过Nakanishi等的方法[Nakanishi,M.等,Exp.Cell.Res.,159,399-499(1985);Nakanishi,M.等,Gene introduction into animal tissues.InTrends and Future Perspectives in Peptide and Protein Drug Delivery(ed.by Lee,V.H.等).Harwood Academic Publishers GmbH,Amsterdam,1995,pp.337-349],利用上述膜融合脂质体可进行反义核苷酸的导入。

    通过利用上述膜融合脂质体导入反义核苷酸的方法下文简要描述。

    将其基因用紫外线灭活后的仙台病毒和包括所需反义核苷酸和高分子物质如表达蛋白的脂质体在37℃下融合在一起。膜融合脂质体具有一种结构,其也称为假病毒,其内部有脂质体衍生的腔,其外部有同样的刺突作为病毒被膜。通过蔗糖密度梯度离心进一步纯化膜融合脂质体,然后允许37℃下吸附在靶培养细胞或组织细胞上。然后,将温度提升到37℃,当脂质体内容物导入细胞后,所需的反义核苷酸就可导入到靶细胞中。在此制备脂质体所用的脂成分由50%(摩尔比率)胆固醇、卵磷脂和带负电荷的合成磷脂组成,并且优选制备和使用具有直径为300nm的单层脂质体。

    使用脂质体将反义核苷酸导入靶细胞中的另一方法是使用阳离子脂质体的反义核苷酸导入方法。该方法按照Yagi等的方法[Yagi,K.等,B.B.R.C.,196,1042-1048(1993)]进行。留意质粒和细胞是负电荷的事实,该方法包括脂质体膜的内外两面均带正电荷,由此凭借静电引力增加质粒的吸收并增强其与细胞的相互作用。作为在此待用的脂质体有用的是阳性电荷的多层大泡(MLV)。然而利用大的单层小泡(LUV)或小的单层小泡(SUV)并用质粒制备其合成物也是可能实现目的反义核苷酸的导入。

    制备含质粒的阳离子的MLV的方法现在简要描述。首先制备以1∶2∶2摩尔比率含有脂TMAG(N-(α-三甲基铵基乙酰基)双十二烷基D-谷氨酸氯化物)、DLPC(二月桂酰磷脂酰胆碱)和DOPE(二油酰磷脂酰胆碱乙醇胺)的氯仿溶液(脂浓度1mM)。然后,将总量1μmol的脂放置到Spitz测试试管中,并在旋转蒸发器中通过减压去除氯仿来制备薄的脂膜。进一步在减压下充分去除氯仿干燥膜。再将0.5ml含有Mg和Ca的Dulbecco磷酸缓冲的盐水与20μg的基因转移质粒一起加入,并且在氮气替换后,内容物用旋涡混合器搅拌2分钟,由此可获得阳离子MLV的悬浮液以及包括其中的含有目的反义核苷酸的质粒。

    在用于基因治疗以上述方式获得的包括质粒的阳离子MLV的实施例中,将0.6μg(以DNA计算)含有待表达的反义核苷酸插入其中的表达质粒包埋在上述的阳离子MLV中,从而使脂质体的脂总量达到30nmol。将所得的脂质体悬浮在2μl的磷酸缓冲的盐水中,并把该悬浮液每隔一天施用给从患者中抽提的靶细胞或患者的一种或多种组织。

    根据日本健康和福利部有关指导方针中的定义,基因治疗是“给人施用基因或其中体内导入基因的细胞来治疗疾病”。除了上述指导方针的定义以外,如本发明所用的术语“基因治疗”包括通过把GASC1基因的反义核苷酸导入到上述靶细胞中来治疗各种疾病包括癌症,另还包括通过将靶基因或其中转入了靶基因的细胞导入人体中来治疗各种疾病。将本发明基因导入靶细胞或靶组织的方法

    在本发明的基因治疗中把目的基因导入靶细胞或靶组织的方法包括下列两个代表性的方法。

    第一种方法包括从待治疗的患者中收集靶细胞,例如在添加白介素-2(IL-2)等的条件下离体生长细胞以转移如反转录病毒中内含的目的GASC1基因的反义核苷酸,并重移植所得的细胞(离体方法)。该方法适合于治疗例如ADA缺乏、由缺陷基因导致的遗传疾病、癌症和AIDS。

    第二种方法是直接基因转移法,其包括将目的反义核苷酸(GASC1基因的反义核苷酸)直接注射到患者体内或靶部位如肿瘤组织(直接方法)中。

    更具体而言,例如可按下列方式实施第一种方法。因此,将从患者中收集的单核细胞利用血液分选仪从单核细胞中分部分离,并将分离细胞在有IL-2存在下培养在适当的培养基如AIM-V培养基中约72小时,然后加入待导入的内含反义核苷酸(GASC1基因的反义核苷酸)的载体。为提高反义核苷酸的转移效率,可将细胞在有鱼精蛋白存在下32℃生长1小时,2500rpm离心,然后在10%的二氧化碳气体下37℃培养24小时。此程序重复几次后,将细胞进一步在有IL-2存在下培养在例如AIM-V培养基中48小时,然后用生理盐水洗涤。存活细胞计数,并通过上述的原位PCR对目的反义核苷酸的导入效率进行评价,或者例如当对象是酶活性时,则通过测定这种活性的程度来评价。

    为证实安全性,实施了安全检查如在培养的细胞中培养细菌和真菌、对是否存在支原体感染进行检查、搜查内毒素等。其后,将用预测的有效剂量的反义核苷酸(GASC1基因的反义核苷酸)转化的培养细胞通过静脉内滴注返还给患者。间隔数周或几个月重复上述程序直至完成基因治疗。

    根据靶细胞明智地选择病毒载体的剂量。通常优选的剂量根据病毒效价可以是例如每1×108个靶细胞1×103cfu-1×108cfu。

    可采用上述第一种方法的选择性版本,其包括共培养具有反转录病毒载体的产病毒的细胞和患者的细胞,所述载体内含目的反义核苷酸,由此将反义核苷酸(GASC1基因的反义核苷酸)导入到靶细胞中。

    在实施第二种基因治疗方法(直接方法)中,特别优选的是进行离体预备实验通过操作载体基因cDNA的PCR或原位PCR以检查目的反义核苷酸(GASC1基因的反义核苷酸)是否能由基因转移方法真正导入,或者检查所需的治疗效果例如特异活性的升高或靶细胞的生长或生长抑制是否能通过导入目的反义核苷酸(GASC1基因的反义核苷酸)真正实现。此外,当采用病毒载体时,通过执行PCR搜索增殖性反转录病毒等,测定反转录酶的活性,或采用PCR技术监控外壳蛋白(env)基因,对基因治疗中导入反义核苷酸的安全性进行确认当然具有重要意义。

    尤其当癌症或恶性肿瘤是靶子时,本发明基因治疗的例子是癌症治疗,其包括从患者中收集癌细胞,通过酶处理等建立培养的细胞系,例如利用反转录病毒将目的反义核苷酸导入到靶癌症细胞中,用G418细胞实施筛选,然后测定IL-12等的表达量(体内),给予辐射处理,以及将细胞接种至患者的肿瘤或癌旁的(肿瘤相伴的)一个或多个部位。基因治疗剂

    本发明进一步提供药物组合物或制剂(基因治疗剂),其包括本发明的反义核苷酸转移载体或用反义核苷酸(GASC1基因的反义核苷酸)转化/转染的细胞系作为活性成分以药物有效量与合适的药物载体或稀释剂组合。

    可用于本发明基因治疗剂的药物载体包括那些稀释剂或赋形剂,例如填充剂、容积构件、粘合剂、湿润剂、崩解剂、表面活性剂、润滑剂等,通常它们的用处取决于制剂所用的形式,并且根据制剂预计的单位剂量形式可选择性地使用这些载体。

    本发明基因治疗剂的单位剂量形式可与本发明的药物组合物所述的相同,并根据治疗目的可选择一种合适形式。

    本发明的基因治疗剂例如当其含有反义核苷酸转移载体时,是以所述载体包埋其中的脂质体的形式制备或以用内含反转录病毒载体的病毒感染的培养细胞形式制备,所述反转录病毒载体含有所需的反义核苷酸。

    药剂例如可制成磷酸缓冲的盐水(pH7.4)、林格溶液或胞内组合物注射液,或者制成可与有益于基因转移效率提高的物质如鱼精蛋白组合施用的这种剂量形式。

    施用上述药物制剂的方法不受特别限制,根据特定的剂量形式、患者的年龄、性别和其他因素、疾病的严重性等可建立适当的方案。

    掺入上述药物制剂的活性成分的量和剂量不受特别限制,根据期待的治疗益处、施用方法、治疗期限、患者背景包括年龄和性别以及其他变量,各量可自由选自宽的范围。

    一般而言,内含目的反义核苷酸的反转录病毒载体作为药物制剂的剂量可以是例如根据反转录病毒效价每kg体重每天约1×103pfu-约1×1015pfu。

    在携带导入反义核苷酸的细胞的情况下,剂量可合适地选自约1×104细胞/个体-1×1015细胞/个体的范围。

    上述制剂的施用可每天一次或一天分几次剂量或甚至间隔一周或若干周。优选可组合施用有益于基因转移效率提高的物质如鱼精蛋白或含有同样物质的制剂。

    当根据本发明的基因治疗适用于癌症的治疗时,其可以与如上所述的各种基因疗法适当的组合(结合基因治疗)施行和/或以与常规癌症化疗、放疗、免疫治疗等组合施行。本发明的基因治疗可参照NIH指导方针包括其安全性方面[Recombinant DNA Advisory Committee,Human Gene Therapy,4,365-389(1993)]进行。

    本发明基因的检测和癌症诊断

    根据本发明,为了检测GASC1基因是否存在的目的,所述GASC1基因促进细胞的肿瘤发生,有可能制备生物样品如血液或血清,任选地抽提核酸并分析其是否存在GASC1敏感的基因。根据本发明,还有可能制备具有某种或其他失调的生物样品,并分析其是否存在GASC1相关的赘生物基因,用于检测细胞或组织中的赘生物,恶性前兆的失调的进展和/或其出现作为前兆指数。利用该方法,对细胞或组织中的赘生物、恶性前兆的失调的发展或其出现作为前兆指数进行检测变为可能,因此,这些前兆的诊断例如癌症诊断和癌症治疗效果的判断及其预后变为可能。

    例如,上述检测方法可包括根据有关获自肿瘤患者样品的GASC1基因的信息制备GASC1基因的DNA片段,并对其进行设计,从而其可用于对GASC1基因和/或其扩增的筛选。更具体而言,有可能构建具有探针特性的DNA片段,所述探针用于噬菌斑杂交、菌落杂交、DNA印迹、RNA印迹等,或用于如由聚合酶链式反应(PCR)扩增而制备GASC1基因的全长或部分DNA,所述PCR用聚合酶扩增核苷酸序列。为此目的,首先制备与至少部分的GASC1基因具有相同序列的引物。然后,将引物作为筛选探针与生物样品(核酸样品)反应,由此可检查样品中是否存在GASC1基因序列。核酸样品的制备可采用有助于检测靶序列的任何各种技术,如变性、限制消化、电泳或斑点印迹。

    作为上述的筛选方法,从灵敏度的观点出发尤其优选PCR技术,并且该技术不受特别限制,这是因为GASC1基因的片段用作引物。因此,可采用任何迄今已知的技术(Science,230:1350-1354(1985))和最近已经开发或以后将被开发的PCR的修饰版本(Sakaki,Yoshiyuki等编,Jikken Igaku(Experimental Medicine),Supplement8(9)(1990),Yodosha;Protein,Nucleic Acid,Enzyme:SpecialSupplement,Kyoritsu Shuppan,35(17)(1990))。

    用作引物的DNA片段是化学合成的寡DNA,这种寡DNA的合成可利用全自动DNA分析仪等,例如Pharmacia LKB Gene Assemblerplus(Pharmacia)。优选的准备合成的引物(有义引物或反义引物)长度可以是例如约10-30个核苷酸。用于上述筛选的探针通常是标记探针,但可以是未标记探针,或者根据与直接或间接标记的配体特异的结合可进行检测。合适的标记和标记探针或配体的方法是本发明所属领域公知的。因此,现有技术标记包括放射性同位素、生物素、荧光基团、化学发光基团、酶和抗体等,这些标记可通过已知程序如缺口平移、随机引发和激酶处理来进行。

    用于检测的PCR技术可以是例如RT-PCR,但可采用本领域常用的该技术的各种修饰。

    此外,利用试剂盒检测样品中的GASC1基因,本发明的测定方法可快速施行。

    因此,本发明提供包括GASC1基因的DNA片段的GASC1基因检测试剂盒。

    该试剂盒至少包括作为必要组分的DNA片段,所述DNA片段杂交于部分或全部SEQ ID NO:2所示的核苷酸序列或其互补核苷酸序列。其可任选地含有其他组分如标记介质和PCR试剂(例如,Taq DNA聚合酶、三磷酸脱氧核苷酸、引物等)。

    标记介质可以是放射性同位素或化学修饰物如荧光物质。在DNA片段与这种标记介质预先已经结合的情况下,试剂盒不需单独含有这种标记介质。

    试剂盒可进一步含有适当的反应稀释剂、标准抗体、缓冲液、洗涤溶液、反应终止溶液等,这些物质使得测定更容易操作。

    本发明还提供用于癌症诊断的方法,其包括利用上述测定方法和诊断药剂或诊断试剂盒用于操作所述方法。

    利用本发明的测定方法,通过直接或间接对获自测试样品的GASC1基因测序,有可能发现新的GASC1基因相关的基因,这些相关的基因与野生型GASC1基因具有高度同源性。所以,本发明进一步提供筛选测试样品中人GASC1基因相关的基因的方法,其包括进行测定并对测试样品中所含的GASC1 DNA进行测序。

    利用具有SEQ ID NO:1所示氨基酸序列的蛋白质,即由人GASC1基因所编码的蛋白质,具有从SEQ ID NO:1所示序列中通过缺失、替换或添加一种至若干种或多种氨基酸而衍生的氨基酸序列的蛋白,它们每一种的片段,或抗任何这些蛋白的抗体,可确定野生型GASC1和/或突变的GASC1。因此,本发明提供抗体方法和抗原方法用于确定抗野生型GASC1和/或突变的GASC1。

    通过这些方法,根据野生型GASC1多肽中的变化,可检测赘生性态失调或恶性肿瘤的恶性的程度。这类变化的检测可由GASC1序列分析通过上文所述的明确的技术进行,更优选的是利用抗体(多克隆或单克隆抗体)。由此,可检测GASC1蛋白中的差异或者是否存在GASC1蛋白。

    更具体而言,在实施本发明的野生型GASC1和/或突变的GASC1测定方法时,利用抗GASC1抗体,将GASC1蛋白从含有生物样品的溶液中免疫沉淀出来,所述生物样品获自人体,如血液或血清。然后,对与聚丙烯酰胺凝胶上的GASC1蛋白反应进行蛋白质印迹或免疫印迹。当利用抗GASC1抗体时,通过免疫组织化学技术可检测在石蜡包埋或冷冻的组织切片中的GASC1蛋白。用于上述测定和检测的技术可适当地选自本领域中众所周知的抗体生产和纯化技术。

    在优选的实施例中,用于检测野生型和/或突变的GASC1的方法利用单克隆抗体和/或多克隆抗体,包括酶联免疫吸附测定(ELISA)、放射免疫测定(RIA)、免疫放射分析(IRMA)、免疫酶分析(IEMA),包括三明治技术。本发明的蛋白受体和药物筛选

    本发明可进一步提供存在于细胞膜部分或细胞表面上并具有与GASC1蛋白亲和性结合的GASC1受体。

    通过结合生物样品中标记的GASC1蛋白,所述生物样品含有细胞膜部分,抽提和分离GASC1结合产物,并鉴定被分离产物的氨基酸序列,可得到GASC1受体。获得和测序GASC1受体的程序可以本领域中常规的方式进行。

    GASC1受体或其片段优选GASC1受体可用于对任何各种药物进行筛选的技术中。由此,有可能对化合物进行筛选(与GASC1受体反应的化合物,包括低分子的化合物、高分子的化合物、蛋白、部分蛋白质片段、抗原、抗体等)。用于这些筛选测试中的GASC1受体(多肽或其片段;下文将同样适用)可固定在固相基质上。

    上述药物筛选的例子是一种筛选方法,其包括以竞争性结合分析将测试物质和GASC1蛋白或其片段与GASC1受体部分地反应,然后检测在测试条件下该物质对GASC1受体和GASC1蛋白或其片段之间形成复合体的抑制程度。因此,本发明提供药物筛选方法,其包括将测试物质与GASC1受体接触以使它们之间形成复合体,然后测定由GASC1受体和GASC1蛋白或其片段之间复合体形成而产生的复合体所导致的抑制程度。如由该筛选方法所得到的具有抑制活性的物质可通过抑制GASC1受体的活性来调节GASC1自身的活性。

    通过标记GASC1受体和测定在上述竞争性结合分析中游离(非复合体形成)GASC1受体上的标记量,可将测定值作为测试物质与GASC1受体结合的标准,或者可作为GASC1受体和GASC1蛋白之间复合体形成的抑制的测定。

    药物筛选也可用于不仅对物质而且对化合物(肽)的筛选,所述物质能够抑制GASC1受体活性,所述化合物(肽)对所述受体具有足够水平的结合亲和性。

    该程序包括在固相支持物如塑料针状物的表面上合成大量不同的测试化合物,然后将化合物与GASC1受体反应,并且洗涤后通过已知方法[例如PCT专利申请号WO 84-03564]检测结合的反应产物。在该程序中,纯化的GASC1受体可通过在适当的板上直接包被该物而使用,或者也可以被抗此多肽的非中和抗体捕获的形式使用,并因此固定在固相上。

    此外,上述筛选方法也可用于竞争性药物筛选分析中。在这种情况下,中和抗体能够特异地结合到GASC1受体上,引起与测试化合物的竞争性反应。这种竞争性反应能检测是否存在任何具有一个或多个GASC1受体的抗原决定簇的肽。

    作为药物筛选的进一步方法,所述方法利用可提及的内含非功能性GASC1基因的真核宿主细胞系。该方法包括在测试化合物存在下真核宿主细胞生长一定的周期时间,然后测定宿主细胞的生长速率,由此可能证实测试化合物能否与调节宿主细胞生长和分化的蛋白结合,从而控制例如血液和组织中结合蛋白的浓度及其迁移程度,或者控制这种蛋白自身的活性。测定宿主细胞生长速率的一种方法是测定GASC1受体的生物活性。

    根据本发明,也有可能设计和生产另一生物活性蛋白或结构类似物,所述结构类似物与GASC1蛋白例如GASC1激动剂、GASC1拮抗剂或GASC1抑制剂相互作用。这些物质可用于开发更具活性或更稳定的GASC1蛋白的衍生物,或者例如能体内增强或抑制GASC1蛋白的功能的药物。

    例如通过X射线晶体学、计算机模型方法或这些方法的组合来鉴定和分析GASC1蛋白和另一蛋白的复合体的三维结构,可设计出这种结构类似物的序列。有关结构类似物的结构信息也可由蛋白模型根据同源蛋白的结构而获得。

    至于更具活性或更稳定的GASC1蛋白的衍生物,对GASC1蛋白的活性或稳定性施加重要影响的区域例如可通过丙氨酸扫描(丙氨酸替换)组成GASC1蛋白的至少一种氨基酸残基,并在丙氨酸替换后测定肽的GASC1活性来实现。另外,更具活性或更稳定的GASC1蛋白的衍生物可通过用丙氨酸替换在那个区域中的至少一种氨基酸残基来获得。

    为获得能与GASC1蛋白相互作用并具有生物活性的其他蛋白或其结构类似物,通过功能性分析预先分离靶特异的抗体并分析其晶体结构也是有用的。该方法使得获得用作设计所需药物的基础的药核(pharmacore)成为可能。通过利用针对药物活性抗体的功能性抗独特型的抗体,从由化学或生物合成并积累而构建的肽库中筛选所需的肽成为可能。以此方式筛选的肽也可期待用作药核。

    根据本发明,如果GASC1蛋白可大量获得,这将使在分析研究如X射线晶体学中利用该蛋白成为可能。进一步,由本发明提供的GASC1蛋白可用于计算机模拟技术来代替X射线晶体学,或与X射线晶体学一起使用。

    此外,根据本发明,通过构建的携带GASC1基因的剔除小鼠(转基因小鼠),有可能查明GASC1基因序列的哪一个或哪些位点对体内所述多种GASC1活性具有影响,也就是说GASC1基因表达产物和修饰的GASC1基因产物在体内具有什么样的功用。

    该方法是通过利用同源性重组基因而有意修饰生命体遗传信息的技术,其包括使用小鼠胚胎干细胞(ES细胞)作为例子的方法[Capecchi,M.R.,Science,244,1288-1292(1989)]。

    构建这种突变小鼠的方法是迄今为止相关领域中的常规技术[例如Noda,Testuo(编):Jikken Igaku(Experimental Medicine),Supplement,14(20)(1996),Yodosha]。通过将该技术适用于野生型GASC1基因和突变的GASC1基因,可容易地生产突变小鼠。

    在突变小鼠得到的突变基因序列和其功用之间关系的建立,为设计和开发如上所述的更具活性或更稳定形式的GASC1蛋白衍生物,尤其是作为GASC1激动剂、GASC1拮抗剂或GASC1抑制剂功能的药物提供了有用的信息。本发明的效果

    本发明提供能够调节各种细胞生长和分化、肿瘤发生和转录活化等的新基因。该基因用于例如阐明疾病的病理、诊断和/或治疗疾病,其中都涉及这些活性,例如下述的恶性肿瘤。

    如同已知的致癌基因,本发明基因编码相关氨基酸序列C末端上的两个PHD指状结构基元和一个PX结构域。进一步,本发明基因所在的染色体9p23-24区域的扩增已在许多癌症中被观察到。分析本发明基因用于解释该基因的功用和各种疾病之间的关系。所以,当利用这种分析时,本发明基因通过检查该基因在各种组织中的表达状态或其体内功能分析实现了各种疾病的基因诊断。

    根据本发明,有可能以遗传工程方式大量生产由本发明基因编码的蛋白,也有可能生产针对该蛋白的抗体。该蛋白用于测定GASC1活性、与GASC1受体的结合活性以及其他功能。该蛋白及其抗体尤其用于疾病的病理说明、诊断和治疗,GASC1基因及其产物参与其中,例如癌症。

    此外,本发明提供本发明基因的反义链、用于基因治疗含有相同反义链的基因转移载体、内含所述载体的细胞、包含所述载体或细胞作为活性成分的基因治疗剂,以及利用相同物质的基因治疗方法。具体而言,通过抑制生长活性抗各种癌细胞,上述基因疗法可用于治疗各种癌症。附图简述

    图1是实施例1-1中所述的FISH测试结果的示意图。在该图中,A是围绕本发明基因9p23-24区域的基因图,以及B示意性表示5种如由DNA印迹分析鉴定的食道鳞状细胞癌细胞系中9p23扩增子的大小(长度)。

    图2表示如实施例1-1中所述对食道鳞状细胞癌细胞系KYSE150进行FISH分析的典型结果。

    图3表示实施例1-2中所述的测试结果。在该图中,A表示GASC1在各种食道鳞状细胞癌细胞系中扩增的程度,以及B表示利用来自各种食道鳞状细胞癌细胞系的RNA进行RNA印迹分析的结果,这表明GASC1的过量表达。

    图4表示实施例1-2中所述的测试结果,这显示本发明基因在各种正常人组织中的表达模式的检查结果。实施本发明的最佳方式

    下列实施例用于进一步详细说明本发明。实施例1

    1.材料和方法

    1)食道鳞状细胞癌细胞系以及其细胞分裂中期载玻片的制备

    测试中所用的29种食道鳞状细胞癌细胞系(KYSE系列)是从外科手术切除的肿瘤中建立的细胞系(Shimada,Y.等,Cancer,69,277-284(1992))。在所有这些细胞系中的拷贝数异常都已得到本发明人的证实。分裂中期染色体的载玻片的制备按照Shinomiya的方法(Shinomiya,T.等,Genes Chromosomes Cancer,24,337-344(1999))进行并用于FISH测试中。

    2)采用YAC和PAC作为探针的FISH测试

    对指定区域中YAC的定位的信息收集来自Whitehead研究所/MIT基因组中心(MIT Genome Center)(http//www-genome.Wi.Mit.Edu/)以及人类分子细胞遗传学资源(Resources for Human MolecularCytogenetics)(http://bioserver.uniba.it/FISH/rocchi/welcom.html)。

    覆盖人9p23-24区域的多种YAC克隆分离自Center d′Etude duPolymorphisme Humain(CEPH)的YAC文库,以及FISH探针的准备根据上述Shinomiya等的方法通过PCR利用Alu序列进行。

    PCR按照下列方式进行。将YAC DNA 1μg(1μl)、具有SEQ IDNO:4所示核苷酸序列的引物2484(30μM)1μl、具有SEQ ID NO:5所示核苷酸序列的引物PDJ34(10μM)1μl、10×PCR缓冲液(ExTaq缓冲液,Takara Shuzo)10μl、2.5mM dNTP(Takara Shuzo)5μl、ExTaq聚合酶0.5μl以及水81.5μl(总100μl)混合,然后在95℃处理4分钟(首先一次变性处理),反应共进行30次循环(各个循环包括95℃-4分钟、55℃-1分钟和72℃-4分钟),接着在72℃进行终处理(一次)7分钟。上述全部反应都采用Perkin-Elmer GeneAmp PCR system9700进行。

    一种PAC克隆子(由Peter Marynen博士赠送)用作探针,其含有janua激酶2(JAK2,GenBank保藏编号为NM-004972),是9p24图中的已知基因。

    采用生物素16-dUTP或地高辛11-dUTP(Boehringr Mannheim)通过缺口平移标记上述探针。根据上述Shinomiya等的方法进行染色体杂交信号的荧光检测。

    冲洗后,将载玻片上染色的影象和荧光信号利用CCD(冷电荷偶联装置)照相机(KAF 1400,Photometrics产品)同时进行成像分析。

    利用IP实验室光谱软件(Signal Analytics Corp.产品)对DNA序列拷贝数的相对变化进行分析。根据染色体在分裂中期和休眠期所观察到的杂交模式来评估必要区域的拷贝数。当荧光强度比率超过1.5时,可判断此染色体区域表现出高水平的扩增。

    结果,通过前述的CGH分析,在本发明人所研究的29种食道鳞状细胞癌细胞系中检测到5种有9p上拷贝数的增加(17.2%)。发现在它们中间有一个存在更高水平的扩增。在此CGH结果的基础上,采用8种YAC和一种PAC作为探针在KYSE150中进行FISH分析。

    3)结果

    结果显示在图1中(图1A和图1B)。

    在图1中,A是9p23-24区域包括本发明基因的基因图,在该图中,“STSs(基因/ESTs)”代表序列-标记的位点(基因/表达序列标记),“Tel”代表端粒边,“Cen”代表着丝粒边,以及“YACs/PAC”代表在FISH中所用的各个探针。

    在图1A中,由括号中所示的各自表达序列标记(EST)所鉴定的已知基因和转录物表示在代表染色体的线上。这些基因和转录物用作DNA印迹中的探针。

    FISH中所用的多种YAC(953A7、807B4、799D2、871F1、853F4、933F6、830E1和845G2)和一种PAC(PJ2B)由分别在染色体-标志线以下被一个或多个白色小圆中断的水平黑线来表示。这些水平线中的小圆分别显示在YAC或PAC上标记的固定点。此图是示意图,因此,其不反映YAC和PAC的真正大小和实际的标记-标记距离。

    图1B是在5种各自食道鳞状细胞癌细胞系(在图中显示为KYSE70、KYSE450、KYSE890、KYSE1170和KYSE150)中的9p23扩增子的示意图,所述这些细胞系经DNA印迹分析后指定(大约对应于图1A中的染色体-标志线所示)。在该图中,最小的重叠区域(SRO)由FISH与DNA印迹分析的结果一起指定。

    图2表示在KYSE150中FISH分析的典型结果,所述KYSE150是一种上述的食道鳞状细胞癌细胞系。

    在该图中,采用PACPJ2B、YAC799D2和YAC830E1克隆子进行FISH的结果分别被从上到下显示。在各图象中,荧光点的数目表示DNA拷贝数。在各图象中,缩写PJ2B、799D2和830E1与图1A中所示的相同。

    如图2所示,YAC799D2产生了强烈的信号,如同在两个标记染色体上的均匀染色区域(HSR)。这说明高水平的扩增出现在该区域,其中包括YAC799D2。在807B4的情况下,以同样方式进行的FISH给出了相同的结果(未显示)。

    出现在YAC799D2(参见:图1A)两边的YAC953A7、871F1、853F4和933F6中FISH信号的数目范围从4到9。然而,这些信号数目与YAC799D2和807B4比较要少得多。而采用PACPJ2B和YAC830E1,拷贝数仅为2到3。

    为了对在9p23-24区域内显示最低水平扩增的公共区域进行鉴定,其他4种细胞系(KYSE70、450、890和1170)在前述的CGH分析中显示了9p上拷贝数的增加,对这些细胞系也进行了FISH分析。

    结果在KYSE890和1170中,YAC799D2和807B4的杂交信号被检测为小HSR模式。另一方面,在KYSE70和450中信号数为约6到9。然而在这些细胞系中,比在KYSE150中所检测的扩增区域更大的区域得到扩增,因此在KYSE150中所测定的扩增子大小不可能狭小。

    因此,预测在9p23-24区域扩增子中的目的基因应出现在被YAC799D2和807B4所覆盖的相对狭小的区域中。

    2.DNA印迹分析和RNA印迹分析

    如同选自Whitehead研究所的基因组研究数据库,在9p23-24区域中的8种EST克隆子((1)GYG2、(2)GLDC、(3)IMAGE克隆子131865(GenBank保藏编号R24542)、(4)SLC1A1、(5)CSNK1G2、(6)JAK2、(7)IMAGE克隆子650495(GenBank保藏编号AA219360)和(8)IMAGE克隆子30354(GenBank保藏编号R18567);上述克隆(1)、(2)和(4)-(6)各是已知基因的部分以及(3)、(7)和(8)各是转录物的部分)都购自Research Genetics公司,并用作DNA印迹和RNA印迹分析的探针。

    将肿瘤DNA从通过标准方法(参考:Sambrook,J.等,MolucularCloning,A Laboratory Manual,2nd Ed.,Cold Spring Harbor LaboratoryPress,1989)培养的各个食道鳞状细胞癌细胞系中抽提出来。

    对于DNA印迹分析,10μg的DNA从各细胞系或正常淋巴细胞中抽提出来,并用EcoRI消化,然后在0.8%的琼脂糖凝胶上进行电泳,接着转移到聚酰胺膜(BIODYNE B,Nihon Pall产品)上。对于RNA印迹分析,20μg的总RNA从各细胞系中抽提出来,在1.0%琼脂糖/0.67M甲醛凝胶上进行电泳,接着转移到聚酰胺膜(Hybond-N+,Amersham Pharmacia Biotech产品)上。

    转移后,在适当条件下各膜与标记有[α32P]dCTP的各个EST探针杂交,洗涤后,根据上述Shinomiya的方法杂交膜用于科达X-OMAT胶片的曝光。

    为了比较不同人正常组织中的表达模式,将通过使用从12种不同组织(MTN-human 12泳道,Clontech产品)中抽提的RNA而制备的RNA印迹与标记有[α32P]dCTP的IMAGE克隆131865(GenBank保藏编号R24542)杂交。

    按照下列条件进行DNA印迹分析:

    1)预杂交和杂交缓冲液:含有变性鲑鱼精子DNA(200mg/ml)和人胎盘DNA(200mg/ml)的PEG/SDS溶液(7%PEG8000,10%SDS);

    2)预杂交条件:在65℃下连续搅拌12-16小时;

    3)杂交条件:在65℃下连续搅拌12-16小时;

    4)洗涤:用洗涤溶液1(2×SSC,0.1%SDS)在55℃下连续搅拌15分钟,然后用洗涤溶液2(0.1×SSC,0.1%SDS)在55℃下连续搅拌15分钟,接着用2×SSC漂洗。

    按照下列条件进行RNA印迹分析:

    1)预杂交和杂交缓冲液:采用ExpressHyb(Clontech);

    2)预杂交条件:在68℃下连续搅拌30分钟;

    3)杂交条件:在68℃下连续搅拌1小时;

    4)洗涤:用洗涤溶液1(2×SSC,0.1%SDS)在55℃下连续搅拌30分钟,然后用洗涤溶液2(0.1×SSC,0.1%SDS)在55℃下连续搅拌15分钟,接着用2×SSC漂洗。

    结果,在CGH和FISH测试中,利用三种EST探针即糖原素2(glycogenin 2)(GYG2)和位于YAC799D2上的甘氨酸脱氢酶(GLDC)以及IMAGE克隆131865(GenBank保藏编号R24542),对食道鳞状细胞癌细胞系进行DNA印迹分析,在5种已显示9p上拷贝数增加的细胞系中表现了扩增模式。

    与之相反的是,在KYSE150中用于区域外基因或未知转录物的探针即SLC1A1、一种溶质载体家族、JAK2、酪蛋白激酶1γ2(CSNK1G2)、IMAGE克隆650495(GenBank保藏编号AA219360)和IMAGE克隆350354(GenBank保藏编号R18567)并未显示扩增(对于这些探针,参照图1B)。

    根据食道鳞状细胞癌细胞系DNA和正常DNA之间的杂交信号的比较,在粗略估计扩增的程度后表明,首先的三种探针(GYG2、GLDC和IMAGE克隆131865)在KYSE150中显示了至少12倍的扩增,以及在其他四种细胞系中3-6倍的扩增得到证实(参见图3A)。

    图3A表示GASC1在食道鳞状细胞癌细胞系中的扩增。利用IMAGE克隆131865作为探针以上述方式通过DNA印迹获得该图。

    从该图可看出,在8种食道鳞状细胞癌细胞系中,正常人外周血淋巴细胞-衍生的DNA(N)上的信号要比KYSE70、150、450、890和1170弱,但强于1250和1260,并与110相当。这说明IMAGE克隆131865在KYSE70、150、450、890和1170中得到扩增。

    图3B显示RNA印迹分析的结果,利用IMAGE克隆131865(GASC1)或对照(GAPDH)作为探针,将如图3A中所用的同样8种食道鳞状细胞癌细胞系各个的总RNA进行杂交,以获得图3B中的结果。

    从该图中,显然GASC1基因在5种食道鳞状细胞癌细胞系中过量表达,所述5种细胞系在图3A中表现扩增(KYSE70、KYSE150、KYSE450、KYSE890和KYSE1170)。

    进一步,图4显示本发明基因在正常人组织中表达的检查结果。

    该图显示利用从12种不同的组织中抽提出来的RNA样品与标记有[α32P]dCTP的IMAGE克隆131865进行RNA印迹杂交所产生的结果。所用的此杂交程序与图3B中的情形相同。

    依据上述发现,进行如下讨论。

    对三种未知转录物(IMAGE克隆131865、650495和30354)的表达水平进行分析的RNA印迹的结果揭示,仅IMAGE克隆131865在9p23-24上显示扩增的细胞系中显示过量表达(参见图3B)。

    该结果说明IMAGE克隆131865是出现在这种扩增子内的部分候选扩增靶基因。所以,利用此克隆对全长基因进行克隆,并且对序列进行了测定。

    利用来自多种与IMAGE克隆131865杂交的人正常组织的RNA而产生的RNA印迹揭示出了在所有组织中的一种信号转录物4.5kb的表达(参见图4)。

    3.cDNA文库筛选和DNA序列测定

    利用寡帽(oligo cap)方法(Maruyama,K.等,Gene,138,171-174(1994))和ZAP-cDNA GigaPACK III Gold克隆试剂盒(stratagene)从胃癌细胞系(HSC39)中构建两个cDNA文库。

    利用IMAGE克隆131865(其部分序列是已知的,该序列具有GenBank保藏编号R24542)作为探针对各个文库进行筛选。

    作为筛选结果,分离到6个重叠的cDNA克隆,采用型号377 ABI的全自动测序仪(PE Biosystems)测定它们的DNA序列。以这种方式,找到了由4235个核苷酸组成的转录物。

    该转录物在大小上与通过RNA印迹分析所显示的转录物符合一致,因此,该cDNA估计是全长cDNA。

    在核酸序列分析后发现,用于转录起始的共有序列(Kozak规则)是高度保守的,因此,推测转录应在第147位核苷酸开始。在由聚腺苷酸延伸而持续的3′端发现了两个AATAA聚腺苷酸化信号。因此,推导蛋白的氨基酸序列被鉴定为包含如SEQ ID NO:1所示的1056个氨基酸残基的序列。

    来自GASC1的DNA序列(SEQ ID NO:2所示)的第10到第3140位核苷酸的区域显示显著同源于KIAA0780的cDNA部分(GenBank保藏编号AB018323)。

    此外,为了确认分离的克隆的序列,利用来自已显示过量表达的5种食道鳞状细胞癌细胞系(KYSE-70、KYSE-150、KYSE-450、KYSE-890和KYSE-1170)每一种的RNA作为模板,与两对引物一起,进行反转录PCR(RT-PCR),所述引物如下所示,根据从由筛选克隆131865而被分离的克隆中所测定的序列来制备。

    用于这种RT-PCR中的引物的序列显示在SEQ ID NO:6-SEQ IDNO:9中。

    引物W1f:SEQ ID NO:6

    引物W1r:SEQ ID NO:7

    引物W2f:SEQ ID NO:8

    引物W2r:SEQ ID NO:9

    RT(反转录)反应操作如下:将1μg的RNA与0.5μg的寡脱氧胸苷酸引物混合(总量10μl),在70℃变性处理10分钟后,加入4μl的5×反转录缓冲液(GIBCO)、1μl的核糖核酸酶抑制剂(TOYOBO)以及4μl的2.5mM dNTP(TAKARA)(总量为19μl)、再加入1μl的Superscript II(GIBCO),并在42℃下温育45分钟。

    利用GeneAmp PCR系统9700(Perkin-Elmer)进行PCR。反应操作如下:将2μl的10×ExTaq缓冲液(TAKARA)、1.0μl的2.5mMdNTP(TAKARA)、0.5μl的10μM各个引物以及0.5单位的ExTaq(TAKARA)加入到1μl的RT产物中,并使总量达到20μl。至于反应条件,起始在94℃下变性2分钟,接着进行25次循环,各循环包括94℃下30秒、58℃下30秒以及72℃下30秒,并进一步在72℃延伸7分钟。

    结果发现已产生单一条带产物,其具有预测的大小,通过测定序列确认是正确的。此外,包含DNA序列第238位到第638位的核苷酸的DNA片段利用W2f和W2r作为探针通过PCR生产,用[α32P]dCTP标记,并与被含有IMAGE克隆(R24542)的YAC799D2点缀的聚酰胺膜(BIODYNE B,Nihon Pall产品)杂交,于是检测信号,此外,扩增信号显示在5种肿瘤细胞系(KYSE70、KYSE150、KYSE450、KYSE890和KYSE1170)的所有DNA印迹上,所述5种细胞系在9p23-24区域中显示扩增。

    对估计的氨基酸序列的分析暗示该基因产物含有两个PHD指状结构和一个PX结构域(SEQ ID NO:1所示氨基酸序列中从第687位到第749位以及从第806位到第867位的序列是指状结构序列,而从第980位到第1047位的氨基酸序列是PX结构域序列)。

    利用PSORT II程序(参见:http://psort.nibb.ac.jp/form2.html),在对其胞内定位进行计算机预测中,一种典型的双联体核定位信号在GASC1蛋白第979位到第996位氨基酸上被检测到,这暗示了胞核中的定位。

    根据上述结果,含有PHD指状结构基元的GASC1基因,这些基元暗示其是候选的“致癌基因”,以及PX结构域被认为在各种肿瘤的发生和发展等中发挥重要作用,以及强烈暗示的是在染色体9p23-24区域中GASC1转录物的增加的表达后,所述基因应是与各种类型肿瘤的发生和/或发展相关的肿瘤伴随基因(包括候选致癌基因),也包括食道鳞状细胞癌细胞系。工业实用性

    本发明提供新基因,即GASC1基因,其具有调节各种细胞的生长和分化、肿瘤发生和转录活化等的活性。利用该基因,阐明与所述活性相关的疾病例如恶性肿瘤的病理学和/或实施其诊断和治疗等变为可能。

                            序列表<110>大塚制药株式会社(Otsuka Pharmaceutical Co.,Ltd.)<120>GASC1基因(GASC1 gene)<130>SCT022782-09<150>JP 2000-174946<151>2000-6-12<160>9<170>PatentIn Ver.2.0<210>1<211>1056<212>PRT<213><400>1Met Glu Val Ala Glu Val Glu Ser Pro Leu Asn Pro Ser Cys Lys Ile  1               5                  10                  15Met Thr Phe Arg Pro Ser Met Glu Glu Phe Arg Glu Phe Asn Lys Tyr

             20                  25                  30Leu Ala Tyr Met Glu Ser Lys Gly Ala His Arg Ala Gly Leu Ala Lys

         35                  40                  45Val Ile Pro Pro Lys Glu Trp Lys Pro Arg Gln Cys Tyr Asp Asp Ile

     50                  55                  60Asp Asn Leu Leu Ile Pro Ala Pro Ile Gln Gln Met Val Thr Gly Gln 65                  70                  75                  80Ser Gly Leu Phe Thr Gln Tyr Ash Ile Gln Lys Lys Ala Met Thr Val

                 85                  90                  95Lys Glu Phe Arg Gln Leu Ala Asn Ser Gly Lys Tyr Cys Thr Pro Arg

            100                 105                 110Tyr Leu Asp Tyr Glu Asp Leu Glu Arg Lys Tyr Trp Lys Asn Leu Thr

        115                 120                 125Phe Val Ala Pro Ile Tyr Gly Ala Asp Ile Asn Gly Ser Ile Tyr Asp

    130                 135                 140Glu Gly Val Asp Glu Trp Asn Ile Ala Arg Ile Asn Thr Val Leu Asp145                 150                 155                 160Val Val Glu Glu Glu Cys Gly Ile Ser Ile Glu Gly Val Asn Thr Pro

                165                 170                 175Tyr Leu Tyr Phe Gly Met Trp Lys Thr Thr Phe Ala Trp His Thr Glu

            180                 185                 190Asp Met Asp Leu Tyr Ser Ile Asn Tyr Leu His Phe Gly Glu Pro Lys

        195                 200                 205Ser Trp Tyr Ala Ile Pro Pro Glu His Gly Lys Arg Leu Glu Arg Leu

    210                 215                 220Ala Gln Gly Phe Phe Pro Ser Ser Ser Gln Gly Cys Asp Ala Phe Leu225                 230                 235                 240Arg His Lys Met Thr Leu Ile Ser Pro Ser Val Leu Lys Lys Tyr Gly

                245                 250                 255Ile Pro Phe Asp Lys Ile Thr Gln Glu Ala Gly Glu Phe Met Ile Thr

            260                 265                 270Phe Pro Tyr Gly Tyr His Ala Gly Phe Asn His Gly Phe Asn Cys Ala

        275                 280                 285Glu Ser Thr Asn Phe Ala Thr Val Arg Trp Ile Asp Tyr Gly Lys Val

    290                 295                 300Ala Lys Leu Cys Thr Cys Arg Lys Asp Met Val Lys Ile Ser Met Asp305                 310                 315                 320Ile Phe Val Arg Lys Phe Gln Pro Asp Arg Tyr Gln Leu Trp Lys Gln

                325                 330                 335Gly Lys Asp Ile Tyr Thr Ile Asp His Thr Lys Pro Thr Pro Ala Ser

            340                 345                 350Thr Pro Glu Val Lys Ala Trp Leu Gln Arg Arg Arg Lys Val Arg Lys

        355                 360                 365Ala Ser Arg Ser Phe Gln Cys Ala Arg Ser Thr Ser Lys Arg Pro Lys

    370                 375                 380Ala Asp Glu Glu Glu Glu Val Ser Asp Glu Val Asp Gly Ala Glu Val385                 390                 395                 400Pro Asn Pro Asp Ser Val Thr Asp Asp Leu Lys Val Ser Glu Lys Ser

                405                 410                 415Glu Ala Ala Val Lys Leu Arg Asn Thr Glu Ala Ser Ser Glu Glu Glu

            420                 425                 430Ser Ser Ala Ser Arg Met Gln Val Glu Gln Asn Leu Ser Asp His Ile

        435                 440                 445Lys Leu Ser Gly Asn Ser Cys Leu Ser Thr Ser Val Thr Glu Asp Ile

    450                 455                 460Lys Thr Glu Asp Asp Lys Ala Tyr Ala Tyr Arg Ser Val Pro Ser Ile465                 470                 475                 480Ser Ser Glu Ala Asp Asp Ser Ile Pro Leu Ser Thr Gly Tyr Glu Lys

                485                 490                 495Pro Glu Lys Ser Asp Pro Ser Glu Leu Ser Trp Pro Lys Ser Pro Glu

            500                 505                 510Ser Cys Ser Ser Val Ala Glu Ser Asn Gly Val Leu Thr Glu Gly Glu

        515                 520                 525Glu Ser Asp Val Glu Ser His Gly Asn Gly Leu Glu Pro Gly Glu Ile

    530                 535                 540Pro Ala Val Pro Ser Gly Glu Arg Asn Ser Phe Lys Val Pro Ser Ile545                 550                 555                 560Ala Glu Gly Glu Asn Lys Thr Ser Lys Ser Trp Arg His Pro Leu Ser

                565                 570                 575Arg Pro Pro Ala Arg Ser Pro Met Thr Leu Val Lys Gln Gln Ala Pro

            580                 585                 590Ser Asp Glu Glu Leu Pro Glu Val Leu Ser Ile Glu Glu Glu Val Glu

        595                 600                 605Glu Thr Glu Ser Trp Ala Lys Pro Leu Ile His Leu Trp Gln Thr Lys

    610                 615                 620Ser Pro Asn Phe Ala Ala Glu Gln Glu Tyr Asn Ala Thr Val Ala Arg625                 630                 635                 640Met Lys Pro His Cys Ala Ile Cys Thr Leu Leu Met Pro Tyr His Lys

                645                 650                 655Pro Asp Ser Ser Asn Glu Glu Asn Asp Ala Arg Trp Glu Thr Lys Leu

            660                 665                 670Asp Glu Val Val Thr Ser Glu Gly Lys Thr Lys Pro Leu Ile Pro Glu

        675                 680                 685Met Cys Phe Ile Tyr Ser Glu Glu Asn Ile Glu Tyr Ser Pro Pro Asn

    690                 695                 700Ala Phe Leu Glu Glu Asp Gly Thr Ser Leu Leu Ile Ser Cys Ala Lys705                 710                 715                 720Cys Cys Val Arg Val His Ala Ser Cys Tyr Gly Ile Pro Ser His Glu

                725                 730                 735Ile Cys Asp Gly Trp Leu Cys Ala Arg Cys Lys Arg Asn Ala Trp Thr

            740                 745                 750Ala Glu Cys Cys Leu Cys Asn Leu Arg Gly Gly Ala Leu Lys Gln Thr

        755                 760                 765Lys Asn Asn Arg Trp Ala His Val Met Cys Ala Val Ala Val Pro Glu

    770                 775                 780Val Arg Phe Thr Asn Val Pro Glu Arg Thr Gln Ile Asp Val Gly Arg785                 790                 795                 800Ile Pro Leu Gln Arg Leu Lys Leu Lys Cys Ile Phe Cys Arg His Arg

                805                 810                 815Val Lys Arg Val Ser Gly Ala Cys Ile Gln Cys Ser Tyr Gly Arg Cys

            820                 825                 830Pro Ala Ser Phe His Val Thr Cys Ala His Ala Ala Gly Val Leu Met

        835                 840                 845Glu Pro Asp Asp Trp Pro Tyr Val Val Asn Ile Thr Cys Phe Arg His

    850                 855                 860Lys Val Asn Pro Asn Val Lys Ser Lys Ala Cys Glu Lys Val Ile Ser865                 870                 875                 880Val Gly Gln Thr Val Ile Thr Lys His Arg Asn Thr Arg Tyr Tyr Ser

                885                 890                 895Cys Arg Val Met Ala Val Thr Ser Gln Thr Phe Tyr Glu Val Met Phe

            900                 905                 910Asp Asp Gly Ser Phe Ser Arg Asp Thr Phe Pro Glu Asp Ile Val Ser

        915                 920                 925Arg Asp Cys Leu Lys Leu Gly Pro Pro Ala Glu Gly Glu Val Val Gln

    930                 935                 940Val Lys Trp Pro Asp Gly Lys Leu Tyr Gly Ala Lys Tyr Phe Gly Ser945                 950                 955                 960Asn Ile Ala His Met Tyr Gln Val Glu Phe Glu Asp Gly Ser Gln Ile

                965                 970                 975Ala Met Lys Arg Glu Asp Ile Tyr Thr Leu Asp Glu Glu Leu Pro Lys

            980                 985                 990Arg Val Lys Ala Arg Phe Ser Thr Ala Ser Asp Met Arg Phe Glu Asp

        995                1000                1005Thr Phe Tyr Gly Ala Asp Ile Ile Gln Gly Glu Arg Lys Arg Gln Arg   1010                1015                1020Val Leu Ser Ser Arg Phe Lys Asn Glu Tyr Val Ala Asp Pro Val Tyr1025               1030                1035                1040Arg Thr Phe Leu Lys Ser Ser Phe Gln Lys Lys Cys Gln Lys Arg Gln

               1045                1050                1055<210>2<211>3168<212>DNA<213>人鳞状细胞癌细胞(KYSE)<400>2atggaggtgg ccgaggtgga aagtcctctg aaccccagct gtaagataat gaccttcaga 60ccctccatgg aggagttccg ggagttcaac aaataccttg catacatgga gtctaaagga 120gcccatcgtg cgggtcttgc aaaggtgatt cctcctaagg agtggaagcc aagacagtgc 180tatgatgaca ttgataattt gctcattcca gcaccaattc agcagatggt cacagggcag 240tcaggactgt tcactcagta caacatccag aaaaaagcga tgactgtgaa ggagttcagg 300cagctggcca acagtggcaa atattgtact ccaagatact tggattacga agatttggag 360cgcaagtact ggaagaactt aacttttgtg gcacctatct atggtgcaga tattaatggg 420agcatatatg atgagggtgt ggatgaatgg aacatagctc gcatcaatac agtcttggat 480gtggttgaag aagagtgtgg catttctatt gagggtgtaa ataccccata tctctatttt 540ggcatgtgga agaccacgtt tgcatggcac accgaagaca tggacctcta tagcattaat 600tatctccact ttggagagcc caagtcttgg tatgctatac ctccggagca tggaaaacga 660cttgaaagac tagctcaagg ttttttccca agcagctccc aagggtgtga tgcatttctt 720cgccacaaga tgacattgat ttctccatca gtattgaaga aatatggtat tccctttgac 780aagataaccc aggaggctgg agaattcatg atcactttcc catatggcta ccatgctggt 840tttaatcatg gtttcaactg tgcagaatct acaaattttg ctactgtcag atggattgac 900tatggaaaag ttgccaaatt gtgcacttgc aggaaagaca tggtgaagat ttcaatggat 960atctttgtga ggaaatttca gccagacaga tatcagcttt ggaaacaagg aaaggatata 1020tacaccattg atcacacgaa gcctactcca gcatccaccc ctgaagtaaa agcatggctg 1080cagaggagga ggaaagtaag aaaagcatcc cgaagcttcc agtgtgctag gtctacctct 1140aaaaggccta aggctgatga ggaagaggaa gtgtcagatg aagtcgatgg ggcagaggtc 1200cctaaccccg actcagtcac agatgacctc aaggtcagtg aaaagtcaga agcagcagtg 1260aagctgagga acacagaagc atcttcagaa gaagagtcat ctgctagcag gatgcaggtg 1320gagcagaatt tatcagatca tatcaaactc tcaggaaaca gctgcttaag tacatctgta 1380acagaagaca taaaaactga ggatgacaaa gcttatgcat atagaagtgt accttctata 1440tccagtgagg ctgatgattc cattccattg tctactggct atgagaagcc cgagaaatca 1500gacccatccg agctttcatg gccaaagtca cctgagtcat gctcatcagt ggcagagagt 1560aatggtgtgt taacagaggg agaagagagt gatgtggaga gccatgggaa tggccttgaa 1620cctggggaaa tcccagcggt ccccagtgga gagagaaata gcttcaaagt ccccagtata 1680gcagagggag agaacaaaac ctctaagagt tggcgccatc cacttagcag gcctccagca 1740agatctccga tgactcttgt gaagcagcag gcgccaagtg atgaagaatt gcctgaggtt 1800ctgtccattg aggaggaagt ggaagaaaca gagtcttggg cgaaacctct catccacctt 1860tggcagacga agtcccctaa cttcgcagct gagcaagagt ataatgcaac agtggccagg 1920atgaagccac actgtgccat ctgcactctg ctcatgccgt accacaagcc agatagcagc 1980aatgaagaaa atgatgctag atgggagaca aaattagatg aagtcgttac atcggaggga 2040aagactaagc ccctcatacc agagatgtgt tttatttata gtgaagaaaa tatagaatat 2100tctccaccca atgccttcct tgaagaggat ggaacaagtc tccttatttc ctgtgcaaag 2160tgctgcgtac gggttcatgc aagttgttat ggtattcctt ctcatgagat ctgtgatgga 2220tggctgtgtg cccggtgcaa aagaaatgcg tggacagcag aatgctgtct ctgcaatttg 2280agaggaggtg ctcttaagca aacgaagaac aataggtggg cccatgtcat gtgcgccgtt 2340gcggtcccag aagttcgatt cactaatgtc ccagaaagga cacaaataga tgtaggcaga 2400atacctttac agaggttaaa attgaaatgc atcttctgca gacaccgggt taagagggtc 2460tctggagcct gcatccagtg ttcctacggt cgctgcccgg cctccttcca tgtcacttgt 2520gcccatgctg ctggggtact gatggagcct gatgattggc cttatgtggt gaacattaca 2580tgctttcgac ataaggtcaa ccccaacgtg aagtccaagg cttgcgagaa ggtcatttcc 2640gtgggtcaaa cggtcatcac gaagcatcgg aacacccggt attacagttg cagagtgatg 2700gctgtgacat cgcagacctt ctatgaggtc atgtttgatg atggctcctt tagcagagac 2760acatttcctg aggatatcgt gagccgagac tgtctgaagc tgggcccacc tgctgaggga 2820gaagtcgtcc aagtcaagtg gcccgatggc aaactctatg gagcaaaata ttttggatca 2880aatattgccc acatgtacca ggttgagttt gaagatggat cccagatagc aatgaagaga 2940gaggacatct acactttaga tgaagagtta cccaagagag tgaaagctcg attttccaca 3000gcctctgaca tgcgatttga agacacgttt tatggagcag acattatcca aggggagaga 3060aagagacaaa gagtgctgag ctccaggttt aagaatgaat atgtggccga ccctgtatac 3120cgcacttttt tgaagagctc tttccagaag aagtgccaga agagacag              3168<210>3<211>4235<212>DNA<213>人鳞状细胞癌细胞(KYSE)<220><221>CDS<222>(147)..(3314)<400>3cggcacgaga acagctgtca cctagtgcgg aacaagtctc ccaaatttcc caaatctccc 60tgggccggag gccactgtct tctcttcctc ctccaccgag tcgtgctctc gccccaaccc 120gcgcgccaga cactgcccta accatc atg gag gtg gcc gag gtg gaa agt cct  173

                             Met Glu Val Ala Glu Val Glu Ser Pro

                               1               5ctg aac ccc agc tgt aag ata atg acc ttc aga ccc tcc atg gag gag    221Leu Asn Pro Ser Cys Lys Ile Met Thr Phe Arg Pro Ser Met Glu Glu 10                  15                  20                  25ttc cgg gag ttc aac aaa tac ctt gca tac atg gag tct aaa gga gcc    269Phe Arg Glu Phe Asn Lys Tyr Leu Ala Tyr Met Glu Ser Lys Gly Ala

                 30                  35                  40cat cgt gcg ggt ctt gca aag gtg att cct cct aag gag tgg aag cca    317His Arg Ala Gly Leu Ala Lys Val Ile Pro Pro Lys Glu Trp Lys Pro

             45                  50                  55aga cag tgc tat gat gac att gat aat ttg ctc att cca gca cca att    365Arg Gln Cys Tyr Asp Asp Ile Asp Asn Leu Leu Ile Pro Ala Pro Ile

         60                  65                  70cag cag atg gtc aca ggg cag tca gga ctg ttc act cag tac aac atc    413Gln Gln Met Val Thr Gly Gln Ser Gly Leu Phe Thr Gln Tyr Asn Ile

     75                  80                  85cag aaa aaa gcg atg act gtg aag gag ttc agg cag ctg gcc aac agt    461Gln Lys Lys Ala Met Thr Val Lys Glu Phe Arg Gln Leu Ala Asn Ser 90                  95                 100                 105ggc aaa tat tgt act cca aga tac ttg gat tac gaa gat ttg gag cgc    509Gly Lys Tyr Cys Thr Pro Arg Tyr Leu Asp Tyr Glu Asp Leu Glu Arg

                110                 115                 120aag tac tgg aag aac tta act ttt gtg gca cct atc tat ggt gca gat    557Lys Tyr Trp Lys Asn Leu Thr Phe Val Ala Pro Ile Tyr Gly Ala Asp

            125                 130                 135att aat ggg agc ata tat gat gag ggt gtg gat gaa tgg aac ata gct    605Ile Asn Gly Ser Ile Tyr Asp Glu Gly Val Asp Glu Trp Asn Ile Ala

        140                 145                 150cgc atc aat aca gtc ttg gat gtg gtt gaa gaa gag tgt ggc att tct    653Arg Ile Asn Thr Val Leu Asp Val Val Glu Glu Glu Cys Gly Ile Ser

    155                 160                 165att gag ggt gta aat acc cca tat ctc tat ttt ggc atg tgg aag acc    701Ile Glu Gly Val Asn Thr Pro Tyr Leu Tyr Phe Gly Met Trp Lys Thr170                 175                 180                 185acg ttt gca tgg cac acc gaa gac atg gac ctc tat agc att aat tat    749Thr Phe Ala Trp His Thr Glu Asp Met Asp Leu Tyr Ser Ile Asn Tyr

                190                 195                 200ctc cac ttt gga gag ccc aag tct tgg tat gct ata cct ccg gag cat    797Leu His Phe Gly Glu Pro Lys Ser Trp Tyr Ala Ile Pro Pro Glu His

            205                 210                 215gga aaa cga ctt gaa aga cta gct caa ggt ttt ttc cca agc agc tcc    845Gly Lys Arg Leu Glu Arg Leu Ala Gln Gly Phe Phe Pro Ser Ser Ser

        220                 225                 230caa ggg tgt gat gca ttt ctt cgc cac aag atg aca ttg att tct cca    893Gln Gly Cys Asp Ala Phe Leu Arg His Lys Met Thr Leu Ile Ser Pro

    235                 240                 245tca gta ttg aag aaa tat ggt att ccc ttt gac aag ata acc cag gag    941Ser Val Leu Lys Lys Tyr Gly Ile Pro Phe Asp Lys Ile Thr Gln Glu250                 255                 260                 265gct gga gaa ttc atg atc act ttc cca tat ggc tac cat gct ggt ttt    989Ala Gly Glu Phe Met Ile Thr Phe Pro Tyr Gly Tyr His Ala Gly Phe

                270                 275                 280aat cat ggt ttc aac tgt gca gaa tct aca aat ttt gct act gtc aga    1037Asn His Gly Phe Asn Cys Ala Glu Ser Thr Asn Phe Ala Thr Val Arg

            285                 290                 295tgg att gac tat gga aaa gtt gcc aaa ttg tgc act tgc agg aaa gac    1085Trp Ile Asp Tyr Gly Lys Val Ala Lys Leu Cys Thr Cys Arg Lys Asp

        300                 305                 310atg gtg aag att tca atg gat atc ttt gtg agg aaa ttt cag cca gac    1133Met Val Lys Ile Ser Met Asp Ile Phe Val Arg Lys Phe Gln Pro Asp

    315                 320                 325aga tat cag ctt tgg aaa caa gga aag gat ata tac acc att gat cac    1181Arg Tyr Gln Leu Trp Lys Gln Gly Lys Asp Ile Tyr Thr Ile Asp His330                 335                 340                 345acg aag cct act cca gca tcc acc cct gaa gta aaa gca tgg ctg cag    1229Thr Lys Pro Thr Pro Ala Ser Thr Pro Glu Val Lys Ala Trp Leu Gln

                350                 355                 360agg agg agg aaa gta aga aaa gca tcc cga agc ttc cag tgt gct agg    1277Arg Arg Arg Lys Val Arg Lys Ala Ser Arg Ser Phe Gln Cys Ala Arg

            365                 370                 375tct acc tct aaa agg cct aag gct gat gag gaa gag gaa gtg tca gat    1325Ser Thr Ser Lys Arg Pro Lys Ala Asp Glu Glu Glu Glu Val  Ser Asp

        380                 385                 390gaa gtc gat ggg gca gag gtc cct aac ccc gac tca gtc aca gat gac    1373Glu Val Asp Gly Ala Glu Val Pro Asn Pro Asp Ser Val Thr Asp Asp

    395                 400                 405ctc aag gtc agt gaa aag tca gaa gca gca gtg aag ctg agg aac aca    1421Leu Lys Val Ser Glu Lys Ser Glu Ala Ala Val Lys Leu Arg Asn Thr410                 415                 420                 425gaa gca tct tca gaa gaa gag tca tct gct agc agg atg cag gtg gag    1469Glu Ala Ser Ser Glu Glu Glu Ser Ser Ala Ser Arg Met Gln Val Glu

                430                 435                 440cag aat tta tca gat cat atc aaa ctc tca gga aac agc tgc tta agt    1517Gln Asn Leu Ser Asp His Ile Lys Leu Ser Gly Asn Ser Cys Leu Ser

            445                 450                 455aca tct gta aca gaa gac ata aaa act gag gat gac aaa gct tat gca    1565Thr Ser Val Thr Glu Asp Ile Lys Thr Glu Asp Asp Lys Ala Tyr Ala

        460                 465                 470tat aga agt gta cct tct ata tcc agt gag gct gat gat tcc att cca    1613Tyr Arg Ser Val Pro Ser Ile Ser Ser Glu Ala Asp Asp Ser Ile Pro

    475                 480                 485ttg tct act ggc tat gag aag ccc gag aaa tca gac cca tcc gag ctt    1661Leu Ser Thr Gly Tyr Glu Lys Pro Glu Lys Ser Asp Pro Ser Glu Leu490                 495                 500                 505tca tgg cca aag tca cct gag tca tgc tca tca gtg gca gag agt aat    1709Ser Trp Pro Lys Ser Pro Glu Ser Cys Ser Ser Val Ala Glu Ser Asn

                510                 515                 520ggt gtg tta aca gag gga gaa gag agt gat gtg gag agc cat ggg aat    1757Gly Val Leu Thr Glu Gly Glu Glu Ser Asp Val Glu Ser His Gly Asn

            525                 530                 535ggc ctt gaa cct ggg gaa atc cca gcg gtc ccc agt gga gag aga aat    1805Gly Leu Glu Pro Gly Glu Ile Pro Ala Val Pro Ser Gly Glu Arg Asn

        540                 545                 550agc ttc aaa gtc ccc agt ata gca gag gga gag aac aaa acc tct aag    1853Ser Phe Lys Val Pro Ser Ile Ala Glu Gly Glu Asn Lys Thr Ser Lys

    555                 560                 565agt tgg cgc cat cca ctt agc agg cct cca gca aga tct ccg atg act    190lSer Trp Arg His Pro Leu Ser Arg Pro Pro Ala Arg Ser Pro Met Thr570                 575                 580                 585ctt gtg aag cag cag gcg cca agt gat gaa gaa ttg cct gag gtt ctg    1949Leu Val Lys Gln Gln Ala Pro Ser Asp Glu Glu Leu Pro Glu Val Leu

                590                 595                 600tcc att gag gag gaa gtg gaa gaa aca gag tct tgg gcg aaa cct ctc    1997Ser Ile Glu Glu Glu Val Glu Glu Thr Glu Ser Trp Ala Lys Pro Leu

            605                 610                 615atc cac ctt tgg cag acg aag tcc cct aac ttc gca gct gag caa gag    2045Ile His Leu Trp Gln Thr Lys Ser Pro Asn Phe Ala Ala Glu Gln Glu

        620                 625                 630tat aat gca aca gtg gcc agg atg aag cca cac tgt gcc atc tgc act    2093Tyr Asn Ala Thr Val Ala Arg Met Lys Pro His Cys Ala Ile Cys Thr

    635                 640                 645ctg ctc atg ccg tac cac aag cca gat agc agc aat gaa gaa aat gat    2141Leu Leu Met Pro Tyr His Lys Pro Asp Ser Ser Asn Glu Glu Asn Asp650                 655                 660                 665gct aga tgg gag aca aaa tta gat gaa gtc gtt aca tcg gag gga aag    2189Ala Arg Trp Glu Thr Lys Leu Asp Glu Val Val Thr Ser Glu Gly Lys

                670                 675                 680act aag ccc ctc ata cca gag atg tgt ttt att tat agt gaa gaa aat    2237Thr Lys Pro Leu Ile Pro Glu Met Cys Phe Ile Tyr Ser Glu Glu Asn

            685                 690                 695ata gaa tat tct cca ccc aat gcc ttc ctt gaa gag gat gga aca agt    2285Ile Glu Tyr Ser Pro Pro Asn Ala Phe Leu Glu Glu Asp Gly Thr Ser

        700                 705                 710ctc ctt att tcc tgt gca aag tgc tgc gta cgg gtt cat gca agt tgt    2333Leu Leu Ile Ser Cys Ala Lys Cys Cys Val Arg Val His Ala Ser Cys

    715                 720                 725tat ggt att cct tct cat gag atc tgt gat gga tgg ctg tgt gcc cgg    2381Tyr Gly Ile Pro Ser His Glu Ile Cys Asp Gly Trp Leu Cys Ala Arg730                 735                 740                 745tgc aaa aga aat gcg tgg aca gca gaa tgc tgt ctc tgc aat ttg aga    2429Cys Lys Arg Asn Ala Trp Thr Ala Glu Cys Cys Leu Cys Asn Leu Arg

                750                 755                 760gga ggt gct ctt aag caa acg aag aac aat agg tgg gcc cat gtc atg    2477Gly Gly Ala Leu Lys Gln Thr Lys Asn Asn Arg Trp Ala His Val Met

            765                 770                 775tgc gcc gtt gcg gtc cca gaa gtt cga ttc act aat gtc cca gaa agg    2525Cys Ala Val Ala Val Pro Glu Val Arg Phe Thr Asn Val Pro Glu Arg

        780                 785                 790aca caa ata gat gta ggc aga ata cct tta cag agg tta aaa ttg aaa    2573Thr Gln Ile Asp Val Gly Arg Ile Pro Leu Gln Arg Leu Lys Leu Lys

    795                 800                 805tgc atc ttc tgc aga cac cgg gtt aag agg gtc tct gga gcc tgc atc    262lCys Ile Phe Cys Arg His Arg Val Lys Arg Val Ser Gly Ala Cys Ile810                 815                 820                 825cag tgt tcc tac ggt cgc tgc ccg gcc tcc ttc cat gtc act tgt gcc    2669Gln Cys Ser Tyr Gly Arg Cys Pro Ala Ser Phe His Val Thr Cys Ala

                830                 835                 840cat gct gct ggg gta ctg atg gag cct gat gat tgg cct tat gtg gtg    2717His Ala Ala Gly Val Leu Met Glu Pro Asp Asp Trp Pro Tyr Val Val

            845                 850                 855aac att aca tgc ttt cga cat aag gtc aac ccc aac gtg aag tcc aag    2765Asn Ile Thr Cys Phe Arg His Lys Val Asn Pro Asn Val Lys Ser Lys

        860                 865                 870gct tgc gag aag gtc att tcc gtg ggt caa acg gtc atc acg aag cat    2813Ala Cys Glu Lys Val Ile Ser Val Gly Gln Thr Val Ile Thr Lys His

    875                 880                 885cgg aac acc cgg tat tac agt tgc aga gtg atg gct gtg aca tcg cag    2861Arg Asn Thr Arg Tyr Tyr Ser Cys Arg Val Met Ala Val Thr Ser Gln890                 895                 900                 905acc ttc tat gag gtc atg ttt gat gat ggc tcc ttt agc aga gac aca    2909Thr Phe Tyr Glu Val Met Phe Asp Asp Gly Ser Phe Ser Arg Asp Thr

                910                 915                 920ttt cct gag gat atc gtg agc cga gac tgt ctg aag ctg ggc cca cct    2957Phe Pro Glu Asp Ile Val Ser Arg Asp Cys Leu Lys Leu Gly Pro Pro

            925                 930                 935gct gag gga gaa gtc gtc caa gtc aag tgg ccc gat ggc aaa ctc tat    3005Ala Glu Gly Glu Val Val Gln Val Lys Trp Pro Asp Gly Lys Leu Tyr

        940                 945                 950gga gca aaa tat ttt gga tca aat att gcc cac atg tac cag gtt gag   3053Gly Ala Lys Tyr Phe Gly Ser Asn Ile Ala His Met Tyr Gln Val Glu

    955                 960                 965ttt gaa gat gga tcc cag ata gca atg aag aga gag gac atc tac act   3101Phe Glu Asp Gly Ser Gln Ile Ala Met Lys Arg Glu Asp Ile Tyr Thr970                 975                 980                 985tta gat gaa gag tta ccc aag aga gtg aaa gct cga ttt tcc aca gcc   3149Leu Asp Glu Glu Leu Pro Lys Arg Val Lys Ala Arg Phe Ser Thr Ala

                990                 995                1000tct gac atg cga ttt gaa gac acg ttt tat gga gca gac att atc caa   3197Ser Asp Met Arg Phe Glu Asp Thr Phe Tyr Gly Ala Asp Ile Ile Gln

           1005                1010                1015ggg gag aga aag aga caa aga gtg ctg agc tcc agg ttt aag aat gaa   3245Gly Glu Arg Lys Arg Gln Arg Val Leu Ser Ser Arg Phe Lys Asn Glu

       1020                1025                1030tat gtg gcc gac cct gta tac cgc act ttt ttg aag agc tct ttc cag   3293Tyr Val Ala Asp Pro Val Tyr Arg Thr Phe Leu Lys Ser Ser Phe Gln   1035                1040                1045aag aag tgc cag aag aga cag tagtctgcat acatcgctgc aggccacaga      3344Lys Lys Cys Gln Lys Arg Gln1050               1055gcagcttggg ttggaaaaga gaagatgaag ggacatcctt ggggctgtgc cgtgagattt 3404gctggcatag gtgacagggt gtgtctctga cagtggtaaa tcgggtttcc agagtttggt 3464caccaaaaat acaaaataca cacaatgaat tggacgcagc aatctgaaat catctctagt 3524cttgctttca cttgtgagca gttgtcttct atgatcccaa agaagttttc taagtgaaag 3584gaaatactag tgaatcaccc acaaggaaaa gccactgcca cagaggaggc gggtcccctt 3644gtgcggctta gggccctgtc aggaaacaca cggggacctc tctctctagc tccagcaggt 3704ggcacctcgg tacccagcgg gtagggcgat aatttatata ttttccacag tcagggaagg 3764actctcactt atttgtttca aattgcagtt tttataaaac atttttaaaa cacaaatggc 3824atgtatgcta atgagattta cccgtgtgct atctgtattt cccttgtaca gaacttttac 3884atttttgaat attcctatta cttttgattg tgtctgatgg gaactgagtt gttggccttt 3944gtgaaatgaa atttttggct cttgagaaag aattcttatg aattgttatg cgaattttat 4004atatttaaag agggagatct ggggctgtta tttttaaaca ctttttttca taatacatat 4064tccgagtaga tatttataaa atatatgttt ctttcattat gtgtttgtaa aattagagtt 4124taaataaata tgctttgatg catagttttg aactaatgta acatgatttt tcttttttaa 4184aacagcctga aaatgtacta gtgtttaaaa ataaagattt ccattttctc caaaaaaaaa 4244aaaaaaaaa                                                         4253<210>4<211>24<212>DNA<213>人工序列<223>引物2484<400>4aggagtgagc caccgcaccc agcc                                     24<210>5<211>35<212>DNA<213>人工序列<223>引物PDJ34<400>5tgagcyrwga tyryrccayt gcactccagc ctggg                         35<210>6<211>19<212>DNA<213>人工序列<223>引物W1f<400>6cgggttaaga gggtctctg                                           19<210>7<211>20<212>DNA<213>人工序列<223>引物W1r<400>7ggatgtccct tcatcttctc                                          20<210>8<211>22<212>DNA<213>人工序列<223>引物W2f<400>8aataccttgc atacatggag tc                                       22<210>9<211>22<212>DNA<213>人工序列<223>引物W2r<400>9cttcttcaac cacatccaag ac                                       22

GASCI基因.pdf_第1页
第1页 / 共73页
GASCI基因.pdf_第2页
第2页 / 共73页
GASCI基因.pdf_第3页
第3页 / 共73页
点击查看更多>>
资源描述

《GASCI基因.pdf》由会员分享,可在线阅读,更多相关《GASCI基因.pdf(73页珍藏版)》请在专利查询网上搜索。

本发明提供例如基因,其包括编码具有SEQ ID NO:1所示氨基酸序列的多肽的多核苷酸。该基因显示在9p2324区域中的扩增,具有PX结构域和PHD指状结构基元,在细胞生长和分化以及肿瘤发生中发挥了重要作用,以及用于阐明各种由蛋白导致的疾病的病理学,所述蛋白参与恶性肿瘤等中的细胞分化,并用于这些疾病的诊断和治疗。。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 化学;冶金 > 生物化学;啤酒;烈性酒;果汁酒;醋;微生物学;酶学;突变或遗传工程


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1