表达盒.pdf

上传人:r7 文档编号:39934 上传时间:2018-01-17 格式:PDF 页数:89 大小:10.19MB
返回 下载 相关 举报
摘要
申请专利号:

CN201280069001.0

申请日:

2012.12.05

公开号:

CN104093834A

公开日:

2014.10.08

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):C12N 15/09申请日:20121205|||公开

IPC分类号:

C12N15/09

主分类号:

C12N15/09

申请人:

格兰马克药品股份有限公司

发明人:

D·吕舍尔; C·埃比谢尔-古米; P·莫莱迪; M·博特施格尔

地址:

瑞士拉绍德封

优先权:

2011.12.07 US 61/567,675

专利代理机构:

北京市中咨律师事务所 11247

代理人:

史文静;黄革生

PDF下载: PDF下载
内容摘要

本发明涉及用于表达编码多肽的多核苷酸序列的表达盒。

权利要求书

1.  一种表达盒,其包含启动子、编码多肽的多核苷酸序列和表达增强元件,其中表达增强元件包含真核甘油醛3-磷酸脱氢酶(GAPDH)启动子下游的非翻译性基因组DNA序列,其中由多核苷酸序列编码的多肽不是GAPDH,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列始于跨越核苷酸位置约+1至核苷酸位置约+7000的区域内部,其中核苷酸位置是相对于GAPDH mRNA转录起始的,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列的长度是约100至约15000个核苷酸。

2.
  根据权利要求所述1的表达盒,其中表达盒还包含真核GAPDH启动子上游的非翻译性基因组DNA序列,其中真核GAPDH启动子上游的非翻译性基因组DNA序列始于跨越约真核GAPDH启动子的5'末端至核苷酸位置约-3500的区域内部,其中核苷酸位置是相对于GAPDH mRNA转录起始,并且其中真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是约100至约15000个核苷酸。

3.
  一种表达盒,其包含启动子、编码多肽的多核苷酸序列和真核GAPDH启动子上游的非翻译性基因组DNA序列,其中由多核苷酸序列编码的多肽不是GAPDH,并且其中真核GAPDH启动子上游的非翻译性基因组DNA序列始于跨越约真核GAPDH启动子的5'末端至核苷酸位置约-3500的区域内部,其中核苷酸位置是相对于GAPDH mRNA转录起始的,其中真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是100至约15000个核苷酸,条件是表达盒不包含真核GAPDH启动子或其片段。

4.
  根据权利要求3所述的表达盒,其中表达盒还包含真核GAPDH启动子下游的非翻译性基因组DNA序列,其中真核GAPDH启动子下游的非翻译性基因组DNA序列始于跨越核苷酸位置约+1至核苷酸位置约+7000的区域内部,其中核苷酸位置是相对于GAPDH mRNA转录起始的,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列的长度是约100至约15000个核苷酸。

5.
  根据权利要求1至4中任一项所述的表达盒,其中真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列未与编码多肽的多核苷酸序列有效连接。

6.
  根据权利要求1至4中任一项所述的表达盒,其中表达盒还包含多聚腺苷化位点。

7.
  根据权利要求1或4所述的表达盒,其中真核GAPDH启动子下游的非翻译性基因组DNA序列的长度是约10个核苷酸并且在其最大情况下延伸至IFF01基因的倒数第二内含子或延伸至其部份。

8.
  根据权利要求1或4所述的表达盒,其中真核GAPDH启动子下游的非翻译性基因组DNA序列始于真核GAPDH多聚腺苷化位点的下游并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列的长度是至少约100个核苷酸并且在其最大情况下延伸至IFF01基因的倒数第二内含子。

9.
  根据权利要求2所述的表达盒,其中真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是至少约100个核苷酸并且在其最大情况下延伸至NCAPD2基因的起始密码子。

10.
  根据权利要求2所述的表达盒,其中真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是至少约100个核苷酸并且在其最大情况下延伸至NCAPD2基因的倒数第三内含子。

11.
  根据权利要求3所述的表达盒,其中真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是至少100个核苷酸并且在其最大情况下延伸至NCAPD2基因的起始密码子。

12.
  根据权利要求3所述的表达盒,其中真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是至少100个核苷酸并且在其最大情况下延伸至NCAPD2基因的倒数第三内含子。

13.
  根据权利要求1至4中任一项所述的表达盒,其中真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列是哺乳动物源的。

14.
  根据权利要求13所述的表达盒,其中真核GAPDH启动子下游 和/或上游的非翻译性基因组DNA序列是啮齿类源或人源的。

15.
  根据权利要求1或4所述的表达盒,其中真核GAPDH启动子下游的非翻译性基因组DNA序列包含选自SEQ ID NOs:8和21的核苷酸序列或其片段。

16.
  根据权利要求1或4所述的表达盒,其中真核GAPDH启动子下游的非翻译性基因组DNA序列包含与选自SEQ ID NOs:8和21的核苷酸序列或其片段互补的核苷酸序列。

17.
  根据权利要求1或4所述的表达盒,其中真核GAPDH启动子下游的非翻译性基因组DNA序列包含与选自SEQ ID NOs:8和21的核苷酸序列或其片段相同至少80%的核苷酸序列。

18.
  根据权利要求2或3所述的表达盒,其中真核GAPDH启动子上游的非翻译性基因组DNA序列包含选自SEQ ID NO:7、9、10、11、12、13、14、15、16、20、22、23、24、25、26、27和28的核苷酸序列或其片段。

19.
  根据权利要求18所述的表达盒,其中选自SEQ ID NOs:7、9、10、11、12、13、14、15、16、20、22、23、24、25、26、27和28的核苷酸序列或其片段包含5个或更少的核酸修饰。

20.
  根据权利要求2或3所述的表达盒,其中真核GAPDH启动子上游的非翻译性基因组DNA序列包含与选自SEQ ID NO:7、9、10、11、12、13、14、15、16、20、22、23、24、25、26、27和28的核苷酸序列或其片段互补的核苷酸序列。

21.
  根据权利要求2或3所述的表达盒,其中真核GAPDH启动子上游的非翻译性基因组DNA序列包含与选自SEQ ID NO:7、9、10、11、12、13、14、15、16、20、22、23、24、25、26、27和28的核苷酸序列或其片段相同至少80%的核苷酸序列。

22.
  根据权利要求1至4中任一项所述的表达盒,其中启动子和编码多肽的多核苷酸序列是有效连接的。

23.
  根据权利要求1或4所述的表达盒,其中真核GAPDH启动子下 游的非翻译性基因组DNA序列以与编码多肽的多核苷酸序列相同的方向定向。

24.
  根据权利要求1或4所述的表达盒,其中真核GAPDH启动子下游的非翻译性基因组DNA序列相对于编码多肽的多核苷酸序列以相反方向定向。

25.
  根据权利要求2或3所述的表达盒,其中真核GAPDH启动子上游的非翻译性基因组DNA序列以与编码多肽的多核苷酸序列相同的方向定向。

26.
  根据权利要求2或3所述的表达盒,其中真核GAPDH启动子上游的非翻译性基因组DNA序列相对于编码多肽的多核苷酸序列以相反方向定向。

27.
  根据权利要求1至4中任一项所述的表达盒,其中启动子选自SV40启动子、MPSV启动子、小鼠CMV、人tk、人CMV、大鼠CMV、人EF1α、中国仓鼠EF1α、人GAPDH、杂合启动子,所述杂合启动子包括MYC、HYK和CX启动子。

28.
  根据权利要求1至4中任一项所述的表达盒,其中多肽选自抗体、抗体片段或抗体衍生物。

29.
  根据权利要求6所述的表达盒,其中多聚腺苷化位点选自BGH poly(A)和SV40poly(A)。

30.
  根据权利要求1至4中任一项所述的表达盒,还包含选自额外的启动子、增强子、转录控制元件和选择标记的遗传元件。

31.
  根据权利要求30所述的表达盒,其中遗传元件是选择标记,其中在编码选择标记的多核苷酸序列中所含的CpG位点的含量是45或更小。

32.
  表达载体,其包含根据权利要求1至29中任一项所述的表达盒。

33.
  表达载体,其依次包含:
a)真核GAPDH启动子上游和/或下游的非翻译性基因组DNA序列
b)启动子
c)编码多肽的多核苷酸序列
d)多聚腺苷化位点
e)增强子
f)真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列,或
a)真核GAPDH启动子上游和/或下游的非翻译性基因组DNA序列
b)增强子
c)启动子
d)编码多肽的多核苷酸序列
e)多聚腺苷化位点
f)真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列,或
a)增强子
b)真核GAPDH上游和/或下游的非翻译性基因组DNA序列
c)启动子
d)编码多肽的多核苷酸序列
e)多聚腺苷化位点
f)真核GAPDH下游和/或上游的非翻译性基因组DNA序列,
其中包含增强子是任选的,并且其中由多核苷酸序列编码的多肽不是GAPDH,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列始于跨越核苷酸位置约+1至核苷酸位置约+7000的区域内部,其中核苷酸位置是相对于GAPDH mRNA转录起始的,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列的长度是约100至约15000个核苷酸并且其中真核GAPDH启动子上游的非翻译性基因组DNA序列始于跨越约真核GAPDH启动子的5'末端至核苷酸位置约-3500的区域内部,其中核苷酸位置是相对于GAPDH mRNA转录起始的,并且其中真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是约100至约15000个核苷酸,条件是如果a)或b)是真核GAPDH上游的非翻译性基因组DNA序列,则f)是真核GAPDH下游的非翻译性基因组DNA序列,并且如果a)或b)是真核GAPDH下游的非翻译性基因组DNA序列,则f)是真核GAPDH上游的非翻译性基因组DNA序列。

34.
  根据权利要求32或33所述的表达载体,其中表达载体还包含选自额外的启动子、增强子,转录控制单元、复制起点和选择标记的遗传元件。

35.
  根据权利要求32或33所述的表达载体,其中表达载体还包含复制起点和选择标记,其中表达载体的编码复制起点和选择标记的多核苷酸序列中所含的CpG位点的含量是200或更小。

36.
  宿主细胞,其包含根据权利要求1至31中任一项所述的表达盒或根据权利要求32至35中任一项所述的表达载体。

37.
  根据权利要求1至31中任一项所述的表达盒或根据权利要求32至35中任一项所述的表达载体,用于作为用于治疗疾病的药物。

38.
  根据权利要求1至31中任一项所述的表达盒或根据权利要求32至35中任一项所述的表达载体,用于基因疗法。

39.
  用于表达多肽的体外方法,包括用根据权利要求1至31中任一项所述的表达盒或根据权利要求32至35中任一项所述的表达载体转染宿主细胞并回收多肽。

40.
  根据权利要求39所述的方法,其中将表达盒或表达载体是稳定转染。

41.
  根据权利要求39所述的方法,其中将表达盒或表达载体是瞬时转染。

42.
  根据权利要求1至31中任一项所述的表达盒或根据权利要求32至35中任一项所述的表达载体的用途,用于从哺乳动物宿主细胞表达异源多肽。

说明书

表达盒
相关申请
本申请要求2011年12月7日递交的US临时申请号61/567,675的权益;所有这些通过引用以其整体并入本文。
发明领域
本发明涉及用于表达编码多肽的多核苷酸序列的表达盒。本发明是还涉及包含表达盒的载体和宿主细胞以及表达盒用于从宿主细胞产生多肽的用途。
背景技术
用于产生重组多肽的表达系统是现有技术中熟知的并且由例如,Marino MH(1989)Biopharm,2:18-33;Goeddel DV等人,(1990)Methods Enzymol 185:3-7;Wurm F和Bernard A(1999)Curr Opin Biotechnol 10:156-159描述。用于药物应用中的多肽优选地在哺乳动物细胞如CHO细胞、NSO细胞、SP2/0细胞、COS细胞、HEK细胞、BHK细胞等中产生。用于此目的的表达载体的必需元件通常选自包含原核复制起点和原核选择标记,任选地真核选择标记的原核质粒增殖单元,例如大肠杆菌(E.coli),和用于表达一个或多个目的结构基因的一个或多个表达盒,所述表达盒每一者包含启动子、编码多肽的多核苷酸序列和任选地转录终止子,所述转录终止子包含多聚腺苷化信号。为了在哺乳动物细胞中瞬时表达,可以包括哺乳动物复制起点,如SV40Ori或OriP。作为启动子,可以选择组成型或诱导型启动子。为了优化的转录,可以在5'非翻译区中包含Kozak序列。为了mRNA加工,尤其mRNA剪接和转录终止,取决于结构基因的组织状况(外显子/内含子组织状况),可以包括mRNA剪接信号,以及多聚腺苷 化信号。基因的表达以瞬时方式或使用稳定的细胞系进行。生产细胞系中多肽的稳定和高度表达的水平对于产生重组多肽的整个过程至关重要。在过去数年间,对生物分子如蛋白质并且特别对抗体或抗体片段的需求已经显著地增加。高成本和不良产率已经是生物分子可用性方面的限制因素并且它已经成为发展以工业规模增加所需生物分子的产量的稳健工艺的主要挑战。因而仍需要改善表达载体的效率以在重组多肽生产中实现高表达。
发明简述
本发明一般地涉及可以用来在重组多肽生产中实现表达增加的表达系统如表达盒和表达载体。在一个方面,本公开提供表达盒,其包含启动子、编码多肽的多核苷酸序列和真核甘油醛3-磷酸脱氢酶(GAPDH)启动子下游的非翻译性基因组DNA序列,其中由多核苷酸序列编码的多肽不是GAPDH,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列始于跨越从核苷酸位置约+1至核苷酸位置约+7000的区域内部,其中核苷酸位置是相对于GAPDH mRNA转录起始的,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列的长度是约100至约15000个核苷酸。
在又一个方面,本公开提供表达盒,其包含启动子、编码多肽的多核苷酸序列和真核GAPDH启动子上游的非翻译性基因组DNA序列,其中由多核苷酸序列编码的多肽不是GAPDH,并且其中真核GAPDH启动子上游的非翻译性基因组DNA序列始于跨越大约真核GAPDH启动子的5'末端至核苷酸位置约-3500的区域内部,其中核苷酸位置是相对于GAPDH mRNA转录起始的,其中真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是100至约15000个核苷酸,条件是表达盒不包含真核GAPDH启动子或其片段。
在又一个方面,本公开提供包含表达盒的表达载体和包含表达盒或表达载体的宿主细胞,其中所述表达载体包含表达盒。
在其他方面,本公开提供一种用于表达多肽的体外方法,所述方法包括用表达盒或表达载体转染宿主细胞并回收多肽,和表达盒或表达载体用 于从哺乳动物宿主细胞表达异源多肽的用途。
附图简述
图1显示报道基因表达构建体(REP),其由小鼠巨细胞病毒启动子(mCMV)、含有第一内含子的Ig供体接纳体片段(IgDA)、IgG1抗体轻链(IgG1LC)、源自脑心肌炎病毒的内部核糖体进入位点(IRES)、IgG1抗体重链(IgG1HC)、绿色荧光蛋白(GFP)和猿猴病毒40多聚腺苷化信号(poly(A))组成。
图2显示在转染后第5日IgG1抗体在CHO-S细胞中的瞬时表达(将IgG滴度的均值对两次独立转染作图)。使用GAPDH_A和GAPDH_B载体(GAPDH_A和GAPDH_B)、无GAPDH上游元件和下游元件的相同载体(A和B)和作为对照的pGLEX41载体(pGLEX41),转染细胞。使用Octet仪器(Fortebio,Menlo,CA,美国)确定上清液中积累的IgG1抗体的浓度。
图3显示IgG1抗体在HEK293EBNA细胞中的表达。使用GAPDH_A和GAPDH_B载体(GAPDH_A和GAPDH_B)和作为对照的pGLEX41载体(pGLEX41),转染细胞。将上清液收获并在转染后第10日使用Octet仪器分析。数据代表每个载体在旋转管(tubespin)中的N=3个独立转染。
图4显示使用细胞汇集物在分批生产时的表达水平研究。使用GAPDH_A和GAPDH_B载体(GAPDH_A(1)、GAPDH_A(2)、GAPDH_B(1)和GAPDH_B(2))、无GAPDH上游元件和下游元件的相同载体(A(1)和A(2))和作为对照的pGLEX41载体(pGLEX41),转染细胞并且产生稳定细胞的汇集物。在7日培养后,使用Octet仪器对上清液分析上清液中积累的抗体。给出每种汇集物的IgG滴度均值(μg/ml)。数据代表每种汇集物N=2个批次。
图5显示在通过稳定转染和有限稀释法产生的群体上的表达水平研究。使用GAPDH_A和GAPDH_B载体(GAPDH_A和GAPDH_B)、无GAPDH上游元件和下游元件的相同载体(A和B)和作为对照的pGLEX41载体(pGLEX41),转染细胞。在转染后14日读取来自稳定转染的克隆和小 量汇集物所表达的GFP荧光的均值。将细胞在96孔板中选择压力下培育。数据代表每种载体N=48个克隆或小量汇集物。
图6显示培养基添加物胰岛素和PMA(佛波醇12-肉豆蔻酸酯13-乙酸酯,一种佛波醇酯)对上清液中IgG1抗体表达的影响。用GAPDH_A载体(GAPDH_A)和作为对照的pGLEX41载体(pGLEX41)转染后,将细胞稀释于PowerCHO2培养基、4mM Gln、+/-胰岛素和PowerCHO2、4mM Gln、PMA+/-胰岛素中。与标准培养基相比,对pGLEX41(实心棒)或GAPDH_A(空心棒)没有观察到表达差异。
图7显示人GAPDH基因座的概览。GAPDH基因侧翼为基因NCAPD2和IFFO1。
图8显示人GAPDH基因、GAPDH上游元件和下游元件和为分析GAPDH上游片段化研究所产生的片段的细节。引入NruI限制性位点以促进克隆步骤并且该位点不是基因组5'GAPDH上游序列的部分(因此使用星号突出显示它)。片段的大小是:片段1(SEQ ID NO:9):511bp、片段2(SEQ ID NO:10):2653bp、片段3(SEQ ID NO:11):1966bp、片段4(SEQ ID NO:12):1198bp、片段8(SEQ ID NO:13):259bp、片段9(SEQ ID NO:14):1947bp、片段11(SEQ ID NO:15):1436bp和片段17(SEQ ID NO:16):1177bp。
图9显示GAPDH上游元件和下游元件片段化的表达结果。在转染后第10日在CHO细胞中以瞬时转染方式获得表达结果。使用Octet仪器进行定量。载体pGLEX41充当阴性对照。pGLEX41-ampiA还是显示无GAPDH侧翼元件的载体基础表达的阴性对照。pGLEX41-上/下含有全长侧翼区(上游区和下游区)并充当阳性对照。pGLEX41-上仅含有上游侧翼区并且pGLEX41-下仅含有下游侧翼区。全部其他构建体均含有图8中描述的片段。片段2和片段3按照与IgG1LC和IgG1HC相同的方向克隆或相对于IgG1LC和IgG1HC(AS)以相反方向克隆。
图10显示在转染后第8日IgG1抗体在CHO-S细胞中的瞬时表达(将IgG滴度的均值对三次独立转染作图;误差条:SD+/-)。使用具有中国仓 鼠GAPDH上游元件与小鼠CMV(A_GAPDH_UP)或中国仓鼠GAPDH启动子(A_GAPDH_UP_PR)组合的载体,转染细胞。转染仅具有小鼠CMV(A)或中国仓鼠GAPDH启动子(A_PR)的质粒作为对照。使用Octet QK仪器(Fortebio,Menlo,CA,美国)确定上清液中积累的IgG1抗体的浓度。
发明详述
本公开涉及表达盒和表达载体,所述表达盒和表达载体包含启动子、编码多肽的多核苷酸序列和真核甘油醛3-磷酸脱氢酶(GAPDH)启动子下游的非翻译性基因组DNA序列,其中由多核苷酸序列编码的多肽不是GAPDH,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列始于跨越核苷酸位置约+1至核苷酸位置约+7000的区域内部,其中核苷酸位置是相对于GAPDH mRNA转录起始的,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列的长度是约100至约15000个核苷酸。
本公开还涉及一种表达盒,其包含启动子、编码多肽的多核苷酸序列和真核GAPDH启动子上游的非翻译性基因组DNA序列,其中由多核苷酸序列编码的多肽不是GAPDH,并且其中真核GAPDH启动子上游的非翻译性基因组DNA序列始于跨越大约真核GAPDH启动子的5'末端至核苷酸位置约-3500的区域内部,其中核苷酸位置是相对于GAPDH mRNA转录起始的,其中真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是100至约15000个核苷酸,条件是表达盒不包含真核GAPDH启动子或其片段。
如本文所用的术语“表达盒”包含多核苷酸序列,所述多核苷酸序列编码待表达的多肽和控制其表达的序列如启动子以及任选地增强子序列,包括顺式作用转录性控制单元的任何组合。控制基因表达(即其转录和转录产物翻译)的序列常称作调节单元。调节单元的大多数部分位于基因的编码序列上游并与之有效连接。表达盒也可以含有包含多聚腺苷化位点的下游3'非翻译区。本发明的调节单元与待表达的基因即转录单位有效连接,或由间插DNA例如异源基因的5'-非翻译区分隔。优选地,表达盒侧翼为一种 或多种合适的限制性位点以便可以将表达盒插入载体中和/或将其从载体切除。因而,本发明的表达盒可以用于构建表达载体,尤其哺乳动物表达载体。本发明的表达盒可以包含一个或多个例如两个、三个或甚至更多个在真核GAPDH启动子或其片段下游的非翻译性基因组DNA序列,和/或一个或多个例如两个、三个或甚至更多个在真核GAPDH启动子或其片段上游的非翻译性基因组DNA序列。如果本发明的表达盒包含多于一个在真核GAPDH启动子或其片段下游和/或上游的DNA序列,则这些DNA序列可以是直接连接的,即可以包含接头序列,例如含有与5'末端和3'末端连接并允许轻易依次克隆所述序列或其片段的限制性位点的接头序列。备选地,真核GAPDH启动子或其片段下游和/或上游的DNA序列可以不是直接连接的,即可以随间插DNA序列一起克隆。
如本文所用的术语“编码多肽的多核苷酸序列”包括编码表达所述多肽的基因、优选地异源基因的DNA。
术语“异源编码序列”、“异源基因序列”、“异源基因”、“重组基因”或“基因”互换使用。这些术语指这样的DNA序列,所述DNA序列编码设法在宿主细胞中、优选地在哺乳动物细胞中表达并收获的重组蛋白产物,尤其重组异源蛋白产物。基因的产物可以是多肽。异源基因序列天然地不存在于宿主细胞中并且源自相同或不同物种的生物并且可以是基因修饰的。
术语“蛋白质”和“多肽”互换地用来包括通过相邻残基的α-氨基和羧基之间的肽键彼此连接的一串氨基酸残基。
如本文所用的术语“非翻译性基因组DNA序列”包括构成生物的遗传信息的DNA。几乎全部生物的基因组是DNA,唯一例外是具有RNA基因组的一些病毒。大多数生物中的基因组DNA分子被组织成称作染色体的DNA-蛋白质复合体。染色体的大小、数目和基因组DNA的性质在不同生物之间不同。病毒DNA基因组可以是单链或双链、线型或环状的。全部其他生物具有双链DNA基因组。细菌具有单个环状染色体。在真核生物中,大多数基因组DNA作为大小不同的多条线形染色体位于核内(核DNA)。真核细胞额外地在线粒体中含有基因组DNA,并且在植物和低等 真核生物中,在叶绿体中含有基因组DNA。这种DNA通常是环状分子并且在这些细胞器内部作为多个副本存在。非翻译性基因组DNA序列通常不与启动子有效连接并且因此不翻译。它可以含有不翻译的基因,因此含有编码例如不表达的蛋白质的基因。
如本文所用的术语“真核GAPDH启动子下游的非翻译性基因组DNA序列”对应于真核GAPDH启动子3'的非翻译性真核基因组DNA。真核GAPDH启动子下游的非翻译性基因组DNA序列通常在核苷酸位置约+1处,优选地在核苷酸位置+1处开始,其中核苷酸位置是相对于GAPDH mRNA转录起始的,即相对于编码GAPDH的真核基因的转录起始(transcription start)的起点(origin)。真核GAPDH启动子下游的非翻译性基因组DNA序列通常具有与真核GAPDH启动子相同的来源,例如,如果该GAPDH启动子是人源的,则人GAPDH启动子下游的非翻译性基因组DNA序列也是人源的并对应于人GAPDH启动子下游天然存在的人类基因组DNA序列。
如本文所用的术语“真核GAPDH启动子上游的非翻译性基因组DNA序列”对应于真核GAPDH启动子5'的非翻译性真核基因组DNA。真核GAPDH启动子上游的非翻译性基因组DNA序列通常在约真核GAPDH启动子的5'末端处的核苷酸位置处,优选地在紧邻真核GAPDH启动子5'末端之后的核苷酸位置处开始。真核GAPDH启动子上游的非翻译性基因组DNA序列通常具有与真核GAPDH启动子相同的来源,例如,如果该GAPDH启动子是人源的,则人GAPDH启动子上游的非翻译性基因组DNA序列也是人源的并对应于人GAPDH启动子上游天然存在的人类基因组DNA序列。
如非另外具体说明,则真核GAPDH启动子、真核GAPDH启动子下游或上游的非翻译性基因组DNA序列和如本文中所示的其他DNA序列的位置是相对于GAPDH mRNA转录起始的,例如是相对于真核GAPDH的转录起始的起点的。
术语“真核GAPDH启动子上游的非翻译性基因组DNA序列延伸至” 或“真核GAPDH启动子下游的非翻译性基因组DNA序列延伸至”用来限定真核GAPDH启动子上游和/或下游的非翻译性基因组DNA序列的长度从起始至特定遗传元件的长度的延伸,例如至内含子的延伸。这种延伸包括编码该遗传元件例如内含子或其部份的DNA序列的全长。
人、大鼠和小鼠的真核GAPDH启动子和GAPDH启动子上游和/或下游的真核基因组DNA可以在NCBI公共数据库中找到(人、小鼠、大鼠和中国仓鼠GAPDH基因的条目分别是基因ID 2597(mRNA:NM_002046.3)、14433(mRMA:NM_008084.2)、24383(mRNA:NM_017008.3)和100736557(mRNA:NM_001244854.2;美国国家生物技术信息中心(NCBI):http://www.ncbi.nlm.nih.gov/)并且示意地在图7和8中针对人GAPDH基因显示。
通常认为真核GAPDH启动子相对于GAPDH mRNA转录起始从约bps-500伸展至约+50。人GAPDH启动子位于第12号染色体上。基于片段化研究,Graven等人(Graven等人,(1999)Biochimica et Biophysics Acta,147:203-218)认为人GAPDH启动子相对于GAPDH mRNA转录起始从bps-488伸展至+20。根据NCBI公共数据库,人GAPDH启动子相对于如NCBI公共数据库所定义的GAPDH mRNA转录起始从bps-462伸展至+46。如非另外具体说明,如本文提到的人GAPDH启动子相对于GAPDH mRNA转录起始从位置-462伸展至位置+46,这对应于从SEQ ID NO:17的bps 4071伸展至4578的序列。
如本文中提到的针对人、小鼠和大鼠源GAPDH基因、IFF01基因和NCAPD2基因的DNA所用的编号对应于NCBI公共数据库中针对这些基因所用的编号(http://www.ncbi.nlm.nih.gov/)。
如本文所用的术语“启动子”限定一般位于基因上游的调节性DNA序列,所述调节性DNA序列通过指导RNA聚合酶与DNA结合并启动RNA合成介导转录的起始。
如本文所用的术语“增强子”限定一种核苷酸序列,该核苷酸序列作用为使激动基因转录成为可能,所述基因转录与基因的身份、该序列相对于 基因的位置或序列的取向无关。本发明的载体任选地包含增强子。
术语“功能性连接”和“有效连接”互换使用并且指两个或更多个DNA区段、尤其待表达基因序列和控制其表达的那些序列之间的功能关系。例如,如果启动子和/或增强子序列(包括顺式作用转录性控制元件的任何组合)在适宜的宿主细胞或其他表达系统中刺激或调节编码序列的转录,则它与编码序列有效连接。与转录的基因序列有效连接的启动子调节序列是在物理上与转录的序列邻接的。
“取向”指给定DNA序列中的核苷酸顺序。例如,DNA序列相对于另一个DNA序列以相反方向的取向是这种情况,其中与从其中获得该序列的DNA中的参照点相比时,该序列相对于另一个序列的5'至3'顺序反转。这类参考点可以包括源DNA中转录其他指定DNA序列的方向和/或含有该序列的复制型载体的复制起点。
如本文所用的术语“表达载体”包括分离和纯化的DNA分子,所述分子在转染入适宜的宿主细胞时在宿主细胞内部提供重组基因产物的高水平表达。除编码重组或基因产物的DNA序列之外,表达载体还包含宿主细胞系中将DNA编码序列有效转录成mRNA并将mRNA有效翻译成蛋白质所需要的调节性DNA序列。
如本文所用的术语“宿主细胞”或“宿主细胞系”包括能够在培养物中生长并表达所需重组产物蛋白质的任何细胞、尤其哺乳动物细胞。
如本文所用的术语“片段”包括相应核苷酸序列的一部分,例如真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列的一部分或编码特定遗传元件(如启动子)的核苷酸序列的一部分。真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列的片段可以保留生物活性并因此改变(例如增加)与启动子有效连接的编码序列的表达模式。真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列的片段范围从至少约100至约3000bp、优选地从约200至约2800bp、更优选地从约300至约2000bp核苷酸、尤其从约500至约1500bp核苷酸。为了在本发明的表达盒中克隆真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列 的片段,通常将含有允许便利克隆的限制性位点的接头序列与所述片段的5'末端和3'末端连接。
如本文所用的术语“核苷酸序列同一性”或“相同核苷酸序列”包括在比对序列并引入空位(如果需要)以实现最大序列同一性百分数后,候选序列中与例如真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列的核苷酸序列相同的核苷酸的百分数。因此,可以通过常用来比较两个核苷酸序列的核苷酸位置中相似性的标准方法确定序列同一性。通常,相对于真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列,候选序列的核苷酸序列同一性是至少80%、优选地至少85%、更优选地至少90%并且最优选地是至少95%、尤其96%,更特别地是97%,甚至更特别地是98%、最特别地是99%,包括例如,80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%和100%。
如本文所用的术语“CpG位点”包括其中胞嘧啶核苷酸在线性碱基序列中沿其长度紧邻鸟嘌呤核苷酸出现的DNA区域。“CpG”是“-C-磷酸酯-G-”的速记,即,由仅一个磷酸酯分隔的胞嘧啶和鸟嘌呤;磷酸酯将DNA中的任何两个核苷连接在一起。“CpG”记号用来区分这种线性序列与胞嘧啶和鸟嘌呤的CG碱基配对。
如本文所用的术语“备选密码子选择”包括使用编码相同氨基酸的备选密码子以避免CpG序列基序。这包括优选地使用不具有内部CpG位点的密码子(例如编码丙氨酸并含有CpG位点的GCG,可由GCT、GCC或GCA替换)以及避免产生新CpG位点的两个密码子连接。
在涉及DNA序列长度和涉及相对于GAPDH mRNA转录起始例如相对于真核GAPDH转录起始起点的核苷酸位置时,本文所用的术语“约”包括偏离所述值最多±50%、通常最多±10%的值,例如“约3000个核苷酸”包括2700至3300个核苷酸、优选地2900至3100个核苷酸、更优选地2995至3005个核苷酸的值,“约100个核苷酸”包括50至150个核苷酸、优选地90至110个核苷酸、更优选地95至105个核苷酸的值,“约15000个核 苷酸”包括13500至16500个核苷酸、优选地14500至15500个核苷酸、更优选地14990至15010个核苷酸、最优选地14995至15005个核苷酸的值,“约200个核苷酸”包括150至250个核苷酸、优选地190至210个核苷酸、更优选地195至205个核苷酸的值,“约8000个核苷酸”包括7200至8800、优选地7500至8500个核苷酸、更优选地7990至8010个核苷酸、最优选地7995至8005个核苷酸的值,“约500个核苷酸”包括450至550个核苷酸、优选地475至525、更优选地490至510、最优选地495至505个核苷酸的值,“约5000个核苷酸”包括4500至5500个核苷酸、优选地4750至5250、更优选地4990至5010、最优选地4995至5005个核苷酸的值,“约1000个核苷酸”包括900至1100个核苷酸、优选地950至1050、更优选地990至1010、最优选地995至1005个核苷酸的值,“约4500个核苷酸”包括4050至4950个核苷酸、优选地4250至4750、更优选地4490至4510、最优选地4495至4505个核苷酸的值,“约1500个核苷酸”包括1350至1650个核苷酸、优选地1450至1550、更优选地1490至1510、最优选地1495至1505个核苷酸的值,“约4000个核苷酸”包括3600至4400个核苷酸、优选地3800至4200、更优选地3990至4010、更优选地3995至4005个核苷酸的值,“约2000个核苷酸”包括1800至2200个核苷酸、优选地1900至2100、更优选地1990至2010、最优选地1995至2005个核苷酸的值,“约3500个核苷酸”包括3150至3850个核苷酸、优选地3300至3700、更优选地3490至3510、最优选地3495至3505个核苷酸的值,“约2700个核苷酸”包括2430至2970个核苷酸、优选地2600至2800、更优选地2690至2710、最优选地2695至2705个核苷酸的值,“约3300个核苷酸”包括2970至3630个核苷酸,优选地3100至3500、更优选地3290至3310、最优选地3295至3305个核苷酸的值,“约3200个核苷酸”包括2880至3520个核苷酸、优选地3000至3400、更优选地3190至3210、最优选地3195至3205个核苷酸,约+7000或约位置+7000包括位置+6300至+7700、优选地位置+6700至+7300、更优选地位置+6990至+7010、最优选地位置+6995至+7005,约+1或约位置+1包括位置-10至+10、优选地位置-5至+5、更优选 地位置-1至+2,约-3500或约位置-3500包括位置-3150至-3850、优选地位置-3300至-3700、更优选地位置-3490至-5010、最优选地位置-3495至-3505。
对于与SEQ ID号的序列中的位置相关的本文所涉及的或本文所用的针对人、小鼠和大鼠源的GAPDH基因、IFF01基因和NCAPD2基因的DNA所用的编号,术语“约”包括偏离最多±500bp、优选地±100bp、更优选地±10bp、最优选地±5bp的值。
在一个实施方案中,本公开提供一种表达盒,其包含启动子、编码多肽的多核苷酸序列和真核GAPDH启动子下游的非翻译性基因组DNA序列,其中由多核苷酸序列编码的多肽不是GAPDH,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列始于跨越核苷酸位置约+1至核苷酸位置约+7000的区域内部,其中核苷酸位置是相对于GAPDH mRNA转录起始的,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列的长度是约100至约15000个核苷酸。
在一个实施方案中,真核GAPDH启动子下游的非翻译性基因组DNA序列的长度是至少约100个核苷酸并且在其最大情况下延伸至IFF01基因的倒数第二内含子或延伸至其部份。在一个实施方案中,真核GAPDH启动子下游的非翻译性基因组DNA序列的长度是至少约100个核苷酸并且在其最大情况下延伸至IFF01基因的最末内含子。
人IFF01基因位于第12号染色体(NCBI基因ID:25900)约bp 6665249至bp 6648694的人DNA中。在一个实施方案中,在其最大情况下延伸至人中IFF01基因的最末内含子的真核GAPDH启动子下游非翻译性基因组DNA序列的长度在其最大情况下伸展至人中编码IFF01基因的第12号染色体的约bp 6650677(位置+7021)。在一个实施方案中,在其最大情况下延伸至人中IFF01基因的倒数第二内含子的真核GAPDH启动子下游非翻译性基因组DNA序列的长度在其最大情况下伸展至人中编码IFF01基因的第12号染色体的约bp 6657230(位置+13574)。在显示第12号染色体(NCBI基因ID:25900)的bp 6657230至bp 6639125的SEQ ID NO:17中包含在其最大情况下分别延伸至人中IFF01基因的最末内含子和人中IFF01基因 的倒数第二内含子的真核GAPDH启动子下游非翻译性基因组DNA序列。延伸至最末内含子的真核GAPDH启动子下游非翻译性基因组DNA序列伸展至如SEQ ID NO:17所示的核苷酸序列的约bp 11553,并且延伸至倒数第二内含子的真核GAPDH启动子下游非翻译性基因组DNA序列伸展至如SEQ ID NO:17所示核苷酸序列的约bp 18106。
小鼠IFF01基因(NCBI基因ID:320678)位于第6号染色体的约bp125095259至125111800的小鼠DNA中。在一个实施方案中,在其最大情况下延伸至小鼠中IFF01基因的最末内含子的真核GAPDH启动子下游非翻译性基因组DNA序列的长度在其最大情况下伸展至小鼠中编码IFF01基因的第6号染色体的约bp 125109211(位置+6391)。在一个实施方案中,在其最大情况下延伸至小鼠中IFF01基因的倒数第二内含子的真核GAPDH启动子下游非翻译性基因组DNA序列的长度在其最大情况下伸展至小鼠中编码IFF01基因的第6号染色体的约bp 125103521(位置+12081)。在显示第6号染色体(NCBI基因ID:320678)的bp 125103521至bp 125119832的SEQ ID NO:18中包含在其最大情况下分别延伸至小鼠中IFF01基因的最末内含子和倒数第二内含子的真核GAPDH启动子下游非翻译性基因组DNA序列。延伸至小鼠中IFFO1基因的最末内含子的真核GAPDH启动子下游非翻译性基因组DNA序列伸展至如SEQ ID NO:18所示的核苷酸序列的约bp 10622,并且延伸至小鼠中IFFO1基因的倒数第二内含子的真核GAPDH启动子下游非翻译性基因组DNA序列伸展至如SEQ ID NO:18所示核苷酸序列的约bp 16312。
大鼠IFF01基因(NCBI基因ID:362437)位于第4号染色体的约bp1612649669至bp161282150的大鼠DNA中。在一个实施方案中,在其最大情况下延伸至大鼠中IFF01基因的最末内含子的真核GAPDH启动子下游非翻译性基因组DNA序列的长度在其最大情况下伸展至大鼠中编码IFF01基因的第4号染色体的约bp 161280937(位置+5154)。在一个实施方案中,在其最大情况下延伸至大鼠中IFF01基因的倒数第二内含子的真核GAPDH启动子下游非翻译性基因组DNA序列的长度在其最大情况下伸 展至大鼠中编码IFF01基因的第4号染色体的约bp 161279451(位置+6640)。
在显示第4号染色体(NCBI基因ID:362437)的bp 161279451至bp161290508的SEQ ID NO:19中包含在其最大情况下分别延伸至大鼠中IFF01基因的最末内含子和倒数第二内含子的真核GAPDH启动子下游非翻译性基因组DNA序列。延伸至IFFO1基因的最末内含子的真核GAPDH启动子下游非翻译性基因组DNA序列伸展至如SEQ ID NO:19所示的核苷酸序列的约bp 9572,并且延伸至IFFO1基因的倒数第二内含子的真核GAPDH启动子下游非翻译性基因组DNA序列伸展至如SEQ ID NO:19所示核苷酸序列的约bp 11058。
中国仓鼠IFFO1基因(NCBI基因ID:100753382)位于约bp3577293至3593683的中国仓鼠DNA中。在一个实施方案中,在其最大情况下延伸至中国仓鼠中IFF01基因的最末内含子的真核GAPDH启动子下游非翻译性基因组DNA序列的长度在其最大情况下伸展至中国仓鼠中编码IFF01基因的约bp 3579014(位置+6883)。在一个实施方案中,在其最大情况下延伸至中国仓鼠中IFF01基因的倒数第二内含子的真核GAPDH启动子下游非翻译性基因组DNA序列的长度在其最大情况下伸展至中国仓鼠中编码IFFO1基因的约bp 3585061(位置+12930)。该染色体位置仍未在NCBI数据库中注释并且当前的序列信息含有许多未知的碱基。因此对界限的精确注释可以随更精确序列信息的可获得性而变化。
在显示bp3567932至bp3585061的SEQ ID NO:29中包含在其最大情况下分别延伸至中国仓鼠中IFF01基因的最末内含子和倒数第二内含子的真核GAPDH启动子下游非翻译性基因组DNA序列。延伸至IFFO1基因的最末内含子的真核GAPDH启动子下游非翻译性基因组DNA序列伸展至如SEQ ID NO:29所示的核苷酸序列的约bp 11083,并且延伸至IFFO1基因的倒数第二内含子的真核GAPDH启动子下游非翻译性基因组DNA序列伸展至如SEQ ID NO:29所示核苷酸序列的约bp 17130。
在又一个实施方案中,真核GAPDH启动子下游的非翻译性基因组 DNA序列始于真核GAPDH多聚腺苷化位点处,例如始于编码真核GAPDH多聚腺苷化位点的第一核苷酸。优选地,真核GAPDH启动子下游的非翻译性基因组DNA序列始于真核GAPDH多聚腺苷化位点的下游,例如紧邻编码真核GAPDH多聚腺苷化位点的最末核苷酸之后开始。甚至更优选的真核GAPDH启动子下游非翻译性基因组DNA序列始于真核GAPDH多聚腺苷化位点的下游并且真核GAPDH启动子下游的非翻译性基因组DNA序列的长度是至少约100个核苷酸并且在其最大情况下延伸至IFF01基因的倒数第二内含子。
在一个实施方案中,真核GAPDH启动子下游的非翻译性基因组DNA序列始于跨越核苷酸位置约+3881至核苷酸位置约+5000的区域内部,优选地始于跨越核苷酸位置约+3931至核苷酸位置约+5000的区域内部,更优选地始于跨越核苷酸位置约+4070至核苷酸位置约+5000的区域内部,其中核苷酸位置是相对于GAPDH mRNA转录起始的。
始于例如本发明中使用的真核GAPDH多聚腺苷化位点下游的真核GAPDH启动子下游非翻译性基因组DNA序列通常始于核苷酸位置约位置+3931处,优选地始于核苷酸位置约+4070处,其中核苷酸位置是相对于GAPDH mRNA转录起始的。
在人中,人GAPDH多聚腺苷化位点下游的非翻译性基因组DNA序列始于约核苷酸位置+3931处(相对于对应如SEQ ID NO:17中所显示的bp8463的GAPDH mRNA转录起始)。优选地,如果GAPDH多聚腺苷化位点下游的非翻译性基因组DNA序列来自人,则GAPDH多聚腺苷化位点下游的非翻译性基因组DNA序列始于约+3931(相对于GAPDH mRNA转录起始;其对应如SEQ ID NO:17中所显示的bp 8463),并且其长度是约3357bp,对应于从如SEQ ID NO:17中所显示的约bp8463至约bp11819的序列,更优选地它始于约+4070处(相对于对应如SEQ ID NO:17中所显示的bp 8602的GAPDH mRNA转录起始)并且其长度是约3218bp,对应于从如SEQ ID NO:17中所显示的约bp8602至约bp11819的序列。
在又一个实施方案中,真核GAPDH启动子下游的非翻译性基因组 DNA序列包含选自SEQ ID NOs:8和21的核苷酸序列或其片段。
在又一个实施方案中,真核GAPDH启动子下游的非翻译性基因组DNA序列包含与选自SEQ ID NOs:8和21的核苷酸序列或其片段互补的核苷酸序列。
在又一个实施方案中,真核GAPDH启动子下游的非翻译性基因组DNA序列包含与选自SEQ ID NOs:8和21的核苷酸序列或其片段相同至少80%的核苷酸序列。
在一些实施方案中,选自SEQ ID NOs:8和21的核苷酸序列或其片段包含5个或更少、优选地4个或更少、更优选地3个或更少、最优选地2个或更少的、特别是1个核酸修饰,其中核酸修饰优选地是核酸置换。
在又一个实施方案中,真核GAPDH启动子下游的非翻译性基因组DNA序列的长度优选地是约200至约8000个核苷酸、更优选地约500至约5000个核苷酸、甚至更优选地约1000至约4500个核苷酸、最优选地约1500至约4000个核苷酸、特别地约2000至约3500个核苷酸、更特别约2700至约3300个、甚至更特别约3200个、最特别地3218个核苷酸。如本文定义的真核GAPDH启动子下游非翻译性基因组DNA序列的长度不包括对非翻译性基因组DNA序列添加的任何接头序列。
在又一个实施方案中,真核GAPDH启动子下游的非翻译性基因组DNA序列以与编码多肽的多核苷酸序列相同的方向定向。
在又一个实施方案中,真核GAPDH启动子下游的非翻译性基因组DNA序列以相对于编码多肽的多核苷酸序列相反方向定向。
在一些实施方案中,包含启动子、编码多肽的多核苷酸序列和真核GAPDH启动子下游非翻译性基因组DNA序列的表达盒还包含真核GAPDH启动子上游的非翻译性基因组DNA序列,其中真核GAPDH启动子上游的非翻译性基因组DNA序列始于跨越约真核GAPDH启动子的5'末端至核苷酸位置约-3500的区域内部,其中核苷酸位置是相对于GAPDH mRNA转录起始,并且其中真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是约100至约15000个核苷酸。
在另一个实施方案中,该表达盒包含启动子、编码多肽的多核苷酸序列和真核GAPDH启动子上游的非翻译性基因组DNA序列,其中由多核苷酸序列编码的多肽不是GAPDH,并且其中真核GAPDH启动子上游的非翻译性基因组DNA序列始于跨越约真核GAPDH启动子的5'末端至核苷酸位置约-3500的区域内部,其中核苷酸位置是相对于GAPDH mRNA转录起始的,其中真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是100至约15000个核苷酸,条件是表达盒不包含真核GAPDH启动子或其片段。
在一些实施方案中,该表达盒还包含真核GAPDH启动子下游的非翻译性基因组DNA序列,其中真核GAPDH启动子下游的非翻译性基因组DNA序列始于跨越核苷酸位置约+1至核苷酸位置约+7000的区域内部,其中核苷酸位置是相对于GAPDH mRNA转录起始的,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列的长度是约100至约15000个核苷酸。在这些实施方案中,使用的真核GAPDH启动子下游非翻译性基因组DNA序列例如如上文描述。
在一些实施方案中,真核GAPDH启动子上游的非翻译性基因组DNA序列的长度优选地是约200至约8000个核苷酸、更优选地约500至约5000个核苷酸、甚至更优选地约1000至约4500个核苷酸、最优选地约1500至约4000个核苷酸、特别地约2000至约3500个核苷酸、更特别约2700至约3300个、甚至更特别约3200个、最特别地3158个核苷酸长度。如本文定义的真核GAPDH启动子上游非翻译性基因组DNA序列的长度不包括对非翻译性基因组DNA序列添加的任何接头序列。
在又一个实施方案中,真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是至少约100个核苷酸并且在其最大情况下延伸至NCAPD2基因的起始密码子。在又一个实施方案中,真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是至少约100个核苷酸并且在其最大情况下延伸至NCAPD2基因的倒数第三内含子。在又一个实施方案中,真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是至少 约100个核苷酸并且在其最大情况下延伸至NCAPD2基因的倒数第二内含子。在又一个实施方案中,真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是至少约100个核苷酸并且在其最大情况下延伸至NCAPD2基因的最末内含子。
人NCAPD2基因(NCBI基因ID:9918)位于第12号染色体约bp6603298至bp6641132的人DNA中。在一个实施方案中,在其最大情况下延伸至人中NCAPD2基因的最末内含子的真核GAPDH启动子上游非翻译性基因组DNA序列的长度在其最大情况下伸展至人中编码NCAPD2基因的第12号染色体的约bp 6640243(相对于GAPDH基因转录起始的位置-3414,对应SEQ ID NO:17中bp 1119)。
在一个实施方案中,在其最大情况下延伸至人中NCAPD2基因的倒数第二内含子的真核GAPDH启动子上游非翻译性基因组DNA序列的长度在其最大情况下伸展至人中编码NCAPD2基因的第12号染色体的约bp6639984(相对于GAPDH基因转录起始的位置-3673,对应SEQ ID NO:17中bp860)。
在一个实施方案中,在其最大情况下延伸至人中NCAPD2基因的倒数第三内含子的真核GAPDH启动子上游非翻译性基因组DNA序列的长度在其最大情况下伸展至人中编码NCAPD2基因的第12号染色体的约bp6639125(相对于GAPDH基因转录起始的位置-4532;其对应SEQ ID NO:17中的bp 1)。
在显示第12号染色体(NCBI基因ID:9918)的bp 6657230至bp6639125的SEQ ID NO:17中包含在其最大情况下分别延伸至人中NCAPD2基因的最末内含子、倒数第二内含子和倒数第三内含子的真核GAPDH启动子上游非翻译性基因组DNA序列。
小鼠NCAPD2基因(基因ID:68298)位于第6号染色体的约位置125118025至125141604的小鼠DNA中。在一个实施方案中,在其最大情况下延伸至小鼠中NCAPD2基因的最末内含子的真核GAPDH启动子上游非翻译性基因组DNA序列的长度(据估计具有转录起始上游的500bp长 度)在其最大情况下伸展至小鼠中编码NCAPD2基因的第6号染色体的约125118607。
在一个实施方案中,在其最大情况下延伸至小鼠中NCAPD2基因的倒数第二内含子的真核GAPDH启动子上游非翻译性基因组DNA序列的长度在其最大情况下伸展至小鼠中编码NCAPD2基因的第6号染色体的约bp 125118880。
在一个实施方案中,在其最大情况下延伸至小鼠中NCAPD2基因的倒数第三内含子的真核GAPDH启动子上游非翻译性基因组DNA序列的长度在其最大情况下伸展至小鼠中编码NCAPD2基因的第6号染色体的约bp 125119832。
在显示第6号染色体(NCBI基因ID:68298)的bp125103521至bp125119832的SEQ ID NO:18中包含在其最大情况下分别延伸至小鼠中NCAPD2基因的最末内含子、倒数第二内含子和倒数第三内含子的真核GAPDH启动子上游非翻译性基因组DNA序列。延伸至最末内含子的真核GAPDH启动子上游非翻译性基因组DNA序列伸展至如SEQ ID NO:18所显示的核苷酸序列的约bp 1226(相对于小鼠GAPDH mRNA转录起始的-3006)。延伸至倒数第二内含子的真核GAPDH启动子下游非翻译性基因组DNA序列伸展至如SEQ ID NO:18所显示的核苷酸序列的约bp953(相对于小鼠GAPDH mRNA转录起始的-3279)。延伸至倒数第三内含子的真核GAPDH启动子下游非翻译性基因组DNA序列伸展至如SEQ ID NO:18所显示的核苷酸序列的约bp 1(相对于小鼠GAPDH mRNA转录起始的-4231)。
大鼠NCAPD2基因(基因ID:362438)位于第4号染色体的约位置161288671至161310417的真核DNA中。在一个实施方案中,在其最大情况下延伸至大鼠中NCAPD2基因的最末内含子的真核GAPDH启动子上游非翻译性基因组DNA序列的长度在其最大情况下伸展至大鼠中编码NCAPD2基因的第4号染色体的约bp 161289191。在一个实施方案中,在其最大情况下延伸至大鼠中NCAPD2基因的倒数第二内含子的真核 GAPDH启动子上游非翻译性基因组DNA序列的长度在其最大情况下伸展至大鼠中编码NCAPD2基因的第4号染色体的约bp 161289446。在一个实施方案中,在其最大情况下延伸至大鼠中NCAPD2基因的倒数第三内含子的真核GAPDH启动子上游非翻译性基因组DNA序列的长度在其最大情况下伸展至大鼠中编码NCAPD2基因的第4号染色体的约bp161290508。
在显示第4号染色体(NCBI基因ID:362438)的bp161279451至bp161290508的SEQ ID NO:19中包含在其最大情况下分别延伸至大鼠中NCAPD2基因的最末内含子、倒数第二内含子和倒数第三内含子的真核GAPDH启动子上游非翻译性基因组DNA序列。延伸至最末内含子的真核GAPDH启动子上游非翻译性基因组DNA序列伸展至如SEQ ID NO:19所显示的核苷酸序列的约bp 1318(相对于大鼠GAPDH mRNA转录起始的-3101)。延伸至倒数第二内含子的真核GAPDH启动子下游非翻译性基因组DNA序列伸展至如SEQ ID NO:19所显示的核苷酸序列的约bp 1063(相对于大鼠GAPDH mRNA转录起始的位置-3356)。延伸至倒数第三内含子的真核GAPDH启动子下游非翻译性基因组DNA序列伸展至如SEQ ID NO:19所显示的核苷酸序列的约bp 1(相对于大鼠GAPDH mRNA转录起始的位置-4418)。
中国仓鼠NCAPD2基因(基因ID:100753087)位于约位置3544184至3569879的真核DNA中。该染色体位置在NCBI数据库上不可获得。在一个实施方案中,在其最大情况下延伸至中国仓鼠中NCAPD2基因的最末内含子的真核GAPDH启动子上游非翻译性基因组DNA序列的长度在其最大情况下伸展至中国仓鼠中的约3569380bp。在一个实施方案中,在其最大情况下延伸至中国仓鼠中NCAPD2基因的倒数第二内含子的真核GAPDH启动子上游非翻译性基因组DNA序列的长度在其最大情况下伸展至中国仓鼠中的约3569131bp。在一个实施方案中,在其最大情况下延伸至中国仓鼠中NCAPD2基因的倒数第三内含子的真核GAPDH启动子上游非翻译性基因组DNA序列的长度在其最大情况下伸展至中国仓鼠中 的约3567932bp。
在显示bp3567932至bp3585061的SEQ ID NO:29中包含在其最大情况下分别延伸至中国仓鼠中NCAPD2基因的最末内含子、倒数第二内含子和倒数第三内含子的真核GAPDH启动子上游非翻译性基因组DNA序列。延伸至最末内含子的真核GAPDH启动子上游非翻译性基因组DNA序列伸展至如SEQ ID NO:29所显示的核苷酸序列的约bp 1449(相对于中国仓鼠GAPDH mRNA转录起始的-2752)。延伸至倒数第二内含子的真核GAPDH启动子下游非翻译性基因组DNA序列伸展至如SEQ ID NO:29所显示的核苷酸序列的约bp 1200(相对于中国仓鼠GAPDH mRNA转录起始的位置-3001)。延伸至倒数第三内含子的真核GAPDH启动子下游非翻译性基因组DNA序列伸展至如SEQ ID NO:29所显示的核苷酸序列的约bp 1(相对于中国仓鼠GAPDH mRNA转录起始的位置-4200)。
在一些实施方案中,真核GAPDH启动子上游的非翻译性基因组DNA序列通常始于跨越核苷酸位置约-500至核苷酸位置约-3500区域内部,优选地始于跨越核苷酸位置约-576至核苷酸位置约-3500区域内部,其中核苷酸位置是相对于GAPDH mRNA转录起始的。
在一些实施方案中,真核GAPDH启动子上游的非翻译性基因组DNA序列通常始于核苷酸位置约位置-500处,优选地始于核苷酸位置约-576处,其中核苷酸位置是相对于GAPDH mRNA转录起始的。
在人中,人GAPDH启动子上游的非翻译性基因组DNA序列始于约核苷酸位置-463处(相对于对应如SEQ ID NO:17中所显示的bp4533的GAPDH mRNA转录起始)。优选地,如果GAPDH启动子上游的非翻译性基因组DNA序列来自人,则该GAPDH启动子上游的非翻译性基因组DNA序列始于约-500处(相对于GAPDH mRNA转录起始;其对应如SEQ ID NO:17中所显示的bp 4533)。更优选地,如果GAPDH启动子上游的非翻译性基因组DNA序列来自人,则该GAPDH启动子上游的非翻译性基因组DNA序列始于约-576处(相对于GAPDH mRNA转录起始;其对应如SEQ ID NO:17中所显示的bp 4533),并且其长度是约3158bp,对应于 从如SEQ ID NO:17中所显示的约bp800至约bp3957的序列。
在又一个实施方案中,真核GAPDH启动子上游的非翻译性基因组DNA序列包含选自SEQ ID NOs:7、9、10、11、12、13、14、15、16、20、22、23、24、25、26、27和28的核苷酸序列或其片段,优选地选自SEQ ID NOs:7、9、10、11、12、13、14、15和16的核苷酸序列或其片段,或选自SEQ ID NOs:20、22、23、24、25、26、27、28和16的核苷酸序列或其片段。更优选地是选自SEQ ID NOs:10、12、15和16的核苷酸序列或其片段,更优选地是选自SEQ ID NOs:10、12、15和16的核苷酸序列或其片段,其中包含SEQ ID NOs:10和/或16的核苷酸序列相对于编码多肽的多核苷酸序列以相反方向定向,并且包含SEQ ID NOs:12和/或15的核苷酸序列以与编码多肽的多核苷酸序列相同的方向定向。同等更优选地是选自SEQ ID NOs:23、25、28和16的核苷酸序列或其片段,更优选地是选自SEQ ID NOs:23、25、28和16的核苷酸序列或其片段,其中包含SEQ ID NOs:23和/或16的核苷酸序列相对于编码多肽的多核苷酸序列以相反方向定向,并且包含SEQ ID NOs:25和/或28的核苷酸序列以与编码多肽的多核苷酸序列相同的方向定向。
在又一个实施方案中,真核GAPDH启动子上游的非翻译性基因组DNA序列包含与选自SEQ ID NOs:7、9、10、11、12、13、14、15、16、20、22、23、24、25、26、27和28的核苷酸序列或其片段互补的核苷酸序列,优选地与选自SEQ ID NOs:7、9、10、11、12、13、14、15和16的核苷酸序列或其片段互补的核苷酸序列或与选自SEQ ID NOs:20、22、23、24、25、26、27、28和16的核苷酸序列或其片段互补的核苷酸序列。更优选地是与选自SEQ ID NOs:10、12、15和16的核苷酸序列或其片段互补的核苷酸序列。同等地更优选地是与选自SEQ ID NOs:23、25、28和16的核苷酸序列或其片段互补的核苷酸序列。
在又一个实施方案中,真核GAPDH启动子上游的非翻译性基因组DNA序列包含与选自SEQ ID NOs:7、9、10、11、12、13、14、15、16、20、22、23、24、25、26、27和28的核苷酸序列或其片段相同至少80% 的核苷酸序列,优选地与选自SEQ ID NOs:7、9、10、11、12、13、14、15和16的核苷酸序列或其片段相同至少80%的核苷酸序列或与选自SEQ ID NOs:20、22、23、24、25、26、27、28和16的核苷酸序列或其片段相同至少80%的核苷酸序列。更优选地是与选自SEQ ID NOs:10、12、15和16的核苷酸序列或其片段相同至少80%的核苷酸序列,更优选地是与选自SEQ ID NOs:10、12、15和16的核苷酸序列或其片段相同至少80%的核苷酸序列,其中包含SEQ ID NOs:10和/或16的核苷酸序列相对于编码多肽的多核苷酸序列以相反方向定向,并且包含SEQ ID NOs:12和/或15的核苷酸序列以与编码多肽的多核苷酸序列相同的方向定向。同等更优选地是与选自SEQ ID NOs:23、25、28和16的核苷酸序列或其片段相同至少80%的核苷酸序列,更优选地是与选自SEQ ID NOs:23、25、28和16的核苷酸序列或其片段相同至少80%的核苷酸序列,其中包含SEQ ID NOs:23和/或16的核苷酸序列相对于编码多肽的多核苷酸序列以相反方向定向,并且包含SEQ ID NOs:25和/或28的核苷酸序列以与编码多肽的多核苷酸序列相同的方向定向。
在一些实施方案中,选自SEQ ID NOs:7、9、10、11、12、13、14、15、16、20、22、23、24、25、26、27和28的核苷酸序列或其片段包含5个或更少、优选地4个或更少、更优选地3个或更少、最优选地2个或更少的、特别是1个核酸修饰,其中核酸修饰优选地是核酸置换。
在一些实施方案中,选自SEQ ID NOs:7、9、11、14、20、22、24和27的核苷酸序列或其片段包含5个或更少、优选地4个或更少、更优选地3个或更少、最优选地2个或更少的、特别是1个核酸修饰,其中核酸修饰优选地是核酸置换。
在一些实施方案中,选自SEQ ID NOs:7、9、11、14的核苷酸序列或其片段在第16位置处相对于SEQ ID NOs:7、9、11、14的核苷酸序列的起始包含一个核酸置换。优选地在第16位置处的G相对于核苷酸序列起始替换为T。
在一些实施方案中,选自SEQ ID NOs:20、22、24和27的核苷酸序 列或其片段在第13位置处相对于SEQ ID NOs:20、22、24和27的核苷酸序列的起始包含一个核酸置换。优选地在第13位置处的G相对于核苷酸序列起始替换为T。
在又一个实施方案中,真核GAPDH启动子上游的非翻译性基因组DNA序列以与编码多肽的多核苷酸序列相同的方向定向。
在又一个实施方案中,真核GAPDH启动子上游的非翻译性基因组DNA序列相对于编码多肽的多核苷酸序列以相反方向定向。
在优选实施方案中,如上文描述,表达盒包含启动子、编码多肽的多核苷酸序列和真核GAPDH启动子下游的非翻译性基因组DNA序列和真核GAPDH启动子上游的非翻译性基因组DNA序列。优选地,真核GAPDH启动子下游的非翻译性基因组DNA序列和真核GAPDH启动子上游的非翻译性基因组DNA序列的起源是相同的,即,是相同物种的。更优选地,真核GAPDH启动子下游非翻译性基因组DNA序列、真核GAPDH启动子上游非翻译性基因组DNA序列和宿主细胞的起源是相同的,即,是相同物种的,例如真核GAPDH启动子下游非翻译性基因组DNA序列、真核GAPDH启动子上游的非翻译性基因组DNA序列和宿主细胞的起源来自相同的哺乳动物,例如来自人。
在一些实施方案中,如果真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列是来自一个物种的非翻译性基因组DNA序列,则表达盒的启动子不是来自相同物种的GAPDH启动子。
在一些实施方案中,如果真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列是人源下游和/或上游的非翻译性基因组DNA序列,则表达盒的启动子不是人GAPDH启动子。
在一些实施方案中,表达盒的启动子不是GAPDH启动子。
在一个实施方案中,如果表达盒包含启动子、编码多肽的多核苷酸序列和真核甘油醛3-磷酸脱氢酶(GAPDH)启动子下游的非翻译性基因组DNA序列,其中由多核苷酸序列编码的多肽不是GAPDH,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列始于跨越核苷酸位置约 +1至核苷酸位置约+7000的区域内部,其中核苷酸位置是相对于GAPDH mRNA转录起始的,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列的长度是约100至约15000个核苷酸并且其中表达盒还包含真核GAPDH启动子上游的非翻译性基因组DNA序列,其中真核GAPDH启动子上游的非翻译性基因组DNA序列始于跨越约真核GAPDH启动子的5'末端至核苷酸位置约-3500的区域内部,其中核苷酸位置是相对于GAPDH mRNA转录起始的,并且其中真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是约100至约15000个核苷酸,表达盒的启动子可以是真核GAPDH启动子,优选地是哺乳动物GAPDH启动子,更优选地是啮齿类或人GAPDH启动子。在这个实施方案中,始于跨越约真核GAPDH启动子的5'末端至核苷酸位置约-3500的区域内部的真核GAPDH启动子上游非翻译性基因组DNA序列优选地刚好位于真核GAPDH启动子的上游,更优选地在这个实施方案中,表达盒包含天然存在的基因组DNA序列,所述基因组DNA序列包含真核GAPDH启动子并延伸至核苷酸位置约-3500,其中核苷酸位置是相对于GAPDH mRNA转录起始的。
在一些实施方案中,真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列是哺乳动物源的,例如真核GAPDH启动子是哺乳动物GAPDH启动子,并且哺乳动物GAPDH启动子下游和/或上游的非翻译性基因组DNA序列如本文所述那样使用。
在一些实施方案中,真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列是啮齿类或人源的,例如真核GAPDH启动子是啮齿类或人GAPDH启动子,并且啮齿类或人GAPDH启动子下游和/或上游的非翻译性基因组DNA序列如本文所述那样使用。
优选地,真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列选自人、大鼠或小鼠源,更优选地来自人源或小鼠源,最优选地来自人源。
在一些实施方案中,真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列未与编码多肽的多核苷酸序列有效连接。
在一些实施方案中,表达盒包含多聚腺苷化位点。优选地,多聚腺苷化位点选自SV40poly(A)和BGH(牛生长激素)poly(A)。
在一些实施方案中,表达盒的启动子和编码多肽的多核苷酸序列有效连接。
在一些实施方案中,表达盒的启动子选自SV40启动子、人tk启动子、MPSV启动子、小鼠CMV、人CMV、大鼠CMV、人EF1α、中国仓鼠EF1α、人GAPDH、杂合启动子,所述杂合启动子包括MYC、HYK和CX启动子。
在一些实施方案中,由表达盒编码的多肽可以是非糖基化多肽和糖基化多肽。糖基化多肽指具有至少一条寡糖链的多肽。
非糖基化蛋白的例子是例如非糖基化激素;非糖基化酶;神经生长因子(NGF)家族、上皮生长因子(EGF)和成纤维细胞生长因子(FGF)家族的非糖基化生长因子以及激素和生长因子的非糖基化受体。
糖基化蛋白的例子是激素和激素释放因子、凝血因子、抗凝血因子、激素或生长因子的受体、神经营养因子细胞因子和它们的受体、T细胞受体、表面膜蛋白、转运蛋白、归巢受体、地址素、调节蛋白、抗体、嵌合蛋白(如免疫黏附素)和任何糖基化蛋白的片段。优选地,多肽选自抗体,抗体片段或抗体衍生物(例如Fc融合蛋白和特殊抗体样式,如双特异性抗体)。如本文所用的抗体片段包括,但不限于(i)结构域;(ii)由VL、VH、CL或CK和CH1结构域组成的Fab片段,包括Fab'和Fab'-SH;(iii)由VH和CH1结构域组成的Fd片段;(iv)由单个可变域组成的dAb片段(Ward ES等人,(1989)Nature,341(6242):544-6);(v)F(ab')2片段,一种包含两个连接的Fab片段的双价片段;(vi)单链Fv分子(scFv),其中VH结构域和VL结构域由允许这两个结构域缔合以形成抗原结合位点的肽接头连接(Bird RE等人,(1988)Science,242(4877):423-6;Huston JS等人,(1988)Proc Natl Acad Sci U S A,85(16):5879-83);(vii)“双抗体”或“三抗体”,通过基因融合所构建的多价或多特异性片段(Holliger P等人,(1993)Proc Natl Acad Sci U S A,90(14):6444-8;Holliger P等人,(2000)Methods  Enzymol,326:461-79);(viii)scFv,与Fc区融合的双抗体(diabody)或结构域抗体和(ix)与相同或不同抗体融合的scFv。
在一些实施方案中,表达盒还包含遗传元件,所述遗传元件选自额外的启动子、增强子、转录控制元件和选择标记,优选地在动物细胞中表达的选择标记。转录控制元件例如是Kozak序列或转录终止子元件。
在一个实施方案中,遗传元件是一种选择标记,其中在编码选择标记的多核苷酸序列中含有的CpG位点的含量是45或更小,优选地是40或更小,更优选地是20或更小,特别地是10或更小,更特别地是5或更小,最特别地是0(已经彻底移除CpG位点)。
在又一个方面,本公开提供表达载体,优选地包含如上文所述表达盒的哺乳动物表达载体。
在一些实施方案中,表达载体包含至少两个独立的转录单位。具有两个独立转录单位的表达载体也称作双基因载体。其例子是其中第一转录单位编码抗体重链或其片段且第二转录单位编码抗体轻链的载体。另一个例子是其中两个转录单位编码蛋白质(如酶)的两个不同亚基的双基因载体。然而,还可能的是本发明的表达载体包含多于两个独立转录单位,例如三、四或甚至更多个独立转录单位,所述独立转录单位各自包含编码不同多肽链的不同核苷酸序列。其例子是具有4个独立转录单位的载体,所述独立转录单位各自含有编码由4个不同亚基组成的酶的一个亚基的不同核苷酸序列。
在一些实施方案中,表达载体还包含选自额外启动子、增强子,转录控制单元、复制起点和选择标记的遗传元件。
在一些实施方案中,表达载体还包含复制起点和选择标记,其中表达载体的编码复制起点和选择标记的多核苷酸序列中所含的CpG位点的含量是200或更小,优选地是150或更小,特别地是100或更小,更特别地是50或更小,最特别地是30或更小。
常使用的任何选择标记如胸苷激酶(tk)、二氢叶酸还原酶(DHFR)、嘌呤霉素、新霉素或谷氨酰胺合成酶(GS)可以用于本发明的表达盒或表达载 体。优选地,本发明的表达载体还包含有限数目的有用限制性位点用于插入分泌本发明异源蛋白的表达盒。在仅特别用于瞬时/附加型表达使用时,本发明的表达载体还可以包含在真核宿主细胞中用于自主复制/附加型维持的复制起点如EB病毒(EBV)或SV40病毒的oriP起点,但是可以缺少选择标记。还可能在缺少促进载体复制的相关因子的细胞中瞬时表达。
携带表达盒的表达载体还可以包含编码荧光标记的表达盒、编码ncRNA的表达盒、编码抗凋亡蛋白的表达盒或编码增加分泌途径容量的蛋白质的表达盒。
在又一个方面,本公开提供一种表达载体,其依次包含:
a)真核GAPDH启动子上游和/或下游的非翻译性基因组DNA序列
b)启动子
c)编码多肽的多核苷酸序列
d)多聚腺苷化位点
e)增强子
f)真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列,或
a)真核GAPDH启动子上游和/或下游的非翻译性基因组DNA序列
b)增强子
c)启动子
d)编码多肽的多核苷酸序列
e)多聚腺苷化位点
f)真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列,或
a)增强子
b)真核GAPDH上游和/或下游的非翻译性基因组DNA序列
c)启动子
d)编码多肽的多核苷酸序列
e)多聚腺苷化位点
f)真核GAPDH下游和/或上游的非翻译性基因组DNA序列,
其中包含增强子是任选的,并且其中由多核苷酸序列编码的多肽不是 GAPDH,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列始于跨越核苷酸位置约+1至核苷酸位置约+7000的区域内部,其中核苷酸位置是相对于GAPDH mRNA转录起始的,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列的长度是约100至约15000个核苷酸并且其中真核GAPDH启动子上游的非翻译性基因组DNA序列始于跨越约真核GAPDH启动子的5'末端至核苷酸位置约-3500的区域内部,其中核苷酸位置是相对于GAPDH mRNA转录起始的,并且其中真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是约100至约15000个核苷酸,条件是如果a)或b)是真核GAPDH上游的非翻译性基因组DNA序列,则f)是真核GAPDH下游的非翻译性基因组DNA序列,并且如果a)或b)是真核GAPDH下游的非翻译性基因组DNA序列,则f)是真核GAPDH上游的非翻译性基因组DNA序列。
在一些实施方案中,本公开提供一种表达载体,其依次包含:
a)真核GAPDH启动子上游的非翻译性基因组DNA序列
b)启动子
c)编码多肽的多核苷酸序列
d)多聚腺苷化位点
e)增强子
f)真核GAPDH启动子下游的非翻译性基因组DNA序列,其中包含增强子是任选的。
在又一个方面,本公开提供一种表达载体,其依次包含:
a)真核GAPDH启动子上游的非翻译性基因组DNA序列
b)增强子
c)启动子
d)编码多肽的多核苷酸序列
e)多聚腺苷化位点
f)真核GAPDH下游的非翻译性基因组DNA序列,
其中包含增强子是任选的。
在又一个方面,本公开提供一种表达载体,其依次包含:
a)增强子
b)真核GAPDH上游的非翻译性基因组DNA序列
c)启动子
c)编码多肽的多核苷酸序列
e)多聚腺苷化位点
f)真核GAPDH下游的非翻译性基因组DNA序列,
其中包含增强子是任选的。
在又一个方面,本公开提供一种表达载体,其依次包含:
a)真核GAPDH启动子下游的非翻译性基因组DNA序列
b)启动子
c)编码多肽的多核苷酸序列
d)多聚腺苷化位点
e)增强子
f)真核GAPDH启动子上游的非翻译性基因组DNA序列,其中包含增强子是任选的。
在又一个方面,本公开提供一种表达载体,其依次包含:
a)真核GAPDH启动子下游的非翻译性基因组DNA序列
b)增强子
c)启动子
d)编码多肽的多核苷酸序列
e)多聚腺苷化位点
f)真核GAPDH上游的非翻译性基因组DNA序列
其中包含增强子是任选的。
在又一个方面,本公开提供一种表达载体,其依次包含:
a)增强子
b)真核GAPDH下游的非翻译性基因组DNA序列
c)启动子
d)编码多肽的多核苷酸序列
e)多聚腺苷化位点
f)真核GAPDH上游的非翻译性基因组DNA序列,
其中包含增强子是任选的。
表达载体的真核GAPDH上游非翻译性基因组DNA序列、增强子、启动子、编码多肽的多核苷酸序列、多聚腺苷化位点和真核GAPDH启动子下游非翻译性基因组DNA序列例如如上文描述。
在又一个方面,本公开提供包含如上文描述的表达盒或表达载体的宿主细胞。该宿主细胞可以是人或非人细胞。优选的宿主细胞是哺乳动物细胞。哺乳动物宿主细胞的优选例子包括而不限于人胚肾细胞(Graham FL等人,J.Gen.Virol.36:59-74)、MRC5人成纤维细胞、983M人黑色素瘤细胞、MDCK犬肾细胞、RF培养的从Sprague-Dawley大鼠分离的大鼠肺成纤维细胞、B16BL6鼠黑色素瘤细胞、P815鼠肥大细胞瘤细胞、MTl A2鼠乳房腺癌细胞、PER:C6细胞(Leiden、荷兰)和中国仓鼠卵巢(CHO)细胞或细胞系(Puck等人,1958,J.Exp.Med.108:945-955)。
在一个具体的优选实施方案中,宿主细胞是中国仓鼠卵巢(CHO)细胞或细胞系。合适的CHO细胞系例如包括CHO-S(Invitrogen,Carlsbad,CA,美国)、CHO Kl(ATCC CCL-61)、CHO pro3-、CHO DG44、CHO P12或dhfr-CHO细胞系DUK-BII(Chasin等人,PNAS 77,1980,4216-4220)、DUXBI l(Simonsen等人,PNAS 80,1983,2495-2499)、或CHO-K1SV(Lonza,巴赛尔,瑞士)。
在又一个方面,本公开提供用于表达多肽的体外方法,所述方法包括用如上文描述的表达盒或表达载体转染宿主细胞并回收多肽。该多肽优选地是异源的,更优选地是人多肽。
根据本发明为了将表达盒或表达载体转染入宿主细胞,可以使用任何转染技术,如本领域熟知的那些,例如电穿孔法、磷酸钙共沉淀法、DEAE-葡聚糖转染法、脂质体转染法,适当时用于给定宿主细胞类型。应当指出, 用本发明表达盒或表达载体转染的宿主细胞应当解释为是瞬时或稳定转染的细胞系。因此,根据本发明,本发明表达盒或表达载体可以按附加型方式维持,即瞬时转染的,或可以稳定整合在宿主细胞的基因组中,即稳定转染的。
瞬时转染以不采用针对具有选择标记的载体的任何选择压力为特征。在转染后通常持续2直至10日的瞬时表达实验中,转染的表达盒或表达载体作为附加型元件维持并也不整合至基因组中。即,转染的DNA通常不整合至宿主细胞基因组中。宿主细胞倾向于丢失转染的DNA并且当培养瞬时转染的细胞汇集物时在群体中长满转染的细胞。因此表达在紧邻转染后的时间段中最强烈并且随时间减少。优选地,将本发明的瞬时转染子理解为在选择压力不存在的情况下在细胞培养物中维持直至转染后2至10日时间的细胞。
在本发明的优选实施方案中,宿主细胞例如CHO宿主细胞用本发明的表达盒或表达载体稳定转染。稳定转染意指新引入的外来DNA如载体DNA被掺入基因组DNA中,通常借助随机非同源重组事件。可以通过选择其中在整合入宿主细胞的DNA之后载体序列已经被扩增的细胞系,增加载体DNA的拷贝数以及同时增加基因产物的量。因此,可能的是当暴露于用于扩增基因的选择压力进一步增加时,这种稳定整合在CHO细胞中产生双倍微小染色体。另外,稳定转染可以导致丢失与重组基因产物表达不直接相关的载体序列部分,例如当基因组整合时变得多余的细菌拷贝数控制区。因此,转染的宿主细胞已经将表达盒或表达载体的至少部分或不同部分整合至基因组中。
在又一个方面,本公开提供如上文描述的表达盒或表达载体用于从哺乳动物宿主细胞表达异源多肽的用途,特别是如上文描述的表达盒或表达载体用于从哺乳动物宿主细胞体外表达异源多肽的用途。
可以根据本领域技术人员已知的方法实施蛋白质的表达和回收。
为了表达多肽,使用如上文描述的表达盒或表达载体的真核GAPDH启动子下游和/或上游非翻译性基因组DNA序列和如上文描述的宿主细胞 并且它们通常是相同来源的。令人惊讶地已经发现如果表达盒或表达载体的真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列和宿主细胞是不同来源的,例如,如果在CHO细胞中使用人的真核GAPDH启动子下游和/或上游的DNA序列,则获得表达的增加。
在又一个方面,本公开提供如上文描述的表达盒或表达载体制备用于治疗疾病的药物的用途。
在又一个方面,本公开提供如上文描述的表达盒或表达载体,其用作治疗疾病的药物。
在又一个方面,本公开提供如上文描述的表达盒或表达载体,其用于基因疗法。
实施例
实施例1:表达载体的克隆:
I.材料和方法
I.1质粒构建体
I.1.1.LB培养板
将500ml水与16g LB琼脂(Invitrogen,Carlsbad,CA,美国)混合并煮沸(1升LB含有10g胰蛋白胨、5g酵母提取物和10g NaCl)。在冷却下来后,将相应的抗生素添加至溶液,所述溶液随后铺板(氨苄青霉素平板为100μg/ml和卡那霉素平板为50μg/ml)。
I.1.2.聚合酶链反应(PCR)
全部PCR均使用50μl终体积中的1μldNTP(每种dNTP为10mM;Invitrogen,Carlsbad,CA,美国)、2单位DNA聚合酶(Finnzymes Oy,Espoo,芬兰)、25nmol引物A(Mycrosynth,Balgach,瑞士)、25nmol引物B(Mycrosynth,Balgach,瑞士)、10μl5X HF缓冲剂(7.5mM MgCl2,Finnzymes,Espoo,芬兰)、1.5μl二甲基亚砜(DMSO,Finnzymes,Espoo,芬兰)和1-3μl模板(1-2μg)进行。表1中列出使用的全部引物。
通过在98℃初始变性3分钟启动PCR,随后是35个循环:在98℃变性30秒,在引物特异性温度(根据CG含量)退火30秒和在72℃延长2分钟。在72℃进行最终延长10分钟,之后冷却和保持在4℃。
表1:PCR中使用的引物的总结。GAPDH:甘油醛3-磷酸脱氢酶序列,5':上游序列,3:下游序列。引物GlnPr1172中引入“T”(加下划线)以避免引物二聚体形成。

I.1.3.限制性消化
对于全部限制性消化,将约1μg质粒DNA(用NanoDrop,ND-1000分光光度计(Thermo Scientific,威名顿,DE,美国)定量)混合入10-20单位的每种酶、4μl相应10X NEBuffer(NEB,Ipswich,MA,美国)中,并且将体积用无菌H2O补足至40μl。在不进一步明示的情况下,将消化物在37℃温育1小时。
在每次制备性消化主链后,添加1单位牛小肠碱性磷酸酶(CIP;NEB,Ipswich,MA,美国)并将混合物在37℃温育30分钟。
如果在NEBuffer 3(NEB,Ipswich,MA,美国)中进行消化,则在添加CIP之前将缓冲液改变成NEB缓冲液4,因为这种酶在这个缓冲液中具有强烈活性并且还可以消化在外末端处的一些核苷酸。
I.1.4.PCR纯化和琼脂糖凝胶电泳
I.1.4.1.PCR净化
为允许消化,在限制性消化之前,使用Macherey Nagel Extract II试 剂盒(Macherey Nagel,Oensingen,瑞士),遵循制造商的手册,使用40μl洗脱缓冲液净化全部PCR片段。这种方案还用于改变DNA样品的缓冲液。
I.1.4.2.DNA提取
对于凝胶电泳,使用UltraPureTM琼脂糖(Invitrogen,Carlsbad,CA,美国)和50X Tris乙酸EDTA缓冲液(TAE,pH 8.3;Bio RAD,Munich,德国),制备1%凝胶。为了DNA染色,将1μl Gel Red Dye(Biotum,Hayward,CA,美国)添加至100ml琼脂糖凝胶。作为大小标志物,使用2μg的1kb DNA梯(NEB,Ipswich,MA,美国)。电泳以125伏运行约1小时。
将目的条带从琼脂糖凝胶切下并使用试剂盒Extract II(Macherey-Nagel,Oensingen,瑞士),遵循制造商手册,使用40μl洗脱缓冲液进行纯化。
I.1.5.连接
对于每个连接,将4μl插入物与1μl载体、400单位连接酶(T4DNA连接酶,NEB,Ipswich,MA,美国),1μl10X连接酶缓冲液(T4DNA连接酶缓冲液;NEB,Ipswich,MA,美国)在10μl体积中混合。将混合物在室温温育1-2小时。
I.1.6.连接产物转化入感受态细菌中
为了克隆pGLEX41-[REP]并对于用含有标准复制起点的pCR-Blunt载体产生的构建体,使用TOP10(OneTOP 10感受态大肠杆菌;Invitrogen,Carlsbad,CA,美国)。
为了含有R6K复制起点的质粒的复制起始,需要表达pir序列编码的π蛋白。π蛋白由OnePIR1感受态大肠杆菌(Invitrogen,Carlsbad,CA,美国)表达。这些细菌用于含有R6K序列的全部载体。
为了用连接产物转化感受态细菌,在冰上融化25-50μl细菌5分钟。 随后,将3-5μl连接产物添加至感受态细菌并在冰上温育20-30分钟,随后在42℃热休克1分钟。随后,每管添加500μl S.O.C培养基(Invitrogen,Carlsbad,CA,美国)并在37℃在搅拌下温育1小时。最后,将细菌涂布在含氨苄青霉素(Sigma-Aldrich,St.Louis,MO,美国)的LB平板上并在37℃温育过夜。为了在pCR-Blunt载体中克隆,使用含卡那霉素(Sigma-Aldrich,St.Louis,MO,美国)的平板。
I.1.7.小规模(小量)和中等规模(中等量)质粒制备
I.1.7.1.小量制备
为了小量制备,将转化细菌的菌落在2.5ml LB和氨苄青霉素或卡那霉素中在37℃,200rpm培育6-16小时。遵循提供的手册,用大肠杆菌质粒纯化试剂盒(QuickPure,Macherey Nagel,Oensingen,瑞士)提取DNA。
通过测量在260nm处的吸光度并评估必须在1.8和2之间的OD260nm/OD280nm比率,用NanoDrop ND-1000分光光度计(Thermo Scientific,威名顿,DE,美国),定量来自小量制备的质粒DNA一次。在发送样品到Fasteris SA(Geneva,瑞士)以便序列证实之前,进行对照消化。
对于BAC提取,使用QuickPure试剂盒(Macherey Nagel,Oensingen,瑞士),同时对方案作出以下修改:用含有pBACe3.6载体的细菌接种10ml LB和氯霉素(12.5μg/ml)(Sigma-Aldrich,St.Louis,MO,美国)。在振动平台上37℃温育过夜后,将培养物以13 300rpm离心5分钟,之后重悬于500μl A1缓冲液中。添加500μl A2裂解缓冲液并且将溶液在室温温育5分钟。随后,将该溶液用600μlA3缓冲液中和并以13 300rpm离心10分钟。将上清液加载在柱上,并且从这个步骤往后,使用QuickPure小量制备试剂盒的标准方案。
I.1.7.2.中等量制备
为了中等量制备,将转化的细菌在200至400ml LB和氨苄青霉素(或卡那霉素)中于37℃培育过夜。随后,将培养物以725g离心20分钟并且 使用商业试剂盒(NucleoBond Xtra Midi;Macherey Nagel,Oensingen,瑞士),遵循制造商的手册中提供的低拷贝质粒方案纯化质粒。
用NanoDrop ND-1000分光光度计3次定量来自中等量制备的质粒-DNA,用限制性消化物证实并最终发送测序(Fasteris SA,Geneva,瑞士)。
II.结果和讨论
II.1.克隆GAPDH表达盒上游和下游的DNA区域(5'和3'GAPDH)
在Imagene(柏林,德国)订购BAC克隆RPCIB753F11841Q。这个克隆在含有氯霉素抗性基因的pBACe3.6载体主链中含有人GAPDH序列。在通过小量制备提取DNA后,通过Nanodrop确定载体浓度是27ng/μl。
使用27ng纯化的克隆RPCIB753F11841Q作为模板,通过PCR扩增启动子上游和多聚腺苷化位点下游紧邻GAPDH表达盒周围的DNA序列。用引物GlnPr1171(SEQ ID NO:1)和GlnPr1172(SEQ ID NO:2)扩增启动子上游的3kb片段,产生具有SEQ ID No.5的扩增子。由于引物GlnPr1172(SEQ ID NO:2)相对于模板序列携带碱基变化(G至T),源自这个PCR反应的全部序列也将携带这个碱基变化。该变化位于相对于GAPDH基因转录起始的位置-3721内(SEQ ID NO:17的bp812,相对于SEQ ID NO:5起始的位置23)。用引物GlnPr1173(SEQ ID NO:3)和GlnPr1174(SEQ ID NO:4)扩增多聚腺苷化位点下游的3kb片段,产生具有SEQ ID NO:6的扩增子(表1)。用于这些PCR的退火温度是72℃。
将5'和3'GAPDH片段(SEQ ID NOs:5和6)克隆在市售PCR产物克隆载体pCR-Blunt(pCR-Blunt,PCR Zero Blunt克隆试剂盒,Invitrogen)中。将连接产物转化至TOP10感受态细菌中并涂布在卡那霉素LB-琼脂平板上。放大菌落并通过小量制备法分离质粒。进行对照消化以鉴定阳性克隆,其产生pCR-Blunt-5'GAPDH和pCR-Blunt-3'GAPDH构建体。
II.2.制备编码报道蛋白GFP和重组IgG1单克隆抗体的DNA片段(LC-IRES-HC-IRES-GFP)
本工作中使用的报道基因构建体(REP)以多顺反子基因方式组成:IgG1单克隆抗体轻链(LC)-IRES-IgG1单克隆抗体重链(HC)-IRES-绿色荧光蛋白(GFP)。源自脑心肌炎病毒的内部核糖体进入位点(IRES)(Gurtu等人,Biochem Biophys Res Commun.;229(1):295-298,1996))的存在允许以下3种肽的翻译:IgG1单克隆抗体轻链(LC)、IgG1单克隆抗体重链(HC)和GFP(图1)。转染的细胞将因此分泌IgG1单克隆抗体并以依赖性方式积累胞内GFP。然而,多顺反子mRNA在真核细胞中不常见并且它们的翻译不是非常有效的,导致IgG1和GFP表达的滴度相对低。
使用限制性酶NheI和BstBI(BstBI在65℃使用)消化含有REP构建体的载体。将含有该表达构建体的REP片段切下,纯化和用于进一步的克隆步骤。
II.3.表达载体的克隆
将载体pGLEX41(一种源自pcDNA3.1(+)(Invitrogen,Carlsbad,CA)的表达载体)用于产生稳定细胞系。使用它作为初始主链,所述初始主链已经被修饰以产生具有和不具有GAPDH序列的第二代载体A和B。对于全部载体,使用相同的启动子-内含子组合(mCMV和编码第一内含子(IgDA)的供体-接纳体片段)(Gorman等人,(1990)Proc Natl Acad Sci USA,87:5459-5463)。
中间载体pGLEX41-HM-MCS-ampiA的克隆:
新一代载体的开发始自pGLEX41。使用限制性酶NruI和BspHI切割这种载体以释放氨苄青霉素抗性盒。将主链片段用CIP处理并通过凝胶电泳纯化。已经从GeneArt订购编码密码子优化(以便在大肠杆菌中表达)形式的氨苄青霉素抗性基因(包含bla启动子)的DNA片段。使用限制性酶NruI和BspHI(与针对主链所用相同的酶),从GeneArt克隆载体#1013237切下插入物,将其纯化并克隆入主链中。
通过限制性消化分析小量制备物。克隆pGLEX41-HM-MCS-ampiA#2 具有期望的限制性图谱并且通过测序证实了正确片段的整合。
中间载体pGLEX41-MCS-R6K-ampiA的克隆:
为了交换载体pGLEX41-HM-MCS-ampiA#2的pUC复制起点,使用PvuI和BspHI消化该载体。将主链片段用CIP处理并纯化。新插入片段含有R6K复制起点和修饰的SV40poly(A)序列作为表达盒的部分。已经消除SV40poly(A)周围不必要的细菌或病毒主链序列(见下表2)。已经从GeneArt订购插入片段;使用酶PvuI和BspHI(与针对主链所用的酶相同),从GeneArt克隆载体#1013238切下该片段,将其纯化并克隆入主链片段中。制备小量制备物并通过序列分析验证。克隆pGLEX41-MCS-R6K-ampiA#1具有正确的序列。
表2:不同载体中CpG的含量

中间载体pGLEX41-MCS-R6K-ampiB的克隆
使用限制性酶BspHI和CIP,打开载体pGLEX41-MCS-R6K-ampiA#1以释放氨苄青霉素抗性。新的插入片段含有经优化以便在大肠杆菌中表达的氨苄青霉素抗性密码子,但是,已经替换可以通过备选密码子选择予以消除的全部CpG序列(见上表2)。这个片段在GeneArt订购。为了释放插入片段,使用BspHI消化GeneArt克隆载体#1016138。通过凝胶电泳纯化插入片段和主链片段后,将它们连接并转化至PIR1细 菌中。将小量制备物直接发送测序。pGLEX41-R6K-MCS-ampiB#1具有正确序列并且用于进一步克隆步骤。
在pGLEX41衍生的表达载体中克隆报道基因构建体
为了在表达载体pGLEX41-MCS-R6K-ampiA和pGLEX41-MCS-R6K-ampiB中克隆报道基因构建体REP,使用限制性酶NheI和ClaI切割载体。使用限制性酶NheI和BstBI(在65℃)打开表达载体pGLEX41-HM-MCS。在消化后,全部载体主链用CIP处理并且通过凝胶电泳纯化主链。将主链与编码报道基因构建体REP的NheI/BstBI(BstBI与ClaI相容)片段连接。将连接产物转化至PIR1或TOP 10感受态细菌中并涂布在氨苄青霉素LB-琼脂平板上。放大菌落并通过小量制备法分离质粒。通过小量制备物的限制性消化鉴定阳性克隆并且由Fasteris SA后续测序证实。
在pGLEX41衍生的表达载体中添加GAPDH侧翼序列
这个段落的全部限制性消化在80μl终体积中进行并在37℃温育过夜。
使用限制性酶NruI,将5'GAPDH序列(SEQ ID NO:7)从pCR-blunt-5'GAPDH切下并在使用NruI作线性化并用CIP处理以避免再环化的表达载体pGLEX41-R6K-ampiA-[REP]和pGLEX41-R6K-ampiB-[REP]中连接。在扩增(通过转化连接产物所获得的)PIR1菌落后,通过限制性消化分析小量制备物。克隆pGLEX41-R6K-ampiA-5'GAPDH-[REP]#2和pGLEX41-R6K-ampiB-5'GAPDH-[REP]#1在限制性分析中显示预期大小的条带,随后通过测序证实并用于其他克隆步骤。将这些新载体随后用ScaI打开并用CIP处理。使用相同酶,将3'GAPDH片段(SEQ ID NO:8)从pCR-Blunt-3'GAPDH切下并连接至两个主链中,以产生pGLEX41-R6K-ampiA-GAPDH-[REP] 和pGLEX41-R6K-ampiB-GAPDH-[REP]表达载体。
克隆pGLEX41-R6K-ampiA-GAPDH-[REP]#2和pGLEX41-R6K-ampiB-GAPDH-[REP]#8的对照消化物在限制性分析中显示预期大小的条带。随后通过测序证实3'GAPDH片段以正确方向插入(Fasteris)。
II.4.抗性载体的克隆
克隆抗性载体的起点是载体pGLEX-MCS-R6K-ampiA#1。对于抗性基因的表达,弱启动子足够用,将mCMV启动子替换为SV40启动子。编码抗性基因的基因从GeneArt SA(雷根斯堡,德国)订购且将其为在中国仓鼠(嘌呤霉素:puroA以及新霉素:neoA)中的表达而优化或通过选择性密码子选择降低CpG含量(嘌呤霉素:puroB以及新霉素:neoB)。
pGLEX-R6K-AmpiA-PuroA/PuroB的克隆:
为了在表达盒中克隆嘌呤霉素抗性,使用限制性酶NruI和Xba I打开载体pGLEX41-MCS-R6K-ampiA#1,随后用CIP处理。插入片段从GeneArt订购并且作为GeneArt克隆载体#1013239中的插入物提供。它含有SV40启动子和密码子优化的嘌呤霉素抗性基因(针对CHO细胞的密码子选择)。使用酶NruI和XbaI(与针对主链所用相同的酶),从GeneArt克隆载体切下插入物,将其纯化并克隆入主链片段中。制备小量制备物并通过限制性消化进行分析。克隆pGLEX-MCS-R6K-ampiA-puroA#1显示正确的图谱并可以通过测序证实。
通过交换嘌呤霉素抗性基因的编码区,同时保留SV40启动子,将这个载体用于载体pGLEX-MCS-R6K-ampiA-puroB的克隆。新插入片段含有密码子优化形式的嘌呤霉素基因,其中已经替换因备选密码子选择而可消除的全部CpG序列。该片段已经从GeneArt订购并且在克隆载体#1016139中输送。为了释放插入片段,使用限制性酶Xba I和NotI消化GeneArt载体。将插入片段通过凝胶电泳纯化并克隆至 pGLEX-MCS-R6K-ampiA-puroA的主链中,随后通过使用XbaI和NotI限制性消化释放嘌呤霉素可读框,然后进行CIP处理。通过序列分析直接证实所产生的载体pGLEX-MCS-R6K-ampiA-puroB#1。
载体pGLEX-R6K-ampiA-NeoA和pGLEX-R6K-ampiA-NeoB的克隆
为了在表达盒中克隆新霉素抗性基因,使用限制性酶Xba I和NotI打开载体pGLEX-R6K-puroA#1,随后用CIP处理。插入片段从GeneArt订购并且作为GeneArt克隆载体#1013242(neoA)和#1026894(neoB)中的插入物提供。它们分别含有针对CHO细胞密码子选择进行密码子优化的新霉素抗性基因和CpG缩减形式的新霉素抗性基因。使用酶XbaI和NotI(与针对主链所用相同的酶),从GeneArt克隆载体切下插入物,将其纯化并克隆入主链片段中。制备小量制备物并通过测序证实克隆。
载体pGLEX-R6K-ampiB-NeoB和pGLEX41-R6K-ampiB-puroB的克隆:
将载体pGLEX41-R6K-puroB#1使用限制性酶BspHI打开并随后作CIP处理。插入片段含有经密码子优化以便在大肠杆菌中表达的氨苄青霉素抗性基因,同时已经替换因备选密码子选择而可消除的全部CpG序列。这个片段已经在GeneArt订购并在克隆载体#1016138中抵达。为了释放插入片段,使用BspHI消化GeneArt克隆载体。通过凝胶电泳纯化插入片段和主链片段后,将它们连接并转化至PIR1细菌中。将小量制备物直接发送测序并且其可以得到证实(pGLEX41-ampiB-R6K-puroB#1)。
通过使用限制性酶BspHI打开pGLEX-R6K-neoB-ampiA以产生主链片段,进行克隆,产生载体pGLEX-R6K-neoB-ampiB。使用相同的限制性酶组合对pGLEX-R6K-ampiB-hygroB的消化产生了编码ampiB的插入片段。将ampiB插入物克隆至pGLEX-R6K-neoB-ampiA主链中。
II.5添加人GAPDH基因上游和下游的序列至抗性载体中
用NruI消化载体pCR-blunt-5'GAPDH以获得5'GAPDH插入物(3164bp)。将编码抗性基因的载体用NruI消化,随后用CIP(牛小肠磷酸酶,NEB,Ipswich,MA)处理以制备主链片段。将4个不同主链片段(pGLEX-R6K-neoA-ampiA、pGLEX-R6K-neoB-ampiB、pGLEX-R6K-puroA-ampiA和pGLEX-puroB-ampiB)与3164bp的5'GAPDH插入物连接并转化至PIR1感受态细菌中。使用ApalI对小量制备物的限制性消化允许鉴定出克隆pGLEX-R6K-neoB-ampiB-5'GAPDH#5、pGLEX-R6K-neoA-ampiA-5'GAPDH#6、pGLEX-R6K-puroA-ampiA-5'GAPDH#16和pGLEX-puroB-ampiB-5'GAPDH#5。
这些中间载体随后用限制性酶ScaI切割并用CIP处理以制备主链用于连接。使用ScaI切割携带第二插入片段pCR-Blunt-3'GAPDH的载体以释放插入片段(3224bp),即GAPDH下游侧翼区。将4个不同主链分子与纯化的3224bp插入片段连接并转化至PIR1感受态细胞中。通过限制性消化分析小量制备物。显示预期大小的限制性片段的克隆是pGLEX-R6K-neoB-ampiB-GAPDH#8、pGLEX-R6K-neoA-ampiA-GAPDH#1、pGLEX-R6K-puroA-ampiA-GAPDH#1和pGLEX-puroB-ampiB-GAPDH#4。随后通过测序分析证实这些克隆(Fasteris,Geneva,瑞士)。
II.1.5.为转染所克隆的质粒的中等量制备
为了具有足够量的质粒,使用Macherey Nagel试剂盒(NucleoBond Xtra Midi;Macherey Nagel,Oensingen,瑞士)制备中等量制备物。通过限制性消化和测序证实后,将质粒线性化并用于CHO-S细胞中转染。表3汇总了以中等量制备获得的质粒DNA批次、已经被制备用于转染的线性化DNA制备物、用于线性化的酶的浓度和来自Fasteris SA的证实各个质 粒的身份和序列信息的序列档案。在用于转染之前,全部中等量制备物均通过测序证实。
表3:克隆的质粒的总结。DNA中等量制备物和线性化中等量制备物的浓度(采用相应的酶)。GSC号编码各个质粒并允许确定相关的测序档案。

实施例2:用表达载体转染细胞:
1.材料和方法
CHO-S细胞和HEK293细胞
哺乳动物细胞是表达蛋白质的优选宿主,因为它们能够将重组蛋白正确折叠、装配和转录后修饰。使用CHO细胞系,原因是它们经充分表征并且不作为大多数对人致病的病毒的宿主,这使它们成为相对安全的稳定产生治疗性蛋白的宿主。将中国仓鼠卵巢细胞(CHO-S,Invitrogen,Carlsbad,CA,美国)在补充有4mM L-谷氨酰胺(Applichem,德国)并在摇床(200rpm,具有2.5cm环状划桨)中温育的PowerCHO-2CD培养基(Lonza,Verviers,比利时)中于37℃、5%CO2和80%湿度悬浮培养。
使用HEK293细胞,原因是它们易于转染并允许快速产生重组蛋白直至较低克数量。所用的细胞是HEK293-EBNA细胞(ATCC,马纳萨斯,VA)并且在Ex-cell 293培养基(Sigma-Aldrich,St.Louis,MI)中常规悬浮培养。
使用接种密度0.5x106个活细胞/ml,每3-4日在新鲜培养基中常规实施CHO-S和HEK293EBNA细胞的继代培养。使用10ml培养基,在含有允许气体交换的可透性滤器的50ml生物反应器管(Tubespin Bioreactor50;TPP,Trasadingen,瑞士)中培养细胞。使用台盼蓝细胞排斥法(cell exclusion method),用Countess自动化细胞计数器(Invitrogen,Carlsbad,CA,美国)确定细胞活力和浓度。对于CHO-S细胞使用PCV管(TPP,Trasadingen,瑞士),通过细胞压积法(packed cell volumn,PCV)确定证实细胞浓度。
细胞压积(PCV)
PCV方法基于微量PCV管(PCV细胞压积管;TPP,Trasadingen,瑞士)中以5000rpm离心特定体积的培养液体1分钟。在离心期间,细胞沉淀在管基部处的有刻度的毛细管中。随后通过相对于所离心的细胞培养液的量评估沉淀物体积确定细胞压积的百分数。例如,1%PCV表明10μl 细胞沉淀物存在于1ml培养液中。
对于细胞的常规细胞计数,将200μl每份样品移入PCV管中并且用尺(“易读取”测量装置;TPP,Trasadingen,瑞士)读取相应沉淀物的体积(以μl计)。将这个体积放大5倍以使该值针对1ml并且随后使用细胞特异性相关系数,乘以该值以获得活细胞浓度的估计值(以“百万个细胞/ml”计)。
“自动化”细胞计数
在样品与相同量的台盼蓝混合时,用自动化细胞计数器(Invitrogen,Carlsbad,CA,美国)确定细胞浓度和活力。随后将溶液移入室载玻片中,之后由该仪器读取。这种仪器允许Neubauer室的自动读出,在校正后,所述自动读出确定细胞活力和死细胞及活细胞的浓度。
流式细胞术分析
流式细胞术是一项分析单独细胞的多个参数的技术。这项技术允许定量和定性分析表型上彼此不同的细胞,例如死细胞与活细胞(根据细胞的大小和颗粒性)。它还允许对表达目的蛋白如GFP的细胞定量。通过无菌抽吸300μl样品从培养物收集细胞并且用配备488nm处发射的气冷氩激光的荧光相关细胞分选(FACS)Calibur流式细胞仪(Becton,Dickinson and Company,Franklin Lakes,NJ,美国)分析。用CellQuest软件进行分析。使用530/30-nm带通滤波器(band pass filter),用FL-1检测到GFP发射。
在第一门中,在SSC/FSC点图中按线性标度从分析排除细胞残片以及死细胞。随后,活细胞的GFP荧光按对数标度在直方图中显示。荧光分布的中位值用来评估所分析的细胞群体的GFP表达水平。
IgG定量方法:OCTET QK
OCTET QK系统(FortéBio,Menlo Park,CA,美国)执行抗体、蛋白质、肽、DNA和其他生物分子的无标记物定量并提供生物分子结合相互作 用的动力学表征。结合速率(nm)和样品的积累IgG1浓度(μg/ml)之间的相关性允许用校正曲线对IgG滴度定量。
将细胞样品以300g离心5分钟。随后将上清液用Octet缓冲液(对IgG1抗体而言1/5)在96孔平板中稀释,之后,使用蛋白A生物传感器(Protein A DIP and READTM Biosensor,Forté Bio,USA),以Octet分析以获得每孔的抗体浓度。
使用JetPEI瞬时转染
使用聚乙烯亚胺(PEI;JetPEI,Polyplus-transfection,Illkirch,法国)进行CHO-S和HEK293EBNA细胞的瞬时转染和稳定转染。PEI是可以与带负电荷的分子如DNA复合的阳离子聚合物。带正电荷的DNA-PEI复合物与带负电荷的细胞表面结合并且由胞吞作用内化。它达到溶酶体区室,从这里它由裂解释放至核。DNA-PEI复合物的高转染效率因PEI保护DNA免于溶酶体降解的能力所致。根据制造商提供的手册转染细胞。
全部质粒在稳定转染之前均线性化(重悬在100μl Tris-EDTA,pH7.5中的100μg DNA)。对于瞬时转染,直接使用来自中等量制备DNA的环状质粒。在这项研究中,在50ml生物反应器管中维持瞬时转染并且不添加抗生素。
通过共转染一个表达载体和两个抗性载体(分别编码嘌呤霉素或新霉素抗性)获得了表达IgG1和GFP的稳定CHO-S克隆。
稳定汇集物和小量汇集物的选择
通过分析胞内GFP表达,借助流式细胞术(BD FACS Calibur细胞计数器,#1293)在转染后24小时确定转染效率。如果GPF阳性细胞的百分数高于20%,将转染的细胞用选择培养基稀释并分配至96孔平板中(对于产生分离的稳定小量汇集物的有限稀释法)或在T-Flask中(以产生稳定汇集物)。使用的选择培养基是PowerCHO-2,4mM谷氨酰胺,补充有不同浓度的遗传霉素和嘌呤霉素。
在转染后7日,通过添加选择培养基至细胞更新选择严格性。一旦96孔平板中的集落汇合,使用荧光读数仪读取平板。
使用无抗生素的PowerCHO-2,4mM L-谷氨酰胺,将T-Flask中的汇集物扩充至旋转管规模。用Countess自动化细胞计数器(Invitrogen,Carlsbad,CA,美国)评价它们的活力和浓度。一旦细胞密度允许,则通过以密度0.5x106细胞/ml在50ml生物反应器管中的10ml培养基内接种细胞(在摇床(200rpm)中于5%CO2,37℃和80%湿度温育),对每个汇集物启动种子培养。通过以0.5x106细胞/ml在生长培养基中接种细胞(通过PCV分析确定细胞浓度),将每个种子培养物一周2次传代。种子培养物用于接种全部生产过程(批次)。
对于下一个4-5周,一周一次一式两份接种生产过程。如上文对克隆群体所述,通过FACS和IgG表达评价汇集物稳定性。
生产过程(分批发酵)
使用用于接种的种子培养物,以0.5x106个细胞/ml的浓度接种细胞汇集物的批量(batch run),并且随后将细胞在进料培养基中培养7日。在第4日和第8日,将200μl细胞以300g离心5分钟并且使用Octet,对上清液分析积累的IgG。此外,通过FACS分析每个批次的GFP表达。
2.结果
2.1CHO细胞中的瞬时表达:
这项研究中所比较的载体主要区别在于它们的主链。全部载体的整个表达盒(启动子、第一内含子、表达构建体,poly(A))是完全相同的。载体源自如实施例1中所述的载体pGLEX41。在一个载体中,氨苄青霉素抗性基因经密码子优化以便在大肠杆菌中表达并且将细菌主链缩减至最少:pGLEX41-R6K-AmpiA-[REP](简言之A)。在第二载体中,氨苄青霉素抗性基因经密码子优化以便在大肠杆菌中表达,但是通过使用备选密码子(当 可能时),避开全部CpG序列:这个载体称作pGLEX41-R6K-AmpiB-[REP](简言之B)。第三修改包括使用克隆在载体A和B的表达盒上游和下游的GAPDH侧翼序列,产生载体pGLEX41-R6K-AmpiA-[REP]-GAPDH(简言之GAPDH_A)和pGLEX41-R6K-AmpiB-[REP]-GAPDH(简言之GAPDH_B)。
进行CHO-S细胞(Invitrogen)的瞬时转染以比较在不同质粒主链的环境下表达的报道蛋白的表达水平。转染(一式两份)在50ml生物反应器管(TPP,Trasadingen,瑞士)中使用10ml最终培养基体积进行并在转染后第5日由Octet分析(图2)。
具有经修正的主链的全部载体(A和B)显示比对照载体pGLEX41略微更高的表达水平。在载体A和载体B之间仅存在少量差异。这是预期的,因为主链中的唯一差异是不应当对瞬时表达产生影响的氨苄青霉素抗性。
最惊人的观察结果是GAPDH序列对表达的积极影响。与不携带GAPDH序列的质粒相比,采用携带GAPDH侧翼序列的质粒时,获得2倍更高的表达水平。对于构建体A和B均是如此。与pGLEX41载体相比,可以观察到3倍更高的表达。如果考虑质粒的尺寸,这甚至更令人惊讶。与载体GAPDH-A(13436bp)相比,载体A(7048bps)的尺寸几乎是其一半。因此,假定瞬时转染过程期间递送的DNA的量对于全部质粒是相同的,则仅半数摩尔量的GAPDH-A被递送至核。
2.2HEK293细胞中的瞬时表达
进行HEK293EBNA细胞的瞬时转染以比较在不同质粒主链的环境下表达的报道蛋白的表达水平。转染(一式两份)在50ml生物反应器管(TPP,Trasadingen,瑞士)中使用10ml终末培养基体积进行并在转染后第10日由Octet分析(图3)。
图3中显示的结果表明HEK293EBNA细胞中的表达显著增加,这可以使用GAPDH侧翼区获得。GAPDH-B载体显示表达增加三倍,而GAPDH-A载体显示甚至更高的5倍表达增加。这些载体不含有oriP元件 并且可能因此具有甚至更高滴度的潜能。
2.3稳定CHO细胞系中的表达
建立稳定的转染细胞
通过共转染表达载体和编码抗性基因的载体,随后采用抗生素介导的选择压力,产生稳定的群体。在转染后14日移除选择压力。这些步骤导致产生稳定的小量汇集物和稳定的汇集物,将所述汇集物在生产过程中以定期间隔培养,以比较不同构建体的报道蛋白(IgG1抗体和GFP)的表达水平和表达的稳定性。
在生产过程中用细胞汇集物进行的报道蛋白表达研究
通过稳定转染产生汇集物。在选择过程期间(转染后第一个14日),通过FACS分析汇集物。可以在这个时间范围内观察到GFP阳性细胞部分的增加,连同培养物活力的增加。14日后从汇集物移除抗生素介导的选择压力。使用这种方法,不能获得用“B”质粒转染的细胞汇集物。一旦细胞可以在50ml生物反应器管中培养,则测定生成的汇集物的表达水平。一式两份进行批次。通过FACS分析细胞的GFP表达,并且在表达8日后通过Octet测定上清液中IgG的积累。
可以在汇集物的IgG滴度和GFP表达之间观察到成比例关系。因此,图4中仅显示IgG数据。与载体pGLEX41或不含有GAPDH序列的相同载体相比,用含有GAPDH序列的载体转染的全部汇集物均显示更高的表达(A和A-GAPDH之间2.8倍。在B和B-GAPDH之间不能得出结论,因为无B汇集物存活)。用A-GAPDH和B-GADPH进行的转染引起比pGLEX41转染更高的IgG表达(分别是2.7倍和3.5倍)(对于批次-2而言)。因此在汇集物中,GAPDH侧翼序列看起来有利于蛋白质的产生。
最后,用B-GADPH载体进行的转染引起比用A-GAPDH进行的转染更高的IgG表达(1.25倍)。因此,抗性基因中CpG减少看起来也有利于蛋 白质的稳定产生。
在克隆群体上的表达水平研究
将细胞转染并在96孔平板中分配于选择培养基中以获得克隆或寡克隆群体。在7日后,通过向细胞添加选择培养基更新选择压力。转染后14日,通过使用ELISA-平板读数仪评估GFP的表达。图5中显示结果。
证实了细胞汇集物中所获得的结果,用含有GAPDH侧翼序列的载体转染的细胞比不含有GAPDH上游和下游序列的相同主链表达显著更多的GFP(倍数从1.7至2倍)或比作为对照使用的其他载体表达显著更多的GFP(pGLEX41:2.5倍)(图5)。此外,含有带抗性序列的载体(B)的群体比相应载体(A)引起更高的表达,其中所述抗性序列已经减少CpG,所述相应载体仅已经被密码子优化(A和B之间1.5倍;B和B-GAPDH之间1.2倍)。
可以从表达研究得出几个结论。首先,GAPDH上游和下游序列允许比作为基准使用的标准载体(pGLEX41)更高的表达。另外,用不含GAPDH序列的相同载体主链转染细胞时获得较低的表达水平证实,对表达的有益影响与插入的GAPDH侧翼序列相关。此外,表达质粒和选择质粒中CpG数目的减少看起来也略微有利于表达。
实施例3:用新设计的载体转染的CHO-S GMP细胞的瞬时表达水平
已经在文献中描述,GAPDH启动子的5'区域携带潜在的胰岛素应答元件及佛波醇酯应答元件(Alexander-Bridges等人,(1992)Advan Enzyme Regul,32:149-159)。佛波醇酯应答元件(-1040-1010bp)位于通常称作GAPDH启动子的上游(-488-+20)。在稳定H35肝细胞瘤细胞系中所进行的缺失研究中,作者不能够展示缺失碱基对-1200至-488的显著影响(相对于转录起始点)。因此,佛波醇酯应答元件可能无法与从GAPDH启动子驱动的表达功能性联系。然而,进行瞬时转染实验以评价胰岛素和PMA(佛波醇-12-肉豆蔻酸酯-13-乙酸酯,最常见佛波醇酯)在使用含有GAPDH侧 翼元件的质粒时观察到的瞬时表达和稳定表达增加方面的贡献。
为了获得无胰岛素的生长培养基,从粉状培养基制备PowerCHO2并且不添加胰岛素。PMA从Sigma(St.Louis,MO)购买并且以终浓度1.6μM(对应于Alexander-Bridges对H35肝细胞瘤细胞系所使用的浓度)投入PowerCHO2(+/-胰岛素)中。
如先前所描述在50ml生物反应器管(Tubespins,TPP,Trasadingen,瑞士)中进行转染。为了避免存在OptiMEM(Life technologies,Carlsbad,CA)提供的胰岛素,将转染培养基更换成补充有4mM Gln和25mM HEPES的RPMI1640(PAA,Pasching,Austria)。在转染后,将细胞分配在12孔平板中并添加1ml四种不同的培养基(PowerCHO2,4mM Gln,+/-胰岛素;PowerCHO2,4mM Gln,1.6μM PMA,+/-胰岛素)。再次,使用(实施例2中描述的)利用两个IRES表达IgG1和GFP的报道基因构建体。这个载体允许验证转染效率。在全部4种不同的培养基制备物中发现转染细胞的百分数和活力相似。
如6中所显示图,未在这个实验期间观察到胰岛素耗尽和/或PMA添加的明显影响。在用于表达的全部培养基中均获得相似的滴度。
这表明存在于GAPDH基因侧翼序列上游中的潜在佛波醇酯应答元件和胰岛素应答元件不影响瞬时转基因表达。
实施例4:在启动子上游和polyA位点下游的GAPDH表达盒侧翼的DNA的片段化分析,旨在研究对报道基因表达的影响
人GAPDH基因座位于人基因组的第12号染色体上。据称GAPDH在哺乳动物来源的全部细胞中具有组成型活性,因为该酶是葡萄糖代谢中的关键角色。在该启动子的上游,GAPDH基因侧翼为NCAPD2,即伸展多于30000bp的基因。在多聚腺苷化位点下游,GAPDH基因侧翼为IFFO1(详见图7)。
GAPDH和该启动子以及侧翼区在不同物种之间均保守(见表4)。
表4:人、大鼠和小鼠GAPDH侧翼区之间的高度同源区段。使用克隆管理者9(ScieED,Cary,NC,USA)作出分析。编号分别相对于上游侧翼元件或下游侧翼元件(分别是序列ID NO:7和序列ID NO:8)的第一碱基。对于小鼠,用于比对的序列是序列ID No 18的碱基532-3731(上游)和8164-11364(下游),并且对于大鼠,是序列ID No 19的碱基719-3918(上游)和8495-11058(下游)。

啮齿类和人之间DNA同源性的比较显示38%的最低DNA保守。保守DNA片段在启动子区域或编码基因的区域外部的存在表示可能存在针对细胞的选择压力以维持该DNA序列或以仅允许某些/微小变化。在我们的特定情况下,GAPDH侧翼区可能对细胞是重要的,因为它们维持GAPDH基因的高表达水平。将再次选择DNA序列中导致表达下降的变化。
为了评价上游和下游GAPDH元件对观察到的表达增加的贡献,产生仅含有上游GAPDH侧翼区(SEQ ID NO:7)、上游GAPDH侧翼区片段或下游GAPDH侧翼区(SEQ ID NO:8)的构建体。报道分子IgG1类型抗体由IRES构建体(轻链-IRES-重链)表达,因此避免多个质粒的共转染。图8中显示关于片段化GAPDH上游片段的细节。使用上游GAPDH侧翼区的以下片段:片段1(SEQ ID NO:9)、片段2(SEQ ID NO:10)、片段3(SEQ ID NO:11)、片段4(SEQ ID NO:12)、片段8(SEQ ID NO:13)、片段9(SEQ ID NO:14)、片段11(SEQ ID NO:15)、片段17(SEQ ID NO:16)。
使用的上游GAPDH侧翼区(SEQ ID NO:7)含有NruI限制性位点的2x3(总计6个)核苷酸,其中三个核苷酸与基因组DNA在其5'处连接并且三个核苷酸与基因组DNA在其3'处连接。使用的下游GAPDH侧翼区(SEQ ID NO:8)含有ScaI限制性位点的2x3(总计6个)核苷酸,其中三个核苷酸与基因组DNA在其5'处连接并且三个核苷酸与基因组DNA在其3'处连接。在SEQ ID NO:20(无限制性位点的上游GAPDH侧翼区)和SEQ ID NO:21(无限制性位点的下游GAPDH侧翼区)中显示无相应限制性位点核苷酸的上游GAPDH侧翼区和下游GAPDH侧翼区。使用的上游GAPDH侧翼区片段各自在其5'和/或其3'末端处含有相应限制性位点的与基因组DNA连接的3个核苷酸(片段1在其5'末端处含有NruI限制性位点的3个核苷酸;片段2在其3'末端处含有NruI限制性位点的3个核苷酸;片段3在其5'末端处含有NruI限制性位点的3个核苷酸;片段4在其3'末端处含有NruI限制性位点的3个核苷酸;片段8在其3'末端处含有NruI限制性位点的3个核苷酸;片段9在其5'末端处含有NruI限制性位点的3个核苷酸并在其3'末端处含有NruI限制性位点的3个核苷酸;片段11在其3'末端处含有NruI限制性位点的3个核苷酸)。片段17不含限制性位点的核苷酸。不含相应限制性位点核苷酸的上游GAPDH侧翼区片段在SEQ ID NO:22(不含限制性位点的片段1)、SEQ ID NO:23(不含限制性位点的片段2)SEQ ID NO:24(不含限制性位点的片段3)、SEQ ID NO:25(不含限制性位点的片段4)、SEQ ID NO:26(不含限制性位点的片段8)、SEQ ID NO:27(不含限制性位点的片段9)、SEQ ID NO:28(不含限制性位点的片段11)中显示。
在转染后第10日,使用Octet(Fortebio,Menlo,CA,美国)评估上游和下游GAPDH元件对表达的影响以便对上清液中分泌型IgG1的量定量(见图9)。与pGLEX41-ampiA主链中使用的改进的新载体设计相比,原始载体pGLEX41产生较低表达结果(80%)。与原始pGLEX41主链相比,这种新设计包括大肠杆菌中氨苄青霉素抗性所需的ampiA基因的密码子优化、不同的复制起点(R6K替代pUC复制起点)和消除细菌源的不必要接 头序列(或间隔序列)。两种载体具有大致相同的尺寸。
令人惊讶地,与不含上游和下游序列的相同载体相比,包括上游元件(SEQ ID NO:7)和下游元件(SEQ ID NO:8)的pGLEX41-ampiA(在显示表达结果的图9中命名为pGLEX41-up/down)产生更高的表达(1.5倍数)。如果考虑尺寸的差异(上/下游片段增加质粒的尺寸大约6000bp)和因此转染期间所输送质粒拷贝的差异,基于每个质粒,这种影响甚至可能是更重要的。
仅含有上游片段(up)的载体显示与原始表达构建体pGLEX41-ampiA相似的表达水平。与原始表达构建体pGLEX41-ampiA相比,仅含有下游片段(down)的载体显示表达显著增加(1.2倍)。如果上游片段和下游片段均存在,则可以观察到表达的进一步增加。这通过上游片段的片段化来证实。与pGLEX41-ampiA相比,片段9和启动子近端片段8不显示任何表达差异。片段1、11和17显示表达的增加。对片段4观察到最高增加。应当强调的是,启动子近端片段8不显示任何影响。因此,表达的增加不能由先前公开的序列解释(Alexander-Bridges等人,(1992)Advan Enzyme Regul,32:149-159),Graven等人,(1999)Biochimica et Biophysics Acta 147:203-218)。
有趣地,片段2和片段3导致表达显著减少。这是出乎意料的,特别地鉴于以下事实:以相反方向克隆的这些片段(图9中的反义(AS))不造成这种影响。就片段1、8、9、11和17而言,对以有义方向或反义方向整合的片段未观察到表达差异(数据未显示)。片段11,虽然是片段2的部分,但不显示这种影响。因此,看起来有损表达的序列元件应当至少部分在为了获得片段11而在片段2中缺失的BstBI-BstBI片段上。
此外,负向元件(至少部分地)位于BstBI-BstBI片段上的假设由片段3(其包含BstBI-BstBI片段)和片段1之间所观察到的表达增加支持。
尽管看起来容易定位具有负向影响的片段(BstBI-BstBI),从这项研究看,不太清楚对片段2和片段3观察到的这种负向影响怎样被完整上游片段中存在的序列元件补偿。可能的是,这种负向影响由针对片段1和片段 4观察到的微小正向影响平衡(但是片段1的表达增加小于片段4)。然而,与负向影响(0.4倍)相比,观察到的片段4的正向影响(1.25倍)看起来较不重要。另外,与完整GAPDH上游侧翼区相比,片段9,作为不含BstBI-BstBI片段的完整上游区域(但是,片段9包含了作为片段2和片段3的部分并可能对表达具有负向影响的EcoRV-BstBI片段),不显示增加的表达。
仅可能推测关于已观察到的影响背后的机制。随片段2和片段3所观察到的对表达的负向影响的方向依赖性排除了未鉴定的可读框表达(例如ncRNA表达),因为不存在可能触发仅一个方向表达的周围的启动子。表达降至基础水平以下的事实显示不仅不存在正向影响(例如增强子活性),反而存在方向依赖性负向影响。
总之,如果两种侧翼区即上游区域和下游区域均存在于表达质粒中,则观察到CHO细胞中令人惊讶的瞬时表达增加。虽然片段4看起来对表达具有显著的正向影响,但是不能鉴定到负责所观察到的全部表达增加的单一片段。表达载体pGLEX41-ampiA(up/down)的表达增加看起来是两种区域即上游侧翼区和下游侧翼区的汇总影响。
实施例5:克隆中国仓鼠GAPDH基因上游的非翻译性基因组DNA序列及中国仓鼠启动子.
1.1克隆中国仓鼠GAPDH基因上游的非翻译性基因组DNA序列至表达载体中
通过PCR从CHO-S细胞(Life Technologies)的基因组DNA扩增中国仓鼠GAPDH基因上游的非翻译性基因组DNA序列。如实施例1中所述提取基因组DNA。使用小鼠CMV启动子或中国仓鼠GAPDH启动子,制备用于表达实施例1中描述的报道基因构建体[REP]的构建体。
为了克隆与小鼠CMV启动子组合的中国仓鼠GAPDH基因上游基因组DNA序列,使用实施例1中描述的PCR方案,将引物GlnPr1896和GlnPr1897用于扩增3kb片段(SEQ ID No 29的bp672至bp 3671)并产生具有SEQ ID No 30的扩增子。该扩增子含有中国仓鼠GAPDH基因上游 的基因组DNA序列和通过引物引入的5'和3'限制性位点。
为了克隆与中国仓鼠GAPDH启动子组合的中国仓鼠GAPDH基因上游基因组DNA序列,使用引物GlnPr1902和GlnPr1905以扩增含有基因组DNA序列的3508bp片段,所述基因组DNA序列包含中国仓鼠GAPDH基因上游的基因组DNA序列和GAPDH启动子(SEQ ID No 29的bp 672至bp 4179),产生具有SEQ ID No 31的扩增子。在第二PCR中,将GlnPr1901和GlnPr1902用于扩增仅含有启动子区的508bp片段(SEQ ID No 29的bp3672至bp 4179),产生SEQ ID No 32。使用引物GlnPr1903和GlnPr1904扩增(实施例1中描述的)载体“A”中所用的内含子。
使用具有SEQ ID NO:32的扩增子和具有内含子序列的扩增子作为模板,用引物GlnPr1904和GlnPr1901进行第一融合PCR。该扩增子含有中国仓鼠GAPDH启动子、内含子和通过引物引入的5'和3'限制性位点。表5中显示全部引物。
使用具有SEQ ID No.31的扩增子和具有内含子序列的扩增子作为模板,用引物GlnPr1905和GlnPr1904进行第二融合PCR。该扩增子含有中国仓鼠GAPDH基因上游的基因组DNA序列、中国仓鼠GAPDH启动子、内含子和通过引物引入的5'和3'限制性位点。
在1%琼脂糖凝胶上纯化后,将目的条带切下并使用试剂盒“NucleoSpin Gel and PCR Clean-up”(Macherey Nagel,Oensingen,瑞士)纯化。使用Zero Blunt PCR克隆试剂盒(Invitrogen,Carlsbad,CA,美国),将纯化的片段克隆至质粒pCR_Blunt中。将连接产物转化入感受态大肠杆菌TOP10(OneTOP10感受态大肠杆菌;Invitrogen,Carlsbad,CA,美国)中并通过限制性分析小量制备物进行分析。这产生了含有中国仓鼠GAPDH基因上游基因组DNA序列的质粒pCR_blunt[CHO-上游GAPDH]、含有中国仓鼠GAPDH基因上游基因组DNA序列和GAPDH启动子及来自载体“A”的内含子的pCR_Blunt[CHO-上游GAPDH_GAPDH启动子],以及含有GAPDH启动子和来自载体“A”的内含子的pCR_Blunt[CHO-GAPDH启动子]。
为了评价扩增子的对分泌型基因表达的影响,使用(在实施例1中描述的)载体“A”。如先前所描述,这个载体中使用的表达盒含有编码分泌型IgG1和GFP的多顺反子基因(见实施例1)。转染的细胞将因此分泌IgG1单克隆抗体并以依赖性方式积累胞内GFP。
为了释放含有中国仓鼠GAPDH基因上游基因组DNA序列的3kb插入片段,使用限制性酶NaeI消化质粒pCR_Blunt[CHO-上游GAPDH]。将这个插入物克隆在“A”的主链中,所述主链使用限制性酶NruI消化并进行CIP处理(CIP;NEB,Ipswich,MA,美国)。使用T4DNA连接酶(T4DNA连接酶,NEB,Ipswich,MA,美国),将主链和插入物连接在一起并随后转化至感受态大肠杆菌PIR1中。挑取克隆用于小量制备物制备和后续限制性分析。将所产生的质粒称作“A_GAPDH_UP”,通过测序分析证实并且使用NucleoBond Xtra Midi试剂盒(Macherey Nagel,Oensingen,瑞士)以中等量制备规模产生。
为了使用中国仓鼠GAPDH启动子克隆表达构建体,通过使用限制性酶NheI和NruI消化,从质粒pCR_Blunt[CHO-上游GAPDH_GAPDH启动子]和pCR_Blunt[CHO-GAPDH启动子]释放插入片段。将所产生的片段克隆在载体“A”的主链中,使用相同的酶打开并进行CIP处理。在用T4DNA连接酶连接并转化入感受态大肠杆菌PIR1后,挑取克隆用于小量制备物限制性分析。将所产生的质粒称作“A_GAPDH_UP_Prom”(具有中国仓鼠GAPDH上游非翻译性基因组DNA序列和所述启动子的质粒)和“A_PR”(仅具有所述启动子的质粒),通过测序分析证实并且使用试剂盒NucleoBond Xtra Midi(Macherey Nagel,Oensingen,瑞士)以中等量制备规模产生。
2.评估中国仓鼠GAPDH基因上游非翻译性基因组DNA序列对报道基因构建体表达的影响
在旋转管生物反应器中使用10ml培养基体积转染CHO-S细胞(如实施例2中所述)。将转染的细胞在摇床中于37℃、5%CO2和80%湿度温 育,伴以200rpm搅拌。使用带蛋白A生物传感器(FortéBio,Menlo Park,CA,美国)的Octet QK系统,对细胞的上清液分析IgG1表达。图10中显示结果。
与小鼠CMV启动子(A)相比,含有GAPDH启动子的质粒的表达水平(“A_PR”)减少50%,这表明中国仓鼠GAPDH启动子不如病毒启动子强。与仅具有GAPDH启动子的构建体(“A_PR”)相比,含有与中国仓鼠GAPDH启动子组合的中国仓鼠GAPDH基因上游非翻译性基因组DNA序列的质粒(“A_GAPDH_UP_Prom”)显示表达增加2倍。含有中国仓鼠GAPDH基因上游非翻译性基因组DNA序列和小鼠CMV启动的质粒(“A_GAPDH_UP”)显示最高表达和超过仅含有小鼠CMV启动子的质粒(“A”)多于40%的增加。这证实中国仓鼠GAPDH基因上游的非翻译性基因组DNA序列对报道蛋白表达具有增强子效应。
表5:实施例5中克隆所用的引物






































表达盒.pdf_第1页
第1页 / 共89页
表达盒.pdf_第2页
第2页 / 共89页
表达盒.pdf_第3页
第3页 / 共89页
点击查看更多>>
资源描述

《表达盒.pdf》由会员分享,可在线阅读,更多相关《表达盒.pdf(89页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN104093834A43申请公布日20141008CN104093834A21申请号201280069001022申请日2012120561/567,67520111207USC12N15/0920060171申请人格兰马克药品股份有限公司地址瑞士拉绍德封72发明人D吕舍尔C埃比谢尔古米P莫莱迪M博特施格尔74专利代理机构北京市中咨律师事务所11247代理人史文静黄革生54发明名称表达盒57摘要本发明涉及用于表达编码多肽的多核苷酸序列的表达盒。30优先权数据85PCT国际申请进入国家阶段日2014080486PCT国际申请的申请数据PCT/IB2012/05697720121。

2、20587PCT国际申请的公布数据WO2013/084157EN2013061351INTCL权利要求书4页说明书36页序列表38页附图10页19中华人民共和国国家知识产权局12发明专利申请权利要求书4页说明书36页序列表38页附图10页10申请公布号CN104093834ACN104093834A1/4页21一种表达盒,其包含启动子、编码多肽的多核苷酸序列和表达增强元件,其中表达增强元件包含真核甘油醛3磷酸脱氢酶GAPDH启动子下游的非翻译性基因组DNA序列,其中由多核苷酸序列编码的多肽不是GAPDH,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列始于跨越核苷酸位置约1至核苷酸位。

3、置约7000的区域内部,其中核苷酸位置是相对于GAPDHMRNA转录起始的,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列的长度是约100至约15000个核苷酸。2根据权利要求所述1的表达盒,其中表达盒还包含真核GAPDH启动子上游的非翻译性基因组DNA序列,其中真核GAPDH启动子上游的非翻译性基因组DNA序列始于跨越约真核GAPDH启动子的5末端至核苷酸位置约3500的区域内部,其中核苷酸位置是相对于GAPDHMRNA转录起始,并且其中真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是约100至约15000个核苷酸。3一种表达盒,其包含启动子、编码多肽的多核苷酸序列和真。

4、核GAPDH启动子上游的非翻译性基因组DNA序列,其中由多核苷酸序列编码的多肽不是GAPDH,并且其中真核GAPDH启动子上游的非翻译性基因组DNA序列始于跨越约真核GAPDH启动子的5末端至核苷酸位置约3500的区域内部,其中核苷酸位置是相对于GAPDHMRNA转录起始的,其中真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是100至约15000个核苷酸,条件是表达盒不包含真核GAPDH启动子或其片段。4根据权利要求3所述的表达盒,其中表达盒还包含真核GAPDH启动子下游的非翻译性基因组DNA序列,其中真核GAPDH启动子下游的非翻译性基因组DNA序列始于跨越核苷酸位置约1至核苷酸位。

5、置约7000的区域内部,其中核苷酸位置是相对于GAPDHMRNA转录起始的,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列的长度是约100至约15000个核苷酸。5根据权利要求1至4中任一项所述的表达盒,其中真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列未与编码多肽的多核苷酸序列有效连接。6根据权利要求1至4中任一项所述的表达盒,其中表达盒还包含多聚腺苷化位点。7根据权利要求1或4所述的表达盒,其中真核GAPDH启动子下游的非翻译性基因组DNA序列的长度是约10个核苷酸并且在其最大情况下延伸至IFF01基因的倒数第二内含子或延伸至其部份。8根据权利要求1或4所述的表达。

6、盒,其中真核GAPDH启动子下游的非翻译性基因组DNA序列始于真核GAPDH多聚腺苷化位点的下游并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列的长度是至少约100个核苷酸并且在其最大情况下延伸至IFF01基因的倒数第二内含子。9根据权利要求2所述的表达盒,其中真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是至少约100个核苷酸并且在其最大情况下延伸至NCAPD2基因的起始密码子。10根据权利要求2所述的表达盒,其中真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是至少约100个核苷酸并且在其最大情况下延伸至NCAPD2基因的倒数第三内含子。11根据权利要求3所述的。

7、表达盒,其中真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是至少100个核苷酸并且在其最大情况下延伸至NCAPD2基因的起始密码子。权利要求书CN104093834A2/4页312根据权利要求3所述的表达盒,其中真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是至少100个核苷酸并且在其最大情况下延伸至NCAPD2基因的倒数第三内含子。13根据权利要求1至4中任一项所述的表达盒,其中真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列是哺乳动物源的。14根据权利要求13所述的表达盒,其中真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列是啮齿类源或人源的。1。

8、5根据权利要求1或4所述的表达盒,其中真核GAPDH启动子下游的非翻译性基因组DNA序列包含选自SEQIDNOS8和21的核苷酸序列或其片段。16根据权利要求1或4所述的表达盒,其中真核GAPDH启动子下游的非翻译性基因组DNA序列包含与选自SEQIDNOS8和21的核苷酸序列或其片段互补的核苷酸序列。17根据权利要求1或4所述的表达盒,其中真核GAPDH启动子下游的非翻译性基因组DNA序列包含与选自SEQIDNOS8和21的核苷酸序列或其片段相同至少80的核苷酸序列。18根据权利要求2或3所述的表达盒,其中真核GAPDH启动子上游的非翻译性基因组DNA序列包含选自SEQIDNO7、9、10、。

9、11、12、13、14、15、16、20、22、23、24、25、26、27和28的核苷酸序列或其片段。19根据权利要求18所述的表达盒,其中选自SEQIDNOS7、9、10、11、12、13、14、15、16、20、22、23、24、25、26、27和28的核苷酸序列或其片段包含5个或更少的核酸修饰。20根据权利要求2或3所述的表达盒,其中真核GAPDH启动子上游的非翻译性基因组DNA序列包含与选自SEQIDNO7、9、10、11、12、13、14、15、16、20、22、23、24、25、26、27和28的核苷酸序列或其片段互补的核苷酸序列。21根据权利要求2或3所述的表达盒,其中真核GA。

10、PDH启动子上游的非翻译性基因组DNA序列包含与选自SEQIDNO7、9、10、11、12、13、14、15、16、20、22、23、24、25、26、27和28的核苷酸序列或其片段相同至少80的核苷酸序列。22根据权利要求1至4中任一项所述的表达盒,其中启动子和编码多肽的多核苷酸序列是有效连接的。23根据权利要求1或4所述的表达盒,其中真核GAPDH启动子下游的非翻译性基因组DNA序列以与编码多肽的多核苷酸序列相同的方向定向。24根据权利要求1或4所述的表达盒,其中真核GAPDH启动子下游的非翻译性基因组DNA序列相对于编码多肽的多核苷酸序列以相反方向定向。25根据权利要求2或3所述的表达盒。

11、,其中真核GAPDH启动子上游的非翻译性基因组DNA序列以与编码多肽的多核苷酸序列相同的方向定向。26根据权利要求2或3所述的表达盒,其中真核GAPDH启动子上游的非翻译性基因组DNA序列相对于编码多肽的多核苷酸序列以相反方向定向。27根据权利要求1至4中任一项所述的表达盒,其中启动子选自SV40启动子、MPSV启动子、小鼠CMV、人TK、人CMV、大鼠CMV、人EF1、中国仓鼠EF1、人GAPDH、杂合启动子,所述杂合启动子包括MYC、HYK和CX启动子。28根据权利要求1至4中任一项所述的表达盒,其中多肽选自抗体、抗体片段或抗体权利要求书CN104093834A3/4页4衍生物。29根据权。

12、利要求6所述的表达盒,其中多聚腺苷化位点选自BGHPOLYA和SV40POLYA。30根据权利要求1至4中任一项所述的表达盒,还包含选自额外的启动子、增强子、转录控制元件和选择标记的遗传元件。31根据权利要求30所述的表达盒,其中遗传元件是选择标记,其中在编码选择标记的多核苷酸序列中所含的CPG位点的含量是45或更小。32表达载体,其包含根据权利要求1至29中任一项所述的表达盒。33表达载体,其依次包含A真核GAPDH启动子上游和/或下游的非翻译性基因组DNA序列B启动子C编码多肽的多核苷酸序列D多聚腺苷化位点E增强子F真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列,或A真核GA。

13、PDH启动子上游和/或下游的非翻译性基因组DNA序列B增强子C启动子D编码多肽的多核苷酸序列E多聚腺苷化位点F真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列,或A增强子B真核GAPDH上游和/或下游的非翻译性基因组DNA序列C启动子D编码多肽的多核苷酸序列E多聚腺苷化位点F真核GAPDH下游和/或上游的非翻译性基因组DNA序列,其中包含增强子是任选的,并且其中由多核苷酸序列编码的多肽不是GAPDH,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列始于跨越核苷酸位置约1至核苷酸位置约7000的区域内部,其中核苷酸位置是相对于GAPDHMRNA转录起始的,并且其中真核GAP。

14、DH启动子下游的非翻译性基因组DNA序列的长度是约100至约15000个核苷酸并且其中真核GAPDH启动子上游的非翻译性基因组DNA序列始于跨越约真核GAPDH启动子的5末端至核苷酸位置约3500的区域内部,其中核苷酸位置是相对于GAPDHMRNA转录起始的,并且其中真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是约100至约15000个核苷酸,条件是如果A或B是真核GAPDH上游的非翻译性基因组DNA序列,则F是真核GAPDH下游的非翻译性基因组DNA序列,并且如果A或B是真核GAPDH下游的非翻译性基因组DNA序列,则F是真核GAPDH上游的非翻译性基因组DNA序列。34根据权利。

15、要求32或33所述的表达载体,其中表达载体还包含选自额外的启动子、增强子,转录控制单元、复制起点和选择标记的遗传元件。权利要求书CN104093834A4/4页535根据权利要求32或33所述的表达载体,其中表达载体还包含复制起点和选择标记,其中表达载体的编码复制起点和选择标记的多核苷酸序列中所含的CPG位点的含量是200或更小。36宿主细胞,其包含根据权利要求1至31中任一项所述的表达盒或根据权利要求32至35中任一项所述的表达载体。37根据权利要求1至31中任一项所述的表达盒或根据权利要求32至35中任一项所述的表达载体,用于作为用于治疗疾病的药物。38根据权利要求1至31中任一项所述的表。

16、达盒或根据权利要求32至35中任一项所述的表达载体,用于基因疗法。39用于表达多肽的体外方法,包括用根据权利要求1至31中任一项所述的表达盒或根据权利要求32至35中任一项所述的表达载体转染宿主细胞并回收多肽。40根据权利要求39所述的方法,其中将表达盒或表达载体是稳定转染。41根据权利要求39所述的方法,其中将表达盒或表达载体是瞬时转染。42根据权利要求1至31中任一项所述的表达盒或根据权利要求32至35中任一项所述的表达载体的用途,用于从哺乳动物宿主细胞表达异源多肽。权利要求书CN104093834A1/36页6表达盒0001相关申请0002本申请要求2011年12月7日递交的US临时申请。

17、号61/567,675的权益;所有这些通过引用以其整体并入本文。发明领域0003本发明涉及用于表达编码多肽的多核苷酸序列的表达盒。本发明是还涉及包含表达盒的载体和宿主细胞以及表达盒用于从宿主细胞产生多肽的用途。背景技术0004用于产生重组多肽的表达系统是现有技术中熟知的并且由例如,MARINOMH1989BIOPHARM,21833;GOEDDELDV等人,1990METHODSENZYMOL18537;WURMF和BERNARDA1999CURROPINBIOTECHNOL10156159描述。用于药物应用中的多肽优选地在哺乳动物细胞如CHO细胞、NSO细胞、SP2/0细胞、COS细胞、HE。

18、K细胞、BHK细胞等中产生。用于此目的的表达载体的必需元件通常选自包含原核复制起点和原核选择标记,任选地真核选择标记的原核质粒增殖单元,例如大肠杆菌ECOLI,和用于表达一个或多个目的结构基因的一个或多个表达盒,所述表达盒每一者包含启动子、编码多肽的多核苷酸序列和任选地转录终止子,所述转录终止子包含多聚腺苷化信号。为了在哺乳动物细胞中瞬时表达,可以包括哺乳动物复制起点,如SV40ORI或ORIP。作为启动子,可以选择组成型或诱导型启动子。为了优化的转录,可以在5非翻译区中包含KOZAK序列。为了MRNA加工,尤其MRNA剪接和转录终止,取决于结构基因的组织状况外显子/内含子组织状况,可以包括M。

19、RNA剪接信号,以及多聚腺苷化信号。基因的表达以瞬时方式或使用稳定的细胞系进行。生产细胞系中多肽的稳定和高度表达的水平对于产生重组多肽的整个过程至关重要。在过去数年间,对生物分子如蛋白质并且特别对抗体或抗体片段的需求已经显著地增加。高成本和不良产率已经是生物分子可用性方面的限制因素并且它已经成为发展以工业规模增加所需生物分子的产量的稳健工艺的主要挑战。因而仍需要改善表达载体的效率以在重组多肽生产中实现高表达。0005发明简述0006本发明一般地涉及可以用来在重组多肽生产中实现表达增加的表达系统如表达盒和表达载体。在一个方面,本公开提供表达盒,其包含启动子、编码多肽的多核苷酸序列和真核甘油醛3磷。

20、酸脱氢酶GAPDH启动子下游的非翻译性基因组DNA序列,其中由多核苷酸序列编码的多肽不是GAPDH,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列始于跨越从核苷酸位置约1至核苷酸位置约7000的区域内部,其中核苷酸位置是相对于GAPDHMRNA转录起始的,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列的长度是约100至约15000个核苷酸。0007在又一个方面,本公开提供表达盒,其包含启动子、编码多肽的多核苷酸序列和真核GAPDH启动子上游的非翻译性基因组DNA序列,其中由多核苷酸序列编码的多肽不说明书CN104093834A2/36页7是GAPDH,并且其中真核GAP。

21、DH启动子上游的非翻译性基因组DNA序列始于跨越大约真核GAPDH启动子的5末端至核苷酸位置约3500的区域内部,其中核苷酸位置是相对于GAPDHMRNA转录起始的,其中真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是100至约15000个核苷酸,条件是表达盒不包含真核GAPDH启动子或其片段。0008在又一个方面,本公开提供包含表达盒的表达载体和包含表达盒或表达载体的宿主细胞,其中所述表达载体包含表达盒。0009在其他方面,本公开提供一种用于表达多肽的体外方法,所述方法包括用表达盒或表达载体转染宿主细胞并回收多肽,和表达盒或表达载体用于从哺乳动物宿主细胞表达异源多肽的用途。0010。

22、附图简述0011图1显示报道基因表达构建体REP,其由小鼠巨细胞病毒启动子MCMV、含有第一内含子的IG供体接纳体片段IGDA、IGG1抗体轻链IGG1LC、源自脑心肌炎病毒的内部核糖体进入位点IRES、IGG1抗体重链IGG1HC、绿色荧光蛋白GFP和猿猴病毒40多聚腺苷化信号POLYA组成。0012图2显示在转染后第5日IGG1抗体在CHOS细胞中的瞬时表达将IGG滴度的均值对两次独立转染作图。使用GAPDH_A和GAPDH_B载体GAPDH_A和GAPDH_B、无GAPDH上游元件和下游元件的相同载体A和B和作为对照的PGLEX41载体PGLEX41,转染细胞。使用OCTET仪器FORT。

23、EBIO,MENLO,CA,美国确定上清液中积累的IGG1抗体的浓度。0013图3显示IGG1抗体在HEK293EBNA细胞中的表达。使用GAPDH_A和GAPDH_B载体GAPDH_A和GAPDH_B和作为对照的PGLEX41载体PGLEX41,转染细胞。将上清液收获并在转染后第10日使用OCTET仪器分析。数据代表每个载体在旋转管TUBESPIN中的N3个独立转染。0014图4显示使用细胞汇集物在分批生产时的表达水平研究。使用GAPDH_A和GAPDH_B载体GAPDH_A1、GAPDH_A2、GAPDH_B1和GAPDH_B2、无GAPDH上游元件和下游元件的相同载体A1和A2和作为对照。

24、的PGLEX41载体PGLEX41,转染细胞并且产生稳定细胞的汇集物。在7日培养后,使用OCTET仪器对上清液分析上清液中积累的抗体。给出每种汇集物的IGG滴度均值G/ML。数据代表每种汇集物N2个批次。0015图5显示在通过稳定转染和有限稀释法产生的群体上的表达水平研究。使用GAPDH_A和GAPDH_B载体GAPDH_A和GAPDH_B、无GAPDH上游元件和下游元件的相同载体A和B和作为对照的PGLEX41载体PGLEX41,转染细胞。在转染后14日读取来自稳定转染的克隆和小量汇集物所表达的GFP荧光的均值。将细胞在96孔板中选择压力下培育。数据代表每种载体N48个克隆或小量汇集物。00。

25、16图6显示培养基添加物胰岛素和PMA佛波醇12肉豆蔻酸酯13乙酸酯,一种佛波醇酯对上清液中IGG1抗体表达的影响。用GAPDH_A载体GAPDH_A和作为对照的PGLEX41载体PGLEX41转染后,将细胞稀释于POWERCHO2培养基、4MMGLN、/胰岛素和POWERCHO2、4MMGLN、PMA/胰岛素中。与标准培养基相比,对PGLEX41实心棒或GAPDH_A空心棒没有观察到表达差异。0017图7显示人GAPDH基因座的概览。GAPDH基因侧翼为基因NCAPD2和IFFO1。0018图8显示人GAPDH基因、GAPDH上游元件和下游元件和为分析GAPDH上游片段化说明书CN10409。

26、3834A3/36页8研究所产生的片段的细节。引入NRUI限制性位点以促进克隆步骤并且该位点不是基因组5GAPDH上游序列的部分因此使用星号突出显示它。片段的大小是片段1SEQIDNO9511BP、片段2SEQIDNO102653BP、片段3SEQIDNO111966BP、片段4SEQIDNO121198BP、片段8SEQIDNO13259BP、片段9SEQIDNO141947BP、片段11SEQIDNO151436BP和片段17SEQIDNO161177BP。0019图9显示GAPDH上游元件和下游元件片段化的表达结果。在转染后第10日在CHO细胞中以瞬时转染方式获得表达结果。使用OCTET。

27、仪器进行定量。载体PGLEX41充当阴性对照。PGLEX41AMPIA还是显示无GAPDH侧翼元件的载体基础表达的阴性对照。PGLEX41上/下含有全长侧翼区上游区和下游区并充当阳性对照。PGLEX41上仅含有上游侧翼区并且PGLEX41下仅含有下游侧翼区。全部其他构建体均含有图8中描述的片段。片段2和片段3按照与IGG1LC和IGG1HC相同的方向克隆或相对于IGG1LC和IGG1HCAS以相反方向克隆。0020图10显示在转染后第8日IGG1抗体在CHOS细胞中的瞬时表达将IGG滴度的均值对三次独立转染作图;误差条SD/。使用具有中国仓鼠GAPDH上游元件与小鼠CMVA_GAPDH_UP或。

28、中国仓鼠GAPDH启动子A_GAPDH_UP_PR组合的载体,转染细胞。转染仅具有小鼠CMVA或中国仓鼠GAPDH启动子A_PR的质粒作为对照。使用OCTETQK仪器FORTEBIO,MENLO,CA,美国确定上清液中积累的IGG1抗体的浓度。0021发明详述0022本公开涉及表达盒和表达载体,所述表达盒和表达载体包含启动子、编码多肽的多核苷酸序列和真核甘油醛3磷酸脱氢酶GAPDH启动子下游的非翻译性基因组DNA序列,其中由多核苷酸序列编码的多肽不是GAPDH,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列始于跨越核苷酸位置约1至核苷酸位置约7000的区域内部,其中核苷酸位置是相对。

29、于GAPDHMRNA转录起始的,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列的长度是约100至约15000个核苷酸。0023本公开还涉及一种表达盒,其包含启动子、编码多肽的多核苷酸序列和真核GAPDH启动子上游的非翻译性基因组DNA序列,其中由多核苷酸序列编码的多肽不是GAPDH,并且其中真核GAPDH启动子上游的非翻译性基因组DNA序列始于跨越大约真核GAPDH启动子的5末端至核苷酸位置约3500的区域内部,其中核苷酸位置是相对于GAPDHMRNA转录起始的,其中真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是100至约15000个核苷酸,条件是表达盒不包含真核GAP。

30、DH启动子或其片段。0024如本文所用的术语“表达盒”包含多核苷酸序列,所述多核苷酸序列编码待表达的多肽和控制其表达的序列如启动子以及任选地增强子序列,包括顺式作用转录性控制单元的任何组合。控制基因表达即其转录和转录产物翻译的序列常称作调节单元。调节单元的大多数部分位于基因的编码序列上游并与之有效连接。表达盒也可以含有包含多聚腺苷化位点的下游3非翻译区。本发明的调节单元与待表达的基因即转录单位有效连接,或由间插DNA例如异源基因的5非翻译区分隔。优选地,表达盒侧翼为一种或多种合适的限制性位点以便可以将表达盒插入载体中和/或将其从载体切除。因而,本发明的表达盒可以用于构建表达载体,尤其哺乳动物表。

31、达载体。本发明的表达盒可以包含一个或多个例如两个、三个或甚至更多个在真核GAPDH启动子或其片段下游的非翻译性基因组DNA序列,说明书CN104093834A4/36页9和/或一个或多个例如两个、三个或甚至更多个在真核GAPDH启动子或其片段上游的非翻译性基因组DNA序列。如果本发明的表达盒包含多于一个在真核GAPDH启动子或其片段下游和/或上游的DNA序列,则这些DNA序列可以是直接连接的,即可以包含接头序列,例如含有与5末端和3末端连接并允许轻易依次克隆所述序列或其片段的限制性位点的接头序列。备选地,真核GAPDH启动子或其片段下游和/或上游的DNA序列可以不是直接连接的,即可以随间插DN。

32、A序列一起克隆。0025如本文所用的术语“编码多肽的多核苷酸序列”包括编码表达所述多肽的基因、优选地异源基因的DNA。0026术语“异源编码序列”、“异源基因序列”、“异源基因”、“重组基因”或“基因”互换使用。这些术语指这样的DNA序列,所述DNA序列编码设法在宿主细胞中、优选地在哺乳动物细胞中表达并收获的重组蛋白产物,尤其重组异源蛋白产物。基因的产物可以是多肽。异源基因序列天然地不存在于宿主细胞中并且源自相同或不同物种的生物并且可以是基因修饰的。0027术语“蛋白质”和“多肽”互换地用来包括通过相邻残基的氨基和羧基之间的肽键彼此连接的一串氨基酸残基。0028如本文所用的术语“非翻译性基因组。

33、DNA序列”包括构成生物的遗传信息的DNA。几乎全部生物的基因组是DNA,唯一例外是具有RNA基因组的一些病毒。大多数生物中的基因组DNA分子被组织成称作染色体的DNA蛋白质复合体。染色体的大小、数目和基因组DNA的性质在不同生物之间不同。病毒DNA基因组可以是单链或双链、线型或环状的。全部其他生物具有双链DNA基因组。细菌具有单个环状染色体。在真核生物中,大多数基因组DNA作为大小不同的多条线形染色体位于核内核DNA。真核细胞额外地在线粒体中含有基因组DNA,并且在植物和低等真核生物中,在叶绿体中含有基因组DNA。这种DNA通常是环状分子并且在这些细胞器内部作为多个副本存在。非翻译性基因组D。

34、NA序列通常不与启动子有效连接并且因此不翻译。它可以含有不翻译的基因,因此含有编码例如不表达的蛋白质的基因。0029如本文所用的术语“真核GAPDH启动子下游的非翻译性基因组DNA序列”对应于真核GAPDH启动子3的非翻译性真核基因组DNA。真核GAPDH启动子下游的非翻译性基因组DNA序列通常在核苷酸位置约1处,优选地在核苷酸位置1处开始,其中核苷酸位置是相对于GAPDHMRNA转录起始的,即相对于编码GAPDH的真核基因的转录起始TRANSCRIPTIONSTART的起点ORIGIN。真核GAPDH启动子下游的非翻译性基因组DNA序列通常具有与真核GAPDH启动子相同的来源,例如,如果该G。

35、APDH启动子是人源的,则人GAPDH启动子下游的非翻译性基因组DNA序列也是人源的并对应于人GAPDH启动子下游天然存在的人类基因组DNA序列。0030如本文所用的术语“真核GAPDH启动子上游的非翻译性基因组DNA序列”对应于真核GAPDH启动子5的非翻译性真核基因组DNA。真核GAPDH启动子上游的非翻译性基因组DNA序列通常在约真核GAPDH启动子的5末端处的核苷酸位置处,优选地在紧邻真核GAPDH启动子5末端之后的核苷酸位置处开始。真核GAPDH启动子上游的非翻译性基因组DNA序列通常具有与真核GAPDH启动子相同的来源,例如,如果该GAPDH启动子是人源的,则人GAPDH启动子上游。

36、的非翻译性基因组DNA序列也是人源的并对应于人GAPDH启动子上游说明书CN104093834A5/36页10天然存在的人类基因组DNA序列。0031如非另外具体说明,则真核GAPDH启动子、真核GAPDH启动子下游或上游的非翻译性基因组DNA序列和如本文中所示的其他DNA序列的位置是相对于GAPDHMRNA转录起始的,例如是相对于真核GAPDH的转录起始的起点的。0032术语“真核GAPDH启动子上游的非翻译性基因组DNA序列延伸至”或“真核GAPDH启动子下游的非翻译性基因组DNA序列延伸至”用来限定真核GAPDH启动子上游和/或下游的非翻译性基因组DNA序列的长度从起始至特定遗传元件的长。

37、度的延伸,例如至内含子的延伸。这种延伸包括编码该遗传元件例如内含子或其部份的DNA序列的全长。0033人、大鼠和小鼠的真核GAPDH启动子和GAPDH启动子上游和/或下游的真核基因组DNA可以在NCBI公共数据库中找到人、小鼠、大鼠和中国仓鼠GAPDH基因的条目分别是基因ID2597MRNANM_0020463、14433MRMANM_0080842、24383MRNANM_0170083和100736557MRNANM_0012448542;美国国家生物技术信息中心NCBIHTTP/WWWNCBINLMNIHGOV/并且示意地在图7和8中针对人GAPDH基因显示。0034通常认为真核GAPD。

38、H启动子相对于GAPDHMRNA转录起始从约BPS500伸展至约50。人GAPDH启动子位于第12号染色体上。基于片段化研究,GRAVEN等人GRAVEN等人,1999BIOCHIMICAETBIOPHYSICSACTA,147203218认为人GAPDH启动子相对于GAPDHMRNA转录起始从BPS488伸展至20。根据NCBI公共数据库,人GAPDH启动子相对于如NCBI公共数据库所定义的GAPDHMRNA转录起始从BPS462伸展至46。如非另外具体说明,如本文提到的人GAPDH启动子相对于GAPDHMRNA转录起始从位置462伸展至位置46,这对应于从SEQIDNO17的BPS4071。

39、伸展至4578的序列。0035如本文中提到的针对人、小鼠和大鼠源GAPDH基因、IFF01基因和NCAPD2基因的DNA所用的编号对应于NCBI公共数据库中针对这些基因所用的编号HTTP/WWWNCBINLMNIHGOV/。0036如本文所用的术语“启动子”限定一般位于基因上游的调节性DNA序列,所述调节性DNA序列通过指导RNA聚合酶与DNA结合并启动RNA合成介导转录的起始。0037如本文所用的术语“增强子”限定一种核苷酸序列,该核苷酸序列作用为使激动基因转录成为可能,所述基因转录与基因的身份、该序列相对于基因的位置或序列的取向无关。本发明的载体任选地包含增强子。0038术语“功能性连接”。

40、和“有效连接”互换使用并且指两个或更多个DNA区段、尤其待表达基因序列和控制其表达的那些序列之间的功能关系。例如,如果启动子和/或增强子序列包括顺式作用转录性控制元件的任何组合在适宜的宿主细胞或其他表达系统中刺激或调节编码序列的转录,则它与编码序列有效连接。与转录的基因序列有效连接的启动子调节序列是在物理上与转录的序列邻接的。0039“取向”指给定DNA序列中的核苷酸顺序。例如,DNA序列相对于另一个DNA序列以相反方向的取向是这种情况,其中与从其中获得该序列的DNA中的参照点相比时,该序列相对于另一个序列的5至3顺序反转。这类参考点可以包括源DNA中转录其他指定DNA序列的方向和/或含有该序。

41、列的复制型载体的复制起点。0040如本文所用的术语“表达载体”包括分离和纯化的DNA分子,所述分子在转染入适宜的宿主细胞时在宿主细胞内部提供重组基因产物的高水平表达。除编码重组或基因产物说明书CN104093834A106/36页11的DNA序列之外,表达载体还包含宿主细胞系中将DNA编码序列有效转录成MRNA并将MRNA有效翻译成蛋白质所需要的调节性DNA序列。0041如本文所用的术语“宿主细胞”或“宿主细胞系”包括能够在培养物中生长并表达所需重组产物蛋白质的任何细胞、尤其哺乳动物细胞。0042如本文所用的术语“片段”包括相应核苷酸序列的一部分,例如真核GAPDH启动子下游和/或上游的非翻译。

42、性基因组DNA序列的一部分或编码特定遗传元件如启动子的核苷酸序列的一部分。真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列的片段可以保留生物活性并因此改变例如增加与启动子有效连接的编码序列的表达模式。真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列的片段范围从至少约100至约3000BP、优选地从约200至约2800BP、更优选地从约300至约2000BP核苷酸、尤其从约500至约1500BP核苷酸。为了在本发明的表达盒中克隆真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列的片段,通常将含有允许便利克隆的限制性位点的接头序列与所述片段的5末端和3末端连接。0。

43、043如本文所用的术语“核苷酸序列同一性”或“相同核苷酸序列”包括在比对序列并引入空位如果需要以实现最大序列同一性百分数后,候选序列中与例如真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列的核苷酸序列相同的核苷酸的百分数。因此,可以通过常用来比较两个核苷酸序列的核苷酸位置中相似性的标准方法确定序列同一性。通常,相对于真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列,候选序列的核苷酸序列同一性是至少80、优选地至少85、更优选地至少90并且最优选地是至少95、尤其96,更特别地是97,甚至更特别地是98、最特别地是99,包括例如,80、81、82、83、84、85、86、。

44、87、88、89、90、91、92、93、94、95、96、97、98、99和100。0044如本文所用的术语“CPG位点”包括其中胞嘧啶核苷酸在线性碱基序列中沿其长度紧邻鸟嘌呤核苷酸出现的DNA区域。“CPG”是“C磷酸酯G”的速记,即,由仅一个磷酸酯分隔的胞嘧啶和鸟嘌呤;磷酸酯将DNA中的任何两个核苷连接在一起。“CPG”记号用来区分这种线性序列与胞嘧啶和鸟嘌呤的CG碱基配对。0045如本文所用的术语“备选密码子选择”包括使用编码相同氨基酸的备选密码子以避免CPG序列基序。这包括优选地使用不具有内部CPG位点的密码子例如编码丙氨酸并含有CPG位点的GCG,可由GCT、GCC或GCA替换以及。

45、避免产生新CPG位点的两个密码子连接。0046在涉及DNA序列长度和涉及相对于GAPDHMRNA转录起始例如相对于真核GAPDH转录起始起点的核苷酸位置时,本文所用的术语“约”包括偏离所述值最多50、通常最多10的值,例如“约3000个核苷酸”包括2700至3300个核苷酸、优选地2900至3100个核苷酸、更优选地2995至3005个核苷酸的值,“约100个核苷酸”包括50至150个核苷酸、优选地90至110个核苷酸、更优选地95至105个核苷酸的值,“约15000个核苷酸”包括13500至16500个核苷酸、优选地14500至15500个核苷酸、更优选地14990至15010个核苷酸、最优。

46、选地14995至15005个核苷酸的值,“约200个核苷酸”包括150至250个核苷酸、优选地190至210个核苷酸、更优选地195至205个核苷酸的值,“约8000个核苷酸”包括7200至8800、优选地7500至8500个核苷酸、更优选地7990至8010个核苷酸、最优说明书CN104093834A117/36页12选地7995至8005个核苷酸的值,“约500个核苷酸”包括450至550个核苷酸、优选地475至525、更优选地490至510、最优选地495至505个核苷酸的值,“约5000个核苷酸”包括4500至5500个核苷酸、优选地4750至5250、更优选地4990至5010、最优。

47、选地4995至5005个核苷酸的值,“约1000个核苷酸”包括900至1100个核苷酸、优选地950至1050、更优选地990至1010、最优选地995至1005个核苷酸的值,“约4500个核苷酸”包括4050至4950个核苷酸、优选地4250至4750、更优选地4490至4510、最优选地4495至4505个核苷酸的值,“约1500个核苷酸”包括1350至1650个核苷酸、优选地1450至1550、更优选地1490至1510、最优选地1495至1505个核苷酸的值,“约4000个核苷酸”包括3600至4400个核苷酸、优选地3800至4200、更优选地3990至4010、更优选地3995至4。

48、005个核苷酸的值,“约2000个核苷酸”包括1800至2200个核苷酸、优选地1900至2100、更优选地1990至2010、最优选地1995至2005个核苷酸的值,“约3500个核苷酸”包括3150至3850个核苷酸、优选地3300至3700、更优选地3490至3510、最优选地3495至3505个核苷酸的值,“约2700个核苷酸”包括2430至2970个核苷酸、优选地2600至2800、更优选地2690至2710、最优选地2695至2705个核苷酸的值,“约3300个核苷酸”包括2970至3630个核苷酸,优选地3100至3500、更优选地3290至3310、最优选地3295至3305个。

49、核苷酸的值,“约3200个核苷酸”包括2880至3520个核苷酸、优选地3000至3400、更优选地3190至3210、最优选地3195至3205个核苷酸,约7000或约位置7000包括位置6300至7700、优选地位置6700至7300、更优选地位置6990至7010、最优选地位置6995至7005,约1或约位置1包括位置10至10、优选地位置5至5、更优选地位置1至2,约3500或约位置3500包括位置3150至3850、优选地位置3300至3700、更优选地位置3490至5010、最优选地位置3495至3505。0047对于与SEQID号的序列中的位置相关的本文所涉及的或本文所用的针对人、小鼠和大鼠源的GAPDH基因、IFF01基因和NCAPD2基因的DNA所用的编号,术语“约”包括偏离最多500BP、优选地100BP、更优选地10BP、最优选地5BP的值。0048在一个实施方案中,本公开提供一种表达盒,其包含启动子、编码多肽的多核苷酸序列和真核GAPDH启动子下游的非翻译性基因组DNA序列,其中由多核苷酸序列编码的多肽不是GAPDH,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列始于跨越核苷酸位置约1至核苷酸位置约7000的区域内。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 化学;冶金 > 生物化学;啤酒;烈性酒;果汁酒;醋;微生物学;酶学;突变或遗传工程


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1