《表达盒.pdf》由会员分享,可在线阅读,更多相关《表达盒.pdf(89页珍藏版)》请在专利查询网上搜索。
1、10申请公布号CN104093834A43申请公布日20141008CN104093834A21申请号201280069001022申请日2012120561/567,67520111207USC12N15/0920060171申请人格兰马克药品股份有限公司地址瑞士拉绍德封72发明人D吕舍尔C埃比谢尔古米P莫莱迪M博特施格尔74专利代理机构北京市中咨律师事务所11247代理人史文静黄革生54发明名称表达盒57摘要本发明涉及用于表达编码多肽的多核苷酸序列的表达盒。30优先权数据85PCT国际申请进入国家阶段日2014080486PCT国际申请的申请数据PCT/IB2012/05697720121。
2、20587PCT国际申请的公布数据WO2013/084157EN2013061351INTCL权利要求书4页说明书36页序列表38页附图10页19中华人民共和国国家知识产权局12发明专利申请权利要求书4页说明书36页序列表38页附图10页10申请公布号CN104093834ACN104093834A1/4页21一种表达盒,其包含启动子、编码多肽的多核苷酸序列和表达增强元件,其中表达增强元件包含真核甘油醛3磷酸脱氢酶GAPDH启动子下游的非翻译性基因组DNA序列,其中由多核苷酸序列编码的多肽不是GAPDH,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列始于跨越核苷酸位置约1至核苷酸位。
3、置约7000的区域内部,其中核苷酸位置是相对于GAPDHMRNA转录起始的,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列的长度是约100至约15000个核苷酸。2根据权利要求所述1的表达盒,其中表达盒还包含真核GAPDH启动子上游的非翻译性基因组DNA序列,其中真核GAPDH启动子上游的非翻译性基因组DNA序列始于跨越约真核GAPDH启动子的5末端至核苷酸位置约3500的区域内部,其中核苷酸位置是相对于GAPDHMRNA转录起始,并且其中真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是约100至约15000个核苷酸。3一种表达盒,其包含启动子、编码多肽的多核苷酸序列和真。
4、核GAPDH启动子上游的非翻译性基因组DNA序列,其中由多核苷酸序列编码的多肽不是GAPDH,并且其中真核GAPDH启动子上游的非翻译性基因组DNA序列始于跨越约真核GAPDH启动子的5末端至核苷酸位置约3500的区域内部,其中核苷酸位置是相对于GAPDHMRNA转录起始的,其中真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是100至约15000个核苷酸,条件是表达盒不包含真核GAPDH启动子或其片段。4根据权利要求3所述的表达盒,其中表达盒还包含真核GAPDH启动子下游的非翻译性基因组DNA序列,其中真核GAPDH启动子下游的非翻译性基因组DNA序列始于跨越核苷酸位置约1至核苷酸位。
5、置约7000的区域内部,其中核苷酸位置是相对于GAPDHMRNA转录起始的,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列的长度是约100至约15000个核苷酸。5根据权利要求1至4中任一项所述的表达盒,其中真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列未与编码多肽的多核苷酸序列有效连接。6根据权利要求1至4中任一项所述的表达盒,其中表达盒还包含多聚腺苷化位点。7根据权利要求1或4所述的表达盒,其中真核GAPDH启动子下游的非翻译性基因组DNA序列的长度是约10个核苷酸并且在其最大情况下延伸至IFF01基因的倒数第二内含子或延伸至其部份。8根据权利要求1或4所述的表达。
6、盒,其中真核GAPDH启动子下游的非翻译性基因组DNA序列始于真核GAPDH多聚腺苷化位点的下游并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列的长度是至少约100个核苷酸并且在其最大情况下延伸至IFF01基因的倒数第二内含子。9根据权利要求2所述的表达盒,其中真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是至少约100个核苷酸并且在其最大情况下延伸至NCAPD2基因的起始密码子。10根据权利要求2所述的表达盒,其中真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是至少约100个核苷酸并且在其最大情况下延伸至NCAPD2基因的倒数第三内含子。11根据权利要求3所述的。
7、表达盒,其中真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是至少100个核苷酸并且在其最大情况下延伸至NCAPD2基因的起始密码子。权利要求书CN104093834A2/4页312根据权利要求3所述的表达盒,其中真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是至少100个核苷酸并且在其最大情况下延伸至NCAPD2基因的倒数第三内含子。13根据权利要求1至4中任一项所述的表达盒,其中真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列是哺乳动物源的。14根据权利要求13所述的表达盒,其中真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列是啮齿类源或人源的。1。
8、5根据权利要求1或4所述的表达盒,其中真核GAPDH启动子下游的非翻译性基因组DNA序列包含选自SEQIDNOS8和21的核苷酸序列或其片段。16根据权利要求1或4所述的表达盒,其中真核GAPDH启动子下游的非翻译性基因组DNA序列包含与选自SEQIDNOS8和21的核苷酸序列或其片段互补的核苷酸序列。17根据权利要求1或4所述的表达盒,其中真核GAPDH启动子下游的非翻译性基因组DNA序列包含与选自SEQIDNOS8和21的核苷酸序列或其片段相同至少80的核苷酸序列。18根据权利要求2或3所述的表达盒,其中真核GAPDH启动子上游的非翻译性基因组DNA序列包含选自SEQIDNO7、9、10、。
9、11、12、13、14、15、16、20、22、23、24、25、26、27和28的核苷酸序列或其片段。19根据权利要求18所述的表达盒,其中选自SEQIDNOS7、9、10、11、12、13、14、15、16、20、22、23、24、25、26、27和28的核苷酸序列或其片段包含5个或更少的核酸修饰。20根据权利要求2或3所述的表达盒,其中真核GAPDH启动子上游的非翻译性基因组DNA序列包含与选自SEQIDNO7、9、10、11、12、13、14、15、16、20、22、23、24、25、26、27和28的核苷酸序列或其片段互补的核苷酸序列。21根据权利要求2或3所述的表达盒,其中真核GA。
10、PDH启动子上游的非翻译性基因组DNA序列包含与选自SEQIDNO7、9、10、11、12、13、14、15、16、20、22、23、24、25、26、27和28的核苷酸序列或其片段相同至少80的核苷酸序列。22根据权利要求1至4中任一项所述的表达盒,其中启动子和编码多肽的多核苷酸序列是有效连接的。23根据权利要求1或4所述的表达盒,其中真核GAPDH启动子下游的非翻译性基因组DNA序列以与编码多肽的多核苷酸序列相同的方向定向。24根据权利要求1或4所述的表达盒,其中真核GAPDH启动子下游的非翻译性基因组DNA序列相对于编码多肽的多核苷酸序列以相反方向定向。25根据权利要求2或3所述的表达盒。
11、,其中真核GAPDH启动子上游的非翻译性基因组DNA序列以与编码多肽的多核苷酸序列相同的方向定向。26根据权利要求2或3所述的表达盒,其中真核GAPDH启动子上游的非翻译性基因组DNA序列相对于编码多肽的多核苷酸序列以相反方向定向。27根据权利要求1至4中任一项所述的表达盒,其中启动子选自SV40启动子、MPSV启动子、小鼠CMV、人TK、人CMV、大鼠CMV、人EF1、中国仓鼠EF1、人GAPDH、杂合启动子,所述杂合启动子包括MYC、HYK和CX启动子。28根据权利要求1至4中任一项所述的表达盒,其中多肽选自抗体、抗体片段或抗体权利要求书CN104093834A3/4页4衍生物。29根据权。
12、利要求6所述的表达盒,其中多聚腺苷化位点选自BGHPOLYA和SV40POLYA。30根据权利要求1至4中任一项所述的表达盒,还包含选自额外的启动子、增强子、转录控制元件和选择标记的遗传元件。31根据权利要求30所述的表达盒,其中遗传元件是选择标记,其中在编码选择标记的多核苷酸序列中所含的CPG位点的含量是45或更小。32表达载体,其包含根据权利要求1至29中任一项所述的表达盒。33表达载体,其依次包含A真核GAPDH启动子上游和/或下游的非翻译性基因组DNA序列B启动子C编码多肽的多核苷酸序列D多聚腺苷化位点E增强子F真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列,或A真核GA。
13、PDH启动子上游和/或下游的非翻译性基因组DNA序列B增强子C启动子D编码多肽的多核苷酸序列E多聚腺苷化位点F真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列,或A增强子B真核GAPDH上游和/或下游的非翻译性基因组DNA序列C启动子D编码多肽的多核苷酸序列E多聚腺苷化位点F真核GAPDH下游和/或上游的非翻译性基因组DNA序列,其中包含增强子是任选的,并且其中由多核苷酸序列编码的多肽不是GAPDH,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列始于跨越核苷酸位置约1至核苷酸位置约7000的区域内部,其中核苷酸位置是相对于GAPDHMRNA转录起始的,并且其中真核GAP。
14、DH启动子下游的非翻译性基因组DNA序列的长度是约100至约15000个核苷酸并且其中真核GAPDH启动子上游的非翻译性基因组DNA序列始于跨越约真核GAPDH启动子的5末端至核苷酸位置约3500的区域内部,其中核苷酸位置是相对于GAPDHMRNA转录起始的,并且其中真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是约100至约15000个核苷酸,条件是如果A或B是真核GAPDH上游的非翻译性基因组DNA序列,则F是真核GAPDH下游的非翻译性基因组DNA序列,并且如果A或B是真核GAPDH下游的非翻译性基因组DNA序列,则F是真核GAPDH上游的非翻译性基因组DNA序列。34根据权利。
15、要求32或33所述的表达载体,其中表达载体还包含选自额外的启动子、增强子,转录控制单元、复制起点和选择标记的遗传元件。权利要求书CN104093834A4/4页535根据权利要求32或33所述的表达载体,其中表达载体还包含复制起点和选择标记,其中表达载体的编码复制起点和选择标记的多核苷酸序列中所含的CPG位点的含量是200或更小。36宿主细胞,其包含根据权利要求1至31中任一项所述的表达盒或根据权利要求32至35中任一项所述的表达载体。37根据权利要求1至31中任一项所述的表达盒或根据权利要求32至35中任一项所述的表达载体,用于作为用于治疗疾病的药物。38根据权利要求1至31中任一项所述的表。
16、达盒或根据权利要求32至35中任一项所述的表达载体,用于基因疗法。39用于表达多肽的体外方法,包括用根据权利要求1至31中任一项所述的表达盒或根据权利要求32至35中任一项所述的表达载体转染宿主细胞并回收多肽。40根据权利要求39所述的方法,其中将表达盒或表达载体是稳定转染。41根据权利要求39所述的方法,其中将表达盒或表达载体是瞬时转染。42根据权利要求1至31中任一项所述的表达盒或根据权利要求32至35中任一项所述的表达载体的用途,用于从哺乳动物宿主细胞表达异源多肽。权利要求书CN104093834A1/36页6表达盒0001相关申请0002本申请要求2011年12月7日递交的US临时申请。
17、号61/567,675的权益;所有这些通过引用以其整体并入本文。发明领域0003本发明涉及用于表达编码多肽的多核苷酸序列的表达盒。本发明是还涉及包含表达盒的载体和宿主细胞以及表达盒用于从宿主细胞产生多肽的用途。背景技术0004用于产生重组多肽的表达系统是现有技术中熟知的并且由例如,MARINOMH1989BIOPHARM,21833;GOEDDELDV等人,1990METHODSENZYMOL18537;WURMF和BERNARDA1999CURROPINBIOTECHNOL10156159描述。用于药物应用中的多肽优选地在哺乳动物细胞如CHO细胞、NSO细胞、SP2/0细胞、COS细胞、HE。
18、K细胞、BHK细胞等中产生。用于此目的的表达载体的必需元件通常选自包含原核复制起点和原核选择标记,任选地真核选择标记的原核质粒增殖单元,例如大肠杆菌ECOLI,和用于表达一个或多个目的结构基因的一个或多个表达盒,所述表达盒每一者包含启动子、编码多肽的多核苷酸序列和任选地转录终止子,所述转录终止子包含多聚腺苷化信号。为了在哺乳动物细胞中瞬时表达,可以包括哺乳动物复制起点,如SV40ORI或ORIP。作为启动子,可以选择组成型或诱导型启动子。为了优化的转录,可以在5非翻译区中包含KOZAK序列。为了MRNA加工,尤其MRNA剪接和转录终止,取决于结构基因的组织状况外显子/内含子组织状况,可以包括M。
19、RNA剪接信号,以及多聚腺苷化信号。基因的表达以瞬时方式或使用稳定的细胞系进行。生产细胞系中多肽的稳定和高度表达的水平对于产生重组多肽的整个过程至关重要。在过去数年间,对生物分子如蛋白质并且特别对抗体或抗体片段的需求已经显著地增加。高成本和不良产率已经是生物分子可用性方面的限制因素并且它已经成为发展以工业规模增加所需生物分子的产量的稳健工艺的主要挑战。因而仍需要改善表达载体的效率以在重组多肽生产中实现高表达。0005发明简述0006本发明一般地涉及可以用来在重组多肽生产中实现表达增加的表达系统如表达盒和表达载体。在一个方面,本公开提供表达盒,其包含启动子、编码多肽的多核苷酸序列和真核甘油醛3磷。
20、酸脱氢酶GAPDH启动子下游的非翻译性基因组DNA序列,其中由多核苷酸序列编码的多肽不是GAPDH,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列始于跨越从核苷酸位置约1至核苷酸位置约7000的区域内部,其中核苷酸位置是相对于GAPDHMRNA转录起始的,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列的长度是约100至约15000个核苷酸。0007在又一个方面,本公开提供表达盒,其包含启动子、编码多肽的多核苷酸序列和真核GAPDH启动子上游的非翻译性基因组DNA序列,其中由多核苷酸序列编码的多肽不说明书CN104093834A2/36页7是GAPDH,并且其中真核GAP。
21、DH启动子上游的非翻译性基因组DNA序列始于跨越大约真核GAPDH启动子的5末端至核苷酸位置约3500的区域内部,其中核苷酸位置是相对于GAPDHMRNA转录起始的,其中真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是100至约15000个核苷酸,条件是表达盒不包含真核GAPDH启动子或其片段。0008在又一个方面,本公开提供包含表达盒的表达载体和包含表达盒或表达载体的宿主细胞,其中所述表达载体包含表达盒。0009在其他方面,本公开提供一种用于表达多肽的体外方法,所述方法包括用表达盒或表达载体转染宿主细胞并回收多肽,和表达盒或表达载体用于从哺乳动物宿主细胞表达异源多肽的用途。0010。
22、附图简述0011图1显示报道基因表达构建体REP,其由小鼠巨细胞病毒启动子MCMV、含有第一内含子的IG供体接纳体片段IGDA、IGG1抗体轻链IGG1LC、源自脑心肌炎病毒的内部核糖体进入位点IRES、IGG1抗体重链IGG1HC、绿色荧光蛋白GFP和猿猴病毒40多聚腺苷化信号POLYA组成。0012图2显示在转染后第5日IGG1抗体在CHOS细胞中的瞬时表达将IGG滴度的均值对两次独立转染作图。使用GAPDH_A和GAPDH_B载体GAPDH_A和GAPDH_B、无GAPDH上游元件和下游元件的相同载体A和B和作为对照的PGLEX41载体PGLEX41,转染细胞。使用OCTET仪器FORT。
23、EBIO,MENLO,CA,美国确定上清液中积累的IGG1抗体的浓度。0013图3显示IGG1抗体在HEK293EBNA细胞中的表达。使用GAPDH_A和GAPDH_B载体GAPDH_A和GAPDH_B和作为对照的PGLEX41载体PGLEX41,转染细胞。将上清液收获并在转染后第10日使用OCTET仪器分析。数据代表每个载体在旋转管TUBESPIN中的N3个独立转染。0014图4显示使用细胞汇集物在分批生产时的表达水平研究。使用GAPDH_A和GAPDH_B载体GAPDH_A1、GAPDH_A2、GAPDH_B1和GAPDH_B2、无GAPDH上游元件和下游元件的相同载体A1和A2和作为对照。
24、的PGLEX41载体PGLEX41,转染细胞并且产生稳定细胞的汇集物。在7日培养后,使用OCTET仪器对上清液分析上清液中积累的抗体。给出每种汇集物的IGG滴度均值G/ML。数据代表每种汇集物N2个批次。0015图5显示在通过稳定转染和有限稀释法产生的群体上的表达水平研究。使用GAPDH_A和GAPDH_B载体GAPDH_A和GAPDH_B、无GAPDH上游元件和下游元件的相同载体A和B和作为对照的PGLEX41载体PGLEX41,转染细胞。在转染后14日读取来自稳定转染的克隆和小量汇集物所表达的GFP荧光的均值。将细胞在96孔板中选择压力下培育。数据代表每种载体N48个克隆或小量汇集物。00。
25、16图6显示培养基添加物胰岛素和PMA佛波醇12肉豆蔻酸酯13乙酸酯,一种佛波醇酯对上清液中IGG1抗体表达的影响。用GAPDH_A载体GAPDH_A和作为对照的PGLEX41载体PGLEX41转染后,将细胞稀释于POWERCHO2培养基、4MMGLN、/胰岛素和POWERCHO2、4MMGLN、PMA/胰岛素中。与标准培养基相比,对PGLEX41实心棒或GAPDH_A空心棒没有观察到表达差异。0017图7显示人GAPDH基因座的概览。GAPDH基因侧翼为基因NCAPD2和IFFO1。0018图8显示人GAPDH基因、GAPDH上游元件和下游元件和为分析GAPDH上游片段化说明书CN10409。
26、3834A3/36页8研究所产生的片段的细节。引入NRUI限制性位点以促进克隆步骤并且该位点不是基因组5GAPDH上游序列的部分因此使用星号突出显示它。片段的大小是片段1SEQIDNO9511BP、片段2SEQIDNO102653BP、片段3SEQIDNO111966BP、片段4SEQIDNO121198BP、片段8SEQIDNO13259BP、片段9SEQIDNO141947BP、片段11SEQIDNO151436BP和片段17SEQIDNO161177BP。0019图9显示GAPDH上游元件和下游元件片段化的表达结果。在转染后第10日在CHO细胞中以瞬时转染方式获得表达结果。使用OCTET。
27、仪器进行定量。载体PGLEX41充当阴性对照。PGLEX41AMPIA还是显示无GAPDH侧翼元件的载体基础表达的阴性对照。PGLEX41上/下含有全长侧翼区上游区和下游区并充当阳性对照。PGLEX41上仅含有上游侧翼区并且PGLEX41下仅含有下游侧翼区。全部其他构建体均含有图8中描述的片段。片段2和片段3按照与IGG1LC和IGG1HC相同的方向克隆或相对于IGG1LC和IGG1HCAS以相反方向克隆。0020图10显示在转染后第8日IGG1抗体在CHOS细胞中的瞬时表达将IGG滴度的均值对三次独立转染作图;误差条SD/。使用具有中国仓鼠GAPDH上游元件与小鼠CMVA_GAPDH_UP或。
28、中国仓鼠GAPDH启动子A_GAPDH_UP_PR组合的载体,转染细胞。转染仅具有小鼠CMVA或中国仓鼠GAPDH启动子A_PR的质粒作为对照。使用OCTETQK仪器FORTEBIO,MENLO,CA,美国确定上清液中积累的IGG1抗体的浓度。0021发明详述0022本公开涉及表达盒和表达载体,所述表达盒和表达载体包含启动子、编码多肽的多核苷酸序列和真核甘油醛3磷酸脱氢酶GAPDH启动子下游的非翻译性基因组DNA序列,其中由多核苷酸序列编码的多肽不是GAPDH,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列始于跨越核苷酸位置约1至核苷酸位置约7000的区域内部,其中核苷酸位置是相对。
29、于GAPDHMRNA转录起始的,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列的长度是约100至约15000个核苷酸。0023本公开还涉及一种表达盒,其包含启动子、编码多肽的多核苷酸序列和真核GAPDH启动子上游的非翻译性基因组DNA序列,其中由多核苷酸序列编码的多肽不是GAPDH,并且其中真核GAPDH启动子上游的非翻译性基因组DNA序列始于跨越大约真核GAPDH启动子的5末端至核苷酸位置约3500的区域内部,其中核苷酸位置是相对于GAPDHMRNA转录起始的,其中真核GAPDH启动子上游的非翻译性基因组DNA序列的长度是100至约15000个核苷酸,条件是表达盒不包含真核GAP。
30、DH启动子或其片段。0024如本文所用的术语“表达盒”包含多核苷酸序列,所述多核苷酸序列编码待表达的多肽和控制其表达的序列如启动子以及任选地增强子序列,包括顺式作用转录性控制单元的任何组合。控制基因表达即其转录和转录产物翻译的序列常称作调节单元。调节单元的大多数部分位于基因的编码序列上游并与之有效连接。表达盒也可以含有包含多聚腺苷化位点的下游3非翻译区。本发明的调节单元与待表达的基因即转录单位有效连接,或由间插DNA例如异源基因的5非翻译区分隔。优选地,表达盒侧翼为一种或多种合适的限制性位点以便可以将表达盒插入载体中和/或将其从载体切除。因而,本发明的表达盒可以用于构建表达载体,尤其哺乳动物表。
31、达载体。本发明的表达盒可以包含一个或多个例如两个、三个或甚至更多个在真核GAPDH启动子或其片段下游的非翻译性基因组DNA序列,说明书CN104093834A4/36页9和/或一个或多个例如两个、三个或甚至更多个在真核GAPDH启动子或其片段上游的非翻译性基因组DNA序列。如果本发明的表达盒包含多于一个在真核GAPDH启动子或其片段下游和/或上游的DNA序列,则这些DNA序列可以是直接连接的,即可以包含接头序列,例如含有与5末端和3末端连接并允许轻易依次克隆所述序列或其片段的限制性位点的接头序列。备选地,真核GAPDH启动子或其片段下游和/或上游的DNA序列可以不是直接连接的,即可以随间插DN。
32、A序列一起克隆。0025如本文所用的术语“编码多肽的多核苷酸序列”包括编码表达所述多肽的基因、优选地异源基因的DNA。0026术语“异源编码序列”、“异源基因序列”、“异源基因”、“重组基因”或“基因”互换使用。这些术语指这样的DNA序列,所述DNA序列编码设法在宿主细胞中、优选地在哺乳动物细胞中表达并收获的重组蛋白产物,尤其重组异源蛋白产物。基因的产物可以是多肽。异源基因序列天然地不存在于宿主细胞中并且源自相同或不同物种的生物并且可以是基因修饰的。0027术语“蛋白质”和“多肽”互换地用来包括通过相邻残基的氨基和羧基之间的肽键彼此连接的一串氨基酸残基。0028如本文所用的术语“非翻译性基因组。
33、DNA序列”包括构成生物的遗传信息的DNA。几乎全部生物的基因组是DNA,唯一例外是具有RNA基因组的一些病毒。大多数生物中的基因组DNA分子被组织成称作染色体的DNA蛋白质复合体。染色体的大小、数目和基因组DNA的性质在不同生物之间不同。病毒DNA基因组可以是单链或双链、线型或环状的。全部其他生物具有双链DNA基因组。细菌具有单个环状染色体。在真核生物中,大多数基因组DNA作为大小不同的多条线形染色体位于核内核DNA。真核细胞额外地在线粒体中含有基因组DNA,并且在植物和低等真核生物中,在叶绿体中含有基因组DNA。这种DNA通常是环状分子并且在这些细胞器内部作为多个副本存在。非翻译性基因组D。
34、NA序列通常不与启动子有效连接并且因此不翻译。它可以含有不翻译的基因,因此含有编码例如不表达的蛋白质的基因。0029如本文所用的术语“真核GAPDH启动子下游的非翻译性基因组DNA序列”对应于真核GAPDH启动子3的非翻译性真核基因组DNA。真核GAPDH启动子下游的非翻译性基因组DNA序列通常在核苷酸位置约1处,优选地在核苷酸位置1处开始,其中核苷酸位置是相对于GAPDHMRNA转录起始的,即相对于编码GAPDH的真核基因的转录起始TRANSCRIPTIONSTART的起点ORIGIN。真核GAPDH启动子下游的非翻译性基因组DNA序列通常具有与真核GAPDH启动子相同的来源,例如,如果该G。
35、APDH启动子是人源的,则人GAPDH启动子下游的非翻译性基因组DNA序列也是人源的并对应于人GAPDH启动子下游天然存在的人类基因组DNA序列。0030如本文所用的术语“真核GAPDH启动子上游的非翻译性基因组DNA序列”对应于真核GAPDH启动子5的非翻译性真核基因组DNA。真核GAPDH启动子上游的非翻译性基因组DNA序列通常在约真核GAPDH启动子的5末端处的核苷酸位置处,优选地在紧邻真核GAPDH启动子5末端之后的核苷酸位置处开始。真核GAPDH启动子上游的非翻译性基因组DNA序列通常具有与真核GAPDH启动子相同的来源,例如,如果该GAPDH启动子是人源的,则人GAPDH启动子上游。
36、的非翻译性基因组DNA序列也是人源的并对应于人GAPDH启动子上游说明书CN104093834A5/36页10天然存在的人类基因组DNA序列。0031如非另外具体说明,则真核GAPDH启动子、真核GAPDH启动子下游或上游的非翻译性基因组DNA序列和如本文中所示的其他DNA序列的位置是相对于GAPDHMRNA转录起始的,例如是相对于真核GAPDH的转录起始的起点的。0032术语“真核GAPDH启动子上游的非翻译性基因组DNA序列延伸至”或“真核GAPDH启动子下游的非翻译性基因组DNA序列延伸至”用来限定真核GAPDH启动子上游和/或下游的非翻译性基因组DNA序列的长度从起始至特定遗传元件的长。
37、度的延伸,例如至内含子的延伸。这种延伸包括编码该遗传元件例如内含子或其部份的DNA序列的全长。0033人、大鼠和小鼠的真核GAPDH启动子和GAPDH启动子上游和/或下游的真核基因组DNA可以在NCBI公共数据库中找到人、小鼠、大鼠和中国仓鼠GAPDH基因的条目分别是基因ID2597MRNANM_0020463、14433MRMANM_0080842、24383MRNANM_0170083和100736557MRNANM_0012448542;美国国家生物技术信息中心NCBIHTTP/WWWNCBINLMNIHGOV/并且示意地在图7和8中针对人GAPDH基因显示。0034通常认为真核GAPD。
38、H启动子相对于GAPDHMRNA转录起始从约BPS500伸展至约50。人GAPDH启动子位于第12号染色体上。基于片段化研究,GRAVEN等人GRAVEN等人,1999BIOCHIMICAETBIOPHYSICSACTA,147203218认为人GAPDH启动子相对于GAPDHMRNA转录起始从BPS488伸展至20。根据NCBI公共数据库,人GAPDH启动子相对于如NCBI公共数据库所定义的GAPDHMRNA转录起始从BPS462伸展至46。如非另外具体说明,如本文提到的人GAPDH启动子相对于GAPDHMRNA转录起始从位置462伸展至位置46,这对应于从SEQIDNO17的BPS4071。
39、伸展至4578的序列。0035如本文中提到的针对人、小鼠和大鼠源GAPDH基因、IFF01基因和NCAPD2基因的DNA所用的编号对应于NCBI公共数据库中针对这些基因所用的编号HTTP/WWWNCBINLMNIHGOV/。0036如本文所用的术语“启动子”限定一般位于基因上游的调节性DNA序列,所述调节性DNA序列通过指导RNA聚合酶与DNA结合并启动RNA合成介导转录的起始。0037如本文所用的术语“增强子”限定一种核苷酸序列,该核苷酸序列作用为使激动基因转录成为可能,所述基因转录与基因的身份、该序列相对于基因的位置或序列的取向无关。本发明的载体任选地包含增强子。0038术语“功能性连接”。
40、和“有效连接”互换使用并且指两个或更多个DNA区段、尤其待表达基因序列和控制其表达的那些序列之间的功能关系。例如,如果启动子和/或增强子序列包括顺式作用转录性控制元件的任何组合在适宜的宿主细胞或其他表达系统中刺激或调节编码序列的转录,则它与编码序列有效连接。与转录的基因序列有效连接的启动子调节序列是在物理上与转录的序列邻接的。0039“取向”指给定DNA序列中的核苷酸顺序。例如,DNA序列相对于另一个DNA序列以相反方向的取向是这种情况,其中与从其中获得该序列的DNA中的参照点相比时,该序列相对于另一个序列的5至3顺序反转。这类参考点可以包括源DNA中转录其他指定DNA序列的方向和/或含有该序。
41、列的复制型载体的复制起点。0040如本文所用的术语“表达载体”包括分离和纯化的DNA分子,所述分子在转染入适宜的宿主细胞时在宿主细胞内部提供重组基因产物的高水平表达。除编码重组或基因产物说明书CN104093834A106/36页11的DNA序列之外,表达载体还包含宿主细胞系中将DNA编码序列有效转录成MRNA并将MRNA有效翻译成蛋白质所需要的调节性DNA序列。0041如本文所用的术语“宿主细胞”或“宿主细胞系”包括能够在培养物中生长并表达所需重组产物蛋白质的任何细胞、尤其哺乳动物细胞。0042如本文所用的术语“片段”包括相应核苷酸序列的一部分,例如真核GAPDH启动子下游和/或上游的非翻译。
42、性基因组DNA序列的一部分或编码特定遗传元件如启动子的核苷酸序列的一部分。真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列的片段可以保留生物活性并因此改变例如增加与启动子有效连接的编码序列的表达模式。真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列的片段范围从至少约100至约3000BP、优选地从约200至约2800BP、更优选地从约300至约2000BP核苷酸、尤其从约500至约1500BP核苷酸。为了在本发明的表达盒中克隆真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列的片段,通常将含有允许便利克隆的限制性位点的接头序列与所述片段的5末端和3末端连接。0。
43、043如本文所用的术语“核苷酸序列同一性”或“相同核苷酸序列”包括在比对序列并引入空位如果需要以实现最大序列同一性百分数后,候选序列中与例如真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列的核苷酸序列相同的核苷酸的百分数。因此,可以通过常用来比较两个核苷酸序列的核苷酸位置中相似性的标准方法确定序列同一性。通常,相对于真核GAPDH启动子下游和/或上游的非翻译性基因组DNA序列,候选序列的核苷酸序列同一性是至少80、优选地至少85、更优选地至少90并且最优选地是至少95、尤其96,更特别地是97,甚至更特别地是98、最特别地是99,包括例如,80、81、82、83、84、85、86、。
44、87、88、89、90、91、92、93、94、95、96、97、98、99和100。0044如本文所用的术语“CPG位点”包括其中胞嘧啶核苷酸在线性碱基序列中沿其长度紧邻鸟嘌呤核苷酸出现的DNA区域。“CPG”是“C磷酸酯G”的速记,即,由仅一个磷酸酯分隔的胞嘧啶和鸟嘌呤;磷酸酯将DNA中的任何两个核苷连接在一起。“CPG”记号用来区分这种线性序列与胞嘧啶和鸟嘌呤的CG碱基配对。0045如本文所用的术语“备选密码子选择”包括使用编码相同氨基酸的备选密码子以避免CPG序列基序。这包括优选地使用不具有内部CPG位点的密码子例如编码丙氨酸并含有CPG位点的GCG,可由GCT、GCC或GCA替换以及。
45、避免产生新CPG位点的两个密码子连接。0046在涉及DNA序列长度和涉及相对于GAPDHMRNA转录起始例如相对于真核GAPDH转录起始起点的核苷酸位置时,本文所用的术语“约”包括偏离所述值最多50、通常最多10的值,例如“约3000个核苷酸”包括2700至3300个核苷酸、优选地2900至3100个核苷酸、更优选地2995至3005个核苷酸的值,“约100个核苷酸”包括50至150个核苷酸、优选地90至110个核苷酸、更优选地95至105个核苷酸的值,“约15000个核苷酸”包括13500至16500个核苷酸、优选地14500至15500个核苷酸、更优选地14990至15010个核苷酸、最优。
46、选地14995至15005个核苷酸的值,“约200个核苷酸”包括150至250个核苷酸、优选地190至210个核苷酸、更优选地195至205个核苷酸的值,“约8000个核苷酸”包括7200至8800、优选地7500至8500个核苷酸、更优选地7990至8010个核苷酸、最优说明书CN104093834A117/36页12选地7995至8005个核苷酸的值,“约500个核苷酸”包括450至550个核苷酸、优选地475至525、更优选地490至510、最优选地495至505个核苷酸的值,“约5000个核苷酸”包括4500至5500个核苷酸、优选地4750至5250、更优选地4990至5010、最优。
47、选地4995至5005个核苷酸的值,“约1000个核苷酸”包括900至1100个核苷酸、优选地950至1050、更优选地990至1010、最优选地995至1005个核苷酸的值,“约4500个核苷酸”包括4050至4950个核苷酸、优选地4250至4750、更优选地4490至4510、最优选地4495至4505个核苷酸的值,“约1500个核苷酸”包括1350至1650个核苷酸、优选地1450至1550、更优选地1490至1510、最优选地1495至1505个核苷酸的值,“约4000个核苷酸”包括3600至4400个核苷酸、优选地3800至4200、更优选地3990至4010、更优选地3995至4。
48、005个核苷酸的值,“约2000个核苷酸”包括1800至2200个核苷酸、优选地1900至2100、更优选地1990至2010、最优选地1995至2005个核苷酸的值,“约3500个核苷酸”包括3150至3850个核苷酸、优选地3300至3700、更优选地3490至3510、最优选地3495至3505个核苷酸的值,“约2700个核苷酸”包括2430至2970个核苷酸、优选地2600至2800、更优选地2690至2710、最优选地2695至2705个核苷酸的值,“约3300个核苷酸”包括2970至3630个核苷酸,优选地3100至3500、更优选地3290至3310、最优选地3295至3305个。
49、核苷酸的值,“约3200个核苷酸”包括2880至3520个核苷酸、优选地3000至3400、更优选地3190至3210、最优选地3195至3205个核苷酸,约7000或约位置7000包括位置6300至7700、优选地位置6700至7300、更优选地位置6990至7010、最优选地位置6995至7005,约1或约位置1包括位置10至10、优选地位置5至5、更优选地位置1至2,约3500或约位置3500包括位置3150至3850、优选地位置3300至3700、更优选地位置3490至5010、最优选地位置3495至3505。0047对于与SEQID号的序列中的位置相关的本文所涉及的或本文所用的针对人、小鼠和大鼠源的GAPDH基因、IFF01基因和NCAPD2基因的DNA所用的编号,术语“约”包括偏离最多500BP、优选地100BP、更优选地10BP、最优选地5BP的值。0048在一个实施方案中,本公开提供一种表达盒,其包含启动子、编码多肽的多核苷酸序列和真核GAPDH启动子下游的非翻译性基因组DNA序列,其中由多核苷酸序列编码的多肽不是GAPDH,并且其中真核GAPDH启动子下游的非翻译性基因组DNA序列始于跨越核苷酸位置约1至核苷酸位置约7000的区域内。