《减少1>2读框移位的方法.pdf》由会员分享,可在线阅读,更多相关《减少1>2读框移位的方法.pdf(39页珍藏版)》请在专利查询网上搜索。
1、10申请公布号CN104136459A43申请公布日20141105CN104136459A21申请号201380011005822申请日2013022212157512020120229EP12162810120120402EPC07K14/775200601C12N15/6720060171申请人霍夫曼拉罗奇有限公司地址瑞士巴塞尔72发明人阿德尔伯特格罗斯曼弗里德里克黑塞E科佩茨基维尔马劳克里斯蒂安尚茨74专利代理机构中科专利商标代理有限责任公司11021代理人张莹王旭54发明名称减少12读框移位的方法57摘要本文报道了一种重组生产包含二肽AR的多肽的方法,其特征在于所述方法包括从包含编码。
2、所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收多肽,从而生产所述多肽,其中包含在所述多肽中的二肽AR由寡核苷酸GCACGT,或寡核苷酸GCGCGT,或寡核苷酸GCCCGT编码。30优先权数据85PCT国际申请进入国家阶段日2014082686PCT国际申请的申请数据PCT/EP2013/0535472013022287PCT国际申请的公布数据WO2013/127700EN2013090651INTCL权利要求书1页说明书18页序列表18页附图1页19中华人民共和国国家知识产权局12发明专利申请权利要求书1页说明书18页序列表18页附图1页10申请公布号CN1041364。
3、59ACN104136459A1/1页21一种在包含二肽ARSEQIDNO06的多肽的生产中减少由12移码导致的副产物形成的方法,其特征在于所述方法包括以下步骤从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽,从而生产所述多肽,其中包含在编码所述多肽的核酸中的编码所述二肽AR的寡核苷酸在第四位具有核苷酸C。2一种在包含二肽ARSEQIDNO06的多肽的重组生产中减少由12移码导致的副产物形成的方法,其特征在于所述方法包含以下步骤从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽,从而生产所述多肽,其中包含在所述多肽中。
4、的二肽AR由寡核苷酸GCACGTSEQIDNO03,或寡核苷酸GCGCGTSEQIDNO04,或寡核苷酸GCCCGTSEQIDNO05编码。3根据权利要求1所述的方法,其特征在于包含在所述多肽中的二肽AR由寡核苷酸GCACGT,或寡核苷酸GCGCGT,或寡核苷酸GCCCGT编码。4根据权利要求1至3任一项所述的方法,其特征在于所述细胞是原核细胞。5根据权利要求1至3任一项所述的方法,其特征在于所述原核细胞是大肠杆菌细胞。6根据权利要求1至5任一项所述的方法,其特征在于所述多肽是载脂蛋白AI,或具有载脂蛋白AI活性的其变体,或具有载脂蛋白AI活性的其融合多肽。7根据权利要求6所述的方法,其特征在。
5、于所述多肽具有选自包含SEQIDNO09至SEQIDNO14的组的氨基酸序列。8根据权利要求1至7任一项所述的方法,其特征在于所述多肽具有SEQIDNO09或SEQIDNO11的氨基酸序列。权利要求书CN104136459A1/18页3减少12读框移位的方法0001本发明属于重组多肽生产领域。本文报道了一种重组生产具有减少的副产物含量的多肽的方法,其中通过修饰在翻译或转录过程中减少移码FRAMESHIFT的编码核酸实现副产物含量的减少。0002发明背景0003蛋白质在现今的医用组合中发挥重要作用。对于人的应用,每种药用物质必须满足不同的标准。为了保证生物药剂对人的安全性,尤其必须将会引起严重危。
6、害的核酸,病毒,和宿主细胞蛋白质移除。为了满足质量管理规格标准REGULATORYSPECICATION,一个或更多个纯化步骤必须按照制造工艺。0004可以例如通过原核细胞比如大肠杆菌生产重组多肽。重组生产的多肽占原核细胞的多肽含量的大多数并且经常在原核细胞内沉积为不溶的聚集体,即为所谓的包涵体。为了分离重组多肽,必须将细胞破碎并且必须在从细胞碎片分离包涵体之后将包含在包涵体中的重组多肽溶解。对于增溶离液剂,使用比如脲或盐酸胍。为了切开二硫键,尤其在碱性条件下加入还原剂,比如二硫赤藓醇,二硫苏糖醇,或巯基乙醇。溶解聚集的多肽之后,必须将重组多肽的对于生物活性至关重要的球状结构重建。在该所谓的复。
7、性过程中,例如通过针对合适的缓冲液透析缓慢降低还原剂的浓度,其允许变性的多肽重折叠为其生物活性结构。复性后,纯化重组多肽到对于预期用途可接受的纯度。例如,对于作为治疗性蛋白质的使用,必须建立大于90的纯度。0005重组生产的多肽通常伴有来自生产细胞的核酸,内毒素,和/或多肽。除了宿主细胞来源的副产物,在粗制多肽制备物中还存在多肽来源的副产物。除了别的以外,可以存在研究的多肽的截短的变体。0006在WO95/25786中,报道了在细菌表达系统中生产人载脂蛋白A1。0007发明概述0008已经发现,编码二肽AR的寡核苷酸可以是在编码包含二肽AR的多肽的核酸的翻译或转录过程中12移码的点。由于移码的。
8、出现,产生具有不编码的氨基酸序列的无义多肽。0009因此,已经发现,包含在编码更大多肽的核酸中的编码二肽AR的寡核苷酸应该选自寡核苷酸GCACGTSEQIDNO03,GCGCGTSEQIDNO04,和GCCCGTSEQIDNO05。已经发现,编码所述二肽AR的寡核苷酸中的第四个核苷酸不应该是A。0010如本文报道的一个方面是重组生产包含所述二肽ARSEQIDNO06的多肽的方法,其特征在于所述方法包括以下步骤0011从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽并从而生产所述多肽,0012其中包含在编码所述多肽的核酸中的编码所述二肽AR的寡核苷酸在第四。
9、位具有核苷酸C。0013因此,作为一个方面,本文报道了,重组生产包含二肽ARSEQIDNO06的多肽的方法,其特征在于所述方法包括以下步骤说明书CN104136459A2/18页40014从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽并从而生产所述多肽,0015其中包含在所述多肽中的二肽AR由寡核苷酸GCACGTSEQIDNO03,或寡核苷酸GCGCGTSEQIDNO04,或寡核苷酸GCCCGTSEQIDNO05编码。0016如本文报道的一个方面是在包含二肽ARSEQIDNO06的多肽的生产中减少由12移码导致的副产物形成的方法,其特征在于所述方法包括。
10、以下步骤0017从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽并从而生产所述多肽,0018其中编码包含在编码所述多肽的核酸中的二肽AR的寡核苷酸在第四位具有核苷酸C。0019因此,作为一个方面,本发明报道了在包含二肽ARSEQIDNO06的多肽的重组生产中减少由12移码导致的副产物形成的方法,其特征在于所述方法包括以下步骤0020从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽并从而生产所述多肽,0021其中包含在所述多肽中的二肽AR由寡核苷酸GCACGTSEQIDNO03,或寡核苷酸GCGCGTSEQIDNO0。
11、4,或寡核苷酸GCCCGTSEQIDNO05编码。0022在如之前报道的所有方面的一个实施方案中,所述二肽AR是所有二肽AR。0023在如本文报道的所有方面的一个实施方案中,所述二肽AR是氨基酸序列中最后的二肽AR。0024如本文报道的一个方面是重组生产包含二肽ARSEQIDNO06的SEQIDNO09或SEQIDNO11的载脂蛋白AI的方法,其特征在于所述方法包括以下步骤0025从包含编码SEQIDNO09或SEQIDNO11的载脂蛋白AI的核酸的细胞或包含编码SEQIDNO09或SEQIDNO11的载脂蛋白AI的核酸的细胞的培养物的培养基回收所述载脂蛋白AI并从而生产所述载脂蛋白AI,00。
12、26其中包含在编码所述载脂蛋白AI的核酸中的编码最后的二肽AR的寡核苷酸在第四位具有核苷酸C。0027因此,作为一个方面,本发明报道了重组生产包含二肽ARSEQIDNO06的SEQIDNO09或SEQIDNO11的载脂蛋白AI的方法,其特征在于所述方法包括以下步骤0028从包含编码SEQIDNO09或SEQIDNO11的载脂蛋白AI的核酸的细胞或包含编码SEQIDNO09或SEQIDNO11的载脂蛋白AI的核酸的细胞的培养物的培养基回收所述载脂蛋白AI并从而生产所述载脂蛋白,0029其中包含在所述载脂蛋白AI氨基酸序列中的最后的二肽AR由寡核苷酸GCACGTSEQIDNO03,或寡核苷酸GCG。
13、CGTSEQIDNO04,或寡核苷酸GCCCGTSEQIDNO05编码。0030如本文报道的一个方面是编码在其氨基酸序列中包含二肽AR的多肽的核酸,其中所述二肽AR由寡核苷酸GCACGTSEQIDNO03,或寡核苷酸GCGCGTSEQIDNO04,或寡核苷酸GCCCGTSEQIDNO05编码。0031如本文报道的一个方面是包含如本文报道的核酸的细胞。0032如本文报道的一个方面是寡核苷酸GCACGTSEQIDNO03,或寡核苷酸GCG说明书CN104136459A3/18页5CGTSEQIDNO04,或寡核苷酸GCCCGTSEQIDNO05用于编码包含在多肽中的二肽AR的用途。0033以下具体。
14、说明如本文报道的所有方面的实施方案。0034在一个实施方案中,所述二肽AR由寡核苷酸GCACGTSEQIDNO03编码。0035在一个实施方案中,所述二肽AR由寡核苷酸GCGCGTSEQIDNO04编码。0036在一个实施方案中,所述二肽AR由寡核苷酸GCCCGTSEQIDNO05编码。0037在一个实施方案中,所述多肽包含约50个氨基酸残基至约500个氨基酸残基。在一个实施方案中,所述多肽包含约100个氨基酸残基至约400个氨基酸残基。在一个实施方案中,所述多肽包含约250氨基酸残基至约350氨基酸残基。0038在一个实施方案中,所述细胞是原核细胞。在一个实施方案中,所述原核细胞是大肠杆菌E。
15、COLI细胞,或芽胞杆菌BACILLUS细胞。0039在一个实施方案中,所述细胞是真核细胞。在一个实施方案中,所述细胞是CHO细胞,或HEK细胞,或BHK细胞,或NS0细胞,或SP2/0细胞,或酵母细胞。0040在一个实施方案中,所述多肽是异源多聚多肽。在一个实施方案中,所述多肽是抗体或抗体片段。0041在一个实施方案中,所述多肽是同源多聚多肽。在一个实施方案中,所述多肽是同源二聚体或同源三聚体。0042在一个实施方案中,所述多肽是人载脂蛋白AI或具有人载脂蛋白AI的生物活性的其变体。在一个实施方案中,所述载脂蛋白AI变体具有选自SEQIDNO09至SEQIDNO14的组的氨基酸序列。0043。
16、在一个实施方案中,所述多肽是具有SEQIDNO09或SEQIDNO11的氨基酸序列的人载脂蛋白AI。0044发明详述0045定义0046术语氨基酸指羧基氨基酸类,其可以直接或以前体的形式由核酸编码。个体氨基酸被由三个核苷酸组成的核酸所谓密码子或碱基三联体编码。每个氨基酸由至少一个密码子编码。由不同密码子编码相同氨基酸被称为“遗传密码的简并”。术语”氨基酸”指天然存在的羧基氨基酸并且包括丙氨酸三字母代码ALA,单字母代码A,精氨酸ARG,R,天冬酰胺ASN,N,天冬氨酸ASP,D,半胱氨酸CYS,C,谷氨酰胺GLN,Q,谷氨酸GLU,E,甘氨酸GLY,G,组氨酸HIS,H,异亮氨酸ILE,I,亮。
17、氨酸LEU,L,赖氨酸LYS,K,甲硫氨酸MET,M,苯丙氨酸PHE,F,脯氨酸PRO,P,丝氨酸SER,S,苏氨酸THR,T,色氨酸TRP,W,酪氨酸TYR,Y,和缬氨酸VAL,V。0047术语载脂蛋白AI指具有蛋白质脂质和蛋白质蛋白质相互作用性质的,两亲的,螺旋多肽。载脂蛋白AI由肝和小肠合成为267个氨基酸残基的前载脂蛋白原PREPROAPOLIPOPROTEIN,其以载脂蛋白原PROAPOLIPOPROTEIN分泌,所述载脂蛋白原被切割为具有243个氨基酸残基的成熟多肽。载脂蛋白AI由6至8个不同氨基酸重复每个由被接头部分常常是脯氨酸分开的22个氨基酸残基组成组成,并且在一些情况下由通。
18、过一些残基构成的区段组成。在GENPEPT数据库入口DATABASEENTRYNM000039或数据库入口X00566;GENBANKNP0000301GI4557321中报道了代表性的人载脂蛋说明书CN104136459A4/18页6白AI氨基酸序列。存在人载脂蛋白AISEQIDNO07的天然存在的变体,比如P27H,P27R,P28R,R34L,G50R,L84R,D113E,AA119D,D127N,K131的缺失,K131M,W132R,E133K,R151C氨基酸残基151从ARG改变为CYS,载脂蛋白AIPARIS,E160K,E163G,P167R,L168R,E171V,P18。
19、9R,R197C氨基酸残基173从ARG改变为CYS,载脂蛋白AIMILANO和E222K。还包括的是具有保守氨基酸修饰的变体。0048术语“密码子”指由编码限定的氨基酸的三个核苷酸组成的寡核苷酸。由于遗传密码的简并性,一些氨基酸由多于一种密码子编码。这些编码相同氨基酸的不同密码子在个体宿主细胞中具有不同的相对使用频率。因此,特定氨基酸可以由一组不同的密码子编码。同样地,多肽的氨基酸序列可以由不同核酸编码。因此,特定氨基酸可以由一组不同的密码子编码,其中这些密码子中的每个具有给定的宿主细胞中的使用频率。0049表大肠杆菌密码子使用密码子|编码的氨基酸|使用频率00500051保守取代显示在以下。
20、优选的取代标题下的表中。在以下代表性的取代标题下的表中并且如在下文关于氨基酸侧链类型进一步描述的提供另外更多的取代的改变。0052说明书CN104136459A5/18页700530054非保守取代需要将这些类型中的一种的成员交换为另一种类型。0055术语保守氨基酸修饰指不影响或改变多肽的特性的氨基酸序列的修饰。可以说明书CN104136459A6/18页8通过本领域已知的标准技术,比如位点定向的诱变和PCR介导的诱变引入修饰。保守氨基酸修饰包括其中氨基酸残基被具有类似侧链的氨基酸残基替代的修饰。本领域中已经限定了具有类似侧链的氨基酸残基家族。这些家族包括具有碱性侧链例如赖氨酸,精氨酸,组氨酸。
21、,酸性侧链例如天冬氨酸,谷氨酸,不带电极性侧链例如甘氨酸,天冬酰胺,谷氨酰胺,丝氨酸,苏氨酸,酪氨酸,半胱氨酸,色氨酸,非极性侧链例如丙氨酸,缬氨酸,亮氨酸,异亮氨酸,脯氨酸,苯丙氨酸,甲硫氨酸,分枝侧链例如苏氨酸,缬氨酸,异亮氨酸,和芳香侧链例如酪氨酸,苯丙氨酸,色氨酸,组氨酸的氨基酸。0056术语“多肽的变体”指氨基酸序列以多达十个,在一个实施方案中从约两个至约五个,添加,缺失,和/或取代不同于“母体”多肽的氨基酸序列的多肽。可以通过基于如由RIECHMANN,L,等人,NATURE3321988323327,和QUEEN,C,等人,PROCNATLACADSCIUSA8619891002。
22、910033描述的分子模型的诱变进行氨基酸序列修饰。0057可以使用公知的算法,比如BLOSUM30,BLOSUM40,BLOSUM45,BLOSUM50,BLOSUM55,BLOSUM60,BLOSUM62,BLOSUM65,BLOSUM70,BLOSUM75,BLOSUM80,BLOSUM85,或BLOSUM90计算不同氨基酸序列的同源性和同一性。在一个实施方案中,所述算法是BLOSUM30。0058交替使用术语宿主细胞,宿主细胞系,和宿主细胞培养物并且指已引入外源核酸的细胞,包括此种细胞的子代。宿主细胞包括转化体和转化的细胞,其包括原代转化的细胞和从中来源的不考虑传代数量的子代。子代核酸。
23、含量可以不与亲代细胞完全相同,但可以包含突变。具有与在最初转化的细胞中筛选或选择的相同功能或生物活性突变的子代包括在本文中。0059术语“核酸”和“核酸序列”指由个体核苷酸还称为碱基A,C,G,和T或RNA中的U组成的聚合分子,即DNA,RNA,或其修饰物。该多核苷酸分子可以是天然存在的多核苷酸分子或合成的多核苷酸分子或一种或更多种天然存在的多核苷酸分子与一种或更多种合成的多核苷酸分子的组合。该定义还包括的是其中一个或更多个核苷酸被改变例如通过诱变,缺失,或添加的天然存在的多核苷酸分子。核酸可以是分离的,或整合入另一条核酸,例如整合入表达盒,质粒,或宿主细胞的染色体。核酸以其由个体核苷酸组成的。
24、核酸序列为特征。术语“寡核苷酸”指由至多10个个体核苷酸也成为碱基A,C,G,和T或RNA中的U组成的聚合分子。0060对于本领域技术人员来说,将例如多肽的氨基酸序列转变为编码该氨基酸序列的相应的核酸序列的工艺和方法是公知的。因此,核酸以其由个体核苷酸组成的核酸序列为特征并且类似地以由此编码的多肽的氨基酸序列表征。0061有关参考多肽序列的“百分数氨基酸序列同一性定义为经比对序列和引入缺口如果需要以获得最大百分数序列同一性,和不考虑任何保守取代作为序列同一性的部分之后,候选序列中与参考多肽序列中氨基酸残基的相同的氨基酸残基的百分数。可以以不同方式实现为了确定百分数氨基酸序列同一性的目的的比对,。
25、所述方式在本领域技术内,例如,使用公众可获得的计算机软件,比如BLAST,BLAST2,ALIGN或MEGALIGNDNASTAR软件。本领域熟练技术人员可以确定用于比对序列的合适参数,包括获得跨被比较序列的全长的最大比对所需的任何算法。然而,为了本文的目的,使用序列比较计算机程序ALIGN2产生氨基酸序列同一性值。ALIGN2序列比较计算机程序说明书CN104136459A7/18页9由GENENTECH,INC创作,并且已将原代码与用户文献资料提交美国版权局,WASHINGTONDC,20559,其中其在美国版权登记号TXU510087下登记。ALIGN2程序可从GENENTECH,INC。
26、,SOUTHSANFRANCISCO,CALIFORNIA由公众获得,或可以从源代码编辑。应该将ALIGN2程序编辑用于在UNIX操作系统包括数字的UNIXV40D上使用。所有序列比较参数由ALIGN2程序设定并且不改变。0062在将ALIGN2用于氨基酸序列比较的情况下,如下计算给定氨基酸序列A相对TO、与WITH、或针对AGAINST给定氨基酸序列B其可以备选地叙述为相对TO、与WITH、或针对AGAINST给定氨基酸序列B具有或包含某一氨基酸序列同一性的给定氨基酸序列A的氨基酸序列同一性0063100乘以分数X/Y0064其中X是通过序列比对程序ALIGN2中的A和B的程序比对得分为相同。
27、匹配的氨基酸残基的数量,并且其中Y是B中氨基酸残基的总数量。将理解其中氨基酸序列A的长度与氨基酸序列B的长度不相等,A相对B的氨基酸序列同一性将不等于B相对A的氨基酸序列同一性。除非另有特别说明,否则如在紧接的上一段中使用ALIGN2计算机程序获得本文使用所有氨基酸序列同一性值。0065术语重组多肽和“重组生产的多肽”指通过重组方法制备,表达或产生的多肽,比如分离自宿主细胞,比如大肠杆菌,NS0,BHK,或CHO细胞的多肽。0066术语取代指改变母体核酸中一个特定核苷酸以获得取代的/改变的核酸。0067如本文报道的方法0068例如在AUSUBEL,FM编辑,CURRENTPROTOCOLSIN。
28、MOLECULARBIOLOGY,卷I至III1997,WILEYANDSONS;SAMBROOK,J,等人,MOLECULARCLONINGALABORATORYMANUAL,第二版,COLDSPRINGHARBORLABORATORYPRESS,COLDSPRINGHARBOR,NY1989;MORRISON,SL,等人,PROCNATLACADSCIUSA81198468516855;US5,202,238和US5,204,244中描述了用于进行本发明的,本领域技术人员已知的方法和技术。0069已经发现,包含在编码包含二肽AR的多肽的核酸内的编码二肽AR的寡核苷酸可以是编码包含二肽AR的。
29、多肽的核酸的转录或翻译过程中12移码突变的点。由于具有非编码的氨基酸序列的移码多肽的出现,最可能产生无义或截短的氨基酸序列。0070更详细地,已经发现依赖于包含在编码更大的即至少50个氨基酸残基多肽的核酸内的编码二肽AR的寡核苷酸,寡核苷酸的转录或翻译过程中的12移码以不同频率发生参见下表。0071表0072编码AR二肽的寡核苷酸12移码发生GCGAGGSEQIDNO01是GCGAGASEQIDNO0230说明书CN104136459A8/18页10GCACGTSEQIDNO03低于检测极限GCGCGTSEQIDNO04低于检测极限GCCCGTSEQIDNO05低于检测极限0073因此,如本文。
30、报道的一个方面是重组生产包含二肽ARSEQIDNO06的多肽的方法,其特征在于所述方法包括以下步骤0074从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽并从而生产所述多肽,0075其中包含在所述多肽中的二肽AR由寡核苷酸GCACGTSEQIDNO03,或寡核苷酸GCGCGTSEQIDNO04,或寡核苷酸GCCCGTSEQIDNO05编码。0076因此,如本文报道的一个方面是重组生产包含二肽ARSEQIDNO06的多肽的方法,其特征在于所述方法包括以下步骤0077从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽并从。
31、而生产所述多肽,0078其中包含在编码所述多肽的核酸中的编码二肽AR的寡核苷酸在第四位具有核苷酸C。0079在一个实施方案中,编码所述二肽AR的寡核苷酸包含编码氨基酸A的密码子选自GCT,GCC,GCA和GCG的密码子和编码氨基酸R的密码子选自CGT,CGC,CGA和CGG的密码子。0080在一个实施方案中,编码所述二肽AR的寡核苷酸选自包含寡核苷酸GCTCGT,GCTCGC,GCTCGA,GCTCGG,GCCCGT,GCCCGC,GCCCGA,GCCCGG,GCACGT,GCACGC,GCACGA,GCACGG,GCGCGT,GCGCGC,GCGCGA,和GCGCGG的组。0081在一个实施。
32、方案中,编码所述二肽AR的寡核苷酸选自包含寡核苷酸GCACGTSEQIDNO03,GCGCGTSEQIDNO04,和GCCCGTSEQIDNO05的组。0082在一个实施方案中,所述方法包括以下步骤0083提供包含编码所述多肽的核酸的细胞,0084培养所述细胞在适于表达所述多肽的条件下,0085从细胞或培养基回收所述多肽。0086任选地以一个或更多个层析步骤纯化生产的多肽。0087在一个实施方案中,通过在编码二肽AR的寡核苷酸GCGAGGSEQIDNO01,或寡核苷酸GCGAGASEQIDNO02中取代二至三个核苷酸以获得寡核苷酸GCACGTSEQIDNO03,或寡核苷酸GCGCGTSEQID。
33、NO04,或寡核苷酸GCCCGTSEQIDNO05,来获得包含编码二肽AR的寡核苷酸GCACGTSEQIDNO03,或寡核苷酸GCGCGTSEQIDNO04,或寡核苷酸GCCCGTSEQIDNO05的编码所述多肽的核酸。0088在一个实施方案中,以一至五个层析步骤纯化生产的多肽。在一个实施方案中,以二至四个层析步骤纯化生产的多肽。在一个实施方案中,以三个层析步骤纯化生产的多肽。0089一般的层析方法和其用途对于本领域技术人员来说是已知的。参见例如,CHROMATOGRAPHY,第5版,PARTAFUNDAMENTALSANDTECHNIQUES,HEFTMANN,E编辑,说明书CN104136。
34、459A109/18页11ELSEVIERSCIENCEPUBLISHINGCOMPANY,纽约1992;ADVANCEDCHROMATOGRAPHICANDELECTROMIGRATIONMETHODSINBIOSCIENCES,DEYL,Z编辑,ELSEVIERSCIENCEBV,AMSTERDAM,荷兰1998;CHROMATOGRAPHYTODAY,POOLE,CF,和POOLE,SK,ELSEVIERSCIENCEPUBLISHINGCOMPANY,纽约1991;SCOPES,PROTEINPURICATIONPRINCIPLESANDPRACTICE1982;SAMBROOK,J,。
35、等人编辑,MOLECULARCLONINGALABORATORYMANUAL,第二版,COLDSPRINGHARBORLABORATORYPRESS,COLDSPRINGHARBOR,NY1989;或CURRENTPROTOCOLSINMOLECULARBIOLOGY,AUSUBEL,FM,等人编辑,JOHNWILEYSONS,INC,纽约1997。0090如本文报道的一个方面是编码在其氨基酸序列中包含二肽AR的多肽的核酸,其中所述二肽AR由寡核苷酸GCACGTSEQIDNO03,或寡核苷酸GCGCGTSEQIDNO04,或寡核苷酸GCCCGTSEQIDNO05编码。0091如本文报道的一个方。
36、面是包含如本文报道的核酸的细胞。0092如本文报道的一个方面是寡核苷酸GCACGTSEQIDNO03,或寡核苷酸GCGCGTSEQIDNO04,或寡核苷酸GCCCGTSEQIDNO05用于编码包含在多肽中的二肽AR的用途。0093如本文报道的一个方面是在包含二肽AR的多肽的重组生产过程中减少副产物形成的方法,所述方法包括以下步骤0094在编码多肽的核酸中,取代编码二肽AR的寡核苷酸GCGAGGSEQIDNO01,或寡核苷酸GCGAGASEQIDNO02中的二至三个核苷酸以获得寡核苷酸GCACGTSEQIDNO03,或寡核苷酸GCGCGTSEQIDNO04,或寡核苷酸GCCCGTSEQIDNO0。
37、5,从而产生取代的编码多肽的核酸,和0095从包含编码所述多肽的取代的核酸的细胞或包含编码所述多肽的取代的核酸的细胞的培养物的培养基回收所述多肽并从而在包含二肽AR的多肽的重组生产过程中减少副产物形成。0096如本文报道的一个方面是增加重组生产的包含二肽AR的多肽的表达的方法,所述方法包含以下步骤0097在编码多肽的核酸中,取代编码二肽AR的寡核苷酸GCGAGGSEQIDNO01,或寡核苷酸GCGAGASEQIDNO02中的二至三个核苷酸以获得寡核苷酸GCACGTSEQIDNO03,或寡核苷酸GCGCGTSEQIDNO04,或寡核苷酸GCCCGTSEQIDNO05,从而产生取代的编码多肽的核酸。
38、,并且0098从包含编码多肽的取代的核酸的细胞或包含编码多肽的取代的核酸的细胞的培养物的培养基回收所述多肽并从而增加包含二肽AR的多肽的表达。0099在一个实施方案中,所述方法包含以下进一步步骤中的一个或更多个0100提供包含二肽AR的多肽的氨基酸序列或编码核酸,和/或0101用编码所述多肽的取代的核酸转染细胞,和/或0102培养转染有取代的核酸的细胞在适于表达所述多肽的条件下,和/或0103从细胞或培养基回收所述多肽,和/或0104任选地以一个或更多个层析步骤纯化生产的多肽。0105在一个实施方案中以一至五个层析步骤纯化生产的多肽。在一个实施方案中,以说明书CN104136459A1110/。
39、18页12二至四个层析步骤纯化生产的多肽。在一个实施方案中,以三个层析步骤纯化生产的多肽。0106以下以在原核细胞中生产的重组多肽,即在大肠杆菌中生产的四连蛋白载脂蛋白AI融合多肽举例证明如本文报道的方法。0107四连蛋白载脂蛋白AI融合多肽包含在N末端至C末端方向人四连蛋白三聚化结构元件和野生型人载脂蛋白AI。人四连蛋白三聚化结构元件的氨基酸序列可以截短前9个氨基酸,这样,以位置10的异亮氨酸残基天然存在的截短位点起始。作为该截短的结果,位置4的苏氨酸残基的O糖基化位点被删除。四连蛋白三聚化结构元件和人载脂蛋白AI间的五个氨基酸残基SLKGSSEQIDNO08被移除。0108为了改善的表达和。
40、纯化,可以构建包含N末端纯化标签,例如六组氨酸标签,和用于移除纯化标签的蛋白酶切割位点的构建体。在一个实施方案中,所述蛋白酶是IGA蛋白酶,并且所述蛋白酶切割位点是IGA蛋白酶切割位点。作为蛋白酶的特异切割的结果,蛋白酶切割位点的一些氨基酸残基保留在多肽的N末端,即在IGA蛋白酶切割位点的情况下,两个氨基酸残基如第一丙氨酸或甘氨酸或丝氨酸或苏氨酸和如第二脯氨酸被保留在多肽,例如四连蛋白载脂蛋白AI融合多肽的N末端。0109四连蛋白三聚化结构元件提供允许形成四连蛋白载脂蛋白AI同源三聚体的结构域,所述同源三聚体通过每个个体四连蛋白载脂蛋白AI单体之间的非共价相互作用构成。0110在一个实施方案中。
41、,所述载脂蛋白AI融合多肽是包含保守氨基酸取代的变体。0111在一个实施方案中,所述四连蛋白载脂蛋白AI融合多肽包含表达和纯化标签,并具有以下氨基酸序列0112CDLPQTHSLGSHHHHHHGSVVAPPAPIVNAKKDVVNTKMFEELKSRLDTLAQEVALLKEQQALQTVDEPPQSPWDRVKDLATVYVDVLKDSGRDYVSQFEGSALGKQLNLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARA。
42、HVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQSEQIDNO090113在一个实施方案中,所述四连蛋白载脂蛋白AI融合多肽IVN具有以下氨基酸序列0114IVNAKKDVVNTKMFEELKSRLDTLAQEVALLKEQQALQTVDEPPQSPWDRVKDLATVYVDVLKDSGRDYVSQFEGSALGKQLNLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQ。
43、KVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQSEQIDNO100115因此,在一个实施方案中,所述四连蛋白载脂蛋白AI融合多肽PIVN具有以下氨基酸序列0116PIVNAKKDVVNTKMFEELKSRLDTLAQEVALLKEQQALQTVDEPPQSPWDRVKDLATVYVDVLKDSGRDYVSQFEGSALGKQLNLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNL。
44、EKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQSEQIDNO110117在一个实施方案中,所述四连蛋白载脂蛋白AI融合多肽XPIVN具有以下氨基酸序列说明书CN104136459A1211/18页130118G,S,TPIVNAKKDVVNTKMFEELKSRLDTLAQEVALLKEQQALQTVDEPPQ。
45、SPWDRVKDLATVYVDVLKDSGRDYVSQFEGSALGKQLNLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQSEQIDNO120119因此,在一个实施方案中,所述四连蛋白载脂蛋白AI融合多肽APIVN具有以下氨基酸序列0120API。
46、VNAKKDVVNTKMFEELKSRLDTLAQEVALLKEQQALQTVDEPPQSPWDRVKDLATVYVDVLKDSGRDYVSQFEGSALGKQLNLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQSEQIDNO130121在一个实施。
47、方案中,所述包含六组氨酸标签的四连蛋白载脂蛋白AI融合多肽XIVN具有以下氨基酸序列0122HHHHHHXIVNAKKDVVNTKMFEELKSRLDTLAQEVALLKEQQALQTVDEPPQSPWDRVKDLATVYVDVLKDSGRDYVSQFEGSALGKQLNLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKA。
48、KPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQSEQIDNO14,0123其中X可以是以下氨基酸序列中的任一个A,G,S,P,AP,GP,SP,PP,GSAPSEQIDNO15,GSGPSEQIDNO16,GSSPSEQIDNO17,GSPPSEQIDNO18,GGGSSEQIDNO19,GGGGSSEQIDNO20,GGGSGGGSSEQIDNO21,GGGGSGGGGSSEQIDNO22,GGGSGGGSGGGSSEQIDNO23,GGGGSGGGGSGGGGSSEQIDNO24,GGGSAPSEQIDNO25,GGGSGPSEQIDNO26,GGGSSPSEQI。
49、DNO27,GGGSPPSEQIDNO28,GGGGSAPSEQIDNO29,GGGGSGPSEQIDNO30,GGGGSSPSEQIDNO31,GGGGSPPSEQIDNO32,GGGSGGGSAPSEQIDNO33,GGGSGGGSGPSEQIDNO34,GGGSGGGSSPSEQIDNO35,GGGSGGGSPPSEQIDNO36,GGGSGGGSGGGSAPSEQIDNO37,GGGSGGGSGGGSGPSEQIDNO38,GGGSGGGSGGGSSPSEQIDNO39,GGGSGGGSGGGSPPSEQIDNO40,GGGGSAPSEQIDNO41,GGGGSGPSEQIDNO42,GGGGSSPSEQIDNO43,GGGGSPPSEQIDNO44,GGGGSGGGGSAPSEQIDNO45,GGGGSGGGGSGPSEQIDNO46,GGGGSGGGGSSPSEQIDNO47,GGGGSGGGGSPPSEQIDNO48,GGGGSGGGGSGGGGSAPSEQIDNO49,GGGGSGGGGSGGGGSGPSEQIDNO50,GGGGSGGGGSGGGGSSPSEQIDNO51,和GGGGSGGGGSGGG。