《减少13读框移位的方法.pdf》由会员分享,可在线阅读,更多相关《减少13读框移位的方法.pdf(38页珍藏版)》请在专利查询网上搜索。
1、10申请公布号CN104136460A43申请公布日20141105CN104136460A21申请号201380011165222申请日2013022612157513820120229EP12162814320120402EPC07K14/775200601C12N15/6720060171申请人霍夫曼拉罗奇有限公司地址瑞士巴塞尔72发明人阿德尔伯特格罗斯曼F黑塞埃哈德科佩茨基维尔马劳克里斯蒂安尚茨74专利代理机构中科专利商标代理有限责任公司11021代理人张莹王旭54发明名称减少13读框移位的方法57摘要本文报道了一种重组生产包含三肽QKK的多肽的方法,其特征在于所述方法包括从包含编码所。
2、述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收多肽从而生产所述多肽的步骤,其中包含在所述多肽中的三肽QKK由寡核苷酸CAGAAAAAA或寡核苷酸CAAAAGAAA编码。30优先权数据85PCT国际申请进入国家阶段日2014082786PCT国际申请的申请数据PCT/EP2013/0537532013022687PCT国际申请的公布数据WO2013/127752EN2013090651INTCL权利要求书1页说明书17页序列表18页附图1页19中华人民共和国国家知识产权局12发明专利申请权利要求书1页说明书17页序列表18页附图1页10申请公布号CN104136460ACN。
3、104136460A1/1页21一种在大肠杆菌细胞中重组生产包含三肽QKK的全长多肽的方法,其特征在于所述方法包括以下步骤从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的大肠杆菌细胞的培养物的培养基回收所述多肽,从而生产所述多肽,其中包含在所述多肽中的三肽QKK由寡核苷酸CAGAAAAAA,或寡核苷酸CAAAAGAAA编码。2一种在大肠杆菌中重组生产包含三肽QKK的全长多肽的过程中减少副产物形成的方法,其包括以下步骤在编码多肽的核酸中,取代编码三肽QKK的寡核苷酸CAAAAAAAGSEQIDNO01,或寡核苷酸CAAAAGAAGSEQIDNO02,或寡核苷酸CAGAAGAAGSEQID。
4、NO03中的一到三个核苷酸以获得寡核苷酸CAAAAGAAASEQIDNO04,或寡核苷酸CAGAAAAAASEQIDNO05,从而产生取代的编码多肽的核酸,和从包含编码所述多肽的取代的核酸的细胞或包含编码所述多肽的取代的核酸的细胞的培养物的培养基回收所述多肽,从而在重组生产包含所述三肽QKK的多肽的过程中减少副产物形成。3根据权利要求1或2任一项所述的方法,其特征在于所述方法包括以下另外步骤中的一个或更多个提供包含三肽QKK的多肽的氨基酸序列或编码核酸,和/或用编码所述多肽的取代的核酸转染细胞,和/或培养转染有所述取代的核酸的细胞在适于表达所述多肽的条件下,和/或从细胞或培养基回收所述多肽,和。
5、/或任选地以一个或更多个层析步骤纯化生产的多肽。4根据权利要求2至3任一项所述的方法,其特征在于以一至五个层析步骤纯化生产的多肽。5根据在前权利要求中任一项所述的方法,其特征在于所述多肽是载脂蛋白AI,或具有载脂蛋白AI功能的其变体,或其融合多肽。6根据权利要求5所述的方法,其特征在于所述多肽具有选自包含SEQIDNO09至SEQIDNO14的组的氨基酸序列。7根据权利要求5至6任一项所述的方法,其特征在于所述多肽具有SEQIDNO11的氨基酸序列。权利要求书CN104136460A1/17页3减少13读框移位的方法0001本发明属于重组多肽生产领域。本文报道了一种重组生产具有减少的副产物含量。
6、的多肽的方法,其中通过修饰在翻译或转录过程中减少移码FRAMESHIFT的编码核酸实现副产物含量的减少。0002发明背景0003蛋白质在现今的医用组合中发挥重要作用。对于人的应用,每种药用物质必须满足不同的标准。为了保证生物药剂对人的安全性,尤其必须将会引起严重危害的核酸,病毒,和宿主细胞蛋白质移除。为了满足质量管理规格标准REGULATORYSPECICATION,一个或更多个纯化步骤必须按照制造工艺。0004可以例如通过原核细胞比如大肠杆菌生产重组多肽。重组生产的多肽占原核细胞的多肽含量的大多数并且经常在原核细胞内沉积为不溶的聚集体,即为所谓的包涵体。为了分离重组多肽,必须将细胞破碎并且必。
7、须在从细胞碎片分离包涵体之后将包含在包涵体中的重组多肽溶解。对于增溶离液剂,使用比如脲或盐酸胍。为了切开二硫键,尤其在碱性条件下加入还原剂,比如二硫赤藓醇,二硫苏糖醇,或巯基乙醇。溶解聚集的多肽之后,必须将重组多肽的对于生物活性至关重要的球状结构重建。在该所谓的复性过程中,例如通过针对合适的缓冲液透析缓慢降低还原剂的浓度,其允许变性的多肽重折叠为其生物活性结构。复性后,纯化重组多肽到对于预期用途可接受的纯度。例如,对于作为治疗性蛋白质的使用,必须建立大于90的纯度。0005重组生产的多肽通常伴有来自生产细胞的核酸,内毒素,和/或多肽。除了宿主细胞来源的副产物,在粗制多肽制备物中还存在多肽来源的。
8、副产物。除了别的以外,可以存在研究的多肽的截短的变体。0006WO95/25786中报道了在细菌表达系统中生产人载脂蛋白AI。KARATHANASIS,SK,等人,报道了人载脂蛋白A1基因的分离和表征PROCNATLACADSCIUSA80198361476151。由GURVICH,OL,等人在EMBOJOURNAL22200359415950中报道了在大肠杆菌的编码区中引导显著的移码水平的序列是常见的。GRAVERSEN,JH,等人,报道了载脂蛋白A1的三聚化阻滞血浆清除并保持抗动脉粥样硬化的性质JCARDIOVASCULARPHARMACOLOGY512008170177。0007发明概述。
9、0008已经发现,编码三肽QKK的寡核苷酸可以是在编码包含三肽QKK的多肽的核酸的转录或翻译过程中13移码的点。由于移码的出现,产生具有不编码的氨基酸序列的无义多肽。0009因此,作为一个方面,本文报道了重组生产包含三肽QKKSEQIDNO06的多肽的方法,其特征在于所述方法包括以下步骤0010从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽从而生产所述多肽。0011其中包含在所述多肽中的三肽QKK由寡核苷酸CAGAAGAAGSEQIDNO03,或寡核苷酸CAAAAGAAASEQIDNO04,或寡核苷酸CAGAAAAAASEQIDNO05编码。说明书CN。
10、104136460A2/17页40012在一个实施方案中,包含在所述多肽中的三肽QKK由寡核苷酸CAAAAGAAASEQIDNO04或寡核苷酸CAGAAAAAASEQIDNO05编码。0013如本文报道的一个方面是编码在其氨基酸序列中包含三肽QKK的多肽的核酸,其中所述三肽QKK由寡核苷酸CAGAAGAAGSEQIDNO03,或寡核苷酸CAAAAGAAASEQIDNO04,或寡核苷酸CAGAAAAAASEQIDNO05编码。0014如本文报道的一个方面是编码在其氨基酸序列中包含三肽QKK的多肽的核酸,其中所述三肽QKK由寡核苷酸CAAAAGAAASEQIDNO04或寡核苷酸CAGAAAAAAS。
11、EQIDNO05编码。0015如本文报道的一个方面是包含如本文报道的核酸的细胞。0016如本文报道的一个方面是用于编码包含于将在大肠杆菌中表达的多肽中的三肽QKK的寡核苷酸CAGAAGAAGSEQIDNO03,或寡核苷酸CAAAAGAAASEQIDNO04,或寡核苷酸CAGAAAAAASEQIDNO05的用途。0017如本文报道的一个方面是用于编码包含于将在大肠杆菌中表达的多肽中的三肽QKK的寡核苷酸CAAAAGAAASEQIDNO04或寡核苷酸CAGAAAAAASEQIDNO05的用途。0018以下具体说明如本文报道的所有方面的实施方案。0019在一个实施方案中,所述三肽QKK由寡核苷酸CA。
12、AAAGAAASEQIDNO04编码。0020在一个实施方案中,所述三肽QKK由寡核苷酸EAGAAAAAASEQIDNO05编码。0021在一个实施方案中,所述全长多肽包含约50个氨基酸残基至约500个氨基酸残基。在一个实施方案中,所述全长多肽包含约100个氨基酸残基至约400个氨基酸残基。在一个实施方案中,所述全长多肽包含约250个氨基酸残基至约350个氨基酸残基。0022在一个实施方案中,所述细胞是原核细胞。在一个实施方案中,所述原核细胞是大肠杆菌ECOLI细胞,或芽胞杆菌BACILLUS细胞。0023在一个实施方案中,所述细胞是真核细胞。在一个实施方案中,所述细胞是CHO细胞,或HEK细。
13、胞,或BHK细胞,或NSO细胞,或SP2/0细胞,或酵母细胞。0024在一个实施方案中,所述多肽是异源多聚多肽。在一个实施方案中,所述多肽是抗体或抗体片段。0025在一个实施方案中,所述多肽是同源多聚多肽。在一个实施方案中,所述多肽是同源二聚体或同源三聚体。0026在一个实施方案中,所述多肽是人载脂蛋白AI或其变体或包含其的融合多肽,其中所述变体或所述融合多肽显示人载脂蛋白AI的体外和体内功能。在一个实施方案中,所述载脂蛋白AI变体具有选自SEQIDNO09至SEQIDNO14的组的氨基酸序列。0027发明详述0028定义0029术语氨基酸指羧基氨基酸类,其可以直接或以前体的形式由核酸编码。个。
14、体氨基酸被由三个核苷酸组成的核酸所谓密码子或碱基三联体编码。每个氨基酸由至少一个密码子编码。由不同密码子编码相同氨基酸被称为“遗传密码的简并”。术语”氨基酸”指天然存在的羧基氨基酸并且包括丙氨酸三字母代码ALA,单字母代码A,说明书CN104136460A3/17页5精氨酸ARG,R,天冬酰胺ASN,N,天冬氨酸ASP,D,半胱氨酸CYS,C,谷氨酰胺GLN,Q,谷氨酸GLU,E,甘氨酸GLY,G,组氨酸HIS,H,异亮氨酸ILE,I,亮氨酸LEU,L,赖氨酸LYS,K,甲硫氨酸MET,M,苯丙氨酸PHE,F,脯氨酸PRO,P,丝氨酸SER,S,苏氨酸THR,T,色氨酸TRP,W,酪氨酸TYR。
15、,Y,和缬氨酸VAL,V。0030术语载脂蛋白AI指具有蛋白质脂和蛋白质蛋白质相互作用性质的,两亲的,螺旋多肽。载脂蛋白AI由肝和小肠合成为267个氨基酸残基的前载脂蛋白原PREPROAPOLIPOPROTEIN,其以载脂蛋白原PROAPOLIPOPROTEIN分泌,所述载脂蛋白原被切割为具有243个氨基酸残基的成熟多肽。载脂蛋白AI由6至8个不同氨基酸重复每个由被接头部分常常是脯氨酸分开的22个氨基酸残基组成组成,并且在一些情况下由通过一些残基构成的区段组成。在GENPEPT数据库入口DATABASEENTRYNM000039或数据库入口X00566;GENBANKNP0000301GI45。
16、57321中报道了代表性的人载脂蛋白AI氨基酸序列。存在人载脂蛋白AISEQIDNO07的天然存在的变体,比如P27H,P27R,P28R,R34L,G50R,L84R,D113E,AA119D,D127N,K131的缺失,K131M,W132R,E133K,R151C氨基酸残基151从ARG改变为CYS,载脂蛋白AIPARIS,E160K,E163G,P167R,L168R,E171V,P189R,R197C氨基酸残基173从ARG改变为CYS,载脂蛋白AIMILANO和E222K。还包括的是具有保守氨基酸修饰的变体。0031术语“密码子”指由编码限定的氨基酸的三个核苷酸组成的寡核苷酸。由于。
17、遗传密码的简并性,一些氨基酸由多于一种密码子编码。这些编码相同氨基酸的不同密码子在个体宿主细胞中具有不同的相对使用频率。因此,特定氨基酸可以由一组不同的密码子编码。同样地,多肽的氨基酸序列可以由不同核酸编码。因此,特定氨基酸可以由一组不同的密码子编码,其中这些密码子中的每个具有给定的宿主细胞中的使用频率。0032表大肠杆菌密码子使用密码子|编码的氨基酸|使用频率0033说明书CN104136460A4/17页60034以下表中代表性的取代标题下提供代表性的改变。保守取代显示在以下表中优选的取代标题下并且如下文中关于氨基酸侧链类型进一步描述。0035表00360037说明书CN104136460。
18、A5/17页70038非保守取代需要将这些类型中的一种的成员交换为另一种类型。0039术语保守氨基酸修饰指不影响或改变多肽的特性的氨基酸序列的修饰。可以通过本领域已知的标准技术,比如位点定向的诱变和PCR介导的诱变引入修饰。保守氨基酸修饰包括其中氨基酸残基被具有类似侧链的氨基酸残基替代的修饰。本领域中已经限定了具有类似侧链的氨基酸残基家族。这些家族包括具有碱性侧链例如赖氨酸,精氨酸,组氨酸,酸性侧链例如天冬氨酸,谷氨酸,不带电极性侧链例如甘氨酸,天冬酰胺,谷氨酰胺,丝氨酸,苏氨酸,酪氨酸,半胱氨酸,色氨酸,非极性侧链例如丙氨酸,缬氨酸,亮氨酸,异亮氨酸,脯氨酸,苯丙氨酸,甲硫氨酸,分枝侧链例如。
19、苏氨酸,缬氨酸,异亮氨酸,和芳香侧链例如酪氨酸,苯丙氨酸,色氨酸,组氨酸的氨基酸。0040术语“多肽的变体”指氨基酸序列以多达十个,在一个实施方案中从约两个至约五个,添加,缺失,和/或取代不同于“母体”多肽的氨基酸序列的多肽。可以通过基于如由RIECHMANN,L,等人,NATURE3321988323327,和QUEEN,C,等人,PROCNATLACADSCIUSA8619891002910033描述的分子模型的诱变进行氨基酸序列修饰。0041可以使用公知的算法,比如BLOSUM30,BLOSUM40,BLOSUM45,BLOSUM50,BLOSUM55,BLOSUM60,BLOSUM62。
20、,BLOSUM65,BLOSUM70,BLOSUM75,BLOSUM80,BLOSUM85,或BLOSUM90计算不同氨基酸序列的同源性和同一性。在一个实施方案中,所述算法是BLOSUM30。说明书CN104136460A6/17页80042交替使用术语宿主细胞,宿主细胞系,和宿主细胞培养物并且指已引入外源核酸的细胞,包括此种细胞的子代。宿主细胞包括转化体和转化的细胞,其包括原代转化的细胞和从中来源的不考虑传代数量的子代。子代核酸含量可以不与亲代细胞完全相同,但可以包含突变。具有与在最初转化的细胞中筛选或选择的相同功能或生物活性突变的子代包括在本文中。0043术语“核酸”和“核酸序列”指由个体。
21、核苷酸还称为碱基A,C,G,和T或RNA中的U组成的聚合分子,即DNA,RNA,或其修饰。该多核苷酸分子可以是天然存在的多核苷酸分子或合成的多核苷酸分子或一种或更多种天然存在的多核苷酸分子与一种或更多种合成的多核苷酸分子的组合。该定义还包括的是其中一个或更多个核苷酸被改变例如通过诱变,缺失,或添加的天然存在的多核苷酸分子。核酸可以是分离的,或整合入另一条核酸,例如整合入表达盒,质粒,或宿主细胞的染色体。核酸以其由个体核苷酸组成的核酸序列为特征。术语“寡核苷酸”指由至多10个个体核苷酸也成为碱基A,C,G,和T或RNA中的U组成的聚合分子。0044对于本领域技术人员来说,将例如多肽的氨基酸序列转。
22、变为编码该氨基酸序列的相应的核酸序列的工艺和方法是公知的。因此,核酸以其由个体核苷酸组成的核酸序列为特征并且类似地以由此编码的多肽的氨基酸序列表征。0045有关参考多肽序列的“百分数氨基酸序列同一性定义为经比对序列和引入缺口如果需要以获得最大百分数序列同一性,和不考虑任何保守取代作为序列同一性的部分之后,候选序列中与参考多肽序列中氨基酸残基的相同的氨基酸残基的百分数。可以以不同方式实现为了百分数氨基酸序列同一性的目的的比对,所述方式在本领域技术内,例如,使用公众可获得的计算机软件,比如BLAST,BLAST2,ALIGN或MEGALIGNDNASTAR软件。本领域熟练技术人员可以确定用于比对序。
23、列的合适参数,包括获得跨被比较序列的全长的最大比对所需的任何算法。然而,为了本文的目的,使用序列比较计算机程序ALIGN2产生氨基酸序列同一性值。ALIGN2序列比较计算机程序由GENENTECH,INC创作,并且已将原代码与用户文献资料提交美国版权局,WASHINGTONDC,20559,其中其在美国版权登记号TXU510087下登记。ALIGN2程序可从GENENTECH,INC,SOUTHSANFRANCISCO,CALIFORNIA由公众获得,或可以从源代码编辑。应该将ALIGN2程序编辑用于在UNIX操作系统包括数字的UNIXV40D上使用。所有序列比较参数由ALIGN2程序设定并且。
24、不改变。0046在将ALIGN2用于氨基酸序列比较的情况下,如下计算给定氨基酸序列A相对TO、与WITH、或针对AGAINST给定氨基酸序列B其可以备选地叙述为相对TO、与WITH、或针对AGAINST给定氨基酸序列B具有或包含某一氨基酸序列同一性的给定氨基酸序列A的氨基酸序列同一性0047100乘以分数X/Y0048其中X是通过序列比对程序ALIGN2中的A和B的程序比对得分为相同匹配的氨基酸残基的数量,并且其中Y是B中氨基酸残基的总数量。将理解其中氨基酸序列A的长度与氨基酸序列B的长度不相等,A相对B的氨基酸序列同一性将不等于B相对A的氨基酸序列同一性。除非另有特别说明,否则如在紧接的上一。
25、段中使用ALIGN2计算机程序获得本文使用所有氨基酸序列同一性值。说明书CN104136460A7/17页90049术语重组多肽和“重组生产的多肽”指通过重组方法制备,表达或产生的多肽,比如分离自宿主细胞,比如大肠杆菌,NSO,BHK,或CHO细胞的多肽。0050术语取代指改变母体核酸中一个特定核苷酸以获得取代的/改变的核酸。0051如本文报道的方法0052例如在AUSUBEL,FM,等人编辑,CURRENTPROTOCOLSINMOLECULARBIOLOGY,卷I至III,JOHNWILEYANDSONS,INC,NEWYORK1997;SAMBROOK,J,等人,MOLECULARCLO。
26、NINGALABORATORYMANUAL,第二版,COLDSPRINGHARBORLABORATORYPRESS,COLDSPRINGHARBOR,NY1989,MORRISON,SL,等人,PROCNATLACADSCIUSA81198468516855;US5,202,238和US5,204,244中描述了对于本领域技术人员已知的用于进行本发明的方法和技术。0053对于每种生物,给出了用于编码限定的氨基酸的密码子的特征的独特使用。例如氨基酸谷氨酰胺单字母代码为Q可以由两种不同密码子编码由于遗传密码的简并性,即CAG和CAA。人中,所述两种谷氨酰胺密码子分别具有74和26的使用频率。在大肠。
27、杆菌中,所述使用频率是类似的,即分别为82和18。氨基酸赖氨酸K也可以由两种不同密码子编码,即AAG和AAA。人中,所述两种不同的编码赖氨酸的密码子分别具有59和41使用频率,然而大肠杆菌中,所述两种不同的编码赖氨酸的密码子具有非平均的NONEVEN的使用频率,分别是20和80。已发现,包含在编码包含所述三肽QKK的多肽的核酸中的编码三肽QKK的寡核苷酸,在编码包含三肽QKK的多肽的核酸的转录或翻译的过程中可以是13移码突变的点。由于移码的出现,产生具有不编码的氨基酸序列,最可能是无义或截短的氨基酸序列的多肽。0054更详细地,已发现,依赖于编码三肽QKK并包含在更大的即至少50个氨基酸残基编。
28、码多肽的核酸中的寡核苷酸,13移码在寡核苷酸的转录或翻译过程中发生。移码的频率依赖于个体密码子的组合参见下表。0055表。0056编码QKK三肽的寡核苷酸13移码发生CAAAAAAAGSEQIDNO0110CAAAAGAAGSEQIDNO0230CAGAAGAAGSEQIDNO03低于检测极限CAAAAGAAASEQIDNO04低于检测极限CAGAAAAAASEQIDNO05低于检测极限0057可以看出,在大肠杆菌中,如果三肽QKK由核酸CAAAAAAAG和CAAAAGAAG编码,则13移码发生。目前惊奇地发现可以通过使用核酸序列CAGAAGAAGSEQIDNO03,或CAAAAGAAASEQ。
29、IDNO04,或CAGAAAAAASEQIDNO05阻止该移码。这样,可以通过使用SEQIDNO03,或SEQIDNO04,或SEQIDNO05的核酸编码多肽中的三肽QKK改善全长多肽的表达产量同样地,非全长多肽副产物的形成可以被减少。0058因此,如本文报道的一个方面是一种在大肠杆菌中重组生产包含三肽QKKSEQIDNO06的全长多肽的方法,其特征在于所述方法包括以下步骤0059从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽从而生产所述多肽,0060其中包含在所述多肽中的三肽QKK由寡核苷酸CAGAAGAAGSEQIDNO03,或说明书CN10413。
30、6460A8/17页10寡核苷酸CAAAAGAAASEQIDNO04,或寡核苷酸CAGAAAAAASEQIDNO05编码。0061因此,如本文报道的一个方面是在大肠杆菌中重组生产包含三肽QKKSEQIDNO06的全长多肽的方法,其特征在于所述方法包括以下步骤0062从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽,从而生产所述多肽,0063其中包含在所述多肽中的三肽QKK由寡核苷酸CAAAAGAAASEQIDNO04,或寡核苷酸CAGAAAAAASEQIDNO05编码。0064在一个实施方案中,所述方法包括以下步骤0065提供包含编码所述多肽的核酸的细胞。
31、,0066培养所述细胞在适于表达所述多肽的条件下,0067从细胞或培养基回收所述多肽。0068任选地以一个或更多个层析步骤纯化生产的多肽。0069在一个实施方案中,通过取代编码三肽QKK的寡核苷酸CAAAAAAAGSEQIDNO01,或寡核苷酸CAAAAGAAGSEQIDNO02中的一至三个核苷酸以获得寡核苷酸CAGAAGAAGSEQIDNO03,或寡核苷酸CAAAAGAAASEQIDNO04,或寡核苷酸CAGAAAAAASEQIDNO05获得包含编码三肽QKK的寡核苷酸CAGAAGAAGSEQIDNO03,或寡核苷酸CAAAAGAAASEQIDNO04,或寡核苷酸CAGAAAAAASEQID。
32、NO05的编码多肽的核酸。0070在一个实施方案中,以一至五个层析步骤纯化生产的多肽。在一个实施方案中,以二至四个层析步骤纯化生产的多肽。在一个实施方案中,以三个层析步骤纯化生产的多肽。0071一般的层析方法和其用途对于本领域技术人员来说是已知的。参见例如,HEFTMANN,E编辑,CHROMATOGRAPHY,第5版,PARTAFUNDAMENTALSANDTECHNIQUES,ELSEVIERSCIENCEPUBLISHINGCOMPANY,纽约1992;DEYL,Z编辑,ADVANCEDCHROMATOGRAPHICANDELECTROMIGRATIONMETHODSINBIOSCIEN。
33、CES,ELSEVIERSCIENCEBV,AMSTERDAM,荷兰1998;POOLE,CF,和POOLE,SK,CHROMATOGRAPHYTODAY,ELSEVIERSCIENCEPUBLISHINGCOMPANY,纽约1991;SCOPES,RK,PROTEINPURICATIONPRINCIPLESANDPRACTICE1982;SAMBROOK,J,等人编辑,MOLECULARCLONINGALABORATORYMANUAL,第二版,COLDSPRINGHARBORLABORATORYPRESS,COLDSPRINGHARBOR,NY1989;或AUSUBEL,FM,等人编辑,CU。
34、RRENTPROTOCOLSINMOLECULARBIOLOGY,卷I至III,JOHNWILEYSONS,INC,纽约1997。0072如本文报道的一个方面是编码在其氨基酸序列中包含三肽QKK的多肽的核酸,其中所述三肽QKK由寡核苷酸CAAAAGAAASEQIDNO04,或寡核苷酸CAGAAAAAASEQIDNO05编码。0073如本文报道的一个方面是包含如本文报道的核酸的细胞。0074如本文报道的一个方面是用于编码包含在所述多肽中的三肽QKK的寡核苷酸CAAAAGAAASEQIDNO04,或寡核苷酸CAGAAAAAASEQIDNO05的用途。0075如本文报道的一个方面是在大肠杆菌中重组生。
35、产包含三肽QKK的全长多肽过程中减少副产物形成的方法,所述方法包括以下步骤0076在编码所述多肽的核酸中,取代编码三肽QKK的寡核苷酸CAAAAAAAGSEQID说明书CN104136460A109/17页11NO01,或寡核苷酸CAAAAGAAGSEQIDNO02中的一至三个核苷酸以获得寡核苷酸CAGAAGAAGSEQIDNO03,或寡核苷酸CAAAAGAAASEQIDNO04,或寡核苷酸CAGAAAAAASEQIDNO05,从而生产取代的编码多肽的核酸,和0077从包含编码所述多肽的取代的核酸的细胞或包含编码所述多肽的取代的核酸的细胞的培养物的培养基回收所述多肽从而减少在重组生产包含三肽Q。
36、KK的多肽的过程中的副产物形成。0078如本文报道的一个方面是在大肠杆菌中重组生产包含三肽QKK的全长多肽的过程中减少副产物形成的方法,所述方法包括以下步骤0079在编码多肽的核酸中,取代编码三肽QKK的寡核苷酸CAAAAAAAGSEQIDNO01,或寡核苷酸CAAAAGAAGSEQIDNO02中的一至三个核苷酸以获得寡核苷酸CAAAAGAAASEQIDNO04或寡核苷酸CAGAAAAAASEQIDNO05,从而生产取代的编码多肽的核酸,和0080从包含编码所述多肽的取代的核酸的细胞或包含编码所述多肽的取代的核酸的细胞的培养物的培养基回收所述多肽从而在重组生产包含三肽QKK的多肽的过程中减少副。
37、产物形成。0081如本文报道的一个方面是增加在大肠杆菌中重组生产的包含三肽QKK的全长多肽的表达的方法,所述方法包括以下步骤0082在编码所述多肽的核酸中,取代编码三肽QKK的寡核苷酸CAAAAAAAGSEQIDNO01,或寡核苷酸CAAAAGAAGSEQIDNO02中的一至三个核苷酸以获得寡核苷酸CAGAAGAAGSEQIDNO03,或寡核苷酸CAAAAGAAASEQIDNO04,或寡核苷酸CAGAAAAAASEQIDNO05,从而生产取代的编码多肽的核酸,和0083从包含编码所述多肽的取代的核酸的细胞或包含编码所述多肽的取代的核酸的细胞的培养物的培养基回收所述多肽从而增加多肽的表达。008。
38、4如本文报道的一个方面是增加在大肠杆菌中重组生产的包含三肽QKK的全长多肽的表达的方法,所述方法包括以下步骤0085在编码多肽的核酸中,取代编码三肽QKK的寡核苷酸CAAAAAAAGSEQIDNO01,或寡核苷酸CAAAAGAAGSEQIDNO02,或寡核苷酸CAGAAGAAGSEQIDNO03中的一至三个核苷酸以获得寡核苷酸CAAAAGAAASEQIDNO04,或寡核苷酸CAGAAAAAASEQIDNO05,从而生产取代的编码多肽的核酸,和0086从包含编码所述多肽的取代的核酸的细胞或包含编码所述多肽的取代的核酸的细胞的培养物的培养基回收所述多肽从而增加多肽的表达。0087在各个之前的方面的。
39、一个实施方案中,所述方法包括以下进一步步骤的一个或更多个0088提供包含三肽QKK的多肽的氨基酸序列或编码核酸,和/或0089用编码所述多肽的取代的核酸转染细胞,和/或0090培养转染有取代的核酸的细胞在适于表达所述多肽的条件下,和/或0091从细胞或培养基回收所述多肽,和/或0092任选地以一个或更多个层析步骤纯化生产的多肽。0093在一个实施方案中以一至五个层析步骤纯化生产的多肽。在一个实施方案中,以说明书CN104136460A1110/17页12二至四个层析步骤纯化生产的多肽。在一个实施方案中,以三个层析步骤纯化生产的多肽。0094以下以在原核细胞中生产的重组多肽,即在大肠杆菌中生产的。
40、四连蛋白载脂蛋白AI融合多肽举例证明如本文报道的方法。0095四连蛋白载脂蛋白AI融合多肽包含在N末端至C末端方向人四连蛋白三聚化结构元件和野生型人载脂蛋白AI。人四连蛋白三聚化结构元件的氨基酸序列可以截短前9个氨基酸,这样,以位置10的异亮氨酸残基天然存在的截短位点起始。作为该截短的结果,位置4的苏氨酸残基的O糖基化位点被删除。四连蛋白三聚化结构元件和人载脂蛋白AI间的五个氨基酸残基SLKGSSEQIDNO08被移除。0096为了改善的表达和纯化,可以构建包含N末端纯化标签,例如六组氨酸标签,和用于移除纯化标签的蛋白酶切割位点的构建体。在一个实施方案中,所述蛋白酶是IGA蛋白酶,并且所述蛋白。
41、酶切割位点是IGA蛋白酶切割位点。作为蛋白酶的特异切割的结果,蛋白酶切割位点的一些氨基酸残基保留在多肽的N末端,即在IGA蛋白酶切割位点的情况下,两个氨基酸残基如第一丙氨酸或甘氨酸或丝氨酸或苏氨酸和如第二脯氨酸被保留在多肽,例如四连蛋白载脂蛋白AI融合多肽的N末端。0097四连蛋白三聚化结构元件提供允许形成四连蛋白载脂蛋白AI同源三聚体的结构域,所述同源三聚体通过每个个体四连蛋白载脂蛋白AI单体之间的非共价相互作用构成。0098在一个实施方案中,所述载脂蛋白AI融合多肽是包含保守氨基酸取代的变体。0099在一个实施方案中,所述四连蛋白载脂蛋白AI融合多肽包含表达和纯化标签,并具有以下氨基酸序列。
42、0100CDLPQTHSLGSHHHHHHGSVVAPPAPIVNAKKDVVNTKMFEELKSRLDTLAQEVALLKEQQALQTVDEPPQSPWDRVKDLATVYVDVLKDSGRDYVSQFEGSALGKQLNLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFL。
43、SALEEYTKKLNTQSEQIDNO090101在一个实施方案中,所述四连蛋白载脂蛋白AI融合多肽IVN具有以下氨基酸序列0102IVNAKKDVVNTKMFEELKSRLDTLAQEVALLKEQQALQTVDEPPQSPWDRVKDLATVYVDVLKDSGRDYVSQFEGSALGKQLNLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYH。
44、AKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQSEQIDNO100103因此,在一个优选的实施方案中,所述四连蛋白载脂蛋白AI融合多肽PIVN具有以下氨基酸序列0104PIVNAKKDVVNTKMFEELKSRLDTLAQEVALLKEQQALQTVDEPPQSPWDRVKDLATVYVDVLKDSGRDYVSQFEGSALGKQLNLKLLDNWDSVTSTFSKLREQLGPVTQFFWDNLEKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEM。
45、RDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQSEQIDNO110105在一个实施方案中,所述四连蛋白载脂蛋白AI融合多肽XPIVN具有以下氨基酸序列说明书CN104136460A1211/17页130106G,S,TPIVNAKKDVVNTKMFEELKSRLDTLAQEVALLKEQQALQTVDEPPQSPWDRVKDLATVYVDVLKDSGRDYVSQFEGSALGKQLNLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKE。
46、TEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQSEQIDNO120107因此,在一个实施方案中,所述四连蛋白载脂蛋白AI融合多肽APIVN具有以下氨基酸序列0108APIVNAKKDVVNTKMFEELKSRLDTLAQEVALLKEQQALQTVDEPPQSPWDRVKDLATVYVDVLKDSGRDYVSQFE。
47、GSALGKQLNLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQSEQIDNO13,0109在一个实施方案中,所述包含六组氨酸标签的四连蛋白载脂蛋白AI融合多肽XIVN具有以下氨基酸序列0110HHHHHHXIVNAKKDVVNTKMFEELKS。
48、RLDTLAQEVALLKEQQALQTVDEPPQSPWDRVKDLATVYVDVLKDSGRDYVSQFEGSALGKQLNLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQSEQIDNO14,0111其中X可以是以下氨基酸序列中的任一个A,G,。
49、S,P,AP,GP,SP,PP,GSAPSEQIDNO15,GSGPSEQIDNO16,GSSPSEQIDNO17,GSPPSEQIDNO18,GGGSSEQIDNO19,GGGGSSEQIDNO20,GGGSGGGSSEQIDNO21,GGGGSGGGGSSEQIDNO22,GGGSGGGSGGGSSEQIDNO23,GGGGSGGGGSGGGGSSEQIDNO24,GGGSAPSEQIDNO25,GGGSGPSEQIDNO26,GGGSSPSEQIDNO27,GGGSPPSEQIDNO28,GGGGSAPSEQIDNO29,GGGGSGPSEQIDNO30,GGGGSSPSEQIDNO31,GGGGSPPSEQIDNO32,GGGSGGGSAPSEQIDNO33,GGGSGGGSGPSEQIDNO34,GGGSGGGSSPSEQIDNO35,GGGSGGGSPPSEQIDNO36,GGGSGGGSGGGSAPSEQIDNO37,GGGSGGGSGGGSGPSEQIDNO38,GGGSGGGSGGGSSPSEQIDNO39,GGGSGGGSGGGSPPSEQIDNO40,GGGGSAPPSEQIDNO41,GGGGSGPSEQIDN。