减少1＞2读框移位的方法.pdf

摘要
申请专利号：	CN201380011005.8	申请日：	2013.02.22
公开号：	CN104136459A	公开日：	2014.11.05
当前法律状态：	实审	有效性：	审中
法律详情：	发明专利申请公布后的视为撤回IPC(主分类):C07K 14/775申请公布日:20141105\|\|\|实质审查的生效IPC(主分类):C07K 14/775申请日:20130222\|\|\|公开
IPC分类号：	C07K14/775; C12N15/67	主分类号：	C07K14/775
申请人：	霍夫曼-拉罗奇有限公司
发明人：	阿德尔伯特·格罗斯曼; 弗里德里克·黑塞; E·科佩茨基; 维尔马·劳; 克里斯蒂安·尚茨
地址：	瑞士巴塞尔
优先权：	2012.02.29 EP 12157512.0; 2012.04.02 EP 12162810.1
专利代理机构：	中科专利商标代理有限责任公司 11021	代理人：	张莹;王旭
PDF下载：	PDF下载

内容摘要

本文报道了一种重组生产包含二肽AR的多肽的方法，其特征在于所述方法包括从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收多肽，从而生产所述多肽，其中包含在所述多肽中的二肽AR由寡核苷酸gca cgt，或寡核苷酸gcg cgt，或寡核苷酸gcc cgt编码。

权利要求书

1.  一种在包含二肽AR(SEQ ID NO：06)的多肽的生产中减少由1-＞2移码导致的副产物形成的方法，其特征在于所述方法包括以下步骤：
-从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽，从而生产所述多肽，
其中包含在编码所述多肽的核酸中的编码所述二肽AR的寡核苷酸在第四位具有核苷酸‘c’。

2.  一种在包含二肽AR(SEQ ID NO：06)的多肽的重组生产中减少由1-＞2移码导致的副产物形成的方法，其特征在于所述方法包含以下步骤：
-从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽，从而生产所述多肽，
其中包含在所述多肽中的二肽AR由寡核苷酸gca cgt(SEQ ID NO：03)，或寡核苷酸gcg cgt(SEQ ID NO：04)，或寡核苷酸gcc cgt(SEQ ID NO：05)编码。

3.  根据权利要求1所述的方法，其特征在于包含在所述多肽中的二肽AR由寡核苷酸gca cgt，或寡核苷酸gcg cgt，或寡核苷酸gcc cgt编码。

4.  根据权利要求1至3任一项所述的方法，其特征在于所述细胞是原核细胞。

5.  根据权利要求1至3任一项所述的方法，其特征在于所述原核细胞是大肠杆菌细胞。

6.  根据权利要求1至5任一项所述的方法，其特征在于所述多肽是载脂蛋白A-I，或具有载脂蛋白A-I活性的其变体，或具有载脂蛋白A-I活性的其融合多肽。

7.  根据权利要求6所述的方法，其特征在于所述多肽具有选自包含SEQ ID NO：09至SEQ ID NO：14的组的氨基酸序列。

8.  根据权利要求1至7任一项所述的方法，其特征在于所述多肽具有SEQ ID NO：09或SEQ ID NO：11的氨基酸序列。

说明书

减少1-＞2读框移位的方法
本发明属于重组多肽生产领域。本文报道了一种重组生产具有减少的副产物含量的多肽的方法，其中通过修饰在翻译或转录过程中减少移码(frameshift)的编码核酸实现副产物含量的减少。
发明背景
蛋白质在现今的医用组合中发挥重要作用。对于人的应用，每种药用物质必须满足不同的标准。为了保证生物药剂对人的安全性，尤其必须将会引起严重危害的核酸，病毒，和宿主细胞蛋白质移除。为了满足质量管理规格标准(regulatory specification)，一个或更多个纯化步骤必须按照制造工艺。
可以例如通过原核细胞(比如大肠杆菌)生产重组多肽。重组生产的多肽占原核细胞的多肽含量的大多数并且经常在原核细胞内沉积为不溶的聚集体，即为所谓的包涵体。为了分离重组多肽，必须将细胞破碎并且必须在从细胞碎片分离包涵体之后将包含在包涵体中的重组多肽溶解。对于增溶离液剂，使用比如脲或盐酸胍。为了切开二硫键，尤其在碱性条件下加入还原剂，比如二硫赤藓醇，二硫苏糖醇，或β-巯基乙醇。溶解聚集的多肽之后，必须将重组多肽的对于生物活性至关重要的球状结构重建。在该所谓的复性过程中，例如通过针对合适的缓冲液透析(缓慢)降低还原剂的浓度，其允许变性的多肽重折叠为其生物活性结构。复性后，纯化重组多肽到对于预期用途可接受的纯度。例如，对于作为治疗性蛋白质的使用，必须建立大于90％的纯度。
重组生产的多肽通常伴有来自生产细胞的核酸，内毒素，和/或多肽。除了宿主细胞来源的副产物，在粗制多肽制备物中还存在多肽来源的副产物。除了别的以外，可以存在研究的多肽的截短的变体。
在WO 95/25786中，报道了在细菌表达系统中生产人载脂蛋白A1。
发明概述
已经发现，编码二肽AR的寡核苷酸可以是在编码包含二肽AR的多肽的核酸的翻译或转录过程中1-＞2移码的点。由于移码的出现，产生具有不编码的氨基酸序列的无义多肽。
因此，已经发现，包含在编码更大多肽的核酸中的编码二肽AR的寡核苷酸应该选自寡核苷酸gca cgt(SEQ ID NO：03)，gcg cgt(SEQ ID NO：04)，和gcc cgt(SEQ ID NO：05)。已经发现，编码所述二肽AR的寡核苷酸中的第四个核苷酸不应该是‘a’。
如本文报道的一个方面是重组生产包含所述二肽AR(SEQ ID NO：06)的多肽的方法，其特征在于所述方法包括以下步骤：
-从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽并从而生产所述多肽，
其中包含在编码所述多肽的核酸中的编码所述二肽AR的寡核苷酸在第四位具有核苷酸‘c’。
因此，作为一个方面，本文报道了，重组生产包含二肽AR(SEQ ID NO：06)的多肽的方法，其特征在于所述方法包括以下步骤：
-从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽并从而生产所述多肽，
其中包含在所述多肽中的二肽AR由寡核苷酸gca cgt(SEQ ID NO：03)，或寡核苷酸gcg cgt(SEQ ID NO：04)，或寡核苷酸gcc cgt(SEQ IDNO：05)编码。
如本文报道的一个方面是在包含二肽AR(SEQ ID NO：06)的多肽的生产中减少由1-＞2移码导致的副产物形成的方法，其特征在于所述方法包括以下步骤：
-从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽并从而生产所述多肽，
其中编码包含在编码所述多肽的核酸中的二肽AR的寡核苷酸在第四位具有核苷酸‘c’。
因此，作为一个方面，本发明报道了在包含二肽AR(SEQ ID NO：06)的多肽的重组生产中减少由1-＞2移码导致的副产物形成的方法，其特征在于所述方法包括以下步骤：
-从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽并从而生产所述多肽，
其中包含在所述多肽中的二肽AR由寡核苷酸gca cgt(SEQ ID NO：03)，或寡核苷酸gcg cgt(SEQ ID NO：04)，或寡核苷酸gcc cgt(SEQ ID NO：05)编码。
在如之前报道的所有方面的一个实施方案中，所述二肽AR是所有二肽AR。
在如本文报道的所有方面的一个实施方案中，所述二肽AR是氨基酸序列中最后的二肽AR。
如本文报道的一个方面是重组生产包含二肽AR(SEQ ID NO：06)的SEQ ID NO：09或SEQ ID NO：11的载脂蛋白A-I的方法，其特征在于所述方法包括以下步骤：
-从包含编码SEQ ID NO：09或SEQ ID NO：11的载脂蛋白A-I的核酸的细胞或包含编码SEQ ID NO：09或SEQ ID NO：11的载脂蛋白A-I的核酸的细胞的培养物的培养基回收所述载脂蛋白A-I并从而生产所述载脂蛋白A-I，
其中包含在编码所述载脂蛋白A-I的核酸中的编码最后的二肽AR的寡核苷酸在第四位具有核苷酸‘c’。
因此，作为一个方面，本发明报道了重组生产包含二肽AR(SEQ ID NO：06)的SEQ ID NO：09或SEQ ID NO：11的载脂蛋白A-I的方法，其特征在于所述方法包括以下步骤：
-从包含编码SEQ ID NO：09或SEQ ID NO：11的载脂蛋白A-I的核酸的细胞或包含编码SEQ ID NO：09或SEQ ID NO：11的载脂蛋白A-I的核酸的细胞的培养物的培养基回收所述载脂蛋白A-I并从而生产所述载脂蛋白，
其中包含在所述载脂蛋白A-I氨基酸序列中的最后的二肽AR由寡核苷酸gca cgt(SEQ ID NO：03)，或寡核苷酸gcg cgt(SEQ ID NO：04)，或寡核苷酸gcc cgt(SEQ ID NO：05)编码。
如本文报道的一个方面是编码在其氨基酸序列中包含二肽AR的多肽的核酸，其中所述二肽AR由寡核苷酸gca cgt(SEQ ID NO：03)，或寡核苷酸gcg cgt(SEQ ID NO：04)，或寡核苷酸gcc cgt(SEQ ID NO：05)编码。
如本文报道的一个方面是包含如本文报道的核酸的细胞。
如本文报道的一个方面是寡核苷酸gca cgt(SEQ ID NO：03)，或寡核苷酸gcg cgt(SEQ ID NO：04)，或寡核苷酸gcc cgt(SEQ ID NO：05)用于编码包含在多肽中的二肽AR的用途。
以下具体说明如本文报道的所有方面的实施方案。
在一个实施方案中，所述二肽AR由寡核苷酸gca cgt(SEQ ID NO：03)编码。
在一个实施方案中，所述二肽AR由寡核苷酸gcg cgt(SEQ ID NO：04)编码。
在一个实施方案中，所述二肽AR由寡核苷酸gcc cgt(SEQ ID NO：05)编码。
在一个实施方案中，所述多肽包含约50个氨基酸残基至约500个氨基酸残基。在一个实施方案中，所述多肽包含约100个氨基酸残基至约400个氨基酸残基。在一个实施方案中，所述多肽包含约250氨基酸残基至约350氨基酸残基。
在一个实施方案中，所述细胞是原核细胞。在一个实施方案中，所述原核细胞是大肠杆菌(E.coli)细胞，或芽胞杆菌(Bacillus)细胞。
在一个实施方案中，所述细胞是真核细胞。在一个实施方案中，所述细胞是CHO细胞，或HEK细胞，或BHK细胞，或NS0细胞，或SP2/0细胞，或酵母细胞。
在一个实施方案中，所述多肽是异源多聚多肽。在一个实施方案中，所述多肽是抗体或抗体片段。
在一个实施方案中，所述多肽是同源多聚多肽。在一个实施方案中，所述多肽是同源二聚体或同源三聚体。
在一个实施方案中，所述多肽是人载脂蛋白A-I或具有人载脂蛋白A-I的生物活性的其变体。在一个实施方案中，所述载脂蛋白A-I变体具有选自SEQ ID NO：09至SEQ ID NO：14的组的氨基酸序列。
在一个实施方案中，所述多肽是具有SEQ ID NO：09或SEQ ID NO：11 的氨基酸序列的人载脂蛋白A-I。
发明详述
定义：
术语″氨基酸″指羧基α-氨基酸类，其可以直接或以前体的形式由核酸编码。个体氨基酸被由三个核苷酸组成的核酸(所谓密码子或碱基三联体)编码。每个氨基酸由至少一个密码子编码。由不同密码子编码相同氨基酸被称为“遗传密码的简并”。术语”氨基酸”指天然存在的羧基α-氨基酸并且包括丙氨酸(三字母代码：ala，单字母代码：A)，精氨酸(arg，R)，天冬酰胺(asn，N)，天冬氨酸(asp，D)，半胱氨酸(cys，C)，谷氨酰胺(gln，Q)，谷氨酸(glu，E)，甘氨酸(gly，G)，组氨酸(his，H)，异亮氨酸(ile，I)，亮氨酸(leu，L)，赖氨酸(lys，K)，甲硫氨酸(met，M)，苯丙氨酸(phe，F)，脯氨酸(pro，P)，丝氨酸(ser，S)，苏氨酸(thr，T)，色氨酸(trp，W)，酪氨酸(tyr，Y)，和缬氨酸(val，V)。
术语″载脂蛋白A-I″指具有蛋白质-脂质和蛋白质-蛋白质相互作用性质的，两亲的，螺旋多肽。载脂蛋白A-I由肝和小肠合成为267个氨基酸残基的前载脂蛋白原(prepro-apolipoprotein)，其以载脂蛋白原(pro-apolipoprotein)分泌，所述载脂蛋白原被切割为具有243个氨基酸残基的成熟多肽。载脂蛋白A-I由6至8个不同氨基酸重复(每个由被接头部分(常常是脯氨酸)分开的22个氨基酸残基组成)组成，并且在一些情况下由通过一些残基构成的区段组成。在GenPept数据库入口(database entry)NM-000039或数据库入口X00566；GenBank NP-000030.1(gi 4557321)中报道了代表性的人载脂蛋白A-I氨基酸序列。存在人载脂蛋白A-I(SEQ ID NO：07)的天然存在的变体，比如P27H，P27R，P28R，R34L，G50R，L84R，D113E，A-A119D，D127N，K131的缺失，K131M，W132R，E133K，R151C(氨基酸残基151从Arg改变为Cys，载脂蛋白A-I-Paris)，E160K，E163G，P167R，L168R，E171V，P189R，R197C(氨基酸残基173从Arg改变为Cys，载脂蛋白A-I-Milano)和E222K。还包括的是具有保守氨基酸修饰的变体。
术语“密码子”指由编码限定的氨基酸的三个核苷酸组成的寡核苷酸。由于遗传密码的简并性，一些氨基酸由多于一种密码子编码。这些编码相同氨基酸的不同密码子在个体宿主细胞中具有不同的相对使用频率。因此，特定氨基酸可以由一组不同的密码子编码。同样地，多肽的氨基酸序列可以由不同核酸编码。因此，特定氨基酸可以由一组不同的密码子编码，其中这些密码子中的每个具有给定的宿主细胞中的使用频率。
表：大肠杆菌密码子使用(密码子|编码的氨基酸|使用频率[％])

保守取代显示在以下″优选的取代″标题下的表中。在以下″代表性的取代″标题下的表中并且如在下文关于氨基酸侧链类型进一步描述的提供另外更多的取代的改变。

非保守取代需要将这些类型中的一种的成员交换为另一种类型。
术语″保守氨基酸修饰″指不影响或改变多肽的特性的氨基酸序列的修饰。可以通过本领域已知的标准技术，比如位点定向的诱变和PCR-介导的诱变引入修饰。保守氨基酸修饰包括其中氨基酸残基被具有类似侧链的氨基酸残基替代的修饰。本领域中已经限定了具有类似侧链的氨基酸残基家族。这些家族包括具有碱性侧链(例如赖氨酸，精氨酸，组氨酸)，酸性侧链(例如天冬氨酸，谷氨酸)，不带电极性侧链(例如甘氨酸，天冬酰胺，谷氨酰胺，丝氨酸，苏氨酸，酪氨酸，半胱氨酸，色氨酸)，非极性侧链(例如丙氨酸，缬氨酸，亮氨酸，异亮氨酸，脯氨酸，苯丙氨酸，甲硫氨酸)，β-分枝侧链(例如苏氨酸，缬氨酸，异亮氨酸)，和芳香侧链(例如酪氨酸，苯丙氨酸，色氨酸，组氨酸)的氨基酸。
术语“多肽的变体”指氨基酸序列以多达十个，在一个实施方案中从约两个至约五个，添加，缺失，和/或取代不同于“母体”多肽的氨基酸序列的多肽。可以通过基于如由Riechmann，L.，等人，Nature 332(1988)323-327，和Queen，C.，等人，Proc.Natl.Acad.Sci.USA 86(1989)10029-10033描述的分子模型的诱变进行氨基酸序列修饰。
可以使用公知的算法，比如BLOSUM 30，BLOSUM 40，BLOSUM 45，BLOSUM 50，BLOSUM 55，BLOSUM 60，BLOSUM 62，BLOSUM 65，BLOSUM 70，BLOSUM 75，BLOSUM 80，BLOSUM 85，或BLOSUM 90计算不同氨基酸序列的同源性和同一性。在一个实施方案中，所述算法是BLOSUM 30。
交替使用术语″宿主细胞″，″宿主细胞系″，和″宿主细胞培养物″并且指已引入外源核酸的细胞，包括此种细胞的子代。宿主细胞包括″转化体″和″转化的细胞，″其包括原代转化的细胞和从中来源的不考虑传代数量的子代。子代核酸含量可以不与亲代细胞完全相同，但可以包含突变。具有与在最初转化的细胞中筛选或选择的相同功能或生物活性突变的子代包括在本文中。
术语“核酸”和“核酸序列”指由个体核苷酸(还称为碱基)‘a’，‘c’，‘g’，和‘t’(或RNA中的‘u’)组成的聚合分子，即DNA，RNA，或其修饰物。该多核苷酸分子可以是天然存在的多核苷酸分子或合成的多核苷酸分子或一种或更多种天然存在的多核苷酸分子与一种或更多种合成的多核苷酸分子的组合。该定义还包括的是其中一个或更多个核苷酸被改变(例如通过诱变)，缺失，或添加的天然存在的多核苷酸分子。核酸可以是分离的，或整合入另一条核酸，例如整合入表达盒，质粒，或宿主细胞的染色体。核酸以其由个体核苷酸组成的核酸序列为特征。术语“寡核苷酸”指由至多10个个体核苷酸(也成为碱基)′a′，′c′，′g′，和′t′(或RNA中的′u′)组成的聚合分子。
对于本领域技术人员来说，将例如多肽的氨基酸序列转变为编码该氨基酸序列的相应的核酸序列的工艺和方法是公知的。因此，核酸以其由个体核苷酸组成的核酸序列为特征并且类似地以由此编码的多肽的氨基酸序列表征。
有关参考多肽序列的“百分数(％)氨基酸序列同一性″定义为经比对序列和引入缺口(如果需要)以获得最大百分数序列同一性，和不考虑任何保守取代作为序列同一性的部分之后，候选序列中与参考多肽序列中氨基酸残基的相同的氨基酸残基的百分数。可以以不同方式实现为了确定百分数氨基酸序列同一性的目的的比对，所述方式在本领域技术内，例如，使用公众可获得的计算机软件，比如BLAST，BLAST-2，ALIGN或Megalign(DNASTAR)软件。本领域熟练技术人员可以确定用于比对序列的合适参数，包括获得跨被比较序列的全长的最大比对所需的任何算法。然而，为了本文的目的，使用序列比较计算机程序ALIGN-2产生％氨基酸序列同一性值。ALIGN-2序列比较计算机程序由Genentech，Inc.创作，并且已将原代码与用户文献资料提交美国版权局，Washington D.C.，20559，其中其在美国版权登记号TXU510087下登记。ALIGN-2程序可从Genentech，Inc.，South San Francisco，California由公众获得，或可以从源代码编辑。应该将ALIGN-2程序编辑用于在UNIX操作系统(包括数字的UNIX V4.0D)上使用。所有序列比较参数由ALIGN-2程序设定并且不改变。
在将ALIGN-2用于氨基酸序列比较的情况下，如下计算给定氨基酸序列A相对(to)、与(with)、或针对(against)给定氨基酸序列B(其可以备选地叙述为相对(to)、与(with)、或针对(against)给定氨基酸序列B具有或包含某一％氨基酸序列同一性的给定氨基酸序列A)的％氨基酸序列同一性：
100乘以分数X/Y
其中X是通过序列比对程序ALIGN-2中的A和B的程序比对得分为相同匹配的氨基酸残基的数量，并且其中Y是B中氨基酸残基的总数量。将理解其中氨基酸序列A的长度与氨基酸序列B的长度不相等，A相对B的％氨基酸序列同一性将不等于B相对A的％氨基酸序列同一性。除非另有特别说明，否则如在紧接的上一段中使用ALIGN-2计算机程序获得本文使用所有％氨基酸序列同一性值。
术语″重组多肽″和“重组生产的多肽”指通过重组方法制备，表达或产生的多肽，比如分离自宿主细胞，比如大肠杆菌，NS0，BHK，或CHO细胞的多肽。
术语″取代″指改变母体核酸中一个特定核苷酸以获得取代的/改变的核酸。
如本文报道的方法：
例如在Ausubel，F.M.(编辑)，Current Protocols in Molecular Biology，卷I至III(1997)，Wiley and Sons；Sambrook，J.，等人，Molecular Cloning：A Laboratory Manual，第二版，Cold Spring Harbor Laboratory Press，Cold Spring Harbor，N.Y.(1989)；Morrison，S.L，等人，Proc.Natl.Acad.Sci.USA81(1984)6851-6855；US 5,202,238和US 5,204,244中描述了用于进行本发明的，本领域技术人员已知的方法和技术。
已经发现，包含在编码包含二肽AR的多肽的核酸内的编码二肽AR的寡核苷酸可以是编码包含二肽AR的多肽的核酸的转录或翻译过程中1-＞2移码(突变)的点。由于具有非编码的氨基酸序列的移码多肽的出现，最可能产生无义或截短的氨基酸序列。
更详细地，已经发现依赖于包含在编码更大的(即至少50个氨基酸残基)多肽的核酸内的编码二肽AR的寡核苷酸，寡核苷酸的转录或翻译过程中的1-＞2移码以不同频率发生(参见下表)。
表.

编码AR二肽的寡核苷酸1→2移码发生gcg agg(SEQ ID NO：01)是gcg aga(SEQ ID NO：02)30％gca cgt(SEQ ID NO：03)低于检测极限gcg cgt(SEQ ID NO：04)低于检测极限gcc cgt(SEQ ID NO：05)低于检测极限

因此，如本文报道的一个方面是重组生产包含二肽AR(SEQ ID NO：06)的多肽的方法，其特征在于所述方法包括以下步骤：
-从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽并从而生产所述多肽，
其中包含在所述多肽中的二肽AR由寡核苷酸gca cgt(SEQ ID NO： 03)，或寡核苷酸gcg cgt(SEQ ID NO：04)，或寡核苷酸gcc cgt(SEQ ID NO：05)编码。
因此，如本文报道的一个方面是重组生产包含二肽AR(SEQ ID NO：06)的多肽的方法，其特征在于所述方法包括以下步骤：
-从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽并从而生产所述多肽，
其中包含在编码所述多肽的核酸中的编码二肽AR的寡核苷酸在第四位具有核苷酸‘c’。
在一个实施方案中，编码所述二肽AR的寡核苷酸包含编码氨基酸A的密码子(选自gct，gcc，gca和gcg的密码子)和编码氨基酸R的密码子(选自cgt，cgc，cga和cgg的密码子)。
在一个实施方案中，编码所述二肽AR的寡核苷酸选自包含寡核苷酸gct cgt，gct cgc，gct cga，gct cgg，gcc cgt，gcc cgc，gcc cga，gcc cgg，gca cgt，gca cgc，gca cga，gca cgg，gcg cgt，gcg cgc，gcg cga，和gcg cgg的组。
在一个实施方案中，编码所述二肽AR的寡核苷酸选自包含寡核苷酸gca cgt(SEQ ID NO：03)，gcg cgt(SEQ ID NO：04)，和gcc cgt(SEQ ID NO：05)的组。
在一个实施方案中，所述方法包括以下步骤：
-提供包含编码所述多肽的核酸的细胞，
-培养所述细胞(在适于表达所述多肽的条件下)，
-从细胞或培养基回收所述多肽。
-任选地以一个或更多个层析步骤纯化生产的多肽。
在一个实施方案中，通过在编码二肽AR的寡核苷酸gcg agg(SEQ ID NO：01)，或寡核苷酸gcg aga(SEQ ID NO：02)中取代二至三个核苷酸以获得寡核苷酸gca cgt(SEQ ID NO：03)，或寡核苷酸gcg cgt(SEQ ID NO：04)，或寡核苷酸gcc cgt(SEQ ID NO：05)，来获得包含编码二肽AR的寡核苷酸gca cgt(SEQ ID NO：03)，或寡核苷酸gcg cgt(SEQ ID NO：04)，或寡核苷酸gcc cgt(SEQ ID NO：05)的编码所述多肽的核酸。
在一个实施方案中，以一至五个层析步骤纯化生产的多肽。在一个实施方案中，以二至四个层析步骤纯化生产的多肽。在一个实施方案中，以三个层析步骤纯化生产的多肽。
一般的层析方法和其用途对于本领域技术人员来说是已知的。参见例如，Chromatography，第5版，Part A：Fundamentals and Techniques，Heftmann，E.(编辑)，Elsevier Science Publishing Company，纽约(1992)；Advanced Chromatographic and Electromigration Methods in Biosciences，Deyl，Z.(编辑)，Elsevier Science BV，Amsterdam，荷兰(1998)；Chromatography Today，Poole，C.F，和Poole，S.K.，Elsevier Science Publishing Company，纽约(1991)；Scopes，Protein Purification：Principles and Practice(1982)；Sambrook，J.，等人(编辑)，Molecular Cloning：A Laboratory Manual，第二版，Cold Spring Harbor Laboratory Press，Cold Spring Harbor，N.Y.(1989)；或Current Protocols in Molecular Biology，Ausubel，FM.，等人(编辑)，John Wiley&Sons，Inc.，纽约(1997)。
如本文报道的一个方面是编码在其氨基酸序列中包含二肽AR的多肽的核酸，其中所述二肽AR由寡核苷酸gca cgt(SEQ ID NO：03)，或寡核苷酸gcg cgt(SEQ ID NO：04)，或寡核苷酸gcc cgt(SEQ ID NO：05)编码。
如本文报道的一个方面是包含如本文报道的核酸的细胞。
如本文报道的一个方面是寡核苷酸gca cgt(SEQ ID NO：03)，或寡核苷酸gcg cgt(SEQ ID NO：04)，或寡核苷酸gcc cgt(SEQ ID NO：05)用于编码包含在多肽中的二肽AR的用途。
如本文报道的一个方面是在包含二肽AR的多肽的重组生产过程中减少副产物形成的方法，所述方法包括以下步骤：
-在编码多肽的核酸中，取代编码二肽AR的寡核苷酸gcg agg(SEQ ID NO：01)，或寡核苷酸gcg aga(SEQ ID NO：02)中的二至三个核苷酸以获得寡核苷酸gca cgt(SEQ ID NO：03)，或寡核苷酸gcg cgt(SEQ ID NO：04)，或寡核苷酸gcc cgt(SEQ ID NO：05)，从而产生取代的编码多肽的核酸，和
-从包含编码所述多肽的取代的核酸的细胞或包含编码所述多肽的取代的核酸的细胞的培养物的培养基回收所述多肽并从而在包含二肽AR的多肽的重组生产过程中减少副产物形成。
如本文报道的一个方面是增加重组生产的包含二肽AR的多肽的表达的方法，所述方法包含以下步骤：
-在编码多肽的核酸中，取代编码二肽AR的寡核苷酸gcg agg(SEQ ID NO：01)，或寡核苷酸gcg aga(SEQ ID NO：02)中的二至三个核苷酸以获得寡核苷酸gca cgt(SEQ ID NO：03)，或寡核苷酸gcg cgt(SEQ ID NO：04)，或寡核苷酸gcc cgt(SEQ ID NO：05)，从而产生取代的编码多肽的核酸，并且
-从包含编码多肽的取代的核酸的细胞或包含编码多肽的取代的核酸的细胞的培养物的培养基回收所述多肽并从而增加包含二肽AR的多肽的表达。
在一个实施方案中，所述方法包含以下进一步步骤中的一个或更多个：
-提供包含二肽AR的多肽的氨基酸序列或编码核酸，和/或
-用编码所述多肽的取代的核酸转染细胞，和/或
-培养转染有取代的核酸的细胞(在适于表达所述多肽的条件下)，和/或
-从细胞或培养基回收所述多肽，和/或
-任选地以一个或更多个层析步骤纯化生产的多肽。
在一个实施方案中以一至五个层析步骤纯化生产的多肽。在一个实施方案中，以二至四个层析步骤纯化生产的多肽。在一个实施方案中，以三个层析步骤纯化生产的多肽。
以下以在原核细胞中生产的重组多肽，即在大肠杆菌中生产的四连蛋白-载脂蛋白A-I融合多肽举例证明如本文报道的方法。
四连蛋白-载脂蛋白A-I融合多肽包含(在N-末端至C-末端方向)人四连蛋白三聚化结构元件和野生型人载脂蛋白A-I。人四连蛋白三聚化结构元件的氨基酸序列可以截短前9个氨基酸，这样，以位置10的异亮氨酸残基(天然存在的截短位点)起始。作为该截短的结果，位置4的苏氨酸残基的O-糖基化位点被删除。四连蛋白三聚化结构元件和人载脂蛋白A-I间的五个氨基酸残基SLKGS(SEQ ID NO：08)被移除。
为了改善的表达和纯化，可以构建包含N-末端纯化标签，例如六组氨酸-标签，和用于移除纯化标签的蛋白酶切割位点的构建体。在一个实施方案中，所述蛋白酶是IgA蛋白酶，并且所述蛋白酶切割位点是IgA蛋白酶切割位点。作为蛋白酶的特异切割的结果，蛋白酶切割位点的一些氨基酸残基保留在多肽的N-末端，即在IgA蛋白酶切割位点的情况下，两个氨基酸残基-如第一丙氨酸或甘氨酸或丝氨酸或苏氨酸和如第二脯氨酸-被保留在多肽，例如四连蛋白-载脂蛋白A-I融合多肽的N-末端。
四连蛋白三聚化结构元件提供允许形成四连蛋白-载脂蛋白A-I同源三聚体的结构域，所述同源三聚体通过每个个体四连蛋白-载脂蛋白A-I单体之间的非共价相互作用构成。
在一个实施方案中，所述载脂蛋白A-I融合多肽是包含保守氨基酸取代的变体。
在一个实施方案中，所述四连蛋白-载脂蛋白A-I融合多肽包含表达和纯化标签，并具有以下氨基酸序列
CDLPQTHSLGSHHHHHHGSVVAPPAPIVNAKKDVVNTKMFEELKSRLDTLAQEVALLKEQQALQTVDEPPQSPWDRVKDLATVYVDVLKDSGRDYVSQFEGSALGKQLNLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQ(SEQ ID NO：09).
在一个实施方案中，所述四连蛋白-载脂蛋白A-I融合多肽(IVN)具有以下氨基酸序列
IVNAKKDVVNTKMFEELKSRLDTLAQEVALLKEQQALQTVDEPPQSPWDRVKDLATVYVDVLKDSGRDYVSQFEGSALGKQLNLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQ(SEQ ID NO：10).
因此，在一个实施方案中，所述四连蛋白-载脂蛋白A-I融合多肽(PIVN)具有以下氨基酸序列
PIVNAKKDVVNTKMFEELKSRLDTLAQEVALLKEQQALQTVDEPPQSPWDRVKDLATVYVDVLKDSGRDYVSQFEGSALGKQLNLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQ(SEQ ID NO：11).
在一个实施方案中，所述四连蛋白-载脂蛋白A-I融合多肽(XPIVN)具有以下氨基酸序列
(G，S，T)PIVNAKKDVVNTKMFEELKSRLDTLAQEVALLKEQQALQTVDEPPQSPWDRVKDLATVYVDVLKDSGRDYVSQFEGSALGKQLNLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQ(SEQ ID NO：12).
因此，在一个实施方案中，所述四连蛋白-载脂蛋白A-I融合多肽(APIVN)具有以下氨基酸序列
APIVNAKKDVVNTKMFEELKSRLDTLAQEVALLKEQQALQTVDEPPQSPWDRVKDLATVYVDVLKDSGRDYVSQFEGSALGKQLNLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQ(SEQ ID NO：13).
在一个实施方案中，所述包含六组氨酸标签的四连蛋白-载脂蛋白A-I融合多肽(XIVN)具有以下氨基酸序列
HHHHHHXIVNAKKDVVNTKMFEELKSRLDTLAQEVALLKEQQALQTVDEPPQSPWDRVKDLATVYVDVLKDSGRDYVSQFEGSALGKQLNLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQ(SEQ ID NO：14)，
其中X可以是以下氨基酸序列中的任一个：A，G，S，P，AP，GP，SP，PP，GSAP(SEQ IDNO：15)，GSGP(SEQ ID NO：16)，GSSP(SEQ ID NO：17)，GSPP(SEQ ID NO：18)，GGGS(SEQ ID NO：19)，GGGGS(SEQ ID NO：20)，GGGSGGGS(SEQ ID NO：21)，GGGGSGGGGS(SEQ ID NO：22)，GGGSGGGSGGGS(SEQ ID NO：23)，GGGGSGGGGSGGGGS(SEQ ID NO：24)，GGGSAP(SEQ ID NO：25)，GGGSGP(SEQ ID NO：26)，GGGSSP(SEQ ID NO：27)，GGGSPP(SEQ ID NO：28)，GGGGSAP(SEQ ID NO：29)，GGGGSGP(SEQ ID NO：30)，GGGGSSP(SEQ ID NO：31)，GGGGSPP(SEQ ID NO：32)，GGGSGGGSAP(SEQ ID NO：33)，GGGSGGGSGP(SEQ ID NO：34)，GGGSGGGSSP(SEQ ID NO：35)，GGGSGGGSPP(SEQ ID NO：36)，GGGSGGGSGGGSAP(SEQ ID NO：37)，GGGSGGGSGGGSGP(SEQ ID NO：38)，GGGSGGGSGGGSSP(SEQ ID NO：39)，GGGSGGGSGGGSPP(SEQ ID NO：40)，GGGGSAP(SEQ ID NO：41)，GGGGSGP(SEQ ID NO：42)，GGGGSSP(SEQ ID NO：43)，GGGGSPP(SEQ ID NO：44)，GGGGSGGGGSAP(SEQ ID NO：45)，GGGGSGGGGSGP(SEQ ID NO：46)，GGGGSGGGGSSP(SEQ ID NO：47)，GGGGSGGGGSPP(SEQ ID NO：48)，GGGGSGGGGSGGGGSAP(SEQ ID NO：49)，GGGGSGGGGSGGGGSGP(SEQ ID NO：50)，GGGGSGGGGSGGGGSSP(SEQ ID NO：51)，和GGGGSGGGGSGGGGSPP(SEQ ID NO：52).
必须指出的是，如果多肽在大肠杆菌菌株中重组生产，N-末端甲硫氨酸残基通常不被大肠杆菌蛋白酶有效切除。因此，N-末端甲硫氨酸残基部分存在于生产的多肽中。
在大肠杆菌中重组生产SEQ ID NO：09的四连蛋白-载脂蛋白A-I融合多肽。可以检测到主要的副产物。
在IgA蛋白酶切割之后，通过Edmann测序和Lys-C肽图谱分析 (peptide mapping)(LC-ESI-MS/MS)，检测N-末端氨基酸序列。序列对应于四连蛋白-载脂蛋白A-I融合多肽的N-末端氨基酸序列(APIVNAKKDVVN＝SEQ ID NO：13的氨基酸残基1-12)。
通过自上而下(top-down)MS，不能检测对应于SEQ ID NO：13的全长C-末端氨基酸片段。可以发现SEQ ID NO：13的残基1至105的片段。
通过Lys-C肽图谱分析(LC-ESI-MS/MS)，也不能检测C-末端肽。可以观察到来自SEQ ID NO：13的氨基酸残基1至224的所有肽。
因此，从编码核酸的偏离发生在SEQ ID NO：13的从残基225至残基230的氨基酸范围内。
已经发现自目的氨基酸序列的偏离发生在编码具有SEQ ID NO：09的氨基酸序列的四连蛋白-载脂蛋白A-I融合多肽的核酸的位置760的核苷酸‘a’(对应于SEQ ID NO：09的氨基酸位置254)，其在转录或翻译过程中不被处理。
偏离发生在编码二肽AR的寡核苷酸的以核苷酸‘a’起始的密码子处(参见图1)。二肽AR存在于SEQ ID NO：09的氨基酸序列的4个位置，即在位置196-197处，在位置218-219处，在位置242-243处，和在位置253-254处。如上文概述的，对于AR二肽，仅在SEQ ID NO：09的位置253-254观察到由于1-＞2移码导致的副产物的形成。这更加出人意料，因为在从SEQ ID NO：09的位置215至位置219的区域(在总共5个氨基酸残基内包含3个精氨酸残基并且也包含二肽AR)中，不能检测到1-＞2移码。
如在下表中显示的编码SEQ ID NO：09中的个体二肽AR。
表.
二肽AR的位置编码核酸序列196-197gca cgt218-219gca cgt242-243gcg cgt253-254gcg agg

因此，已经发现包含在编码更大多肽的核酸中的编码二肽AR的寡核苷酸应该选自寡核苷酸gca cgt(SEQ ID NO：03)，gcg cgt(SEQ ID NO：04)，和gcc cgt(SEQ ID NO：05)。已经发现编码二肽AR的寡核苷酸中的第四个核苷酸不应该是‘a’。
提供以下实施例，序列表和图以帮助理解本发明，其真正范围列于所附的权利要求中。人们理解，可以在不偏离本发明的精神的情况下，在所列出的工序中进行修饰。
序列表描述
SEQ ID NO：01寡核苷酸gcg agg。
SEQ ID NO：02寡核苷酸gcg aga。
SEQ ID NO：03寡核苷酸gca cgt。
SEQ ID NO：04寡核苷酸gcg cgt。
SEQ ID NO：05寡核苷酸gcc cgt。
SEQ ID NO：06二肽AR。
SEQ ID NO：07人载脂蛋白A-I。
SEQ ID NO：08移除的SLKGS多肽。
SEQ ID NO：09包含表达和纯化标签的四连蛋白-载脂蛋白A-I融合多肽。
SEQ ID NO：10四连蛋白-载脂蛋白A-I融合多肽(IVN)。
SEQ ID NO：11四连蛋白-载脂蛋白A-I融合多肽(PIVN)。
SEQ ID NO：12四连蛋白-载脂蛋白A-I融合多肽(XPIVN)。
SEQ ID NO：13四连蛋白-载脂蛋白A-I融合多肽(APIVN)。
SEQ ID NO：14包含六组氨酸标签的四连蛋白-载脂蛋白A-I融合多肽(XIVN)。
SEQ ID NO：15至52接头多肽。
SEQ ID NO：53主要副产物的C-末端氨基酸序列。
SEQ ID NO：54干扰素片段。
SEQ ID NO：55六组氨酸标签。
SEQ ID NO：56IgA蛋白酶切割位点。
附图描述
图1编码四连蛋白-载脂蛋白融合多肽的核酸中核苷酸a760的缺失(Deletion)或遗漏(skipping)导致1-＞2移码和翻译过程在下一密码子的立即终止。
材料和方法
蛋白质确定：
通过使用基于氨基酸序列计算的摩尔消光系数确定280nm处的光密度(OD)，确定蛋白质浓度。
重组DNA技术：
如在Sambrook，J.，等人，Molecular cloning：A laboratory manual，Cold Spring Harbor Laboratory Press，Cold Spring Harbor，New York 1989描述的使用标准方法操作DNA。根据制造商的使用说明使用分子生物学试剂。
实施例1
大肠杆菌表达质粒的制备和描述
通过重组方法制备四连蛋白-载脂蛋白A-I融合多肽。以N-末端至C-末端方向表达的融合多肽的氨基酸序列如下：
-氨基酸甲硫氨酸(M)，
-具有CDLPQTHSL(SEQ ID NO：54)的氨基酸序列的干扰素序列片段，
-GS接头，
-具有HHHHHH(SEQ ID NO：55)的氨基酸序列的六组氨酸标签，
-GS接头，
-具有VVAPPAP(SEQ ID NO：56)的氨基酸序列的IgA蛋白酶切割位点，和
-具有SEQ ID NO：10的氨基酸序列的四连蛋白-载脂蛋白A-I。
如上文描述的四连蛋白-载脂蛋白A-I融合多肽为前体多肽，使用IgA蛋白酶的体外酶切割从所述前体多肽释放最终四连蛋白-载脂蛋白A-I融合多肽。
用已知的重组方法和技术，通过将合适的核酸片段连接组装编码所述前体多肽的融合基因。通过DNA测序验证通过化学合成制备的核酸序列。如下制备用于生产编码SEQ ID NO：09的融合多肽的SEQ ID NO：10的四连蛋白-载脂蛋白A-I融合多肽的表达质粒。
制备大肠杆菌表达质粒：
质粒4980(4980-pBRori-URA3-LACI-SAC)是用于在大肠杆菌中表达核心链霉亲和素的表达质粒。其通过将源自质粒1966(1966-pBRori-URA3-LACI-T-重复；在EP-B 1422237中报道的)的3142bp长的EcoRI/CelII-载体片段与435bp长的编码核心链霉亲和素的EcoRI/CelII-片段连接产生。
核心链霉亲和素大肠杆菌表达质粒包含以下元件：
-来自载体pBR322的用于在大肠杆菌中复制的复制起点(根据Sutcliffe，G.，等人，Quant.Biol.43(1979)77-90，对应于bp位置2517-3160)，
-酿酒酵母(Saccharomyces cerevisiae)的编码乳清苷5’-磷酸脱羧酶的URA3基因(Rose，M.，等人，Gene 29(1984)113-124)，其允许通过补充大肠杆菌pyrF突变株(尿嘧啶营养缺陷型)进行质粒选择，
-核心链霉亲和素表达盒，所述表达盒包含
-T5杂合启动子(根据Bujard，H，等人，Methods.Enzymol.155(1987)416-433和Stueber，D.，等人，Immunol.Methods IV(1990)121-152的T5-PN25/03/04杂合启动子)，其包括根据Stueber，D.，等人(见前)的合成的核糖体结合位点，
-核心链霉亲和素基因，
-两个源自噬菌体的转录终止子，λ-T0终止子(Schwarz，E.，等人，Nature 272(1978)410-414)和fd-终止子(Beck，E.和Zink，B.，Gene 1-3(1981)35-58)，
-来自大肠杆菌的lacI抑制子基因(Farabaugh，PJ.，Nature 274(1978)765-769)。
通过使用单侧的(singular flanking)EcoRI和CelII限制性内切酶切割位点从载体4980切除核心链霉亲和素结构基因并将侧面连接有编码所述前体多肽的核酸的EcoRII/CelII限制性位点插入3142bp长的EcoRI/CelII-4980载体片段中制备用于表达四连蛋白-载脂蛋白A-I前体多肽的最终表达质粒。
实施例2
四连蛋白-载脂蛋白A-I的表达
为了表达所述融合蛋白，使用了通过补充大肠杆菌营养缺陷型(PyrF)能够进行无抗生素质粒选择的大肠杆菌宿主/载体系统(参见EP 0972838和US 6,291,245)。
用表达质粒p(IFN-His6-IgA-四连蛋白-载脂蛋白A-I)通过电穿孔转化大肠杆菌K12株CSPZ-2(leuB，proC，trpE，th-1，ΔpyrF)。将转化的大肠杆菌细胞首先在琼脂平板上于37℃生长。
发酵方案1：
为了预发酵，使用补充以约1g/l L-亮氨酸，约1g/l L-脯氨酸和约1mg/l硫胺-HCl的根据Sambrook等人(Molecular Cloning：A Laboratory manual，Cold Spring Harbor Laboratory Press；第2版(1989年12月)的M9培养基。
为了预发酵，用得自初级种子库安瓿的2ml接种具有隔板的1000ml锥形烧瓶中的300ml的M9-培养基。在旋转摇床上在37℃进行培养13个小时，直到获得1-3的光密度(578nm)。
为了发酵，使用根据Riesenberg，等人的分批(batch)培养基(Riesenberg，D.，等人，J.Biotechnol.20(1991)17-27)：27.6g/l葡萄糖*H₂O，13.3g/l KH₂PO₄，4.0g/l(NH₄)₂HPO₄，1.7g/l柠檬酸盐，1.2g/l MgSO₄*7H₂O，60mg/l柠檬酸铁(III)，2.5mg/l CoCl₂*6H₂O，15mg/l MnCl₂*4H₂O，1.5mg/l CuCl₂*2H₂O，3mg/l H₃BO₃，2.5mg/l Na₂MoO₄*2H₂O，8mg/l Zn(CH₃COO)₂*2H₂O，8.4mg/l Titriplex III，1.3ml/l Synperonic 10％消泡剂。将所述分批培养基分别补充以5.4mg/l硫胺-HCl和1.2g/l L-亮氨酸和L-脯氨酸。补料(feed)1溶液包含补充以19.7g/l MgSO₄*7H₂O的700g/l葡萄糖。用于pH调节的碱性溶液为分别补充以50g/l L-亮氨酸和50g/l L-脯氨酸的12.5％(w/v)NH₃水溶液。将所有组分溶解于去离子水中。
在10l Biostat C DCU3发酵罐(Sartorius，Melsungen，德国)中进行发酵。以6.4l无菌发酵分批培养基加上300ml来自预发酵的接种物起始，在37℃，pH 6.9±0.2，500mbar和10l/min的通气速率进行分批发酵。在初始补充的葡萄糖用尽后，将温度改变至28℃并且进入发酵补料分批(fed-bach)模式。这里，通过加入补料1与不断增加的搅拌速度(在10小时内从550rpm至1000rpm和16小时内从1000rpm至1400rpm)和通气速率(10小时内从10l/min至16l/min和在5小时内从16l/min至20l/minin)联合将溶解的氧(pO₂)的相对值保持在50％(DO-stat，参见例如Shay，L.K.，等人，J.Indus.Microbiol.Biotechnol.2(1987)79-85)。当在约8小时的培养后pH达到更低的调节极限(6.70)时，由加入碱性溶液引起补充以另外的氨基酸。通过在光密度70时加入1mM IPTG诱导重组治疗性蛋白的表达。
在发酵的最后，以加热步骤(在收获之前将发酵罐中的全部培养液加热至50℃达1或2小时)将细胞质的和可溶表达的四连蛋白-载脂蛋白A-I转换至不溶的蛋白质聚集体(所谓的包涵体)(参见例如EP-B 1 486 571)。之后，以无逆流离心机(flow-through centrifuge)离心发酵罐的内含物(13,000rpm，13l/h)并且将收获的生物质储存在-20℃，直到进一步处理。仅在不溶的细胞碎片部分发现不溶的蛋白质聚集体(所谓的包涵体(IBs))形式的合成的四连蛋白-载脂蛋白A-I前体蛋白质。
以SDS-聚丙烯酰胺凝胶电泳分析取自发酵罐的样品(一个为诱导前的并且其它的为诱导蛋白表达后的特定时间点的)。从每个样品，将相同量的细胞(OD_靶＝5)重悬在5mL PBS缓冲液中，并于冰上通过超声破碎。随后离心100μL的各个悬液(15,000rpm，5分钟)并且回收各个上清并转移至分开的小瓶。这是为了对可溶的和不溶的表达的靶蛋白质间进行区分。对于各个上清(＝可溶的)部分，加入300μL SDS上样缓冲液并且对于各个沉淀(＝不溶的)部分，加入400μL SDS上样缓冲液(Laemmli，U.K.，Nature 227(1970)680-685)。在震荡条件下于95℃加热样品15分钟以溶解和还原样品中的所有蛋白质。在冷却至室温之后，将5μL各个样品转移至4-20％TGX Criterion Stain Free聚丙烯酰胺凝胶(Bio-Rad)。此外，将5μl分子量标准(Precision Plus蛋白质标准，Bio-Rad)和3个量(0.3μl，0.6μl和0.9μl)的具有已知产物蛋白质浓度(0.1μg/μl)的定量标准置于胶上。
在200V运行电泳60分钟并且之后将凝胶转移至GelDOC EZ成像仪(Bio-Rad)并且用UV辐射处理5分钟。使用Image Lab分析软件(Bio-Rad)分析凝胶图像。以三个标准，用＞0.99的相关系数计算线性回归曲线并且由此计算原样品中靶蛋白的浓度。
发酵方案2：
为了预发酵，使用补充以约1g/l L-亮氨酸，约1g/l L-脯氨酸和约1mg/l硫胺-HCl的根据Sambrook等人(Molecular Cloning：A Laboratory manual，Cold Spring Harbor Laboratory Press；第2版(1989年12月)的M9培养基。
为了预发酵，从琼脂平板或用得自初级种子库安瓿的1-2ml接种具有隔板的1000ml锥形烧瓶中的300ml改良的M9-培养基。在旋转摇床上在37℃进行培养13个小时，直到获得1-3的光密度(578nm)。
为了发酵和高产率表达四连蛋白-载脂蛋白A-I，使用以下分批培养基和补料：
8.85g/l葡萄糖，63.5g/l酵母提取物，2.2g/l NH₄Cl，1.94g/l L-亮氨酸，2.91g/l L-脯氨酸，0.74g/l L-甲硫氨酸，17.3g/l KH₂PO₄*H2_O，2.02g/l MgSO₄*7H₂O，25.8mg/l硫胺-HCl，1.0ml/l Synperonic 10％消泡剂。补料1溶液包含333g/l酵母提取物和333g/l 85％-甘油，各补充以1.67g/l L-甲硫氨酸和5g/l L-亮氨酸和L-脯氨酸。补料2为600g/l L-脯氨酸溶液。用于pH调节的碱性溶液为10％(w/v)KOH溶液并且使用75％葡萄糖溶液作为酸。将所有组分溶解于去离子水。
在10l Biostat C DCU3发酵罐(Sartorius，Melsungen，Germany)中进行发酵。以5.15l无菌发酵分批培养基加上300ml来自预发酵的接种物起始，在25℃，pH 6.7±0.2，300mbar和10l/min的通气速率进行补料分批发酵。在初始补充的葡萄糖耗尽之前，培养物达到光密度15(578nm)并且当以70g/h开始补料1时，发酵进入补料分批分批模式。监控培养物中的葡萄糖浓度，在避免葡萄糖积聚和保持pH接近6.9的调节上限的同时增加补料1至150g/h的最大值。在50的光密度(578nm)，以10ml/h的连续补料速率起始补料2。通过平行增加搅拌速度(500rpm至1500rpm)，通气速率(从10l/min至20l/min)和压力(从300mbar至500mbar)将溶解的氧 (pO₂)的相对值保持大于50％。通过在90的光密度加入1mM IPTG诱导重组治疗性蛋白的表达。
用SDS-聚丙烯酰胺凝胶电泳分析取自发酵罐的七个样品(一个是诱导前的并且其它的是在诱导蛋白质表达后的特定时间点的)。从每个样品将相同量的细胞(OD_靶＝5)重悬在5mL PBS缓冲液中并于冰上通过超声破碎。随后将100μL的各个悬液离心(15,000rpm，5分钟)并回收各个上清并转移至分开的小瓶。这是为了将可溶的和不溶的表达的靶蛋白间相区别。对于各个上清(＝可溶的)部分，加入300μL SDS上样缓冲液并且对于各个沉淀(＝不溶的)部分，加入200μL SDS上样缓冲液(Laemmli，U.K.，Nature 227(1970)680-685)。在震荡条件下于95℃加热样品15分钟以溶解和还原样品中的所有蛋白质。在冷却至室温之后，将5μL各个样品转移至10％Bis-Tris聚丙烯酰胺凝胶(Novagen)。此外，将5μl分子量标准(Precision Plus蛋白质标准，Bio-Rad)和3个量(0.3μl，0.6μl和0.9μl)的具有已知产物蛋白质浓度(0.1μg/μl)的定量标准置于胶上。
在200V运行电泳35分钟并随后将凝胶用考马斯亮蓝R染料染色，用加热的水脱色并转移至光密度计以数字化(GS710，Bio-Rad)。使用Quantity One 1-D分析软件(Bio-Rad)分析凝胶图像。以三个标准，用＞0.98的相关系数计算线性回归曲线并且由此计算原样品中靶蛋白的浓度。
在发酵的最后，以加热步骤(在收获之前将发酵罐中的全部培养液加热至50℃达1或2小时)将细胞质的和可溶表达的四连蛋白-载脂蛋白A-I转换至不溶的蛋白质聚集体(所谓的包涵体)(参见例如EP-B 1 486 571)。加热步骤后，仅在不溶的细胞碎片部分发现IBs形式的合成的四连蛋白-载脂蛋白A-I前体蛋白质。
将发酵罐的内含物冷却至4-8℃，以无逆流离心机(flow-through centrifuge)离心发酵罐的内含物(13,000rpm，13l/h)并且将收获的生物质储存在-20℃，直到进一步处理。收获的生物质总产量依赖于表达的构建体范围在39g/l和90g/l干燥物质之间。
实施例3
四连蛋白-载脂蛋白A-I的制备
通过将收获的细菌细胞重悬于磷酸钾缓冲溶液(0.1M，补充以1mM MgSO₄，pH 6.5)进行包涵体制备。加入DNAse后，通过在900bar的压力匀浆破碎细胞。将包含1.5M NaCl的缓冲溶液加入匀浆的细胞悬液。在以25％(w/v)HCl将pH值调节至5.0后，在进一步离心步骤后获得最终的包涵体浆。于-20℃将浆储存在一次性、无菌塑料袋中，直到进一步处理。
将11.75g包涵体在235ml 6M盐酸胍，50mM Tris，1mM DTT，pH8.0中溶解3.5小时。离心后，将溶解物(solubilisate)上样于在50mM Tris，1M NaCl，8M脲，pH 8.0中平衡的NiNTA柱(Qiagen)上。之后将柱用50mM Tris，6M盐酸胍，pH 8.0冲洗，然后以50mM Tris，8M脲，pH 8.0和50mM Tris，60％异丙醇(5个循环)交替洗涤，最后的步骤为50mM Tris，8M脲，pH 8.0。以在50mM Tris，0.5M NaCl，8M脲，pH 7.0开始至50mM Tris，0.5M NaCl，8M脲，pH 3.0的pH梯度进行洗脱。汇集峰级分并针对100mM Tris，100mM NaCl，pH 7.8透析。
用IgA蛋白酶的切割以1∶2000w/w(IgA蛋白酶∶蛋白质)的比例RT进行24h。针对25mM乙酸钠，1mM Tris，pH 4.5透析该溶液。加入脲至8M的终浓度。将该蛋白溶液加载在用缓冲液25mM乙酸钠，1mM Tris，8M脲，pH 4.5平衡的SP-琼脂糖(GE)上并且以至25mM乙酸钠，1mM Tris，0.3M NaCl，8M脲，pH 4.5的梯度洗脱。根据SDS-PAGE汇集级分并针对50mM Tris，250mM NaCl，pH 7.5透析。
实施例4
四连蛋白-载脂蛋白A-I融合多肽的分析
将来自NiNTA(Qiagen)和SP-琼脂糖(TM)(GE)纯化柱的汇集体或级分脱盐并通过电喷雾电离质谱(ESI-MS)分析。
通过使用以交联葡聚糖(Sephadex)G25超细填料(Amersham Bioscience 17-0851-01)内部填充的HR5/20柱(0.7x 22cm，Amersham Bioscience)的尺寸排阻层析和以流速为1ml/min的40％乙腈，2％甲酸的等度洗脱进行脱机脱盐。在280nm波长监控信号，并手动收集四连蛋白-载脂蛋白融合多肽洗脱峰。
在装有Triversa NanoMate源系统(Advion，Ithaka，USA)的Q-Star Elite QTOF质谱仪(Applied Biosystems(ABI)，Darmstadt，德国)上，使用分离电位(declustering potential)50和聚焦电位(focusing potential)200进行监控片段的存在的ESI-MS。以范围为700至2000的m/z每5秒记录15次扫描。
使用两个软件包，Analyst(Applied Biosystems(ABI)，Darmstadt，德国)和MassAnalyzer(内部开发的软件平台)分析ESI-MS数据。手动核对质谱中带有由各自的编码AR二肽的寡核苷酸处的移码导致的蛋白质片段的分子量的信号的存在(与全长融合多肽的预期分子量相比较的-6269Da的Δ)。

资源描述

《减少1＞2读框移位的方法.pdf》由会员分享，可在线阅读，更多相关《减少1＞2读框移位的方法.pdf（39页珍藏版）》请在专利查询网上搜索。

1、10申请公布号CN104136459A43申请公布日20141105CN104136459A21申请号201380011005822申请日2013022212157512020120229EP12162810120120402EPC07K14/775200601C12N15/6720060171申请人霍夫曼拉罗奇有限公司地址瑞士巴塞尔72发明人阿德尔伯特格罗斯曼弗里德里克黑塞E科佩茨基维尔马劳克里斯蒂安尚茨74专利代理机构中科专利商标代理有限责任公司11021代理人张莹王旭54发明名称减少12读框移位的方法57摘要本文报道了一种重组生产包含二肽AR的多肽的方法，其特征在于所述方法包括从包含编码。

2、所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收多肽，从而生产所述多肽，其中包含在所述多肽中的二肽AR由寡核苷酸GCACGT，或寡核苷酸GCGCGT，或寡核苷酸GCCCGT编码。30优先权数据85PCT国际申请进入国家阶段日2014082686PCT国际申请的申请数据PCT/EP2013/0535472013022287PCT国际申请的公布数据WO2013/127700EN2013090651INTCL权利要求书1页说明书18页序列表18页附图1页19中华人民共和国国家知识产权局12发明专利申请权利要求书1页说明书18页序列表18页附图1页10申请公布号CN1041364。

3、59ACN104136459A1/1页21一种在包含二肽ARSEQIDNO06的多肽的生产中减少由12移码导致的副产物形成的方法，其特征在于所述方法包括以下步骤从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽，从而生产所述多肽，其中包含在编码所述多肽的核酸中的编码所述二肽AR的寡核苷酸在第四位具有核苷酸C。2一种在包含二肽ARSEQIDNO06的多肽的重组生产中减少由12移码导致的副产物形成的方法，其特征在于所述方法包含以下步骤从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽，从而生产所述多肽，其中包含在所述多肽中。

4、的二肽AR由寡核苷酸GCACGTSEQIDNO03，或寡核苷酸GCGCGTSEQIDNO04，或寡核苷酸GCCCGTSEQIDNO05编码。3根据权利要求1所述的方法，其特征在于包含在所述多肽中的二肽AR由寡核苷酸GCACGT，或寡核苷酸GCGCGT，或寡核苷酸GCCCGT编码。4根据权利要求1至3任一项所述的方法，其特征在于所述细胞是原核细胞。5根据权利要求1至3任一项所述的方法，其特征在于所述原核细胞是大肠杆菌细胞。6根据权利要求1至5任一项所述的方法，其特征在于所述多肽是载脂蛋白AI，或具有载脂蛋白AI活性的其变体，或具有载脂蛋白AI活性的其融合多肽。7根据权利要求6所述的方法，其特征在。

5、于所述多肽具有选自包含SEQIDNO09至SEQIDNO14的组的氨基酸序列。8根据权利要求1至7任一项所述的方法，其特征在于所述多肽具有SEQIDNO09或SEQIDNO11的氨基酸序列。权利要求书CN104136459A1/18页3减少12读框移位的方法0001本发明属于重组多肽生产领域。本文报道了一种重组生产具有减少的副产物含量的多肽的方法，其中通过修饰在翻译或转录过程中减少移码FRAMESHIFT的编码核酸实现副产物含量的减少。0002发明背景0003蛋白质在现今的医用组合中发挥重要作用。对于人的应用，每种药用物质必须满足不同的标准。为了保证生物药剂对人的安全性，尤其必须将会引起严重危。

6、害的核酸，病毒，和宿主细胞蛋白质移除。为了满足质量管理规格标准REGULATORYSPECICATION，一个或更多个纯化步骤必须按照制造工艺。0004可以例如通过原核细胞比如大肠杆菌生产重组多肽。重组生产的多肽占原核细胞的多肽含量的大多数并且经常在原核细胞内沉积为不溶的聚集体，即为所谓的包涵体。为了分离重组多肽，必须将细胞破碎并且必须在从细胞碎片分离包涵体之后将包含在包涵体中的重组多肽溶解。对于增溶离液剂，使用比如脲或盐酸胍。为了切开二硫键，尤其在碱性条件下加入还原剂，比如二硫赤藓醇，二硫苏糖醇，或巯基乙醇。溶解聚集的多肽之后，必须将重组多肽的对于生物活性至关重要的球状结构重建。在该所谓的复。

7、性过程中，例如通过针对合适的缓冲液透析缓慢降低还原剂的浓度，其允许变性的多肽重折叠为其生物活性结构。复性后，纯化重组多肽到对于预期用途可接受的纯度。例如，对于作为治疗性蛋白质的使用，必须建立大于90的纯度。0005重组生产的多肽通常伴有来自生产细胞的核酸，内毒素，和/或多肽。除了宿主细胞来源的副产物，在粗制多肽制备物中还存在多肽来源的副产物。除了别的以外，可以存在研究的多肽的截短的变体。0006在WO95/25786中，报道了在细菌表达系统中生产人载脂蛋白A1。0007发明概述0008已经发现，编码二肽AR的寡核苷酸可以是在编码包含二肽AR的多肽的核酸的翻译或转录过程中12移码的点。由于移码的。

8、出现，产生具有不编码的氨基酸序列的无义多肽。0009因此，已经发现，包含在编码更大多肽的核酸中的编码二肽AR的寡核苷酸应该选自寡核苷酸GCACGTSEQIDNO03，GCGCGTSEQIDNO04，和GCCCGTSEQIDNO05。已经发现，编码所述二肽AR的寡核苷酸中的第四个核苷酸不应该是A。0010如本文报道的一个方面是重组生产包含所述二肽ARSEQIDNO06的多肽的方法，其特征在于所述方法包括以下步骤0011从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽并从而生产所述多肽，0012其中包含在编码所述多肽的核酸中的编码所述二肽AR的寡核苷酸在第四。

9、位具有核苷酸C。0013因此，作为一个方面，本文报道了，重组生产包含二肽ARSEQIDNO06的多肽的方法，其特征在于所述方法包括以下步骤说明书CN104136459A2/18页40014从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽并从而生产所述多肽，0015其中包含在所述多肽中的二肽AR由寡核苷酸GCACGTSEQIDNO03，或寡核苷酸GCGCGTSEQIDNO04，或寡核苷酸GCCCGTSEQIDNO05编码。0016如本文报道的一个方面是在包含二肽ARSEQIDNO06的多肽的生产中减少由12移码导致的副产物形成的方法，其特征在于所述方法包括。

10、以下步骤0017从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽并从而生产所述多肽，0018其中编码包含在编码所述多肽的核酸中的二肽AR的寡核苷酸在第四位具有核苷酸C。0019因此，作为一个方面，本发明报道了在包含二肽ARSEQIDNO06的多肽的重组生产中减少由12移码导致的副产物形成的方法，其特征在于所述方法包括以下步骤0020从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽并从而生产所述多肽，0021其中包含在所述多肽中的二肽AR由寡核苷酸GCACGTSEQIDNO03，或寡核苷酸GCGCGTSEQIDNO0。

11、4，或寡核苷酸GCCCGTSEQIDNO05编码。0022在如之前报道的所有方面的一个实施方案中，所述二肽AR是所有二肽AR。0023在如本文报道的所有方面的一个实施方案中，所述二肽AR是氨基酸序列中最后的二肽AR。0024如本文报道的一个方面是重组生产包含二肽ARSEQIDNO06的SEQIDNO09或SEQIDNO11的载脂蛋白AI的方法，其特征在于所述方法包括以下步骤0025从包含编码SEQIDNO09或SEQIDNO11的载脂蛋白AI的核酸的细胞或包含编码SEQIDNO09或SEQIDNO11的载脂蛋白AI的核酸的细胞的培养物的培养基回收所述载脂蛋白AI并从而生产所述载脂蛋白AI，00。

12、26其中包含在编码所述载脂蛋白AI的核酸中的编码最后的二肽AR的寡核苷酸在第四位具有核苷酸C。0027因此，作为一个方面，本发明报道了重组生产包含二肽ARSEQIDNO06的SEQIDNO09或SEQIDNO11的载脂蛋白AI的方法，其特征在于所述方法包括以下步骤0028从包含编码SEQIDNO09或SEQIDNO11的载脂蛋白AI的核酸的细胞或包含编码SEQIDNO09或SEQIDNO11的载脂蛋白AI的核酸的细胞的培养物的培养基回收所述载脂蛋白AI并从而生产所述载脂蛋白，0029其中包含在所述载脂蛋白AI氨基酸序列中的最后的二肽AR由寡核苷酸GCACGTSEQIDNO03，或寡核苷酸GCG。

13、CGTSEQIDNO04，或寡核苷酸GCCCGTSEQIDNO05编码。0030如本文报道的一个方面是编码在其氨基酸序列中包含二肽AR的多肽的核酸，其中所述二肽AR由寡核苷酸GCACGTSEQIDNO03，或寡核苷酸GCGCGTSEQIDNO04，或寡核苷酸GCCCGTSEQIDNO05编码。0031如本文报道的一个方面是包含如本文报道的核酸的细胞。0032如本文报道的一个方面是寡核苷酸GCACGTSEQIDNO03，或寡核苷酸GCG说明书CN104136459A3/18页5CGTSEQIDNO04，或寡核苷酸GCCCGTSEQIDNO05用于编码包含在多肽中的二肽AR的用途。0033以下具体。

14、说明如本文报道的所有方面的实施方案。0034在一个实施方案中，所述二肽AR由寡核苷酸GCACGTSEQIDNO03编码。0035在一个实施方案中，所述二肽AR由寡核苷酸GCGCGTSEQIDNO04编码。0036在一个实施方案中，所述二肽AR由寡核苷酸GCCCGTSEQIDNO05编码。0037在一个实施方案中，所述多肽包含约50个氨基酸残基至约500个氨基酸残基。在一个实施方案中，所述多肽包含约100个氨基酸残基至约400个氨基酸残基。在一个实施方案中，所述多肽包含约250氨基酸残基至约350氨基酸残基。0038在一个实施方案中，所述细胞是原核细胞。在一个实施方案中，所述原核细胞是大肠杆菌E。

15、COLI细胞，或芽胞杆菌BACILLUS细胞。0039在一个实施方案中，所述细胞是真核细胞。在一个实施方案中，所述细胞是CHO细胞，或HEK细胞，或BHK细胞，或NS0细胞，或SP2/0细胞，或酵母细胞。0040在一个实施方案中，所述多肽是异源多聚多肽。在一个实施方案中，所述多肽是抗体或抗体片段。0041在一个实施方案中，所述多肽是同源多聚多肽。在一个实施方案中，所述多肽是同源二聚体或同源三聚体。0042在一个实施方案中，所述多肽是人载脂蛋白AI或具有人载脂蛋白AI的生物活性的其变体。在一个实施方案中，所述载脂蛋白AI变体具有选自SEQIDNO09至SEQIDNO14的组的氨基酸序列。0043。

16、在一个实施方案中，所述多肽是具有SEQIDNO09或SEQIDNO11的氨基酸序列的人载脂蛋白AI。0044发明详述0045定义0046术语氨基酸指羧基氨基酸类，其可以直接或以前体的形式由核酸编码。个体氨基酸被由三个核苷酸组成的核酸所谓密码子或碱基三联体编码。每个氨基酸由至少一个密码子编码。由不同密码子编码相同氨基酸被称为“遗传密码的简并”。术语”氨基酸”指天然存在的羧基氨基酸并且包括丙氨酸三字母代码ALA，单字母代码A，精氨酸ARG，R，天冬酰胺ASN，N，天冬氨酸ASP，D，半胱氨酸CYS，C，谷氨酰胺GLN，Q，谷氨酸GLU，E，甘氨酸GLY，G，组氨酸HIS，H，异亮氨酸ILE，I，亮。

17、氨酸LEU，L，赖氨酸LYS，K，甲硫氨酸MET，M，苯丙氨酸PHE，F，脯氨酸PRO，P，丝氨酸SER，S，苏氨酸THR，T，色氨酸TRP，W，酪氨酸TYR，Y，和缬氨酸VAL，V。0047术语载脂蛋白AI指具有蛋白质脂质和蛋白质蛋白质相互作用性质的，两亲的，螺旋多肽。载脂蛋白AI由肝和小肠合成为267个氨基酸残基的前载脂蛋白原PREPROAPOLIPOPROTEIN，其以载脂蛋白原PROAPOLIPOPROTEIN分泌，所述载脂蛋白原被切割为具有243个氨基酸残基的成熟多肽。载脂蛋白AI由6至8个不同氨基酸重复每个由被接头部分常常是脯氨酸分开的22个氨基酸残基组成组成，并且在一些情况下由通。

18、过一些残基构成的区段组成。在GENPEPT数据库入口DATABASEENTRYNM000039或数据库入口X00566；GENBANKNP0000301GI4557321中报道了代表性的人载脂蛋说明书CN104136459A4/18页6白AI氨基酸序列。存在人载脂蛋白AISEQIDNO07的天然存在的变体，比如P27H，P27R，P28R，R34L，G50R，L84R，D113E，AA119D，D127N，K131的缺失，K131M，W132R，E133K，R151C氨基酸残基151从ARG改变为CYS，载脂蛋白AIPARIS，E160K，E163G，P167R，L168R，E171V，P18。

19、9R，R197C氨基酸残基173从ARG改变为CYS，载脂蛋白AIMILANO和E222K。还包括的是具有保守氨基酸修饰的变体。0048术语“密码子”指由编码限定的氨基酸的三个核苷酸组成的寡核苷酸。由于遗传密码的简并性，一些氨基酸由多于一种密码子编码。这些编码相同氨基酸的不同密码子在个体宿主细胞中具有不同的相对使用频率。因此，特定氨基酸可以由一组不同的密码子编码。同样地，多肽的氨基酸序列可以由不同核酸编码。因此，特定氨基酸可以由一组不同的密码子编码，其中这些密码子中的每个具有给定的宿主细胞中的使用频率。0049表大肠杆菌密码子使用密码子|编码的氨基酸|使用频率00500051保守取代显示在以下。

20、优选的取代标题下的表中。在以下代表性的取代标题下的表中并且如在下文关于氨基酸侧链类型进一步描述的提供另外更多的取代的改变。0052说明书CN104136459A5/18页700530054非保守取代需要将这些类型中的一种的成员交换为另一种类型。0055术语保守氨基酸修饰指不影响或改变多肽的特性的氨基酸序列的修饰。可以说明书CN104136459A6/18页8通过本领域已知的标准技术，比如位点定向的诱变和PCR介导的诱变引入修饰。保守氨基酸修饰包括其中氨基酸残基被具有类似侧链的氨基酸残基替代的修饰。本领域中已经限定了具有类似侧链的氨基酸残基家族。这些家族包括具有碱性侧链例如赖氨酸，精氨酸，组氨酸。

21、，酸性侧链例如天冬氨酸，谷氨酸，不带电极性侧链例如甘氨酸，天冬酰胺，谷氨酰胺，丝氨酸，苏氨酸，酪氨酸，半胱氨酸，色氨酸，非极性侧链例如丙氨酸，缬氨酸，亮氨酸，异亮氨酸，脯氨酸，苯丙氨酸，甲硫氨酸，分枝侧链例如苏氨酸，缬氨酸，异亮氨酸，和芳香侧链例如酪氨酸，苯丙氨酸，色氨酸，组氨酸的氨基酸。0056术语“多肽的变体”指氨基酸序列以多达十个，在一个实施方案中从约两个至约五个，添加，缺失，和/或取代不同于“母体”多肽的氨基酸序列的多肽。可以通过基于如由RIECHMANN，L，等人，NATURE3321988323327，和QUEEN，C，等人，PROCNATLACADSCIUSA8619891002。

22、910033描述的分子模型的诱变进行氨基酸序列修饰。0057可以使用公知的算法，比如BLOSUM30，BLOSUM40，BLOSUM45，BLOSUM50，BLOSUM55，BLOSUM60，BLOSUM62，BLOSUM65，BLOSUM70，BLOSUM75，BLOSUM80，BLOSUM85，或BLOSUM90计算不同氨基酸序列的同源性和同一性。在一个实施方案中，所述算法是BLOSUM30。0058交替使用术语宿主细胞，宿主细胞系，和宿主细胞培养物并且指已引入外源核酸的细胞，包括此种细胞的子代。宿主细胞包括转化体和转化的细胞，其包括原代转化的细胞和从中来源的不考虑传代数量的子代。子代核酸。

23、含量可以不与亲代细胞完全相同，但可以包含突变。具有与在最初转化的细胞中筛选或选择的相同功能或生物活性突变的子代包括在本文中。0059术语“核酸”和“核酸序列”指由个体核苷酸还称为碱基A，C，G，和T或RNA中的U组成的聚合分子，即DNA，RNA，或其修饰物。该多核苷酸分子可以是天然存在的多核苷酸分子或合成的多核苷酸分子或一种或更多种天然存在的多核苷酸分子与一种或更多种合成的多核苷酸分子的组合。该定义还包括的是其中一个或更多个核苷酸被改变例如通过诱变，缺失，或添加的天然存在的多核苷酸分子。核酸可以是分离的，或整合入另一条核酸，例如整合入表达盒，质粒，或宿主细胞的染色体。核酸以其由个体核苷酸组成的。

24、核酸序列为特征。术语“寡核苷酸”指由至多10个个体核苷酸也成为碱基A，C，G，和T或RNA中的U组成的聚合分子。0060对于本领域技术人员来说，将例如多肽的氨基酸序列转变为编码该氨基酸序列的相应的核酸序列的工艺和方法是公知的。因此，核酸以其由个体核苷酸组成的核酸序列为特征并且类似地以由此编码的多肽的氨基酸序列表征。0061有关参考多肽序列的“百分数氨基酸序列同一性定义为经比对序列和引入缺口如果需要以获得最大百分数序列同一性，和不考虑任何保守取代作为序列同一性的部分之后，候选序列中与参考多肽序列中氨基酸残基的相同的氨基酸残基的百分数。可以以不同方式实现为了确定百分数氨基酸序列同一性的目的的比对，。

25、所述方式在本领域技术内，例如，使用公众可获得的计算机软件，比如BLAST，BLAST2，ALIGN或MEGALIGNDNASTAR软件。本领域熟练技术人员可以确定用于比对序列的合适参数，包括获得跨被比较序列的全长的最大比对所需的任何算法。然而，为了本文的目的，使用序列比较计算机程序ALIGN2产生氨基酸序列同一性值。ALIGN2序列比较计算机程序说明书CN104136459A7/18页9由GENENTECH，INC创作，并且已将原代码与用户文献资料提交美国版权局，WASHINGTONDC，20559，其中其在美国版权登记号TXU510087下登记。ALIGN2程序可从GENENTECH，INC。

26、，SOUTHSANFRANCISCO，CALIFORNIA由公众获得，或可以从源代码编辑。应该将ALIGN2程序编辑用于在UNIX操作系统包括数字的UNIXV40D上使用。所有序列比较参数由ALIGN2程序设定并且不改变。0062在将ALIGN2用于氨基酸序列比较的情况下，如下计算给定氨基酸序列A相对TO、与WITH、或针对AGAINST给定氨基酸序列B其可以备选地叙述为相对TO、与WITH、或针对AGAINST给定氨基酸序列B具有或包含某一氨基酸序列同一性的给定氨基酸序列A的氨基酸序列同一性0063100乘以分数X/Y0064其中X是通过序列比对程序ALIGN2中的A和B的程序比对得分为相同。

27、匹配的氨基酸残基的数量，并且其中Y是B中氨基酸残基的总数量。将理解其中氨基酸序列A的长度与氨基酸序列B的长度不相等，A相对B的氨基酸序列同一性将不等于B相对A的氨基酸序列同一性。除非另有特别说明，否则如在紧接的上一段中使用ALIGN2计算机程序获得本文使用所有氨基酸序列同一性值。0065术语重组多肽和“重组生产的多肽”指通过重组方法制备，表达或产生的多肽，比如分离自宿主细胞，比如大肠杆菌，NS0，BHK，或CHO细胞的多肽。0066术语取代指改变母体核酸中一个特定核苷酸以获得取代的/改变的核酸。0067如本文报道的方法0068例如在AUSUBEL，FM编辑，CURRENTPROTOCOLSIN。

28、MOLECULARBIOLOGY，卷I至III1997，WILEYANDSONS；SAMBROOK，J，等人，MOLECULARCLONINGALABORATORYMANUAL，第二版，COLDSPRINGHARBORLABORATORYPRESS，COLDSPRINGHARBOR，NY1989；MORRISON，SL，等人，PROCNATLACADSCIUSA81198468516855；US5,202,238和US5,204,244中描述了用于进行本发明的，本领域技术人员已知的方法和技术。0069已经发现，包含在编码包含二肽AR的多肽的核酸内的编码二肽AR的寡核苷酸可以是编码包含二肽AR的。

29、多肽的核酸的转录或翻译过程中12移码突变的点。由于具有非编码的氨基酸序列的移码多肽的出现，最可能产生无义或截短的氨基酸序列。0070更详细地，已经发现依赖于包含在编码更大的即至少50个氨基酸残基多肽的核酸内的编码二肽AR的寡核苷酸，寡核苷酸的转录或翻译过程中的12移码以不同频率发生参见下表。0071表0072编码AR二肽的寡核苷酸12移码发生GCGAGGSEQIDNO01是GCGAGASEQIDNO0230说明书CN104136459A8/18页10GCACGTSEQIDNO03低于检测极限GCGCGTSEQIDNO04低于检测极限GCCCGTSEQIDNO05低于检测极限0073因此，如本文。

30、报道的一个方面是重组生产包含二肽ARSEQIDNO06的多肽的方法，其特征在于所述方法包括以下步骤0074从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽并从而生产所述多肽，0075其中包含在所述多肽中的二肽AR由寡核苷酸GCACGTSEQIDNO03，或寡核苷酸GCGCGTSEQIDNO04，或寡核苷酸GCCCGTSEQIDNO05编码。0076因此，如本文报道的一个方面是重组生产包含二肽ARSEQIDNO06的多肽的方法，其特征在于所述方法包括以下步骤0077从包含编码所述多肽的核酸的细胞或包含编码所述多肽的核酸的细胞的培养物的培养基回收所述多肽并从。

31、而生产所述多肽，0078其中包含在编码所述多肽的核酸中的编码二肽AR的寡核苷酸在第四位具有核苷酸C。0079在一个实施方案中，编码所述二肽AR的寡核苷酸包含编码氨基酸A的密码子选自GCT，GCC，GCA和GCG的密码子和编码氨基酸R的密码子选自CGT，CGC，CGA和CGG的密码子。0080在一个实施方案中，编码所述二肽AR的寡核苷酸选自包含寡核苷酸GCTCGT，GCTCGC，GCTCGA，GCTCGG，GCCCGT，GCCCGC，GCCCGA，GCCCGG，GCACGT，GCACGC，GCACGA，GCACGG，GCGCGT，GCGCGC，GCGCGA，和GCGCGG的组。0081在一个实施。

32、方案中，编码所述二肽AR的寡核苷酸选自包含寡核苷酸GCACGTSEQIDNO03，GCGCGTSEQIDNO04，和GCCCGTSEQIDNO05的组。0082在一个实施方案中，所述方法包括以下步骤0083提供包含编码所述多肽的核酸的细胞，0084培养所述细胞在适于表达所述多肽的条件下，0085从细胞或培养基回收所述多肽。0086任选地以一个或更多个层析步骤纯化生产的多肽。0087在一个实施方案中，通过在编码二肽AR的寡核苷酸GCGAGGSEQIDNO01，或寡核苷酸GCGAGASEQIDNO02中取代二至三个核苷酸以获得寡核苷酸GCACGTSEQIDNO03，或寡核苷酸GCGCGTSEQID。

33、NO04，或寡核苷酸GCCCGTSEQIDNO05，来获得包含编码二肽AR的寡核苷酸GCACGTSEQIDNO03，或寡核苷酸GCGCGTSEQIDNO04，或寡核苷酸GCCCGTSEQIDNO05的编码所述多肽的核酸。0088在一个实施方案中，以一至五个层析步骤纯化生产的多肽。在一个实施方案中，以二至四个层析步骤纯化生产的多肽。在一个实施方案中，以三个层析步骤纯化生产的多肽。0089一般的层析方法和其用途对于本领域技术人员来说是已知的。参见例如，CHROMATOGRAPHY，第5版，PARTAFUNDAMENTALSANDTECHNIQUES，HEFTMANN，E编辑，说明书CN104136。

34、459A109/18页11ELSEVIERSCIENCEPUBLISHINGCOMPANY，纽约1992；ADVANCEDCHROMATOGRAPHICANDELECTROMIGRATIONMETHODSINBIOSCIENCES，DEYL，Z编辑，ELSEVIERSCIENCEBV，AMSTERDAM，荷兰1998；CHROMATOGRAPHYTODAY，POOLE，CF，和POOLE，SK，ELSEVIERSCIENCEPUBLISHINGCOMPANY，纽约1991；SCOPES，PROTEINPURICATIONPRINCIPLESANDPRACTICE1982；SAMBROOK，J，。

35、等人编辑，MOLECULARCLONINGALABORATORYMANUAL，第二版，COLDSPRINGHARBORLABORATORYPRESS，COLDSPRINGHARBOR，NY1989；或CURRENTPROTOCOLSINMOLECULARBIOLOGY，AUSUBEL，FM，等人编辑，JOHNWILEYSONS，INC，纽约1997。0090如本文报道的一个方面是编码在其氨基酸序列中包含二肽AR的多肽的核酸，其中所述二肽AR由寡核苷酸GCACGTSEQIDNO03，或寡核苷酸GCGCGTSEQIDNO04，或寡核苷酸GCCCGTSEQIDNO05编码。0091如本文报道的一个方。

36、面是包含如本文报道的核酸的细胞。0092如本文报道的一个方面是寡核苷酸GCACGTSEQIDNO03，或寡核苷酸GCGCGTSEQIDNO04，或寡核苷酸GCCCGTSEQIDNO05用于编码包含在多肽中的二肽AR的用途。0093如本文报道的一个方面是在包含二肽AR的多肽的重组生产过程中减少副产物形成的方法，所述方法包括以下步骤0094在编码多肽的核酸中，取代编码二肽AR的寡核苷酸GCGAGGSEQIDNO01，或寡核苷酸GCGAGASEQIDNO02中的二至三个核苷酸以获得寡核苷酸GCACGTSEQIDNO03，或寡核苷酸GCGCGTSEQIDNO04，或寡核苷酸GCCCGTSEQIDNO0。

37、5，从而产生取代的编码多肽的核酸，和0095从包含编码所述多肽的取代的核酸的细胞或包含编码所述多肽的取代的核酸的细胞的培养物的培养基回收所述多肽并从而在包含二肽AR的多肽的重组生产过程中减少副产物形成。0096如本文报道的一个方面是增加重组生产的包含二肽AR的多肽的表达的方法，所述方法包含以下步骤0097在编码多肽的核酸中，取代编码二肽AR的寡核苷酸GCGAGGSEQIDNO01，或寡核苷酸GCGAGASEQIDNO02中的二至三个核苷酸以获得寡核苷酸GCACGTSEQIDNO03，或寡核苷酸GCGCGTSEQIDNO04，或寡核苷酸GCCCGTSEQIDNO05，从而产生取代的编码多肽的核酸。

38、，并且0098从包含编码多肽的取代的核酸的细胞或包含编码多肽的取代的核酸的细胞的培养物的培养基回收所述多肽并从而增加包含二肽AR的多肽的表达。0099在一个实施方案中，所述方法包含以下进一步步骤中的一个或更多个0100提供包含二肽AR的多肽的氨基酸序列或编码核酸，和/或0101用编码所述多肽的取代的核酸转染细胞，和/或0102培养转染有取代的核酸的细胞在适于表达所述多肽的条件下，和/或0103从细胞或培养基回收所述多肽，和/或0104任选地以一个或更多个层析步骤纯化生产的多肽。0105在一个实施方案中以一至五个层析步骤纯化生产的多肽。在一个实施方案中，以说明书CN104136459A1110/。

39、18页12二至四个层析步骤纯化生产的多肽。在一个实施方案中，以三个层析步骤纯化生产的多肽。0106以下以在原核细胞中生产的重组多肽，即在大肠杆菌中生产的四连蛋白载脂蛋白AI融合多肽举例证明如本文报道的方法。0107四连蛋白载脂蛋白AI融合多肽包含在N末端至C末端方向人四连蛋白三聚化结构元件和野生型人载脂蛋白AI。人四连蛋白三聚化结构元件的氨基酸序列可以截短前9个氨基酸，这样，以位置10的异亮氨酸残基天然存在的截短位点起始。作为该截短的结果，位置4的苏氨酸残基的O糖基化位点被删除。四连蛋白三聚化结构元件和人载脂蛋白AI间的五个氨基酸残基SLKGSSEQIDNO08被移除。0108为了改善的表达和。

40、纯化，可以构建包含N末端纯化标签，例如六组氨酸标签，和用于移除纯化标签的蛋白酶切割位点的构建体。在一个实施方案中，所述蛋白酶是IGA蛋白酶，并且所述蛋白酶切割位点是IGA蛋白酶切割位点。作为蛋白酶的特异切割的结果，蛋白酶切割位点的一些氨基酸残基保留在多肽的N末端，即在IGA蛋白酶切割位点的情况下，两个氨基酸残基如第一丙氨酸或甘氨酸或丝氨酸或苏氨酸和如第二脯氨酸被保留在多肽，例如四连蛋白载脂蛋白AI融合多肽的N末端。0109四连蛋白三聚化结构元件提供允许形成四连蛋白载脂蛋白AI同源三聚体的结构域，所述同源三聚体通过每个个体四连蛋白载脂蛋白AI单体之间的非共价相互作用构成。0110在一个实施方案中。

41、，所述载脂蛋白AI融合多肽是包含保守氨基酸取代的变体。0111在一个实施方案中，所述四连蛋白载脂蛋白AI融合多肽包含表达和纯化标签，并具有以下氨基酸序列0112CDLPQTHSLGSHHHHHHGSVVAPPAPIVNAKKDVVNTKMFEELKSRLDTLAQEVALLKEQQALQTVDEPPQSPWDRVKDLATVYVDVLKDSGRDYVSQFEGSALGKQLNLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARA。

42、HVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQSEQIDNO090113在一个实施方案中，所述四连蛋白载脂蛋白AI融合多肽IVN具有以下氨基酸序列0114IVNAKKDVVNTKMFEELKSRLDTLAQEVALLKEQQALQTVDEPPQSPWDRVKDLATVYVDVLKDSGRDYVSQFEGSALGKQLNLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQ。

43、KVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQSEQIDNO100115因此，在一个实施方案中，所述四连蛋白载脂蛋白AI融合多肽PIVN具有以下氨基酸序列0116PIVNAKKDVVNTKMFEELKSRLDTLAQEVALLKEQQALQTVDEPPQSPWDRVKDLATVYVDVLKDSGRDYVSQFEGSALGKQLNLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNL。

44、EKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQSEQIDNO110117在一个实施方案中，所述四连蛋白载脂蛋白AI融合多肽XPIVN具有以下氨基酸序列说明书CN104136459A1211/18页130118G，S，TPIVNAKKDVVNTKMFEELKSRLDTLAQEVALLKEQQALQTVDEPPQ。

45、SPWDRVKDLATVYVDVLKDSGRDYVSQFEGSALGKQLNLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQSEQIDNO120119因此，在一个实施方案中，所述四连蛋白载脂蛋白AI融合多肽APIVN具有以下氨基酸序列0120API。

46、VNAKKDVVNTKMFEELKSRLDTLAQEVALLKEQQALQTVDEPPQSPWDRVKDLATVYVDVLKDSGRDYVSQFEGSALGKQLNLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKAKPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQSEQIDNO130121在一个实施。

47、方案中，所述包含六组氨酸标签的四连蛋白载脂蛋白AI融合多肽XIVN具有以下氨基酸序列0122HHHHHHXIVNAKKDVVNTKMFEELKSRLDTLAQEVALLKEQQALQTVDEPPQSPWDRVKDLATVYVDVLKDSGRDYVSQFEGSALGKQLNLKLLDNWDSVTSTFSKLREQLGPVTQEFWDNLEKETEGLRQEMSKDLEEVKAKVQPYLDDFQKKWQEEMELYRQKVEPLRAELQEGARQKLHELQEKLSPLGEEMRDRARAHVDALRTHLAPYSDELRQRLAARLEALKENGGARLAEYHAKATEHLSTLSEKA。

48、KPALEDLRQGLLPVLESFKVSFLSALEEYTKKLNTQSEQIDNO14，0123其中X可以是以下氨基酸序列中的任一个A，G，S，P，AP，GP，SP，PP，GSAPSEQIDNO15，GSGPSEQIDNO16，GSSPSEQIDNO17，GSPPSEQIDNO18，GGGSSEQIDNO19，GGGGSSEQIDNO20，GGGSGGGSSEQIDNO21，GGGGSGGGGSSEQIDNO22，GGGSGGGSGGGSSEQIDNO23，GGGGSGGGGSGGGGSSEQIDNO24，GGGSAPSEQIDNO25，GGGSGPSEQIDNO26，GGGSSPSEQI。

49、DNO27，GGGSPPSEQIDNO28，GGGGSAPSEQIDNO29，GGGGSGPSEQIDNO30，GGGGSSPSEQIDNO31，GGGGSPPSEQIDNO32，GGGSGGGSAPSEQIDNO33，GGGSGGGSGPSEQIDNO34，GGGSGGGSSPSEQIDNO35，GGGSGGGSPPSEQIDNO36，GGGSGGGSGGGSAPSEQIDNO37，GGGSGGGSGGGSGPSEQIDNO38，GGGSGGGSGGGSSPSEQIDNO39，GGGSGGGSGGGSPPSEQIDNO40，GGGGSAPSEQIDNO41，GGGGSGPSEQIDNO42，GGGGSSPSEQIDNO43，GGGGSPPSEQIDNO44，GGGGSGGGGSAPSEQIDNO45，GGGGSGGGGSGPSEQIDNO46，GGGGSGGGGSSPSEQIDNO47，GGGGSGGGGSPPSEQIDNO48，GGGGSGGGGSGGGGSAPSEQIDNO49，GGGGSGGGGSGGGGSGPSEQIDNO50，GGGGSGGGGSGGGGSSPSEQIDNO51，和GGGGSGGGGSGGG。

展开阅读全文