ImageVerifierCode 换一换
格式:PDF , 页数:43 ,大小:4.49MB ,
资源ID:8645501      下载积分:30 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zhuanlichaxun.net/d-8645501.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  
下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(癌症的突变标签.pdf)为本站会员(龙脉)主动上传,专利查询网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知专利查询网(发送邮件至2870692013@qq.com或直接QQ联系客服),我们立即给予删除!

癌症的突变标签.pdf

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201780027340.5 (22)申请日 2017.04.28 (30)优先权数据 1607629.1 2016.05.01 GB (85)PCT国际申请进入国家阶段日 2018.11.01 (86)PCT国际申请的申请数据 PCT/EP2017/060289 2017.04.28 (87)PCT国际申请的公布数据 WO2017/191073 EN 2017.11.09 (71)申请人 基因组研究有限公司 地址 英国剑桥郡 (72)发明人 S尼克-扎因M斯特拉顿 H戴维斯D格

2、洛德齐艾克 (74)专利代理机构 上海一平知识产权代理有限 公司 31266 代理人 华珊徐迅 (51)Int.Cl. C12Q 1/6886(2018.01) G16B 20/50(2019.01) (54)发明名称 癌症的突变标签 (57)摘要 本发明涉及癌症患者中许多突变标签的鉴 定。 所述突变标签包括新的碱基置换标签和重排 标签。 通过560例乳腺癌的全基因组测序以及将 新的和现有的数学方法应用于那些癌症中发现 的碱基置换和重排来鉴定标签。 权利要求书3页 说明书26页 附图13页 CN 109219666 A 2019.01.15 CN 109219666 A 1.一种预测患有癌症的

3、患者是否可能对PARP抑制剂或铂类药物有反应的方法, 其特征 在于, 所述方法包括: 确定来自所述患者的DNA样品中是否存在一个或多个重排标签1、 3和/ 或5, 其中重排标签1、 3和5在表1中定义, 如果重排目录中被确定为与一个或多个所述重排 标签各个或组合相关联的重排的数量或比例超过预定阈值, 则认为DNA样品显示所述重排 标签的存在, 其中如果样品中存在所述重排标签之一, 则患者可能对PARP抑制剂或铂类药 物有反应。 2.一种选择癌症患者用PARP抑制剂或铂类药物治疗的方法, 其特征在于, 所述方法包 括: 鉴定来自所述患者的DNA样品中是否存在一个或多个重排标签1、 3和/或5,

4、其中重排标 签1、 3和5在表1中定义, 如果重排目录中被确定为与一个或多个所述重排标签各个或组合 相关联的重排的数量或比例超过预定阈值, 则认为DNA样品显示所述重排标签的存在; 和如 果样品中存在所述重排标签之一, 则选择该患者用PARP抑制剂或铂类药物治疗。 3.PARP抑制剂或铂类药物用于患者癌症的治疗方法所述癌症具有一个或多个重排标 签1、 3和/或5, 其中重排标签1、 3和5在表1中定义, 如果重排目录中被确定为与一个或多个 所述重排标签各个或组合相关联的重排的数量或比例超过预定阈值, 则认为DNA样品显示 所述重排标签的存在。 4.一种治疗患者癌症的方法, 所述癌症被确定为具有

5、一个或多个重排标签1、 3和/或5, 其中重排标签1、 3和5在表1中定义, 如果重排目录中被确定为与一个或多个所述重排标签 各个或组合相关联的重排的数量或比例超过预定阈值, 则认为DNA样品显示所述重排标签 的存在, 所述方法包括步骤: 向所述患者施用PARP抑制剂或铂类药物。 5.一种PARP抑制剂或铂类药物用于患者癌症的治疗方法其特征在于, 所述方法包括: (i)确定来自患者的DNA样品中是否存在一个或多个重排标签1、 3和/或5, 其中重排标 签1、 3和5在表1中定义, 如果重排目录中被确定为与一个或多个所述重排标签各个或组合 相关联的重排的数量或比例超过预定阈值, 则认为DNA样品

6、显示所述重排标签的存在; 和 (ii)如果所述样品中存在所述重排标签之一, 则向患者施用PARP抑制剂或铂类药物。 6.一种确定来自患者的DNA样品中重排标签1至6中任何一个的存在的方法, 其特征在 于, 所述重排标签在表1中定义, 如果重排目录中被确定为与特定重排标签相关联的重排的 数量或比例超过预定阈值, 则认为DNA样品显示所述特定重排标签的存在。 7.如权利要求1、 2、 4或6中任一项所述的方法, 其特征在于, 确定样品中存在或不存在 重排标签的步骤包括以下步骤: 对所述样品中的体细胞突变进行编目以产生该样品的重排目录, 所述重排目录将样品 中鉴定的重排突变分类为多个类别; 和 通过

7、计算所述目录中的重排突变与重排突变标签之间的余弦相似性, 确定已知重排标 签对所述重排目录的贡献。 8.如权利要求7所述的方法, 其特征在于, 所述方法还包括以下步骤: 在所述确定步骤 之前, 筛选所述目录中的突变, 以去除以下一种或多种: 残留的种系突变、 拷贝数多态性和 已知的测序假象。 9.如权利要求8所述的方法, 其特征在于, 所述筛选使用已知种系多态性的列表。 10.如权利要求8所述的方法, 其特征在于, 所述筛选使用通过与DNA样品相同的过程测 序与正常人组织不匹配的BAM文件, 并去除至少两个所述BAM文件中的至少两个良好映射读 权利要求书 1/3 页 2 CN 10921966

8、6 A 2 数中存在的任何体细胞突变。 11.如权利要求7-10中任一项所述的方法, 其特征在于, 重排突变的分类包括将突变鉴 定为成簇或非成簇。 12.如权利要求11中所述的方法, 其特征在于, 如果突变的重排断点的平均密度为个体 患者样品的全基因组平均重排密度的至少10倍, 则可以将突变鉴定为成簇。 13.如权利要求7-12中任一项所述的方法, 其特征在于, 所述重排突变的分类包括将突 变鉴定为以下之一: 串联重复、 缺失、 倒位或易位。 14.如权利要求13所述的方法, 其特征在于, 所述重排突变的分类包括根据大小将鉴定 为串联重复、 缺失或倒位的突变分组。 15.如权利要求7-14中任

9、一项所述的方法, 其特征在于, 所述方法还包括步骤: 确定与 第i个已知突变标签相关的重排目录中的重排数量Ei, 其与在该样品的目录和之间 的余弦相似性成比例: 其中, 其中, 和是同等大小的向量, 其中非负分量分别是已知重排标签和重排目录, q是所述 多个已知突变标签中的标签数, 并且其中Ei进一步受到和要 求的限制。 16.如权利要求15所述的方法,其特征在于,所述确定重排数量的方法还进一步包括步 骤: 通过将与目录较不相关的标签中的一个或多个重排重新分配给与目录更相关的标签, 筛选确定要分配给各标签的重排的数量。 17.如权利要求16所述的方法, 其特征在于, 所述筛选步骤使用贪婪算法来

10、迭代地找到 另一种分配重排到标签的方法, 其改进或不改变目录和重建目录之间的余 弦相似性, 其中是通过移动突变从标签i到标签j得到的向量 的形式, 其中, 在每次迭代 中, 估测标签之间所有可能的移动的影响, 当所有这些可能的重新分配对余弦相似性产生 负面影响时, 筛选步骤终止。 18.一种检测DNA样品中突变标签26或突变标签30的方法, 其中突变标签26和30在表2 中定义, 所述方法包括以下步骤: 对所述样品中的体细胞突变进行编目以产生所述样品的 突变目录; 通过确定多个所述已知突变标签中每一个的标量因子确定包括突变标签26或突 变标签30的已知突变标签对所述突变目录的贡献, 其中所述突

11、变标签一起最小化一函数, 该函数表示所述目录中的突变与由所述标量因子缩放的所述多个已知突变标签的组合所 预期的突变之间的差异; 和如果对应于突变标签26或突变标签30的标量因子超过预定阈 权利要求书 2/3 页 3 CN 109219666 A 3 值, 则将所述样品分别鉴定为包含相应的突变标签26或突变标签30。 19.如权利要求18所述的方法,其特征在于,所述方法还包括以下步骤: 在所述确定步 骤之前, 筛选所述目录中的突变, 以去除残留的种系突变或已知的测序假象或两者。 20.如权利要求19所述的方法, 其特征在于, 所述筛选使用已知种系多态性的列表。 21.如权利要求19或20所述的方

12、法, 其特征在于, 所述筛选使用通过与DNA样品相同的 过程测序与正常人组织不匹配的BAM文件, 并去除至少两个所述BAM文件中的至少两个良好 映射读数中存在的任何体细胞突变。 22.如权利要求18-21任一项所述的方法, 其特征在于, 所述方法还包括步骤: 选择所述 多个已知突变标签作为所有已知突变标签的子集。 23.如权利要求22所述的方法, 其特征在于, 基于关于DNA样品的生物学知识或突变标 签或两者来选择突变标签的子集。 24.如权利要求18-23任一项所述的方法, 其特征在于, 所述确定步骤可以确定最小化 Frobenius范数的标量Ei: 其中, 和是同等大小的向量, 其中非负分

13、量分别是共有突变标签和突变目录, q是所述 多个已知突变标签中的标签数, 并且其中Ei进一步受到和要 求的限制。 权利要求书 3/3 页 4 CN 109219666 A 4 癌症的突变标签 发明领域 0001 本发明涉及癌症患者中许多突变标签的鉴定。 所述突变标签包括新的碱基置换标 签和重排标签。 这些突变标签可用于表征癌症并用于治疗的鉴定。 本发明还涉及一种用于 检测这些标签的方法。 0002 发明背景 0003 体细胞突变存在于人体的所有细胞中并且在整个生命中发生。 它们是多个突变过 程的结果, 包括DNA复制机制的内在轻微失真、 暴露到外源或内源性诱变剂、 DNA的酶法修饰 和缺陷性D

14、NA修复。 不同的突变过程产生突变类型的独特组合, 称为 “突变标签(Mutational Signatures)” 。 0004 在过去几年中, 大规模分析揭示了人类癌症类型范围中的许多突变标签。 0005 癌症的突变理论提出, DNA序列的变化, 称为 “驱动(driver)” 突变, 赋予细胞增殖 优势, 导致肿瘤克隆的生长1。 一些驱动突变在种系中遗传, 但在癌症患者的一生中大多 数出现在体细胞中, 同时还有许多与癌症发展无关的 “过客(passenger)” 突变1。 多个突 变过程, 包括暴露到内源性和外源性诱变剂、 异常DNA编辑、 复制错误和缺陷性DNA维持, 都 是造成这些突

15、变的原因10,12,13。 0006 在过去的五十年中, 几波技术推动了癌症基因组突变的表征。 核型分析显示重排 的染色体和拷贝数改变。 随后, 杂合性分析的丢失、 癌症来源的DNA与微阵列的杂交和其他 方法提供了对拷贝数变化的更高分辨率的见解14-18。 最近, DNA测序已经能够对突变类 型的完整库进行系统表征, 包括碱基置换、 小插入/缺失、 重排和拷贝数变化19-23, 从而 对突变的癌症基因和人类癌症中的突变过程产生实质性的见解。 0007 产生体细胞突变的突变过程在癌症基因组上印记了特定的突变模式, 称为标签 10,28,30。 以前应用数学方法28提取突变标签揭示了乳腺癌中的五个

16、碱基置换标签: 标签1、 2、 3、 8和135,10。 0008 BRCA1和/或BRCA2中种系失活突变导致早发性乳腺癌1,2、 卵巢癌2,3和胰腺 癌4的风险增加, 而这两个基因的体细胞突变和BRCA1启动子过度甲基化也与这些癌症类 型的发展有关5,6。 BRCA1和BRCA2参与无差错同源介导的双链断裂修复7。 因此, BRCA1 和BRCA2缺陷的癌症由于非同源末端连接机制的易错修复而显示出大量的重排和插入缺 失, 其承担双链断裂修复的责任8,9。 0009 而缺陷性双链断裂修复增加了细胞的突变负担, 从而增加了获得导致肿瘤性转化 的体细胞突变的机会, 当暴露于诸如铂类抗肿瘤药物时,

17、 它还使细胞更容易受到细胞周期 停滞和随后的细胞凋亡的影响10,11。 这种易感性已经成功地用于开发靶向和毒性小的 治疗策略, 用于治疗携带BRCA1和/或BRCA2突变的乳腺癌、 卵巢癌和胰腺癌, 特别是聚(ADP- 核糖)聚合酶(PARP)抑制剂10,11。 这些治疗引起大量DNA双链断裂, 迫使BRCA1和BRCA2功 能缺陷的肿瘤细胞发生凋亡, 因为它们缺乏有效修复双链断裂的能力。 相比之下, 正常细胞 基本上不受影响, 因为它们的修复机构没有受到损害。 说明书 1/26 页 5 CN 109219666 A 5 发明内容 0010 本发明人已经分析了560例乳腺癌的全基因组序列, 以

18、促进对产生体细胞突变的 突变过程的理解。 已知的突变标签分析28揭示了7个新的碱基置换标签(除了已知存在的 5个之外)。 其中, 五个先前已在其他癌症类型中检测到(标签5、 6、 17、 18和20), 而其中两个 是完全新的(标签26和30)。 0011 类似的数学原理扩展到基因组重排, 并且在560例乳腺癌中鉴定出六个全新的 “重 排标签” (表征特定重排突变的标签)。 0012 因此, 本发明的第一方面提供了检测DNA样品中重排标签1至6中任何一个或多个 的存在的方法。 0013 本文所述的结果表明重排标签3与BRCA1突变或启动子高甲基化密切相关, 因此表 现出这种标签的癌症可能受益于

19、铂疗法或PARP抑制剂。 0014 本文所述的结果表明重排标签1通常与TP53突变的三阴性乳腺癌相关, 显示出高 同源重组缺陷(HRD)指数。 因此, 表现出这种标签的癌症也可能受益于铂疗法或PARP抑制 剂。 0015 本文所述的结果表明重排标签5与BRCA1突变或启动子高甲基化和BRCA2突变的存 在密切相关。 因此, 表现出这种标签的癌症也可能受益于铂疗法或PARP抑制剂。 0016 因此, 本发明的另一方面提供了一种预测患有癌症的患者是否可能对PARP抑制剂 或铂类药物有反应的方法, 所述方法包括: 确定来自所述患者的DNA样品中是否存在一个或 多个重排标签1、 3和/或5, 其中重排

20、标签1、 3和5在表1中定义, 如果重排目录中被确定为与 所述重排标签之一相关联的重排的数量或比例超过预定阈值, 则认为DNA样品显示所述重 排标签的存在, 其中如果样品中存在所述重排标签之一, 则患者可能对PARP抑制剂或铂类 药物有反应。 0017 在这方面, 并且在涉及确定重排标签存在的本发明的所有其他方面中, 可以以多 种方式选择预定阈值。 特别地, 可以根据内容和期望的结果确定性来设置用于该确定的不 同阈值。 0018 在一些实施方案中, 所述阈值是重排的绝对数量, 所述重排来自DNA样品的重排目 录, 并被确定为与特定的重排标签相关联。 如果超过该数量, 则可以确定DNA样品中存在

21、特 定的重排标签。 0019 重排标签通常相对于彼此是 “相加的” (即肿瘤可能受与多于一个标签相关的潜在 突变过程的影响, 并且如果是这种情况, 来自该肿瘤的样品通常显示更高的重排总数(是与 每个潜在过程相关的单独重排的总和), 但随着重排的比例分布在存在的标签上)。 因此, 在 确定特定标签的存在或不存在时, 注意力可以集中在与样品中特定标签相关联的重排的绝 对数量(可以通过以下在本发明的其他方面中描述的方法计算)。 在样品中存在多个标签的 情况下, 这样的阈值通常更好。 0020 在这些实施例中, 如果至少5个并且优选地至少10)提供有用信息的重排与其相关 联, 则可以确定标签存在。 0

22、021 在其他实施例中, 阈值将样本中检测到的重排总数(可以设置以确保分析具有代 表性)和与特定标签相关的重排的比例结合(再次, 通过以下在本发明的其他方面中描述的 方法确定)。 说明书 2/26 页 6 CN 109219666 A 6 0022 例如, 确定标签存在的要求可以是存在至少20个、 优选地至少40个、 更优选地至少 50个提供有用信息的重排, 并且如果至少10、 优选至少20、 更优选至少30比例的重排 与其相关, 则可以认为存在该标签。 样品中存在的重排数量越高, 用于检测特定标签的比例 阈值可能越低。 0023 可以根据样本中发现的其他标签(构成了重排的重要部分)的数量调整

23、比例阈值 (例如, 如果4个标签各存在20-25的重排, 那么可以确定所有4个标签均存在, 而不是根本 没有标签), 即使在本实施例中确定的阈值是30。 0024 上述阈值基于从测序至30-40倍深度的基因组获得的数据。 如果数据是从在较低 覆盖度下测序的基因组获得, 则总体上检测到的重排数可能较低, 并且需要相应地调整阈 值。 0025 在本方面以及涉及确定重排标签1、 3或5中任何一个的存在的本发明其他方面, 所 使用的阈值可以组合应用于所有这些标签, 也可以单独应用于各标签。 0026 本发明的另一方面, 提供了一种选择癌症患者用PARP抑制剂或铂类药物治疗的方 法, 所述方法包括: 鉴

24、定来自所述患者的DNA样品中是否存在一个或多个重排标签1、 3和/或 5, 其中重排标签1、 3和5在表1中定义, 如果重排目录中被确定为与一个或多个所述重排标 签各个或组合相关联的重排的数量或比例超过预定阈值, 则认为DNA样品显示所述重排标 签的存在; 和如果样品中存在所述重排标签之一, 则选择该患者用PARP抑制剂或铂类药物 治疗。 0027 在另一方面, 本发明提供了PARP抑制剂或铂类药物用于患者癌症的治疗方法, 所 述癌症具有一个或多个重排标签1、 3和/或5, 其中重排标签1、 3和5在表1中定义, 如果重排 目录中被确定为与一个或多个所述重排标签各个或组合相关联的重排的数量或比

25、例超过 预定阈值, 则认为DNA样品显示所述重排标签的存在。 0028 在另一方面, 本发明提供了一种治疗患者癌症的方法, 所述癌症被确定为具有一 个或多个重排标签1、 3和/或5, 其中重排标签1、 3和5在表1中定义, 如果重排目录中被确定 为与一个或多个所述重排标签各个或组合相关联的重排的数量或比例超过预定阈值, 则认 为DNA样品显示所述重排标签的存在, 所述方法包括步骤: 向所述患者施用PARP抑制剂或铂 类药物。 0029 在另一方面, 本发明提供了PARP抑制剂或铂类药物用于患者癌症的治疗方法, 所 述方法包括: 0030 (i)确定来自所述患者的DNA样品中是否存在一个或多个重

26、排标签1、 3和/或5, 其 中重排标签1、 3和5在表1中定义, 如果重排目录中被确定为与一个或多个所述重排标签各 个或组合相关联的重排的数量或比例超过预定阈值, 则认为DNA样品显示所述重排标签的 存在; 和 0031 (ii)如果所述样品中存在所述重排标签之一, 则向患者施用PARP抑制剂或铂类药 物。 0032 上述方面的方法应解释为包括在DNA样品中单独存在重排标签1、 3或5中的任何一 个, 以及存在这些标签的任何组合。 0033 本文所述的结果表明重排标签2存在于大多数癌症中, 但特别富集在具有平和的 拷贝数谱的雌激素受体(ER)阳性癌症。 ER阳性的乳腺癌可能对激素治疗(例如他

27、莫昔芬)有 说明书 3/26 页 7 CN 109219666 A 7 响应, 因此特别富含重排标签2的乳腺癌可能对激素治疗有响应, 例如, 用他莫昔芬治疗。 0034 在特定实例中, 癌症是乳腺癌、 卵巢癌或胰腺癌。 0035 本发明的另一方面, 提供了一种确定来自患者的DNA样品中重排标签1至6中任何 一个的存在的方法, 其中所述重排标签在表1中定义, 如果重排目录中被确定为与特定重排 标签相关联的重排的数量或比例超过预定阈值, 则认为DNA样品显示所述特定重排标签的 存在。 0036 在本发明的任何上述方面和实施例中, 确定或鉴定任何重排标签的存在或不存在 的步骤可以如在与本申请同日提交

28、的共同未决申请(申请号PCT/EP2017/060279)中所述, 其内容通过引用并入本文。 更具体地, 确定或鉴定重排标签的存在或不存在的步骤可包括: 通过计算所述目录中的重排突变与已知的重排突变标签之间的余弦相似性, 确定已知重排 标签对DNA样品重排目录的贡献。 0037 优选地, 所述方法还包括以下步骤: 在所述确定步骤之前, 筛选所述目录中的突 变, 以去除残留的种系结构变异或已知的测序假象(artefacts)或两者。 这种筛选可以非常 有利于从所述目录中去除已知由体细胞突变以外的机制产生, 并且因此可能遮盖或模糊重 排标签的贡献或者导致假阳性结果的重排。 0038 例如, 所述筛

29、选可以使用已知种系重排或拷贝数多态性的列表, 并在确定重排标 签的贡献之前去除目录中那些多态性导致的体细胞突变。 0039 作为另一个例子, 所述筛选可以使用通过与DNA样品相同的过程测序与正常人组 织不匹配的BAM文件, 并去除至少两个所述BAM文件中的至少两个良好映射读数(mapping reads)中存在的任何体细胞突变。 这种方法可以去除由用于获得样品的测序技术产生的假 象。 0040 重排突变的分类可以包括将突变鉴定为成簇(clustered)或非成簇(non- clustered)。 这可以通过分段常数拟合( “PCF” )算法来确定, 该算法是序列数据的分段方 法。 在特定实施方

30、案中, 如果片段内的重排断点的平均密度是大于个体患者样品的全基因 组平均重排密度的某个因子, 则可以将重排鉴定为成簇。 例如, 所述因子可以是至少8倍, 优 选至少9倍, 并且在特定实施例中是10倍。 重排间距离是从一个重排断点到参照基因组中紧 接在该重排断点之前的另一个重排断点的距离。 这种测量是已知的。 0041 重排突变的分类可以包括将重排鉴定为以下之一: 串联重复、 缺失、 倒位或易位。 这种重排突变的分类是已知的。 0042 所述重排突变的分类可以进一步包括通过大小将鉴定为串联重复、 缺失或倒位的 突变分组。 例如, 可以通过重排中的碱基数将突变分组为多个大小组。 优选地, 大小组是

31、以 对数为基础的, 例如1-10kb、 10-100kb、 100kb-1Mb、 1Mb-10Mb和大于10Mb。 易位不能按大小 分类。 0043在特定的实施方案中, 在每个DNA样品中, 与第i个突变标签相关的重排数量Ei被 确定为与该样品的目录和之间的余弦相似性成比例: 0044 0045 其中, 说明书 4/26 页 8 CN 109219666 A 8 0046 0047其中, 和是同等大小的向量, 其中非负分量(nonnegative components)分别 是已知的重排标签和突变目录, q是所述多个已知重排标签中的标签数。 0048 所述方法可以进一步包括步骤: 通过将一个或

32、多个重排从与目录较不相关的标签 中重新分配给与目录更相关的标签, 筛选确定要分配给各标签的重排的数量。 这种筛选可 以用于将重排从仅具有与其相关联的少量重排的标签(并且因此可能不存在)重新分配到 具有与其相关联的更多重排的标签。 这可以减少分配过程中的 “噪音” 。 0049 在一个实施例中, 筛选步骤使用贪婪算法来迭代地找到另一种分配重排到标签的 方法, 其改进或不改变目录和重建目录之间的余弦相似性, 其中是通过 移动突变从标签i到标签j得到的向量的形式(version), 其中, 在每次迭代中, 估测标签 之间所有可能的移动的影响, 当所有这些可能的重新分配对余弦相似性产生负面影响时, 筛

33、选步骤终止。 0050 在另一方面, 本发明提供了检测DNA样品中突变标签26或突变标签30的方法, 其中 突变标签26和30在表2中定义, 所述方法包括以下步骤: 对所述样品中的体细胞突变进行编 目以产生所述样品的突变目录; 通过确定多个所述已知突变标签中每一个的标量因子 (scalar factors)确定已知突变标签(包括突变标签26或突变标签30)对所述突变目录的 贡献, 其中所述突变标签一起最小化一函数, 该函数表示所述目录中的突变与由所述标量 因子缩放的(scaled)所述多个已知突变标签的组合中所预期的突变之间的差异; 和如果对 应于突变标签26或突变标签30的标量因子超过预定阈

34、值, 则将所述样品分别鉴定为包含相 应的突变标签26或突变标签30。 0051 优选地, 本方面所述方法还包括以下步骤: 在所述确定步骤之前, 筛选所述目录中 的突变, 以去除残留的种系突变或已知的测序假象或两者。 这种筛选可以非常有利于从所 述目录中去除已知由体细胞突变以外的机制产生, 并且因此可能遮盖或模糊突变标签的贡 献或者导致假阳性结果的突变。 0052 例如, 所述筛选可以使用已知种系多态性的列表, 并在确定突变标签的贡献之前 去除目录中那些多态性导致的体细胞突变。 0053 作为另一个例子, 所述筛选可以使用通过与DNA样品相同的过程测序与正常人组 织不匹配的BAM文件, 并去除至

35、少两个所述BAM文件中的至少两个良好映射读数中存在的任 何体细胞突变。 所述方法可以去除由用于获得样品的测序技术产生的假象。 0054 所述方法还可以包括步骤: 选择所述多个已知突变标签作为所有已知突变标签的 子集。 通过选择子集, 例如, 基于关于样品的先前知识, 减少有助于突变目录的可能标签的 数量, 这可能增加确定步骤的准确性。 0055 例如, 可以基于关于DNA样品的生物学知识或突变标签或两者, 来选择突变标签的 子集。 因此, 可能立即显而易见的是, 由于DNA样品的特征和特定的突变标签, 某些DNA样品 可能不会由特定的突变标签产生。 在以下实施例中更详细地描述了其他可能性。 0

36、056 在特定实施例中, 所述确定步骤可以确定最小化Frobenius范数的标量Ei: 说明书 5/26 页 9 CN 109219666 A 9 0057 0058其中, 和是同等大小的向量, 其中非负分量分别是共有突变标签和突变目 录, q是所述多个已知突变标签中的标签数, 并且其中Ei进一步受到和 的要求的限制。 0059 附图和表的简要说明 0060 图1汇总了发明人研究的560个乳腺癌基因组群。 0061 图2是显示七个主要亚组的图, 其显示出与其他基因组、 组织学或基因表达特征的 不同关联, 以及从数据中提取的六个重排标签。 0062 图3是所研究的基因组群的进一步汇总; 0063

37、 图4显示了群中鉴定的碱基置换标签; 0064 图5显示了群中鉴定的重排标签; 0065 图6显示了基于所鉴定的重排标签, 成簇的临床相关性; 0066 图7显示断点特征, 其中 “钝(blunt)” 左边的柱形是非模板序列, 标记为 “钝” 的柱 形是钝端连接,“钝” 右边的柱形是微同源; 和 0067 图8是显示出根据本发明的实施方式确定重排标签的存在的方法中的概要步骤的 流程图。 0068 表1显示了许多重排标签的定量定义; 和 0069 表2显示了碱基置换标签26和30的定量定义。 具体实施方式 0070 本发明基于以下发现: 癌症患者子集具有特定的突变或重排标签。 所述重排标签 在下

38、面更详细地定义, 并在表1中定量地列出。 所述突变(或 “碱基置换” )标签在表2中定量 列出。 0071 如下面进一步确认的, 一些重排标签(标签1、 3和5)与通过同源重组和/或缺乏 BRCA1/2缺陷的双链断裂修复失败相关, 因此, 具有一种或多种这些重排标签的癌症患者可 能受益于铂疗法或用PARP抑制剂治疗。 0072 因此, 本发明尤其涉及一种预测癌症患者是否可能对PARP抑制剂或铂类药物有响 应的方法, 或涉及一种基于来自所述患者的DNA样品中一个或多个重排标签1、 3或5的存在 或不存在, 选择癌症患者用PARP抑制剂或铂类药物治疗的方法。 0073 应注意, 如本文所使用, 短

39、语 “一个或多个重排标签1、 3或5的存在” 尤其包括这些 标签中的任何一个的存在, 以及这些标签的任何组合的存在。 特别地, 它包括所有三个这些 标签的存在, 即使由于所有这些标签的存在, DNA样品中被确定与这些标签中任何一个相关 联的重排比例低于被认为适合于达到确定存在特定标签的比例。 0074 患者优选是人类患者。 0075 具有重排标签1、 3和/或5的癌症患者可能通过同源重组DNA双链修复失败, 并且易 说明书 6/26 页 10 CN 109219666 A 10 受引起双链断裂的药物的影响, 例如, PARP抑制剂或铂类药物。 0076 聚ADP核糖聚合酶(PARP1)是一种对

40、修复单链断裂(也称为 “缺口” )很重要的蛋白 质。 如果这些缺口在DNA复制之前仍未修复, 则复制本身可导致形成大量双链断裂。 抑制 PARP1的药物会导致大量双链断裂。 在不能通过无差错同源重组修复双链DNA断裂的肿瘤 中, PARP1的抑制导致不能修复这些双链断裂并导致肿瘤细胞死亡。 用于本发明的PARP抑制 剂优选是PARP1抑制剂。 PARP抑制剂的实例包括: 依尼帕尼(Iniparib)、 他拉唑帕尼 (Talazoparib)、 奥拉帕尼(Olaparib)、 芦卡帕尼(Rucaparib)和维利帕尼(Veliparib)。 0077 铂类抗肿瘤药物是用于治疗癌症的化学治疗剂。

41、它们是铂的配位络合物, 其引起 DNA作为单加合物交联、 链间交联、 链内交联或DNA蛋白交联。 它们主要作用于相邻的鸟嘌呤 N-7位, 形成1,2链内交联。 所得的交联抑制癌细胞中的DNA修复和/或DNA合成。 一些常用的 铂类抗肿瘤药物包括: 顺铂、 卡铂、 奥沙利铂(oxaliplatin)、 赛特铂(satraplatin)、 吡铂、 奈达铂、 三铂(Triplatin)和利波铂(Lipoplatin)。 0078 确定来自患者的DNA样品中重排标签1、 3和/或5的存在或不存在。 优选地, 这些是 全基因组样品, 并且可以通过全基因组测序确定重排标签的存在或不存在。 所述DNA样品可

42、 以是全外显子组样品, 并且可以通过全外显子组测序确定重排标签的存在或不存在。 外显 子组测序是一种测序基因组中所有蛋白质编码基因(称为外显子组)的技术。 它包括首先仅 选择编码蛋白质的DNA子集(称为外显子), 然后使用任何高通量DNA测序技术对该DNA进行 测序。 有180,000个外显子, 约占人类基因组的1, 或约3千万个碱基对。 0079 所述DNA样品优选来自患者的肿瘤和正常组织, 例如, 来自患者的血液样品和通过 活组织检查获得的肿瘤组织。 通过将其基因组序列与正常组织之一进行比较, 标准地检测 肿瘤样品中的体细胞突变。 0080 本发明还涉及在具有一个或多个重排标签1、 3和/

43、或5的患者中用PARP抑制剂或铂 类药物治疗癌症。 0081 例如, 所述PARP抑制剂或铂类药物可用于患者癌症的治疗方法, 所述癌症具有一 个或多个重排标签1、 3和/或5。 在治疗之前, 所述方法可以包括步骤: 确定在来自所述患者 的DNA样品中是否存在这些重排标签中的一个或多个。 优选地, 这些是全基因组样品, 并且 可以通过全基因组测序确定重排标签的存在或不存在。 所述DNA样品可以是全外显子组样 品, 并且可以通过全外显子组测序确定重排标签的存在或不存在。 0082 所述DNA样品优选来自患者的肿瘤和正常组织, 例如, 来自患者的血液样品和通过 活组织检查获得的肿瘤组织。 通过将其基

44、因组序列与正常组织之一进行比较, 标准地检测 肿瘤样品中的体细胞突变。 0083 所述治疗方法还包括步骤: 将PARP抑制剂或铂类药物施用于具有一个或多个重排 标签1、 3和/或5的癌症患者。 可以使用任何合适的施用途径。 0084 待治疗的患者优选是人类患者。 0085 本发明还涉及检测来自受试者的DNA样品中重排标签1-6或突变标签26和30中任 何一个的方法。 所述方法适用于任何受试者, 包括患有乳腺癌、 卵巢癌、 胰腺癌或胃癌的受 试者。 这些方法的进一步细节如下。 0086 鉴定与癌症相关的重排标签 0087 对来自每个个体(556名女性和4名男性)的560个乳腺癌和非肿瘤组织的全基

45、因组 说明书 7/26 页 11 CN 109219666 A 11 进行测序(图1A)。 检测到3,479,652个体细胞碱基置换, 371,993个小插入缺失和77,695个 重排, 各个样品之间的数量差异很大(图1B)。 从病例子集获得转录组序列、 microRNA表达、 基于阵列的拷贝数和DNA甲基化数据。 0088 为了能够研究重排突变过程的标签, 采用了重排分类, 包括32个子类。 0089 在许多癌症基因组中, 大量重排区域性成簇, 例如在基因扩增区域中。 因此, 重排 首先被分类为以成簇或分散的形式, 进一步细分为缺失、 倒位和串联重复, 然后根据重排区 段的大小。 两组中的最

46、终类别是染色体间易位。 0090 应用用于碱基置换标签5,10,28的数学框架提取了六个重排标签。 基于各乳腺 癌中每个标签的重排比例的无监督层次成簇产生了七个主要亚组, 其显示出与其他基因 组、 组织学或基因表达特征的不同关联, 如图2所示。 0091 重排标签1(所有重排的9)和重排标签3(18重排)主要的特征是串联重复。 与 重排标签1相关的串联重复大多数100kb, 而与重排标签3相关的串联重复10kb。 超过95 的重排标签3串联重复集中在15的癌症中(图2, 簇D), 其中许多具有数百种此类重排。 具 有BRCA1突变或启动子高甲基化的几乎所有癌症(91)都在该组中, 该组富含基底

47、样、 三阴 性癌和高同源重组缺陷(HRD)指数的拷贝数分类31-33。 因此, BRCA1而非BRCA2的失活可 能是重排标签3小串联重复突变体表型的原因。 0092 因此, 重排标签3的存在或不存在, 特别地但非排他地, 与重排标签1和5的存在或 不存在相比, 可以用于区分具有BRCA1而非BRCA2失活的癌症。 0093 在仅8.5的乳腺癌中发现超过35的重排标签1串联重复, 有些病例有数百例 (图2, 簇F)。 这种大串联重复突变体表型的原因尚不清楚。 相对晚期诊断, 表现出它的癌症 通常是TP53突变的三阴性乳腺癌, 显示碱基置换标签3富集和高同源重组缺陷(HRD)指数 (图2), 但

48、没有BRCA1/2突变或BRCA1启动子高甲基化。 0094 重排标签1和3串联重复通常均匀地分布在基因组上。 然而, 有9个位置在乳腺癌中 发现串联重复的重现, 并且在个别病例中经常显示多个嵌套的串联重复。 这些可能是特定 于这些串联重复突变过程的突变热点, 尽管我们不能排除它们代表驱动事件的可能性。 0095 重排标签5(占14重排)的特征是缺失100kb)、 倒位和染色体间易位, 在 大多数癌症中存在, 但特别富集在具有平和拷贝数谱的ER阳性癌症中(图2, 簇E, GISTIC簇 3)。 重排标签4(占重排的18)的特征是成簇的染色体间易位, 而重排标签6(重排的19) 的特征是成簇的倒

49、位和缺失(图2, 簇A、 B和C)。 0097 在大多数重排中发现了末端连接修复的替代方法特有的重叠微同源的短片段(1- 5bp)10,24。 重排标签2、 4和6的特征是微同源在1bp处的峰, 而与同源重组DNA修复缺陷相 关的重排标签1、 3和5在2bp处显示峰(图8)。 因此, 不同的末端连接机制可以用不同的重排 过程操作。 一部分乳腺癌显示重排标签5缺失, 其中较长(10bp)微观同源性涉及来自短散 布核元件(SINE)的序列, 最常见的是AluS(63)和AluY(15)家族重复序列(图8)。 非模板 化序列的长片段(超过10bp)在成簇重排中特别丰富。 0098 方法 0099 样品选择 说明书 8/26 页 12 CN 109219666 A 12 0100 从560个乳腺癌和正常组织(外周血淋巴细胞、 邻近正常乳房组织或皮肤)中提取 DNA。 对样品进行病理学检查, 并且仅被评估为由70肿瘤细胞组成的样品被包括在本研 究中。 0101 大规模平行测序和比对 0102 构建短插入片段500bp基因组文库, 制备流动池(flowcell)并根据依诺米那 (Illumina)文库方法产生测序簇34。 根据依诺米那基因组分析仪操作手册, 在依诺米那 GAIIx, Hiseq 2000或Hiseq 2500基因组分析仪上进行108碱基/

copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1