评估结肠直肠癌.pdf

上传人:00062****4422 文档编号:8842145 上传时间:2021-01-07 格式:PDF 页数:72 大小:751.75KB
返回 下载 相关 举报
摘要
申请专利号:

CN200910148967.3

申请日:

20030329

公开号:

CN101603092B

公开日:

20121107

当前法律状态:

有效性:

失效

法律详情:

IPC分类号:

C12Q1/68

主分类号:

C12Q1/68

申请人:

奥索临床诊断有限公司

发明人:

Y·王

地址:

美国纽约州

优先权:

60/368798

专利代理机构:

中国专利代理(香港)有限公司

代理人:

梁谋;黄可峻

PDF下载: PDF下载
内容摘要

通过分析一组基因的表达对相信患有结肠直肠癌的患者的结肠直肠癌存在与否或其可能状态进行评估的方法。本发明还涉及多种媒介物,如微阵列中基因表达分布图,也包括含有基因表达分布图的试剂盒。

权利要求书

1.包括Seq.ID.No.46-49的基因组合在制备用于评估结肠直肠癌状况方法的试剂中的应用,所述方法包括鉴定每个基因相对于正常种群的相同基因的表达的差异调节。 2.权利要求1的应用,其中被调节的基因表达存在至少2倍差异。 3.权利要求1的应用,其中表示差异调节的p值低于0.05。 4.权利要求1的应用,进一步包括使用非遗传基础的结肠直肠癌诊断方法。 5.权利要求4的应用,其中在非遗传基础的结肠直肠癌诊断方法中使用的非遗传基础的癌症标记选自癌胚性抗原、CA19-9、CA125、CK-BB和鸟苷酸环化酶C。 6.一种诊断框架,包括Seq.ID.No.46-49的基因组合的分离的核酸序列或其互补序列。 7.权利要求6的诊断框架,其位于适合鉴定包含于其上的基因的差异表达的基片上。 8.权利要求7的诊断框架,其中所述的基片用于微阵列。 9.权利要求8的诊断框架,其中所述的微阵列是cDNA微阵列。 10.权利要求8的诊断框架,其中所述的微阵列是寡核苷酸微阵列。 11.一种用于诊断结肠直肠癌的试剂盒,其包含包括Seq.ID.No.46-49的基因组合的分离的核酸序列或其互补序列。 12.权利要求11的试剂盒,进一步包括进行微阵列分析的试剂。 13.权利要求11的试剂盒,进一步包括媒介物,所述的核酸序列或其互补序列通过该媒介物进行检测。 14.包括Seq.ID.No.46-49的基因组合在制备用于评估结肠直肠癌疗效方法的试剂中的应用,所述方法包括鉴定每个基因相对于正常种群的相同基因的表达的差异调节。 15.权利要求14的应用,其中对疗效的评估包括确定患者是否好转,非好转,复发,可能好转或可能复发。 16.评估结肠直肠癌状况的制品,其包含包括Seq.ID.No.46-49的基因组合中的分离的核酸序列或其互补序列。 17.评估结肠直肠癌状况的制品,其包含包括Seq.ID.No.46-49的基因组合的分离的核酸序列或其互补序列的表示物。

说明书

本申请是以下申请的分案申请:申请日:2003年3月29日;申请号: 03131205.5;发明名称:同上。

背景

本申请要求2002年3月29日申请的序列号为60/368,798的美国临时申请 的利益。

本发明涉及基于生物样本基因表达分布图的结肠直肠癌的诊断和预测。

结肠直肠癌是一种异源疾病,由据认为是通过三种主要分子机制形成的肿 瘤组成:1)与染色体不稳定性相结合的多发性结肠腺癌(APC)基因,或β- 连环蛋白基因的突变,2)与微卫星序列不稳定性相关的DNA错配修复基因如 MLH1,MSH2,PMS2和MSH6的突变,和包含短重复序列基因的突变,以及3) 由肿瘤抑制基因启动子区的过甲基化诱导的基因沉默。结肠直肠癌个体的遗传 互补可能包括遗传不稳定性、特异突变和基因沉默的不同结合。染色体不稳定 性(CIN)一般是癌症的普遍特征。它意味着其中所有的或大部分的染色体丢失 或增加了的非整倍体表型。伴随短重复序列突变率的增加,在二倍体肿瘤中发 现了微粒体不稳定性(MIN)。这两种遗传不稳定性的形式在结肠直肠癌中很普 遍。

因此结肠直肠癌具有复杂的起源并且包括不同生物通路间大量的相互作 用。用于协助提供诊断、预测或治疗监测结果的血清标记、组织学和细胞学检 查通常不具有所期望的可信度。同时,使用单独的遗传标记(例如一特殊基因 的表达增加)可能是有益的,癌症的多样性使遗传标记的组合可能成为最好的 途径。

发明概述

本发明是评估结肠直肠癌存在或不存在,或者被认为患有结肠直肠癌的患 者其可能状态的方法。在本方法中,通过分析患者样本的基因表达分布图确定 患者是否得了结肠直肠癌,患者是否未得结肠直肠癌,患者是否可能要得结肠 直肠癌,或正在接受治疗的结肠直肠癌患者对治疗的反应。

本发明的一个方面涉及用于实施该方法的制品。这样的制品包括基因表达 分布图或固定于机器可读媒介如计算机可读媒介的基因表达分布图的表现物。

用来鉴别基因表达分布图的制品也可以包括用于捕捉和/或显示基因表达 存在与否,或表达程度的基片或平面,如微阵列。

发明详述

很少发现组织样本中单纯的特定核苷酸序列的存在或缺失具有诊断或预 测价值。另一方面,关于多种蛋白、肽或mRNA表达的信息正越来越受到重视。 具有表达蛋白、肽或mRNA的潜在可能的特定核苷酸序列(这样的序列称为“基 因”)仅在给定细胞的基因组中存在这一事实本身,并不能确定该蛋白、肽或 mRNA是否会在给定的细胞中表达。能表达蛋白、肽或mRNA的给定基因是否 表达以及表达到何种程度取决于多种复合因子。不考虑理解和评估这些因子的 困难程度,检测基因表达可以为如肿瘤发生、转移、细胞凋亡以及其他临床有 关现象等重要事件的发生提供有用的信息。通过基因表达分布图可以发现基因 激活或失活程度的相对指标。本发明的基因表达分布图可用于结肠直肠癌患者 的诊断和治疗。

样品制备需要收集患者样本。本发明使用的病例样本是那些疑为含有患病 细胞的样本,如取自结肠样本或外科切除样本的上皮细胞。获得可疑样本的一 种有用技术是激光捕捉微切片技术(LCM)。激光捕捉微切片技术提供了一种选 择需研究细胞的方法,并最小化由细胞种类的不均一性造成的易变性。因此, 正常细胞和癌细胞之间的基因表达中度或细小的变化都可以被轻易检测到。在 优选的方法中,样本包括从外周血中提取的循环上皮细胞。这可以按照多种方 法获得,但最优选的方法是Immunivest公司的美国专利6,136,182所描述的磁性 分离技术,该专利在此引入作为参考。一旦得到含有所关注细胞的样本,就提 取其RNA,扩增,并获得基因表达分布图,优选的通过微阵列获得合适框架 (portfolio)中基因的表达分布图。

确立基因表达分布图的优选方法包括,确定一个能够编码蛋白质或肽的基 因所产生的RNA的量。这可通过逆转录酶PCR(RT-PCR),竞争性RT-PCR, 实时RT-PCR,差异显示RT-PCR,Northern杂交分析和其他相关实验实现。尽 管可能用单个PCR反应实施这些技术,但最好扩增来自mRNA的互补DNA (cDNA)或互补RNA(cRNA)并用微阵列对其分析。对本领域的技术人员来 说大量不同的阵列构型及其生产方法是已知的,并且也在如下的美国专利中有 描述:5,445,934;5,532,128;5,556,752;5,242,974;5,384,261;5,405,783;5,412,087; 5,424,186;5,429,807;5,436,327;5,472,672;5,527,681;5,529,756;5,545,531; 5,554,501;5,561,071;5,571,639;5,593,839;5,599,695;5,624,711;5,658,734;和 5,700,637;这些专利披露的技术在此引入作为参考。

微阵列技术允许同时检测数千基因的稳定状态的mRNA水平,因此它为 检测非控制的细胞增殖效果,如启动、抑制或调节等提供了一个强有力的工具。 现在两种微阵列技术正被广泛使用。第一种是cDNA阵列,第二种是寡核苷酸 阵列。尽管这些芯片在构造上存在差异,但其下游数据的分析和输出实质上是 相同的。这些分析的结果典型地是对由标记探针获得的信号强度的测定,所述 的探针用于检测与阵列上已知位点的核酸序列杂交的、来自样品的cDNA序列。 典型地,所述的信号强度与cDNA的含量,或者说样本细胞中所表达的mRNA 的量成比例。有许多这样的技术可以获得并且是有用的。优选的检测基因表达 的方法可以在美国专利中找到,如Linsley等人的专利6,271002;Friend等人的专 利6,218,122;Peck等人的专利6,218,114;Wang等人的专利6,004,755,其所公开 的内容均在此引入作为参考。

基因表达水平的分析通过比较强度进行。最好是通过制备一种待测样品中 基因表达强度相对于对照样品中基因表达强度的比值矩阵进行。例如,可以将 疾病组织中基因表达的强度与相同类型正常组织中的表达强度进行比较(例如 患病的结肠组织样本对正常的结肠组织样本)。这个表达强度的比值显示出被测 样本和对照样本中基因表达的倍数变化。

基因表达分布图也可以通过很多方法显示。最普遍的方法是将原始的荧光 强度或矩阵系数处理成树状图,其中列表示被测样品,行表示基因。数据经这 样的处理后那些具有相似表达分布的基因就会相互邻近。每个基因的表达比率 可用一种颜色显示。例如,小于一的比率(表示下调)可以出现在图谱的蓝色 部分,而大于一的比率(表示上调)可以出现在图谱的红色部分。商业上可购 买到的计算机软件程序很适合显示这样的数据,包括Silicon Genetics有限公司 的“GENESPRING”,Partek有限公司的“DISCOVERY”和“INFER”软件。

用于本发明的方法的受调节基因如表1所示。差异表达的基因表现为在患 病细胞中上调或下调。上调和下调是相对的术语,表示可检测到的相对于某种 基线的基因表达的量的差异(超出检测系统的噪音影响)。在这种情况中,基线 是正常细胞测得的基因表达。再使用同样的测量方法确定患病细胞中所关注的 基因相对于基线水平是上调或下调。上下文中,患病的,是指伴随细胞非控制 增殖而出现的机体状态的改变,此种改变中断、扰乱或潜在的打乱机体功能的 适当表现。当某人基因型或表型的一些方面一致表现出存在特定疾病时,他就 被诊断为患有该种疾病。然而,作出诊断或预测的行为包括确定疾病表象/状态 的情况,如治疗监测。在治疗监测中,比较经过一段时间治疗后的基因表达确 定基因表达分布图是否有变化,或其变化与正常组织的模式更为一致来考虑疗 程的效果从而作出临床判定。

优选的,上升或下降调节的水平是以杂交的微阵列探针测量强度的成倍变 化来区别的。2倍差异或p值小于0.5对于作出这样的辨别是优选的。即当认为 与在正常细胞中相比一个基因在患病细胞中差异表达时,患病细胞中的强度至 少是正常细胞的2倍或1/2。倍数差异越大,该基因就越优选用作诊断。本发明 选择用作分析表达分布图的基因具有产生使该基因区别于正常基因或非调节基 因的信号的表达水平,该信号量超出使用临床实验室检测设备的背景量。

利用统计值可用于确定地使调节基因与非调节基因和噪音区别开。通过统 计检验发现在不同样本组之间有最显著差异的基因。Student’s T检验就是一个发 现两组之间显著差异的有力的统计检验的例子。p值越小,不同组之间基因显示 差异的证据就越有说服力。然而既然微阵列可以同时检测多个基因,那么就需 要同时进行万次的统计检验。因此,就存在偶尔看到极小p值的可能,可以利 用Sidak校正以及随机化/排列实验进行调整。T检验中p值小于.05就证明基因 是差异显著的。更有说服力的证据是加入Sidak校正因子后p值小于.05。对于 每组中的大量样品,经过随机化/排列检验后p值小于.05是差异显著的最有说服 力的证据。

另一个可用来选择产生强于非调节基因和噪音信号的基因的参数是绝对 信号差异测量值。优选的,调节基因的表达形成的信号与正常基因或非调节基 因(以绝对值为基础)至少有20%的差异。更优选的,调节基因形成的表达模 式与正常基因或非调节基因至少有30%的差异。

将基因分组以便于通过获得一组基因中一套基因的信息为诊断、预测或治 疗选择等相关临床判断提供可靠的基础。这些套基因构成了本发明的框架 (portfolios)。此例中,由该框架支持的判断包括结肠直肠癌。基因表达分布图 的框架包含实施例3中描述的基因联合组合。对于大多数诊断标记物来说,最 好使用尽量少的标记物就足以充分作出一个正确的医学判断。这就避免了使用 那些悬而未决需作进一步分析的治疗措施带来的延误,同时又避免了时间和资 源的不合理使用。此例中,这样的最小量的框架包含实施例4中的基因组合。

优选的,构建这样的框架以保证该框架中的基因组合相对于单个基因或随 机选择的基因组合显示出更好的灵敏度和特异性。在本发明中,框架的灵敏度 反映在一个基因在疾病状态下相对于其在正常状态下所表现出的基因表达的成 倍差异中。特异性可以反映在基因表达信号与所关注疾病相关性的统计测量中。 例如,标准差就是这样一个有用的度量。当考虑将一组基因掺入到某一框架中 时,表达测量值的标准差越小其特异性越大。其他检测变量,如相关系数也包 括在使用范围内。

最优选地,建立基因表达框架的方法是运用优化算法,如在确定股票投资 中广泛使用的平均方差算法的。这一方法在同日期的Tim Jatkoe等人标题为“投 资组合选择(Portfolio Selection)”的同时待审的专利申请中有详细表述。该方 法实质上要求一套输入值(金融应用中的股票,这里指通过强度测定的表达), 其可优化收到的回报率(例如形成的信号)以进行应用,同时最小化回报率的 可变性。许多商业软件程序适合进行这样的操作。在整个说明书中称为“Wagner 软件”的“Wagner联合均值-方差优化应用程序”是优选的。这个软件使用 “Wagner联合均值-方差优化库”中的功能,来确定有效边界,优选Markowitz 意义上的优化框架。

由于该软件用于金融分析目的,因此使用这种类型的软件需要将微阵列数 据进行转换,使数据以股票回报值和风险测量值的方式输入处理。例如,当 Wagner软件与微阵列强度测定协同应用时,要运用以下的数据转换方法。

首先通过确定那些其表达至少显示出某种微小差异水平的基因,对基因进 行预选择。优选的预选择过程如下所述。选择一个基线组。典型的基线组包含 来自未患有所述疾病的群体的基因。例如,在选择所用于诊断乳腺癌的基因框 架时,可以将未患乳腺癌患者的样本用作制备基线组。一旦选择了基线组,就 可以计算出基线组样本中每个基因的表达指标的算术平均值和标准差。典型的, 这个指标是微阵列记录的荧光强度。随后将通过计算得到的统计学数据用于计 算每个基因的基线值(X*标准差+均值)。这就是基因的基线记录,其它所有样 本都要与其相比较。X是由制定框架的人选择出来的严格变量。X的数值越大 就越严格。优选的X数值范围是0.5-3,更优选的是2-3,最优选的是3。

随后计算每个实验样本(那些表现出所关注疾病的样本)与基线记录的比 值。再将这些比值转换成易于软件进行数据处理的底数为10的对数值。该方法 使下调基因显示为负值,这是使用Wagner软件并按照Markman均值-方差算法 进行优化所必需的。

将包含这些转换比值的预处理数据作为输入,替代用于金融分析目的的 Wagner软件中通常使用的资产回报值。

一旦制定出有效边界,对于一个给定的输入水平值(回报率)或对应于边 界上的一个点的方差,就可以选择出一个优化框架。这些输入值或方差是制定 框架的人预先确定的标准数集。换句话说,寻求最适框架的人决定一个可接受 的输入水平(表明灵敏度)或者一个给定的方差水平(表明特异性),选择位于 该输入水平或方差相应的有效边界的基因。当选定了输入水平或方差,Wagner 软件就能够选择出这样的基因。Wagner软件可以像对股票投资组合中每支股票 所做的那样,分配所述框架中每个基因一个权重。

将患者样本框架中的基因的表达,与用于构建所述框架的差异表达基因的 计算值相比较,就可以确定该样本是否患有该框架所诊断的疾病。优选的,首 先通过将在选择框架的过程中给每个基因分配的权重乘以框架中每个基因的强 度值,加和得到框架值。然后用(基线组中框架的Y*标准差+均值)计算边界 值,其中Y是一个严格数值,具有与上述X相同的含义。一个样本具有的框架 值大于基线组的框架值,则此样本就被归为患有该病。需要时,可以根据提高 可信度水平的已知统计学方法重复上述过程。

任选的,可以重复进行上述过程直到获得预期的最高准确度。

框架选择的过程和未知量的表征过程概括如下:

1.选择基线组

2.计算基线组样本中每个基因的均值和标准差

3.计算每个基因的(X*标准差+均值)。这就是基线记录,其它所有的样 本都要与这个基线记录相比较。X是一严格变量,X数值越大就越严格。

4.计算每个实验样本对根据步骤3得到的基线记录的比值。

5.转换比值,使值小于1的比值成为负数(例如使用底数为10的对数)。 (现在下调的基因有正确的负值以符合MV优化的需要)。

6.将这些转换的比值作为输入值,替换软件应用中通常使用的资产回报 值。

7.该软件将标绘出有效的边界线,并且返回一组沿此有效边界线上任意 一点的优化框架。

8.在此有效边界线上选择一个所需的回报率或者方差。

9.通过将在选择框架的算法中所给定的权重乘以每个基因的强度值,加 和计算每个样本的框架值。

10.将基线组的框架值的均值加上Y与基线组的框架值的标准差的乘积, 计算出边界值。大于该边界值的数值应被归为实验组。

11.任选的,可以重复进行上述过程,直到获得预期的最佳准确度。

可选择的,首先通过确定那些其表达显示出某种微小差异水平的基因,对 基因进行预选择。在这个可选择的方法中,预选择优选的以给出的阈 值为基础,其中μt是已知患有该疾病或病症的样本子集的均值,μn是正常样本 子集的均值,σt+σn表示联合标准差。通过根据如的关系式对数据 的预选择,也可在其中使用信噪比截止值。这就确保基于差异调节进行预选择 的基因具有临床上的显著差异。即超过了适于测定各种临床参数的仪器产生的 噪音水平。对于根据这些标准预选的每个标记物建立一个矩阵,其中列表示样 本,行表示标记物,并且每个元件都是根据对该标记物的表达进行标准 化后所得到的强度测量值,其中I代表强度测量值。

也可以通过设置附加的边界条件来定义优化框架。例如,框架的大小可限 定为固定的值域或标记物的数目。这或者可以通过制定更为严格的预选标准(例 如以代替)或通过使用程序特征如限制组合大小来实现。 例如可以设置边界条件使有效边界线从最优化的10个基因中选出。也可以使用 所有的预选基因确定有效边界线后再限定所选择基因的数目(例如不超过10 个)。

选择框架的过程也包括应用探索式的规则。优选的,这样的规则是基于生 物学和对用于产生临床结果的技术理解的基础上制定的。更优选的是,它们应 用到优化方法的输出数据中。例如,选择框架的均方差法可以应用于乳腺癌样 本中大量差异表达基因的微阵列数据。这种方法得到的输出数据将会是一套优 化的基因,包括既在外周血中表达也在患病乳腺组织中表达的一些基因。如果 这种检测方法用到的样本来自外周血,并且某些基因既在乳腺癌个例也在外周 血中差异表达,那么就可以应用探索式的规则,从排除了那些在外周血中差异 表达的基因而得到的有效边界线上选择框架。当然,这个规则可以在形成有效 边界线前应用,例如,将该规则应用到数据的预先选择中。

可以应用其他与所考虑的生物学问题无必然联系的探索式规则。例如,可 以应用只有给定百分比的框架可用特定的基因表示的规则。商业上可购买的软 件如Wagner软件就提供了这类型的探索式规则。这是非常有用的,例如,除了 正确度和精密度等,其他因素(例如,预期许可费)也会影响包括一个或多个 基因的可用性。

本发明的一个方法包括如上所述比较多种基因(或框架)的基因表达分布 图以进行诊断。将构成框架的每个基因的基因表达分布图固定于如计算机可读 的媒介物上。这可以采取很多形式。例如,可以建立一个输入表示疾病的信号 范围(例如强度测定值)的表格。可以将患者的实际数据与表格中的值进行比 较以确定该患者的样品属于是正常的或患病的。在一个改进的具体实例中,表 达信号的模式(例如荧光强度)以数字或图形方式记录。再将与患者样本相结 合使用的基因框架中的基因表达模式与上述表达模式比较。然后利用模式比较 软件确定该患者本是否具有表示所讨论的疾病的模式。当然这些比较也可用于 确定该患者的结果是否正常。再将样本的表达分布图与正常或对照细胞的框架 相比较。如果样本表达模式与结肠直肠癌的表达模式一致,那么(无抵消性的 医学理由)该患者就被诊断为结肠直肠癌阳性。如果样本表达模式与正常或对 照细胞的表达模式一致,那么该患者就被诊断为结肠直肠癌阴性。

许多公知的识别模式的方法是适用的。下列参考提供了一些例子:

加权阈值Weighted Voting:

Golub,TR.,Sclonim,DK.,Tamaya,P.,Huard,C.,Gaasenbeek,M.,Mesirov,JP.,Coller ,H.,Loh,L.,Downing,JR.,Caligiuri,MA.,Bloomfield,CD.,Lander,ES.癌症的分子分类: 利用基因表达检测的分类发现和分类预测。科学Science 286:531-537,1999

支持矢量机器Support Vector Machine:

Su,AI.,Welsh,JB.,Sapinoso,LM.,Kern,SG.,Dimitrov,P.,Lapp,H.,Schultz,PG.,Pow ell,SM.,Moskaluk,CA.,Frierson,HF.Jr.,Hampton,GM.利用基因表达信号的人类癌症 的分子分类。癌症研究Cancer Research 61:7388-93,2001

Ramaswamy,S.,Tamayo,P.,Rifkin,R.,Mukherjee,S.,Yeang,GH.,Angelo,M.,Ladd, C.,Reich,M.,Latulippe,E.,Mesirov,JP.,Poggio,T.,Gerald,W.,Loda,M.,Lander,ES.,Gould, TR.利用肿瘤基因表达信号的多种类癌症诊断。美国国家科学院院刊Proceedings of the National Academy of Sciences of the USA 98:15149-15154,2001

K-最邻近值K-nearest Neighbors:

Ramaswamy,S.,Tamayo,P.,Rifkin,R.,Mukherjee,S.,Yeang,GH.,Angelo,M.,Ladd, C.,Reich,M.,Latulippe,E.,Mesirov,JP.,Poggio,T.,Gerald,W.,Loda,M.,Lander,ES.,Gould, TR.利用肿瘤基因表达信号的多种类癌症诊断。美国国家科学院院刊Proceedings of the National Academy of Sciences of the USA 98:15149-15154,2001

相关系数Correlation Coefficients:

van’t Veer LJ,Dai H,van de Vijver MJ,He YD,Hart AA,Mao M,Peterse HL,van der Kooy K,Marton MJ,Witteveen AT,Schreiber GJ,Kerkhoven RM,Roberts C,Linsley PS,Bernards R,Friend SH.基因表达分布图预测乳腺癌的临床结果。自然 Nature.2002 Jan 31:415(6871):530-6

本发明的基因表达分布图也可以与其他在癌症诊断、预测、或治疗监测中 所使用的非遗传的诊断方法联合使用。例如,在一些情况中,将如上所述的基 于基因表达诊断能力的方法与从如血清蛋白标记(例如癌胚性抗原)的传统标 记物中得到的数据结合使用是很有益的。存在许多这样的标记物,包括如 CA19-9,CA125,CK-BB和鸟苷酸环化酶C的分析物。在这样的一个方法中,对 治疗患者周期性采血,然后将血样作上述血清标记之一的酶联免疫检测。当标 记的浓度暗示了肿瘤复发或治疗失败时,可以随后对样本源作基因表达分析。 如果存在所怀疑的肿块,取细针吸取物并如上所述对取自肿块的细胞进行基因 表达分布图分析。可选择的,组织样本可以取自先前摘取了肿瘤的组织的邻近 区域。当其他检测结果不确定时,这种方式特别有用。

当其它诊断的可靠性值得怀疑时,联合使用遗传标记和其他诊断是最优选 的。例如,众所周知CEA血清水平在相当程度上受到与患者癌症状态毫无关系 的因子的影响。当一个患者被监测到在接受结肠癌治疗后显示常规CEA检测高 水平时,那联合进行基因表达/CEA检测是有益的。

本发明的制品包括用于治疗、诊断、预测和其它疾病评估的基因表达分布 图的表示物。这些分布图表示物简化为可被机器自动可读的媒介物,如计算机 可读媒介(磁性的,光学的及类似的)。制品也包括在这种媒介中评估基因表达 分布图的指令说明。例如,制品可能包括具有用于比较上述基因框架的基因表 达分布图的计算机指令的CD ROM。制品可能也含有基因表达分布图的数字记 录以用于与患者样本的基因表达数据进行比较。可选择的,所述的分布图可以 不同的表现格式记录。图形记录就是这样的一种格式。上文提到的 “GENESPRING”和“DISCOVER”计算机程序中整合的聚类算法就可很好的 协助这些数据形象化。

根据本发明生产制造的不同类型的物品是指用于揭示基因表达分布图的 媒介物或格式化检测。这些可以包括,例如微阵列,其中将序列互补物或探针 固定于基片上,它与表示所关注基因的序列联合建立一个有关其存在的易读行 列式。可选择的,根据本发明的制品可以被制作成用于进行杂交、扩增,以及 形成表示所关注的基因表达水平的信号以用来检测结肠直肠癌的试剂盒。

根据本发明制备的试剂盒包括确定基因表达分布图的格式化检测。这就包 括了进行检测所需的如试剂和说明指令等所有或部分材料。

本发明进一步用下列非限定性的实施例说明。

实施例:根据本发明分析的基因是通过参考GenBank数据库中的基因ID 号鉴定的。它们通常与编码产生蛋白质或肽的全长核苷酸序列相关。本领域的 技术人员公认全长核苷酸序列的鉴定不是一个分析观点所必需的。即可以根据 公知的为评估相关基因的基因表达设计探针的原理进行部分序列或ESTs选择。

实施例1-样品处理和LCM

收集接受结肠直肠肿瘤外科手术患者的27个新鲜冷冻组织样本。19个样 本是结肠直肠恶性肿瘤样本,8个样本是正常的结肠粘膜。组织在获得后的20-30 分钟内快速液氮冷冻,并随后贮存于-80℃。为了激光捕捉,将样本切片(6μm), 一切片封固于玻璃载片上,另一切片封固于已被固定于玻璃载片(Micro Slides Colorfrost,VWR Scientific,Media,PA)上的膜(P.A.L.M.)上.封固于玻璃载片上 的切片在冷的丙酮中固定,并用Mayer’s苏木精(Sigma,St.Louis,MO)染色. 病理学家为诊断和定级分析样本。使用Dukes分级,由附带的外科病理学和临 床报告进行临床阶段评估。封固于膜上的切片在100%乙醇中固定5分钟,在曙 红/100%乙醇(100μg曙红溶于100ml脱水乙醇)中复染1分钟,快速在100% 乙醇中浸泡一次以除去未结合染料,空气中干燥10分钟。

结肠直肠腺癌中的两个为等级1,10个为等级2,5个为等级3。一个恶性 肿瘤样本是盲肠的类癌瘤,另一个是转移的黑色素瘤病变。两个腺癌样本表现 为粘蛋白状亚型,一个为章形细胞亚型。腺癌样本按Dukes分级划分如下:Dukes A:2,Dukes B:5,Dukes C:7,Dukes D:3。六个腺癌样本在手术前放疗过。

在LCM中使用前,膜(LPC-MEMBERANE PEN FOIL 1.35μm No.8100,P.A.L.M.GmbH Mikrolaser Technologie,Bernried,Germany)和载片经过 预处理以除去RNA酶,并且增强组织样品在膜上的吸附。简要的,载片用DEP H2O洗涤,膜用RNase AWAY(Molecular Bioproducts,Inc.,San Diego,CA)洗涤 并用DEP H2O冲洗。膜粘附到玻璃载片上后,载片于120℃烘烤8小时,用 TI-SAD处理(Diagnostic Products Corporation,Los Angeles,CA,以1∶50溶于DEP H2O,用脱脂棉过滤),+37℃孵育30分钟。临使用前,将10μl小份的RNA酶 抑制剂溶液(RNA酶蛋白质抑制剂2500U=33U/μl N211A,Promega GmbH, Mannheim,Germany,0.5μl溶于400μl冷的含有0.15mol NaCl,10mmol Tris pH8.0,0.25mmol二硫苏糖醇的溶液)铺展到待封固组织样本的膜上。

封固于膜上的组织切片用于LCM。利用PALM自动微光束技术(P.A.L.M. Microlaser Technologie,Carl Zeiss,Inc.,Thomwood,NY)捕捉约2000个上皮细胞 样品,并连接到Zeiss Axiovert 135显微镜中(Carl Zeiss Jena GmbH,Jena, Germany)。正常粘膜的外周基质和癌症样本中偶然的干扰基质成分都包括在内。 捕捉到的细胞置于100%乙醇的小管中于-80℃保存。

实施例2-RNA提取和扩增

利用Zymo-Spin柱(Zymo Research,Orange,CA92867)提取通过LCM捕 捉的细胞的总RNA。将约2ng总RNA重悬于10μl水并且利用T7 RNA聚合 酶进行两轮扩增,扩增的RNA产量约为50μg。

实施例3-cDNA微阵列杂交和定量

利用一套由约20,000个人cDNA克隆组成的cDNA微阵列检测样本。将 约30个植物基因印迹到微阵列上作为非特异杂交对照。利用LCM捕捉细胞的 5μg aRNA合成Cy3标记的cDNA探针。探针用Qiagen’s核苷酸去除柱 (Nucleotide Removal Columns)纯化然后经14-16小时杂交到微阵列上。载片 在扫描前经过洗涤并于空中干燥。扫描微阵列的Cy3荧光并用ImaGene软件 (Biodiscovery,Los Angeles,CA)定量。对于每个cDNA克隆,进行重复点和重 复阵列的四次测量并将所得强度值平均。

利用第三代微阵列点样仪(Molecular Dynamics)将cDNAs印迹到氨基硅 烷涂层的载片上(Corning)。cDNAs经PCR扩增,纯化(Qiagen PCR纯化试剂 盒),并与10M NaSCN印迹缓冲液1∶1混合。杂交前微阵列在异丙醇中室温孵 育10分钟。探针于95℃孵育2分钟,室温孵育5分钟,然后加到三个平行测定 的载片上。用DPX(Fluka)将盖片密封到载片上并于42℃孵育过夜。然后将载片 在1×SSC/0.2%SDS和0.1×SSC/0.2%SDS中于55℃洗涤5分钟,0.1×SSC中 浸润并干燥后用第三代微阵列扫描仪(Molecular Dynamics)扫描。用 AUTOGENE软件(Biodiscovery,Los Angeles)分析每个点的荧光强度。

对芯片强度进行线性标准化使得每个芯片的强度记录75th个百分点相当于 值100。芯片上的每个基因通过将该基因的强度记录除以所有样本的基因表达值 记录的中间值标准化。在聚类前,那些至少在一个样本中不具有100或更大的 强度记录的基因被滤掉了以限制对相似性量度的背景影响。选择一套6255个基 因作聚类分析。利用作为相似性测量的相关度进行分级聚类,使具有表现正变 化同时不考虑其负变化的基因的样品聚类到一起(Silicon Genetic,Sunnyville, CA)。系统图的每一个主要节点可被认为是样本的一个亚组。通过将每个肿瘤 亚组与正常组进行比较鉴定差异表达的基因。筛选是基于给出的信噪 比测量阈值,其中μt是肿瘤子集的平均数,μn是正常样本子集的平均数,σt+σn表示结合标准差。组内一个基因的强度记录的变异系数必须低于0.33,才可将 基因包括在成对方式比较之中。肿瘤组的中间值与正常组的中间值相比大于2 或等于2时为上调,小于或等于0.5倍时为下调。如果一个基因符合所有标准则 被选择出来。在所有的比较中均被筛选出来的基因即被认为是在结肠直肠癌中 稳定调节异常的。利用T检验假定不等方差计算统计学显著性p值。用于聚类 的一套基因也用软件包(Partek,St Louis,MO)进行主成分分析(PCA)。然后 将数据投射到简化的三维空间。正常的和结肠直肠肿瘤的样本以映射表达水平 表现出来。

建立有很大上调差异的基因列表以用来区别肿瘤和正常样本。利用 作为信噪比中止点先挑选出123个基因。以等于或大于1.5的比率作 为上调的最低标准。也包括的基因。已经建立了一个四基因的框架, 每个基因在肿瘤和正常细胞间都有至少3倍的表达差异。

结肠直肠癌中差异表达的基因。与正常结肠粘膜相比,39个基因在所有的 肿瘤样本中差异表达。除了一个异常值,37个基因在所有的肿瘤中显著下调。2 个上调。基因的身份通过微阵列上cDNA克隆的测序验证。结果如表1所示。

表1调节基因

  登记号   基因描述   平均信号强度   (正常)   平均信号强度   (肿瘤)   P值   AF071569   钙调蛋白激酶II基因   亚型delta2   93   39   4.64E-09   Seq.ID No.1   AB014530   KIAA0630蛋白质的   人类mRNA   108   50   4.83E-07   Seq.ID No.2   AK000319   人KIAA0630cDNA   236   69   7.84E-06   Seq.ID No.3   U81504   AP-3复合物的   Beta-3A-衔接蛋白亚   基mRNA   241   75   3.52E-05   Seq.ID No.4   AB011166   人KIAA0594cDNA   116   55   3.53E-05   Seq.ID No.5   AB040914   人KIAA1481cDNA   187   59   8.85E-05   Seq.ID No.6   AK025205   人FLJ21552cDNA   322   97   0.00013   Seq.ID No.7   AJ278219   脂肪酸羟化酶   143   53   0.00011   Seq.ID No.8   AB046854   人KIAA1634cDNA   142   59   0.00020   Seq.ID No.9   R00585   未知   149   57   1.28E-09   Seq.ID No.10   S45844   Spi-B转录因子   140   43   0.00043   Seq.ID No.11   X98311   癌胚性抗原家族成员   2(CGM2)   6137   223   0.00044   Seq.ID No.12   BAA78050   NADPH氧化还原酶   同源物   153   84   0.00048   Seq.ID No.40   N72128   未知   164   77   0.00068   Seq.ID No.13   AB040955   人KIAA1552cDNA   334   120   0.00067   Seq.ID No.14   AF125101   HSPC040蛋白质   363   115   0.0011   Seq.ID No.15   AB023229   人KIAA1012cDNA   263   88   0.00099   Seq.ID No.16   N95761   a-L-岩藻糖苷酶基因   429   104   0.00047   Seq.ID No.17   AK025033   人FLJ21380cDNA   180   85   0.0010   Seq.ID No.18   L10844   人细胞生长调节蛋白   206   101   0.0013   Seq.ID No.19

  H96534   Gp25L2蛋白质的人   类mRNA   147   58   0.0015   Seq.ID No.20   AK001521   人FLJ10659cDNA   157   60   0.0019   Seq.ID No.21   AF151039   HSPC205蛋白质   117   60   0.0017   Seq.ID No.22   AF052059   SEL 1L蛋白质   168   53   0.0016   Seq.ID No.23   N24597   未知   166   62   0.0016   Seq.ID No.24   AK001950   内着丝粒蛋白   148   64   0.0029   Seq.ID No.25   BAA02649   巨噬细胞消除受体I   型   118   44   0.0031   Seq.ID No.41   N75004   未知   98   48   0.0031   Seq.ID No.26   W16916   人KIAA0260cDNA   162   61   0.0037   Seq.ID No.27   X52001   人类内皮素3mRNA   89   33   0.0042   Seq.ID No.28   T50788   未知   364   102   0.0059   Seq.ID No.38   AJ005866   推定的Sqv-7样蛋白   381   163   0.0049   Seq.ID No.29   AF113535   MAID蛋白质   218   100   0.0053   Seq.ID No.39   AB037789   人KIAA1368cDNA   164   62   0.0068   Seq.ID No.30   M33987   碳酸酐酶   652   46   0.0074   Seq.ID No.31   M77830   桥粒斑蛋白1(DP1)   184   81   0.0092   Seq.ID No.32   H81220   EST功能域转录因子   ELF1   113   55   0.017   Seq.ID No.33   AF000592   人染色体21q11-q21   基因组克隆   33   69   1.16E-05   Seq.ID No.35   AK021701   人FLJ11639cDNA   31   63   0.00070   Seq.ID No.36

实施例4结肠直肠肿瘤的优化框架

利用方差优化算法生成多重基因基础的标记,其中所包括的基因可结合使 用以区别正常和肿瘤样本。利用样本和如实施例1-3所描述的微阵列进行强度检 测。首先,基于肿瘤和正常样本间的预定5倍差异,对待分析的数据进行预选。 根据这个标准预选出来的基因的表达数据随后作如下使用。以非转移性样本作 为基线,计算出每个基因的强度测量值的平均数和标准差。然后对于每个基线 基因计算鉴别值X*(标准差+平均值)(X值指定为3)。这个值用来确保结果框 架是有说服力的。再计算每个转移性样本的鉴别值与基线值的比率。这个比率 随后被转换成常用对数。然后这个数据被输入Wagner软件,产生一个有效边界, 从中选择出一个4基因框架。这套基因包括一未知序列,前胶原I型,核糖体 蛋白L21的大亚基,和纤连蛋白。这些基因确定为Seq.ID.No.42,Seq.ID.No.43, Seq.ID.No.44和Seq.ID.No.45的序列。换句话说,形成框架的基因组合可以为关 于结肠直肠癌的临床判定提供有用的诊断信息。这在将选自该框架的基因组合 与附加标记(遗传或非遗传的)相结合时特别有益。

优化的基因框架:

>gi|1264443|gb|N92134.1|N92134 za23f09.r1 Soares fetal liver spleen INFLS Homo sapiens cDNA clone IMAGE:293417 5’similar to gb|M87908| HUMALNE32 Human carcinoma cell-derived Alu RNA transcript,(rRNA); gbX57025_rnal INSULIN-LIKE GROWTH FACTOR IA PRECURSOR(HUMAN)

>gi|2221047|gb|AA490172.1|AA490172 ab06b08.s1 Stratagene fetal retina 937202 Homo sapiens cDNA clone IMAGE:8399913’similar to gb:J03464 PROCOLLAGEN ALPHA 2(I)CHAIN PRECURSOR(HUMAN)

>gi|2188912|gb|AA464034.1|AA464034 zx86b09.r1 Soares ovary tumor NbHOT Homo sapiens cDNA clone IMAGE:8106175’similar to SW:RL21_HUMAN P4677860S RIBOSOMAL PROTEIN L21

>gi|834491|gb|R62612.1|R62612 yi12d01.s1 Soares placenta Nb2HP Homo sapiens cDNA clone IMAGE:1390093’similar to gb:X02761-cds1 FIBRONECTIN PRECURSOR(HUMAN);

使用不同的标准但相同的方法,通过软件选出了又一个四基因框架。这些 是Seq.ID.No.46,Seq.ID.No.47,Seq.ID.No.48和Seq.ID.No.49的序列。两个基 因与第一个四基因框架重叠。两个优化框架也可以结合形成一个六基因框架。

优化的基因框架:

>gi|2114953|gb|AA431245.1|AA431245.1 zw78d06.r1 Soares_testis_NHT Homo sapiens cDNA clone IMAGE:7823155’similar to wp:F36H1.2CE05814 ANKYRIN LIKE

>gi|2156172|gb|AA443497.1|AA443497 zw34d03.r1 Soares ovary tumor NbHOT Homo sapiens cDNA clone IMAGE:771173

>gi|2221047|gb|2|AA490172 ab06b08.s1 Stratagene fetal retina 937202 Homo sapiens cDNA clone IMAGE:8399913’similar to gb:J03464 PROCOLLAGEN ALPHA 2(I) CHAIN PRECURSOR(HUMAN)

>gi|1264443|gb|N92134.1|N92134 za23f09.r1 Soares fetal liver spleen INFLS Homo sapiens cDNA clone IMAGE:2934175’similar to gb|M87908| HUMALNE32 Human carcinoma cell-derived Alu RNA transcript,(rRNA); gbX57025_rnal INSULIN-LIKE GROWTH FACTOR IA PRECURSOR(HUMAN);

序列表

<110>WANG,YIXIN

<120>评估结肠直肠癌

<130>CDS 267 US NP

<140>TBD

<141>2003-03-21

<150>60/368,798

<151>2002-03-29

<160>49

<170>PatentIn version 3.1

<210>1

<211>1500

<212>DNA

<213>人

<400>1

atggcttcga ccaccacctg caccaggttc acggacgagt atcagctttt cgaggagctt    60

ggaaaggggg cattctcagt ggtgagaaga tgtatgaaaa ttcctactgg acaaggatat   120

gctgccaaaa ttatcaacac caaaaagctt tctgctaggg atcatcagaa actagaaaga   180

gaagctagaa tctgccgtct tttgaagcac cctaatattg tgcgacttca tgatagcata   240

tcagaagagg gctttcacta cttggtgttt gatttagtta ctggaggtga actgtttgaa   300

gacatagtgg caagagaata ctacagtgaa gctgatgcca gtcattgtat acagcagatt   360

ctagaaagtg ttaatcattg tcacctaaat ggcatagttc acagggacct gaagcctgag   420

aatttgcttt tagctagcaa atccaaggga gcagctgtga aattggcaga ctttggctta   480

gccatagaag ttcaagggga ccagcaggcg tggtttggtt ttgctggcac acctggatat   540

ctttctccag aagttttacg taaagatcct tatggaaagc cagtggatat gtgggcatgt   600

ggtgtcattc tctatattct acttgtgggg tatccaccct tctgggatga agaccaacac   660

agactctatc agcagatcaa ggctggagct tatgattttc catcaccaga atgggacacg   720

gtgactcctg aagccaaaga cctcatcaat aaaatgctta ctatcaaccc tgccaaacgc   780

atcacagcct cagaggcact gaagcaccca tggatctgtc aacgttctac tgttgcttcc   840

atgatgcaca gacaggagac tgtagactgc ttgaagaaat ttaatgctag aagaaaacta   900

aagggtgcca tcttgacaac tatgctggct acaaggaatt tctcagcagc caagagtttg   960

ttgaagaaac cagatggagt aaaggagtca actgagagtt caaatacaac aattgaggat  1020

gaagatgtga aagcacgaaa gcaagagatt atcaaagtca ctgaacaact gatcgaagct  1080

atcaacaatg gggactttga agcctacaca aaaatctgtg acccaggcct tactgctttt  1140

gaacctgaag ctttgggtaa tttagtggaa gggatggatt ttcaccgatt ctactttgaa  1200

aatgctttgt ccaaaagcaa taaaccaatc cacactatta ttctaaaccc tcatgtacat  1260

ctggtagggg atgatgccgc ctgcatagca tatattaggc tcacacagta catggatggc  1320

agtggaatgc caaagacaat gcagtcagaa gagactcgtg tgtggcaccg ccgggatgga  1380

aagtggcaga atgttcattt tcatcgctcg gggtcaccaa cagtacccat caagccaccc  1440

tgtattccaa atgggaaaga aaacttctca ggaggcacct ctttgtggca aaacatctga  1500

<210>2

<211>5761

<212>DNA

<213>人

<400>2

cacaccgcag tatgcggtgc cctttactct gagctgcgca gccggccggc cggcgctggt    60

tgaacagact gccgctgtac tggcgtggcc tggagggact cagcaaattc tcctgccttc   120

aacttggcaa cagttgcctg gggtagctct acacaactct gtccagccca cagcaatgat   180

tccagaggcc atggggagtg gacagcagct agctgactgg aggaatgccc actctcatgg   240

caaccagtac agcactatca tgcagcagcc atccttgctg actaaccatg tgacattggc   300

cactgctcag cctctgaatg ttggtgttgc ccatgttgtc agacaacaac aatccagttc   360

cctcccttcg aagaagaata agcagtcagc tccagtctct tccaagtcct ctctagatgt   420

tctgccttcc caagtctatt ctctggttgg gagcagtccc ctccgcacca catcttctta   480

taattccttg gtccctgtcc aagatcagca tcagcccatc atcattccag atactcccag   540

ccctcctgtg agtgtcatca ctatccgaag tgacactgat gaggaagagg acaacaaata   600

caagcccagt agctctggac tgaagccaag gtctaatgtc atcagttatg tcactgtcaa   660

tgattctcca gactctgact cttctttgag cagcccttat tccactgata ccctgagtgc   720

tctccgaggc aatagtggat ccgttttgga ggggcctggc agagttgtgg cagatggcac   780

tggcacccgc actatcattg tgcctccact gaaaactcag cttggtgact gcactgtagc   840

aacccaggcc tcaggtctcc tgagcaataa gactaagcca gtcgcttcag tgagtgggca   900

gtcatctgga tgctgtatca cccccacagg gtatcgagct caacgcgggg ggaccagtgc   960

agcacaacca ctcaatctta gccagaacca gcagtcatcg gcggctccaa cctcacagga  1020

gagaagcagc aacccagccc cccgcaggca gcaggcgttt gtggcccctc tctcccaagc  1080

cccctacacc ttccagcatg gcagcccgct acactcgaca gggcacccac accttgcccc  1140

ggcccctgct cacctgccaa gccaggctca tctgtatacg tatgctgccc cgacttctgc  1200

tgctgcactg ggctcaacca gctccattgc tcatcttttc tccccacagg gttcctcaag  1260

gcatgctgca gcctatacca ctcaccctag cactttggtg caccaggtcc ctgtcagtgt  1320

tgggcccagc ctcctcactt ctgccagcgt ggcccctgct cagtaccaac accagtttgc  1380

cacccaatcc tacattgggt cttcccgagg ctcaacaatt tacactggat acccgctgag  1440

tcctaccaag atcagccagt attcctactt atagttggtg agcatgaggg aggaggaatc  1500

atggctacct tctcctggcc ctgcgttctt aatattgggc tatggagaga tcctccttta  1560

ccctcttgaa atttcttagc cagcaacttg ttctgcaggg gcccactgaa gcagaaggtt  1620

tttctctggg ggaacctgtc tcagtgttga ctgcattgtt gtagtcttcc caaagtttgc  1680

cctattttta aattcattat ttttgtgaca gtaattttgg tacttggaag agttcagatg  1740

cccatcttct gcagttacca aggaagagag attgttctga agttaccctc tgaaaaatat  1800

tttgtctctc tgacttgatt tctataaatg cttttaaaaa caagtgaagc ccctctttat  1860

ttcattttgt gttattgtga ttgctggtca ggaaaaatgc tgatagaagg agttgaaatc  1920

tgatgacaaa aaaagaaaaa ttactttttg tttgtttata aactcagact tgcctatttt  1980

attttaaaag cggcttacac aatctccctt ttgtttattg gacatttaaa cttacagagt  2040

ttcagttttg ttttaatgtc atattatact taatgggcaa ttgttatttt tgcaaaactg  2100

gttacgtatt actctgtgtt actattgaga ttctctcaat tgctcctgtg tttgttataa  2160

agtagtgttt aaaaggcagc tcaccatttg ctggtaactt aatgtgagag aatccatatc  2220

tgcgtgaaaa caccaagtat tctttttaaa tgaagcacca tgaattcttt tttaaattat  2280

tttttaaaag tctttctctc tctgattcag cttaaatttt tttatcgaaa aagccattaa  2340

ggtggttatt attacatggt ggtggtggtt ttattatatg caaaatctct gtctattatg  2400

agatactggc attgatgagc tttgcctaaa gattagtatg aattttcagt aatacacctc  2460

tgttttgctc atctctccct tctgttttat gtgatttgtt tggggagaaa gctaaaaaaa  2520

cctgaaacca gataagaaca tttcttgtgt atagctttta tacttcaaag tagcttcctt  2580

tgtatgccag cagcaaattg aatgctctct tattaagact tatataataa gtgcatgtag  2640

gaattgcaaa aaatatttta aaaatttatt actgaattta aaaatatttt agaagttttg  2700

taatggtggt gttttaatat tttacataat taaatatgta catattgatt agaaaaatat  2760

aacaagcaat ttttcctgct aacccaaaat gttatttgta atcaaatgtg tagtgattac  2820

acttgaattg tgtacttagt gtgtatgtga tcctccagtg ttatcccgga gatggattga  2880

tgtctccatt gtatttaaac caaaatgaac tgatacttgt tggaatgtat gtgaactaat  2940

tgcaattata ttagagcata ttactgtagt gctgaatgag caggggcatt gcctgcaagg  3000

agaggagacc cttggaattg ttttgcacag gtgtgtctgg tgaggagttt ttcagtgtgt  3060

gtctcttcct tccctttctt cctccttccc ttattgtagt gccttatatg ataatgtagt  3120

ggttaataga gtttacagtg agcttgcctt aggatggacc agcaagcccc cgtggaccct  3180

aagttgttca ccgggattta tcagaacagg attagtagct gtattgtgta atgcattgtt  3240

ctcagtttcc ctgccaacat tgaaaaataa aaacagcagc ttttctcctt taccaccacc  3300

tctacccctt tccattttgg attctcggct gagttctcac agaagcattt tccccatgtg  3360

gctctctcac tgtgcgttgc taccttgctt ctgtgagaat tcaggaagca ggtgagagga  3420

gtcaagccaa tattaaatat gcattctttt aaagtatgtg caatcacttt tagaatgaat  3480

ttttttttcc ttttcccatg tggcagtcct tcctgcacat agttgacatt cctagtaaaa  3540

tatttgcttg ttgaaaaaaa catgttaaca gatgtgttta taccaaagag cctgttgtat  3600

tgcttaccat gtccccatac tatgaggaga agttttgtgg tgccgctggt gacaaggaac  3660

tcacagaaag gtttcttagc tggtgaagaa tatagagaag gaaccaaagc ctgttgagtc  3720

attgaggctt ttgaggtttc ttttttaaca gcttgtatag tcttggggcc cttcaagctg  3780

tgaaattgtc cttgtactct cagctcctgc atggatctgg gtcaagtaga aggtactggg  3840

gatggggaca ttcctgccca taaaggattt ggggaaagaa gattaatcct aaaatacagg  3900

tgtgttccat ccgaattgaa aatgatatat ttgagatata attttaggac tggttctgtg  3960

tagatagaga tggtgtcaag gaggtgcagg atggagatgg gagatttcat ggagcctggt  4020

cagccagctc tgtaccaggt tgaacaccga ggagctgtca aagtatttgg agtttcttca  4080

ttgtaaggag taagggcttc caagatgggg caggtagtcc gtacagccta ccaggaacat  4140

gttgtgtttt ctttattttt taaaatcatt atattgagtt gtgttttcag cactatattg  4200

gtcaagatag ccaagcagtt tgtataattt ctgtcactag tgtcatacag ttttctggtc  4260

aacatgtgtg atctttgtgt ctcctttttg ccaagcacat tctgattttc ttgttggaac  4320

acaggtctag tttctaaagg acaaattttt tgttccttgt cttttttctg taagggacaa  4380

gatttgttgt ttttgtaaga aatgagatgc aggaaagaaa accaaatccc attcctgcac  4440

cccagtccaa taagcagata ccacttaaga taggagtcta aactccacag aaaaggataa  4500

taccaagagc ttgtattgtt accttagtca cttgcctagc agtgtgtggc tttaaaaact  4560

agagattttt cagtcttagt ctgcaaactg gcatttccga ttttccagca taaaaatcca  4620

cctgtgtctg ctgaatgtgt atgtatgtgc tcactgtggc tttagattct gtccctgggg  4680

ttagccctgt tggccctgac aggaagggag gaagcctggt gaatttagtg agcagctggc  4740

ctgggtcaca gtgacctgac ctcaaaccag cttaaggctt taagtcctct ctcagaactt  4800

ggcatttcca acttcttcct ttccgggtga gagaagaagc ggagaagggt tcagtgtagc  4860

cactctgggc tcatagggac acttggtcac tccagagttt ttaatagctc ccaggaggtg  4920

atattatttt cagtgctcag ctgaaatacc aaccccagga ataagaactc catttcaaac  4980

agttctggcc attctgagcc tgcttttgtg attgctcatc cattgtcctc cactagaggg  5040

gctaagcttg actgccctta gccaggcaag cacagtaatg tgtgttttgt tcagcattat  5100

tatgcaaaaa ttcactagtt gagatggttt gttttaggat aggaaatgaa attgcctctc  5160

agtgacagga gtggcccgag cctgcttcct attttgattt tttttttttt taactgatag  5220

atggtgcagc atgtctacat ggttgtttgt tgctaaactt tatataatgt gtggtttcaa  5280

ttcagcttga aaaataatct cactacatgt agcagtacat tatatgtaca ttatatgtaa  5340

tgttagtatt tctgctttga atccttgata ttgcaatgga attcctactt tattaaatgt  5400

atttgatatg ctagttattg tgtgcgattt aaactttttt tgctttctcc ctttttttgg  5460

ttgtgcgctt tcttttacaa caagcctcta gaaacagata gtttctgaga attactgagc  5520

tatgtttgta atgcagatgt acttagggag tatgtaaaat aatcatttta acaaaagaaa  5580

tagatattta aaatttaata ctaactatgg gaaaagggtc cattgtgtaa aacatagttt  5640

atctttggat tcaatgtttg tctttggttt tacaaagtag cttgtatttt cagtattttc  5700

tacataatat ggtaaaatgt agagcaattg caatgcatca ataaaatggg taaattttct  5760

g                                                                  5761

<210>3

<211>2129

<212>DNA

<213>人

<400>3

ctgtattgag acaaaggaag ggatctgtca gaaagcaaca cttgttatct tgggcttggc    60

agcaaggaag aggacaggta gtggagatcc tgcaatctga aaagcagact gaaaggtgac   120

aaagaagctg aagatgggtg gtggagagag gtataacatt ccagcccctc aatctagaaa   180

tgttagtaag aaccaacaac agcttaacag acagaagacc aaggaacaga attcccagat   240

gaagattgtt cataagaaaa aagaaagagg acatggttat aactcatcag cagctgcctg   300

gcaggccatg caaaatgggg ggaagaacaa aaattttcca aataatcaaa gttggaattc   360

tagcttatca ggtcccaggt tactttttaa atctcaagct aatcagaact atgctggtgc   420

caaatttagt gagccgccat caccaagtgt tcttcccaaa ccaccaagcc actgggtccc   480

tgtttccttt aatccttcag ataaggaaat aatgacattt caacttaaaa ccttacttaa   540

agtacaggta taaaataaga caaatgttta aatttagtta tgttcacggg tagttgtcaa   600

ttggtctgaa acaaatttgc tagggaatct atttgtgtag aactaattaa tgtaaaaaaa   660

atagaccatc tcgtgttgtg tgcactgtga tataatggta gtatcagtgc aacttaaact   720

aatgattgta cttgatatta agtgttctca actgagtaac ttttaagtgg aaaccaagtt   780

tagatttggg gagtggtaaa ggaatcagct ttttctattg ttaggggaag acagtaattt   840

atcattcatg gaccagtaga ttgttgaaag ttggtgaatc ggattataag cttctagcta   900

acacaaggat tcagaattag gtaaacatct gaaggtttag tatattagaa acacccaaac   960

cagtaatatg ctaacctgat gcactgctga aagaaaatgt gaatttttcg taataattgc  1020

attttagtga attgtacagt gggtggaaag ggcatttgga gctcattaga atgagacata  1080

gtacacccca atggccctgt ttattaaatg tagtggatta agtgtctgtc aacaaataca  1140

ccaaaaccat tttttataga aacagtattt aatggtcact caatagcttt caaaatacat  1200

ttttgtatta cagcactgca caagctattc taatagtgct ctggcctcat cattcctgca  1260

aagcttgctt tggggagttg gataatgtga aaattttaag tacctagggg agaaagagcc  1320

atgtaaatat ctgtaataaa cttgtagcat atgtaaagtt ttcttggcct ttatcttaca  1380

aaaatggagt attttagtat gaatttgctg aatgtaagac cgtggactgt tttttataat  1440

atggcctaat tttaaaggtc caaaataact tgtttttaaa gtttgccctt gtgctaaagt  1500

gccagtgtat gtatgttata cttgatttgg ttgtaaacta tatttcaaag taaaccctag  1560

tgtaataagt tttataacta aaaaggttta agctgctaaa actattttta agagatgtga  1620

aatgcagtat gggactatct ttttttcctc ctctaagccc aaagattaac tagagtccct  1680

ccaaccttat agattgttgg ctttcacaat cttataacct aggatacagg tagtttcgag  1740

tatggtgcca gtgatgtttt gtttttgttt ggtcaagggg taggtgcaac ccaatggacc  1800

acttatgcaa aagatgtaaa ctcttgcata atacattgat aacatgtttt gccaacttta  1860

aatgcttaaa cataagcgaa accagtagca agtatgtggg tcagcttaaa aattttgatt  1920

gttaatgccc tattttctaa tttggcacct cttgatgcct aagcaggtaa gcagatgcct  1980

aagctgtatt tctccaaata aatcaagatg aagtactgcc caagttaaat attgatagcc  2040

taaagacaag tttatgtagt acttaatgta catgatatga agcataaaat taaataaaat  2100

ttttccccat tgaaaaaaaa aaaaaaaaa                                    2129

<210>4

<211>3950

<212>DNA

<213>人

<400>4

cgagaactag ttttgttccg tgccctctgg actggaacct tttggagaga acccccggca    60

ggaccaaccc cgcacccgcc agcaccgcgg caatgtccag caatagtttt ccttacaatg   120

agcagtccgg aggaggggag gcgacggagc tgggtcagga ggcgacctca accatttccc   180

cctcgggggc cttcggcctc tttagcagcg atttgaagaa gaatgaagat ctaaagcaaa   240

tgttagagag caacaaagat tctgctaaac tggatgctat gaagcggatt gttgggatga   300

ttgcaaaagg gaaaaatgca tctgaactgt ttcctgctgt tgtgaagaat gtggccagta   360

aaaatattga gatcaagaag ttggtatatg tttacctggt tcgatatgct gaagaacagc   420

aggatcttgc actcctgtcc ataagcactt ttcagcgagc tctgaaggac ccaaaccaac   480

taattcgtgc aagcgctttg agagttctgt caagtattag agtgccaatt attgtaccta   540

tcatgatgct tgctattaag gaagcttctg ctgacttatc accatatgtt aggaagaatg   600

cagcccatgc aatacaaaaa ttatacagcc ttgatccaga gcagaaggaa atgttaattg   660

aagtaattga aaaacttctg aaagataaaa gcacattggt agctggcagt gttgtgatgg   720

cttttgaaga agtatgcccg gacagaatag atctgattca taaaaattac cgcaagctat   780

gtaacttact agtggatgtt gaagagtggg ggcaggttgt cataatccac atgctaactc   840

gatatgctcg gacacagttt gtcagccctt ggaaagaggg tgatgaatta gaagacaatg   900

gaaagaattt ctacgaatct gatgatgatc agaaggaaaa gactgacaaa aagaagaagc   960

cgtatactat ggatccagat catagactct taattagaaa tacaaagcct ttgcttcaga  1020

gcaggaatgc tgcggtggtt atggcagttg ctcagctgta ttggcacata tcaccaaaat  1080

ctgaagctgg cataatttct aaatcactag tgcgtttact tcgtagcaat agggaggtgc  1140

agtatattgt cctacaaaat atagcaacta tgtcaattca aagaaagggg atgtttgaac  1200

cttatctgaa gagtttctat gttaggtcaa ctgatccaac tatgatcaag acactgaagc  1260

ttgaaatttt gacaaacttg gcaaatgaag ccaacatatc aactcttctt cgagaatttc  1320

agacctatgt gaaaagccag gataaacaat ttgcagcagc cactattcag actataggca  1380

gatgtgcaac caacatcttg gaagtcactg acacgtgcct caatggcttg gtctgtctgc  1440

tgtccaacag ggatgaaata gttgttgctg aaagtgtggt tgttataaag aaattactgc  1500

aaatgcaacc tgcacaacat ggtgaaatta ttaaacatat ggccaaactc ctggacagta  1560

tcactgttcc tgttgctaga gcaagtattc tttggctaat tggagaaaac tgtgaacgag  1620

ttcctaaaat tgcccctgat gttttgagga agatggctaa aagcttcact agtgaagatg  1680

atctggtaaa actgcagata ttaaatctgg gagcaaaatt gtatttaacc aactccaaac  1740

agacaaaatt gcttacccag tacatattaa atctcggcaa gtatgatcaa aactacgaca  1800

tcagagaccg tacaagattt attaggcagc ttattgttcc gaatgaaaag agtggagctt  1860

taagtaaata tgccaaaaaa atattcctag cacaaaagcc tgcaccactg cttgagtctc  1920

cttttaaaga tagagatcat ttccagcttg gcaccttatc tcatactctc aacattaaag  1980

ctactgggta cctggaatta tctaattggc cagaggtggc gcccgaccca tcagttcgaa  2040

atgtagaagt aatagagttg gcaaaagaat ggaccccagc aggaaaagca aagcaagaga  2100

attctgctaa gaagttttat tctgaatctg aggaagagga ggactcttct gatagtagca  2160

gtgacagtga gagtgaatct ggaagtgaaa gtggagaaca aggcgaaagt ggggaggaag  2220

gagacagcaa tgaggacagc agtgaggact cctccagtga gcaggacagt gagagtggac  2280

gggagtcagg cctagaaaac aaaagaacag ccaagaggaa ctcaaaagcc aaaggaaaaa  2340

gtgattctga agatggggag aaggaaaatg aaaaatctaa aacttcagat tcttcaaatg  2400

acgaatctag ttcaatagaa gacagttctt ccgattctga atcagagtca gaacctgaaa  2460

gtgaatctga atccagaaga gtcactaagg agaaagaaaa gaaaacaaag caagatagaa  2520

ctcctcttac caaagatgtt tcacttctag atctggatga ttttaaccca gtatccactc  2580

cagttgcact tcccacacca gctctttctc caagtttgat ggctgatctt gaaggtttac  2640

acttgtcaac ttcctcttca gtcatcagtg tcagtactcc tgcatttgta ccaacgaaaa  2700

ctcacgtgct gcttcatcga atgagtggaa aaggactagc tgcccattat ttctttccaa  2760

gacagccttg catttttggt gataagatgg tctctataca aataacactg aataacacta  2820

ctgatcgaaa gatagaaaat atccacatag gggaaaaaaa acttcctata ggcatgaaaa  2880

tgcatgtttt taatccaata gactctcttg agcctgaggg atccattaca gtttcaatgg  2940

gtattgactt ttgtgattct actcagactg ccagtttcca gttgtgtacc aaggatgatt  3000

gcttcaatgt taatattcag ccacctgttg gagaactgct tttacctgtg gccatgtcag  3060

agaaagattt taagaaagag caaggagtgc taacaggaat gaatgaaact tctgctgtaa  3120

tcattgctgc accacagaat ttcactccct ctgtgatctt tcagaaggtt gtaaatgtag  3180

ccaatgtagg tgcagtccct tctggccagg ataatataca caggtttgca gctaaaactg  3240

tgcacagtgg gtcattgatg ctagtcacag tggaactgaa ggaaggctct acagcccagc  3300

ttatcataaa cactgagaaa actgtgattg gctctgttct gctgcgggaa ctgaagcctg  3360

tcctgtctca ggggtaacct gcttacatct ggactttaga atctggcaca caacaaaagt  3420

gcctggcatc cactactgct gcctttcatt tataataata gcccttccat ctggcagtgg  3480

gggtagaata cactcttgac attcttgtct cctgctttag aatgctagtg tgtatctatc  3540

atgtatgcaa tactttcccc ctttttgctt tgctaaccga agagcatata ttttactgtc  3600

agttgtctca actcttgaat ccatgtggcg ttttctctgt cctgctgctt cttttggcct  3660

cctcgttttc cttctctttt tcgacaatgg tagacatgaa tgagatattt aaagttcatt  3720

ggaaatcttc ttccctacag cagtaagcaa aaattagcaa agagatagtc taaatggcct  3780

ctcagcttgg tatgtgaaaa tgagatcaca tactttttaa atccaaatac aaaagcatag  3840

tctctgcaag attttgttct ttgaatttct tgatattgta attgattatt gataactgtc  3900

atcatgaaat tatctctcaa taataagata aataaactag catatgaatc             3950

<210>5

<211>5191

<212>DNA

<213>人

<400>5

gagaaagaaa aacagctcga gacctcatgc aaagagaaaa ctgagtatct acagaaaatg    60

gttcagagga atgaaagata taaacaagat gtggagaggt tctatgaacg gaagcgacat   120

ttagatttaa ttgagatgct tgaagcaaaa aggccatggg tggaatatga aaatgttcgt   180

caggaatatg aagaagtaaa actagttcgt gaccgagtga aggaagaggt cagaaaactt   240

aaagaagggc agattcctat aacatgtcga attgaagaaa tggaaaacga gcgtcacaat   300

ttggaggctc gaatcaaaga aaaggcaaca gatattaagg aggcatctca aaaatgcaaa   360

cagaagcaag atgttataga aaggaaagat aaacatattg aggaacttca gcaggcttta   420

atagtaaagc aaaatgaaga gcttgaccga cagaggagaa taggtaatac ccgcaaaatg   480

atagaggatt tgcaaaatga actaaagacc acggaaaact gcgagaatct tcagccccag   540

attgatgcca ttacaaatga tctgagacgg attcaggatg aaaaggcatt atgtgaaggc   600

gaaataattg ataagcgaag agagagggaa actctagaga aggagaaaaa gagtgtggac   660

gatcatattg tacgttttga caatcttatg aatcagaagg aagataagct aagacagaga   720

ttccgtgaca cgtatgatgc tgttttatgg ctaagaaata acagagacaa atttaaacaa   780

agagtctgtg agcccataat gctcacgatc aatatgaaag ataataaaaa tgccaaatat   840

attgaaaatc atattccatc aaatgactta agagcctttg tatttgaaag tcaagaagat   900

atggaggttt tcctcaaaga ggttcgtgac aataaaaaat taagagtaaa tgctgttatt   960

gctcccaaga gttcatatgc agacaaagca ccttcaagat ctttgaatga acttaaacaa  1020

tacggatttt tctcttattt gagagaatta tttgatgcac ctgatcctgt aatgagttac  1080

ctttgctgtc agtatcatat tcatgaagtt cctgtaggaa ctgaaaagac cagagaaaga  1140

attgaacggg taatacaaga aacccgatta aaacagattt atacagcaga agaaaagtat  1200

gtggtgaaaa cttcttttta ttcaaacaaa gttatttcta gtaacacatc tctaaaagta  1260

gcgcagtttc tcactgtcac tgtggaccta gagcagagaa gacacttaga agaacagcta  1320

aaggaaattc atagaaaatt gcaagcagtg gattcagggt tgattgcctt acgtgaaaca  1380

agcaaacatc tggagcacaa agacaatgaa cttagacaaa agaagaagga gcttcttgag  1440

agaaaaacca agaaaagaca actggaacaa aaaatcagtt ccaaactagg aagtttaaag  1500

ctgatggaac aggatacttg caatcttgaa gaggaagagc gaaaagcaag taccaaaatc  1560

aaagaaataa atgttcaaaa agcgaaactt gttaccgaat taacaaacct aataaagatt  1620

tgtacttctt tgcatataca aaaagtagat ttaattctcc aaaatactac agtgatctct  1680

gagaagaaca aattagaatc agattatatg gccgcatctt cacaactccg tcttacagag  1740

caacatttca ttgaattgga tgaaaataga cagagattat tgcagaaatg caaggaactt  1800

atgaaaagag ctaggcaagt atgtaacctg ggtgcagagc agactcttcc tcaagaatac  1860

cagacacaag tacccaccat tccaaatgga cacaactcct cactccccat ggttttccaa  1920

gaccttccaa acacattgga tgaaattgat gctttattaa ctgaagaaag atcaagagct  1980

tcctgcttca cgggactgaa tcctacaatt gttcaggaat atacaaaaag agaagaagaa  2040

atagaacagt taactgagga actaaaggga aagaaagttg aactagatca atacagggaa  2100

aacatttcac aggtaaaaga aaggtggctt aatcctttaa aagagctggt agaaaaaatt  2160

aatgaaaaat tcagcaattt ttttagttcc atgcagtgtg ctggtgaagt tgatctccat  2220

acagaaaatg aggaagatta tgataaatat ggaattcgaa ttagagtcaa atttcgaagt  2280

agtactcaac tgcatgaatt aactcctcat catcaaagtg gaggtgaaag aagtgtttct  2340

accatgttat acttgatggc acttcaggag ctaaatagat gtccattcag agtagttgat  2400

gaaatcaatc agggaatgga cccaatcaat gaacggagag tgtttgaaat ggttgtaaat  2460

actgcctgta aagaaaatac atctcaatac tttttcataa caccaaagct cctgcaaaat  2520

cttccttatt ctgaaaagat gacagttttg tttgtctaca atggccctca tatgctggaa  2580

ccaaacacat ggaatttaaa ggctttccaa aggcggcggc gccgtattac attcactcaa  2640

ccttcttaat aaaagtaaag agagggaact tgggaatttt ttttgttaaa ttctgtttat  2700

aagtatggct caactgaata aaaggagatt cactaaaacg aaaagcagtt atttttggaa  2760

acctgctttt aaatacaaat aggttgataa tggaaactat aatgaccttt ccaaaatagc  2820

agctggtagt aaaagttaag tcttcttcag tcttggttga acttgagttc ttggcactct  2880

gaccatgagt cattcagttc tcatgttaaa atgtacttaa tattacaaat caaaggtaca  2940

gtggaagaag ggttaatcac aagaagttac ttatatggta gccctgagct ttaattgcag  3000

agtaacttta attactttta gagcctaaag atgactctag agcctaagtc ctagtttctc  3060

ccaatgttat atttaatttt aaaaaattga tatgaaaatg tctaatgtat agtaataatt  3120

tatgacagat ctagtcattt cttcctatta aaaaagatta ccttatctcc agtaggaaat  3180

ggaattttat gggcctttaa aagaaagttt tatgaaactt gatgctataa ttttattggt  3240

atttcaaggg gaaaaaagca ctggggttca aaaatggtag cagaactgct ttgaaatgct  3300

gcaaggtggc cactagatga tgcaaaatac aaccaaaaga ttgactgaga ataaaattag  3360

gtgacaaggg tttttaaaga ataacctttt aaagtgtggg ggcaggggtt gctttttttt  3420

attttattta aagtcaatta tattttacat cttacatttc taaaagcatt ttataattat  3480

ttttagtaag atttttctta aaatttcata tactggtttc tacaatttat atttgaaatt  3540

tctcagtgtt atgtaaagag tgatggaaaa gcattgattt ctttaaaacc gtaatgtttt  3600

tagaacttaa gcctataggg cctttcttac aatgttgatg tacccattat cttagaaaat  3660

ctagtttaaa ctgttttctt tcaccgcaaa agaattaaat gggaaaatca tttgtttatc  3720

tctaagttat actaattagt agaaccaaac aaattatctt cttttaaaaa ataaatctta  3780

taggaaaata gacagtccaa agtcatgtct ttgaacagtg gattggatct gtgccagtaa  3840

tgacaaaatt atttttttga cttgcttgcc tgaataaatt gaagaattgc tttcagtttg  3900

ggttttgtat attcttaagt agccattgaa atttatattc ttaactaggt caaaaaataa  3960

tgagccataa gtttatgtcc tctcacttag acattttctc tttaaaaagg tattttcttc  4020

tttataaaca ttttaaaaga gccttccctt cttaaactaa ctccagtgca tgaagtgtga  4080

aaatatttta aaatgacatt tttactaata tgagcaagtc atgtaaacat tgaagaactt  4140

ggtaacatat tagtaaatgg atattaccaa atgttttcat cgttaattac tttgcgttcc  4200

accaaaatat ctttactaaa atgtgcttgg tgtagtttgt ttattgtcta aattagtacc  4260

agtcatctta tttctgcaaa atgagtatca atgtgaaaaa gacacgtgaa gattaagcat  4320

gtttgaaaat aaaatggtca attacatttc aatttacata ggccaacaac tgttccatac  4380

tttgtttgta aacatttaat ttctctactg gacaaaatta atatttggct ttacattgaa  4440

ttttgagctg tgaagaataa attatgtatc attttagcat attaaacagt agtaagtcta  4500

gcacatagtc tcagccactt aaaacaaaag tttttttgtt tgtttgtttg tttgtttttt  4560

tgagatggag tctcactctg ttgcccaggc tggagtgcag tggcgtgatc tcggcttact  4620

gcaacctccg cctcccgggt tcaagcgatt ctcctgcctc agcctcccaa gtaactggga  4680

caacaggcgc gtcccaccac acccagctaa ttttttatac ttttagtaga gatggggttt  4740

cagcatattg gccaggctgg tctcgaactc ctgaccttgt gatccacccg cctcggcctc  4800

ccaaagtgct gggattatag gcgtgagccc ctgcacccgg ccaaaagttg atttttaatt  4860

acataaaaat cgtaaaaact tctagtaaaa acttgatttg gtgaatacag ttatatttta  4920

aaaccttaag gtgacaagca ttttctatgc ctaaatcttc attggtttgc ctggaaagag  4980

tctctgttaa aagattttcc atattcaaag taaaaggaaa gatttcttgc ttcctaattg  5040

tcttttggac acatgcctat tttctttgag gtataaacct ttagatgtga aaaatgtaat  5100

ttcattctgc tattgtgtgt gcttgtgtgt gtgtaattga aaaaactggg aaatcctgct  5160

ttgttggtaa taaatcaata tttttatatt c                                 5191

<210>6

<211>4755

<212>DNA

<213>人

<400>6

aagagatctt ccaggctctc agagccctgg gagggcgatt tccaggaaga ccacaatgcc    60

aacctctgga ggaggctgga gagagaaggc ctaggccaga gcctgtcagg caactttggc   120

aagaccaagt cagccttctc atctctccag aacattcctg agagtctgag aagacacagc   180

agcctggagc taggccgggg aacccaggag ggttaccccg ggggcaggcc cacctgtgca   240

gtcaacacca aggcagaaga ccctgggagg aaagccgctc ctgacctcgg gagccatctg   300

gaccggcagg tttcctaccc gcggcccgag gggaggaccg gtgcctcggc ttctttcaac   360

agcacagacc caagtcccga agagccgcct gccccctcgc acccgcacac atccagtctg   420

ggccggaggg ggcccggccc aggcagcgcc tcggctcttc agggctttca gtacgggaag   480

ccccactgct cggtgctgga gaaggtctcc aaattcgagc agcgagagca agggagccag   540

agaccgagtg tgggcggctc tggttttggc cataactata ggccccacag gaccgtctca   600

acttccagta cttctgggaa tgacttcgag gagacaaaag cacacattcg tttctctgag   660

tcagctgaac ccctaggcaa cggggagcag cacttcaaaa acggggagct gaagttggaa   720

gaggcttccc ggcagccctg cggtcagcag ctgagcggag gagcgtcgga cagcggccgt   780

ggcccccaga ggccggacgc tcggctcctc cgtagccaga gcaccttcca gctctccagc   840

gagccagaga gggagcccga gtggcgggac aggcccggct cgcccgaatc gcccctgctg   900

gatgccccct tcagccgcgc ctaccggaac agcatcaagg acgcacagtc ccgtgtcttg   960

ggggccacct cctttcgacg tcgagacctg gagctggggg cgcccgtggc gtcgaggtcc  1020

tggcggccac ggccttcctc ggcccacgtg gggctgcgga gccccgaggc gtcggcctcc  1080

gcctccccgc acacgccccg ggagcggcac agcgtgaccc ctgctgaggg cgacctggcc  1140

aggcccgtgc cccctgccgc ccggagaggt gctcgccggc gcctgactcc cgagcagaag  1200

aagcgctcct actcggagcc cgagaagatg aacgaggtgg ggatcgtgga ggaggccgaa  1260

ccggcacccc tgggcccgca gagaaatggg atgcgtttcc cggagagcag cgtggccgac  1320

cggcgccgtc tcttcgagcg cgatggcaag gcctgctcca cgctcagcct gtcggggccc  1380

gagctgaagc agttccagca gagcgccctg gcggactaca tccagcgcaa gaccggcaag  1440

cggcctacct ccgccgccgg ctgcagcctc caggagcccg ggccactgcg tgagcgcgcc  1500

cagagtgcct acctccagcc cggccccgcg gcgctcgaag gctccggcct cgcctcggcc  1560

tccagcttga gctcactgcg ggagcccagc ctgcagcccc gcagggaggc cacgctcctg  1620

ccggccacag ttgcagaaac ccagcaggct ccccgagatc gcagcagctc cttcgccggt  1680

ggccgccgcc tcggggaacg gcgacgcggg gacctgctta gcggagcaaa cggtggaaca  1740

aggggcaccc agagagggga tgagaccccc agggagccat cctcctgggg ggccagggcc  1800

gggaagtcca tgtcggccga ggacctgctg gaacgctcgg acgtccttgc gggccctgtc  1860

catgtgaggt ccaggtcatc tcccgccacc gcagacaagc gccaggatgt gcttttgggg  1920

caagacagtg gctttggtct tgtgaaggat ccatgttatt tggctggtcc tggatctagg  1980

tcactcagtt gttcagaaag aggccaagaa gagatgctgc tgctcttcca ccatctcacc  2040

cctcgttggg gtggttcagg ctgcaaagcc attggtgatt cctccgttcc tagtgaatgt  2100

cctggaaccc tggaccatca gaggcaagcc agtaggacac cctgccccag gccaccactg  2160

gcaggaacgc aagggctggt cacagacacc agggctgcac ccctgacccc aattggcacc  2220

cctctgcctt cagccattcc ctctggctac tgctcacagg acggtcagac agggcgacag  2280

cctctcccgc cctacacccc tgccatgatg cacagaagca atggtcacac cctgacccag  2340

cctcccggtc caagaggctg tgagggcgat ggcccagagc atggggtaga agagggaacg  2400

aggaagaggg tctcgctgcc tcagtggcca cctccttctc gagcaaagtg ggcccacgca  2460

gccagagagg acagccttcc tgaggaatcc tcagcccctg attttgcaaa cctgaagcac  2520

tatcaaaaac agcagagtct tccaagttta tgcagcactt ctgacccaga cacacctctt  2580

ggggccccga gcactccagg gaggatctcc ctccgaatat ctgagtctgt cctgcgggac  2640

tccccgccac ctcatgagga ttatgaagac gaagtgtttg tgagggatcc gcaccccaag  2700

gccacgtcca gccccacatt tgaacctctt cccccacccc cacctcctcc accgagtcag  2760

gaaaccccgg tgtatagcat ggatgacttc cctccacctc ctccccacac tgtatgtgag  2820

gcgcagctgg acagtgagga tcccgagggg ccacgcccca gcttcaacaa actttctaaa  2880

gtgacaattg caagggaaag gcacatgcct ggtgcagccc atgtggtagg tagtcagaca  2940

ctggcttcca gactccaaac ttctatcaag ggttcagagg ctgagtccac accaccctcc  3000

ttcatgagcg ttcacgccca acttgctggg tctcttggtg ggcagccagc acccatccag  3060

actcaaagcc tcagccatga tccagtcagt ggaactcagg gtttagaaaa gaaagtcagt  3120

cctgatcctc agaagagttc agaagacatc agaacagagg ctttggccaa ggaaattgtc  3180

caccaagaca aatctctagc agacattttg gatccagact ccaggctgaa gacaacaatg  3240

gacctgatgg aaggtttgtt tccccgagat gtgaacttgc tgaaggaaaa cagtgtaaag  3300

aggaaggcca tacagagaac tgtcagctct tcaggatgtg aaggcaagag gaatgaagac  3360

aaggaagcag tgagcatgtt ggttaactgc cctgcctact acagtgtgtc tgctcccaag  3420

gctgagctac tgaacaaaat caaagagatg ccagcagaag tgaatgagga agaggaacag  3480

gcagatgtca atgaaaagaa ggctgagctc attggaagtc tcacccacaa gctggagacc  3540

ctccaggagg cgaaggggag cctgctcacg gacatcaagc tcaacaacgc cctgggagaa  3600

gaggtggagg ctctgatcag cgagctctgc aagcccaatg agtttgacaa gtataggatg  3660

ttcatagggg atttggacaa ggtggtcaac ctgctgctct ccctctcggg gcgtctagcc  3720

cgtgttgaga atgtccttag cggccttggt gaagatgcca gtaatgaaga aaggagctct  3780

ctttacgaga aaaggaagat cctggctggt cagcatgagg atgcccggga gctgaaggag  3840

aacctggatc gcagggagcg agtagtgctg ggcatcttgg ccaattacct ttcagaggag  3900

cagctccagg actaccagca cttcgtgaaa atgaagtcca cgctcctcat tgagcaacgg  3960

aagctggatg acaagatcaa gctgggccag gagcaggtca agtgtctgct ggagagcctg  4020

ccctcagatt tcattcccaa ggctggggcc ctggctctgc ccccaaacct cacgagtgag  4080

cccattcctg ctgggggctg tactttcagt ggtattttcc caacattaac ctctccactt  4140

taacctcttc taaaataccc aaccaaaaga tcactgtttc tctcaacact atttaatctg  4200

aaaaatgttt cagtacaaac cactgtttga actatctggg ttattggtgt ttgttcctga  4260

tgaaaggaaa aaaattctct ccaggaggaa gcctttttcc ttcttgccct tcctgattga  4320

tcttctgaga gctcgaatgc tgctggacac gtaccccttt ctattattac tttgtagtag  4380

aaagaaagtt aatgaaactg agaactgatt ggagggtgtt tgatcattta gtttttaaca  4440

ggctgaggca acatggatca gtgtgtgtcc ccctcaggaa tgtatccaca gtggccttcc  4500

ttgctggtgg gcagtgtatc ctgatggcag ggtacaagta ccattaatga agggtctgca  4560

acataaagcc ttaaaaagac acacactaag aaaactgtaa aaccttgaac attgttattt  4620

atatttttta aaatggaaaa gatcactatg tttgttgtgc taaccactta tttgattctg  4680

ttttgtggtg gacatagatg attacgtttg agctttgtat tttgtgaaaa ccttaatgaa  4740

atgaattcca aagat                                                   4755

<210>7

<211>2045

<212>DNA

<213>人

<400>7

gaaacttgac cccggctcat cctgtctctg gctgtggccc ggcaaagcac tgaaaacccc    60

tctggtctca gagacagtag gggcagtgcc actttctaca acctgccaac ccacacactg   120

gagtaattct gaaaaaaatt attcctaaac tctctaagtg tggacggaga atgagcaagc   180

cccagaagta ttttacaacc agagtgggta atgaggaggg ggcttactgg aatcgtcata   240

tctctgaata ttgaaaacaa caactaaaaa agtggacctt ctcagaaaaa aagggcagca   300

aatgaccaag ggcgcccctt ctggccgtgc ttggcttgag taactgtctc tctttcccca   360

cccccatcac agggctttca gtttggcaaa ggaaaagcag ataaaaacag aacattccat   420

atgtttcttt ctccatcggc caaaaacatt ttgacacaat gtttgtgaaa cacctttgga   480

gaggtgcact tctgaatgct gcctctgccg taaatcctgg ggcaagggat cagcctcttc   540

ccaggaacca tcgccttcta taaaccgtga actcaagcag gcattttttt tttcttaccg   600

aaaggctgct attgtgcaag ggcacataat gggtctgttg ctcttattgg cttccaaatg   660

tgcatggcaa agagagagat gtgggcctag agcagatata ttcagcaagg tgacagcttc   720

ccataacaat tctaacactt cttatcttat gtgagaataa aatatttaag ggttgaacct   780

tattttgcca aatgtatctt ttctgctttt gaattgggca gaagatttta gcaactatat   840

tctacaaatg ttacttataa cacacacaca cacatctgaa atatatgccg aaaattgacg   900

tctttgacct cagggagagc acctgtccag gtctgcctaa aggaaatggc tccagtgggt   960

ctaaacaacc acatcctatc catggatagg tctagtcata acactttaga gagaatgtca  1020

gagcaggagg gaggcaagcc gcctcttctc ggccatcaac tgcagatgat gaaagagcgg  1080

gattcaactt tgttttcttt tcctgtggcc ccagtgaaac ctcctgccct ccctgcacgt  1140

ctgtgtcttc atttctaaaa tgggggtgat gctttcatat tgacctcacc ccatactacc  1200

tcacagatgt gttgtgagga ttaataaaat tatgtctatg gtattttcag tttctggaga  1260

aaaatactta tagacagttt aactattaca tagatatata agtgatctca gtttcttgtt  1320

tgctgtgata ctaatgtgtt gttttaactt attccataaa atgacagttg tgtcctagcc  1380

acatcagaca gctatctaag ctctggacta cccctttgtg cagctgaatc actgcagggt  1440

cgaccatgcc tggtgccaca gccatggttt ccatttctag atgaaaggat ggcctaggac  1500

ataggtctca aagactcttg gatcagaatc aggagattag ggaaaacagg atggatacct  1560

gagcactaac agcagtagac gtagacctct gtcctttacc atctgaggtc ttctggattc  1620

tttgtggggt taattttgat ttgatgtcat ctgtttgccc ttcatcttgc ttgcaagtgt  1680

gcatggttca atccctcaca tccaggaaat gaattttgca attgggccag atgctaattt  1740

gcacgttgat tcaccttctt tgcctttaag cctttttttt cttttttttt ttttttggca  1800

aatgaatgta ccatttcaac tttgatttta atagtgctag ttgatattgg taataatgct  1860

aaccaagaga tcaatgccag atttttctct tggggtaagt tagctgaagt catttaaaga  1920

tggaaaggtg ggaaaattct ttgatatttg atgtcattgt atccacattt gttgtaagac  1980

atattgcata ccaattataa ttatatcaat taaagttgat aaaagcttca aaaaaaaaaa  2040

aaaaa                                                              2045

<210>8

<211>2096

<212>DNA

<213>人

<400>8

atggagaacg agcctgtagc ccttgaggaa actcagaaga cagatcctgc tatggaacca    60

cggttcaaag tggtggattg ggacaaggac ctggtggact ggcgaaagcc tctcctgtgg   120

caggtgggcc acttgggaga gaagtacgat gagtgggttc accagccggt gaccaggccc   180

atccgcctct tccactcaga cctcattgag ggcctctcta agactgtctg gtacagtgtc   240

cccatcatct gggtgcccct ggtgctgtat ctcagctggt cctactaccg aacctttgcc   300

cagggcaacg tccgactctt cacgtcattt acaacagagt acacggtggc agtgcccaag   360

tccatgttcc ccgggctctt catgctgggg acattcctct ggagcctcat cgagtacctc   420

atccaccgct tcctgttcca catgaagccc cccagcgaca gctattacct catcatgctg   480

cacttcgtca tgcacggcca gcaccacaag gcacccttcg acggctcccg cctggtcttc   540

ccccctgtgc cagcctccct ggtgatcggc gtcttctact tgtgcatgca gctcatcctg   600

cccgaggcag tagggggcac tgtgtttgcg gggggcctcc tgggctacgt cctctatgac   660

atgacccatt actacctgca ctttggctcg ccgcacaagg gctcctacct gtacagcctg   720

aaggcccacc acgtcaagca ccactttgca catcagaagt caggatttgg tatcagcact   780

aaattgtggg attactgttt ccacaccctc actccagaga aaccccacct gaagacgcag   840

tgacaactcc caccccctcc gtcctgccct cagcccggcc ctggcccctt cccgaccccc   900

acccgccatt cagaccccat taagaaggtt ggcttggcca ggcaggatgg gctgtgtccg   960

gccctgcagc ctagtggaag gtgctgaggg ggccctgagg caggaccgcc ctcctgaccc  1020

ctggtaggag ggtcacatcc acttggtgca ggtggccctt ggtgacccac ttcttcctgg  1080

agcgtccctg cctagagctc agcccacagg actgcttcag gccgtggcca caggtagcag  1140

ccgcaagggg aaatgaagaa aactgagccc tcgtggccac ctgtgtcacc cttgtgcctt  1200

agcctcatgg gctgcctagg agctgcctgc acggcacagc tcgctttcac agtcagaagt  1260

gggtctgtgg gatctgtggt ccctgtcctc cctgctgtcc cttctgggga ggctttggtg  1320

gctctgaggt ggacaaagag ctctcgcaag aagagacagc gtgatgcctc ccacagtcca  1380

ccccagaccc tggggcagcc cctctggccc tgccagctgc ctgcgtcgtt gggcccaggg  1440

tggctggcag gagtcccagc tgcttgcttt aggacctggc agcttttctt gccgtccctc  1500

ccctgcctcc agaatcacag cccttctccc caagggaggc tgaggaggct tctccaccag  1560

tggcagcccc accccgtccc tggccattct tggcctccac cccgctcagg cccctactcg  1620

ggcgctccca gaaggagcca cctctcagtg cctcacctcc ccctgcctcc cagcctccgc  1680

agatgaggtt cctgcccctt cctcctcgta accaaaaccc tcactgctcc caggacggtc  1740

ttatttataa accagataca tgttcttagt ctggtcccag accaaggagc tggtcagacg  1800

gccctttcta atcctacatg ttgagcttat gtaaaaaatg ttgtttcctc ctgtttttgg  1860

ttcctttctt acccacaaac cattactact tgaaacttaa aaaactcgcc aagtgtaaag  1920

gctaaagaga agcagtttga cggaccttgt gatttgtact gtttgctgcg gagctattta  1980

aagattttgg aataaatata caaaactacg gttgtgaaat aaaaacttaa attgtatatt  2040

ttgaaaaata aaacactgaa aagaaaccaa caaaaaaaaa aaaaaaaaaa aaaaaa      2096

<210>9

<211>5640

<212>DNA

<213>人

<400>9

ggaaacgcag aaaacagaga gaggcattct gagtcatctg actggatgaa gactgttcca    60

agttacaacc aaacaaatag ctccatggac tttagaaatt atatgatgag agatgagact   120

ctggaaccac tgcccaaaaa ctgggaaatg gcctacactg acacagggat gatctacttc   180

attgaccaca ataccaagac aaccacctgg ttggatcctc gtctttgtaa gaaagccaaa   240

gcccctgaag actgtgaaga tggagagctt ccttatggct gggagaaaat agaggaccct   300

cagtatggga catactatgt tgatcacctt aaccagaaaa cccagtttga aaatccagtg   360

gaggaagcca aaaggaaaaa gcagttagga caggttgaaa ttgggtcttc aaaaccagat   420

atggaaaaat cacacttcac aagagatcca tcccagctta aaggtgtcct tgttcgagca   480

tcactgaaaa aaagcacaat gggatttggt tttactatta ttggtggaga tagacctgat   540

gagttcctac aagtgaaaaa tgtgctgaaa gatggtcccg cagctcagga tgggaaaatt   600

gcaccaggcg atgttattgt agacatcaat ggcaactgtg tcctcggtca cactcatgca   660

gatgttgtcc agatgtttca attggtacct gtcaatcagt atgtaaacct cactttatgt   720

cgtggttatc cacttcctga tgacagtgaa gatcctgttg tggacattgt tgctgctacc   780

cctgtcatca atggacagtc attaaccaag ggagagactt gcatgaatcc tcaggatttt   840

aagccaggag caatggttct ggagcagaat ggaaaatcgg gacacacttt gactggtgat   900

ggtctcaatg gaccatcaga tgcaagtgag cagagagtat ccatggcatc gtcaggcagc   960

tcccagcctg aactagtgac tatccctttg attaagggcc ctaaagggtt tgggtttgca  1020

attgctgaca gccctactgg acagaaggtg aaaatgatac tggatagtca gtggtgtcaa  1080

ggccttcaga aaggagatat aattaaggaa atataccatc aaaatgtgca gaatttaaca  1140

catctccaag tggtagaggt gctaaagcag tttccagtag gtgctgatgt accattgctt  1200

atcttaagag gaggtcctcc ttcaccaacc aaaactgcca aaatgaaaac agataaaaag  1260

gaaaatgcag gaagtttgga ggccataaat gagcctattc ctcagcctat gccttttcca  1320

ccgagcatta tcaggtcagg atccccaaaa ttggatcctt ctgaggtcta cctgaaatct  1380

aagactttat atgaagataa accaccaaac accaaagatt tggatgtttt tcttcgaaaa  1440

caagagtcag ggtttggctt cagggtgcta ggaggagatg gacctgacca gtctatatat  1500

attggggcta ttattcccct gggagcagct gagaaagatg gtcggctccg cgcagctgat  1560

gaactaatgt gcattgatgg aattcctgtt aaagggaaat cacacaaaca agtcttggac  1620

ctcatgacaa ctgctgctcg aaatggccat gtgttactaa ctgtcagacg gaagatcttc  1680

tatggagaaa aacaacccga ggacgacagc tctcaggcct tcatttcaac acagaatgga  1740

tctccccgcc tgaaccgggc agaggtccca gccaggcctg caccccagga gccctatgat  1800

gttgtcttgc aacgaaaaga aaatgaagga tttggctttg tcatcctcac ctccaaaaac  1860

aaaccacctc caggagttat tcctcataaa attggccgag tcatagaagg aagtccggct  1920

gaccgctgtg gaaaactgaa agttggagat catatctctg cagtgaatgg gcagtccatt  1980

gttgaactgt ctcatgataa cattgttcag ctgatcaaag atgctggtgt caccgtcaca  2040

ctaacggtca ttgctgaaga agagcatcat ggtccaccat caggaacaaa ctcagccagg  2100

caaagcccag ccctgcagca caggcccatg ggacagtcac aggccaacca catacctggg  2160

gacagaagtg ccctagaagg tgaaattgga aaagatgtct ccacttctta cagacattct  2220

tggtcagacc acaagcacct tgcacagcct gacaccgcag taatttcagt tgtaggcagt  2280

cggcacaatc agaaccttgg ttgttatcca gtagagctgg agagaggccc ccggggcttt  2340

ggattcagcc tccgaggggg gaaggagtac aacatggggc tgttcatcct tcgtcttgct  2400

gaagatggtc ctgccatcaa agatggcaga attcatgttg gtgaccagat tgttgaaatc  2460

aatggggaac ctacacaagg aatcacacat actcgagcaa ttgagctcat tcaggctggt  2520

ggaaataaag ttcttcttct tttgaggcca ggaactggct tgatacctga ccatggtttg  2580

gctccttccg gtctgtgctc ctacgtgaaa cccgagcaac attaaggctt tcagggcttt  2640

tcttggtctt tccttaaaaa gacttggtga ttgggatatt aataatcctt cgtcttcaaa  2700

tgtgatttat gatgaacagt caccattacc cccatcttca cattttgctt ccatatttga  2760

agagtctcac gtgccagtaa ttgaagaatc tttgagagtt cagatatgtg aaaaggcaga  2820

agaattaaag gacattgtgc ctgaaaagaa aagcacttta aatgaaaatc agcctgagat  2880

aaagcatcag tctcttctcc agaaaaatgt gagtaagagg gatccaccca gcagtcatgg  2940

gcacagtaac aagaaaaatc tattaaaagt agaaaatggt gttacacgaa gaggtagatc  3000

ggttagtccc aaaaagccag ccagtcaaca ttcagaggaa catttggata agattcctag  3060

tcctctaaaa aataacccca aaagaagacc cagagatcaa tccctcagcc ccagcaaagg  3120

ggaaaataaa agttgtcagg tcagcaccag ggcaggctct ggacaagatc agtgcagaaa  3180

aagcagaggt cggtcggcca gcccaaaaaa gcagcaaaaa attgaaggaa gcaaagctcc  3240

atcaaatgct gaggccaaat tattagaggg taagagtcga agaatagcag gctatacggg  3300

cagtaatgct gagcagatcc cagatgggaa ggaaaaatca gacgtcatca ggaaagatgc  3360

aaagcagaat cagttggaaa aaagcagaac aaggtctcca gagaaaaaaa tcaaaagaat  3420

ggttgagaaa tctcttccat ccaaaatgac taataagact acaagtaaag aagtatctga  3480

aaatgaaaaa ggaaagaaag taaccacagg agaaacaagt tctagtaacg ataaaatagg  3540

agaaaatgtc cagctatcag aaaagaggct gaagcaagaa cctgaagaga aggtagtttc  3600

aaacaaaaca gaagatcaca aagggaaaga actagaggca gctgacaaaa acaaagagac  3660

tggaaggttc aaaccggaaa gcagttctcc agttaagaaa acactgataa ctccagggcc  3720

ctggaaggtt ccaagtggaa ataaagtcac aggcactatt ggtatggctg agaaacggca  3780

gtaaccttta gtataaaaca aagaaaaaca agttgtaatc ttttcttaca gcagcatttt  3840

tccagaaaaa gccttttttt ttttttcaga tattctgaaa cagataagta catgttaatg  3900

tgagcctcaa gttacctagg ctgcatgaag ggcctttagg attgctaaga accaactgtc  3960

cccctggccg gctgccctcc ctcgctctca ggaaggagct gcatccacat gctcatctga  4020

cccgccctgc tcaggctgcc cagctagtct tcatgagtgt ctgaacaaat gacatatgtt  4080

gatattaaca atgtggtcac aactcacttt gtatttgtgc caagttatct actgtatcat  4140

gtctgttttt atcctttttg ttcagctgtt tccacagtaa tgaaaaagtt aggtttggct  4200

tggaagttga tgatctcaat agcatgttgc atgtttacag agagaaatat gtgagtcctt  4260

gcagaagaag agactgttaa ctcatcgtta aagatggccg ttgtctcttc taacagctac  4320

tgatgatgtc ccactttaaa aataaaaccc ccaaacatca ctactttaag gaaaaaaaaa  4380

atgtagtcca atattgatgc tttcttatgg ctttttattt taatttggct ggataagttg  4440

tttcaaataa ctgttaaaga tattacttac aattgaatgt ttgaaataag aaagtacttt  4500

aagcaataga gttcatctcc tgctgtgtta tccaacctcg atgtatactt acagcatctc  4560

aggtcaccct ttttatttca gttatttaat tatgaaacca taaagaagca tgtggaaata  4620

gtgtttattg ctctttgaag aaaaaccacc aactatttct ggatattttg gctgtaccta  4680

ctactaaagt cattagtctt taatacataa tacatatttg aaaagtaaac atattatata  4740

gattatgtga gggacttaat catgaaacca gtttcacagt ccaagtacca actcttctgg  4800

tagcaggtgc acaagcttgg gtgtttaaaa acaacctgtg tagggtatgc ccagcaaatg  4860

aggacaaatg tgtagacagt acttactgga tcttatttaa cttttagcta cattaactaa  4920

ctttcttatt taaaaacaag aaagggagac taaacatctg cttaacttgt acacattttc  4980

agaattcttt ttaaaagtct agttaaagat gtttcttaga agttggagac tgttaacaac  5040

ttccataaaa tagatccagg tttttcagtt ccctgaagca gcattcagta gcatctatat  5100

aaataaaggc accttctgag aataaaacta ttttatggag tgtgtgaaca cacttgttct  5160

gtcacctggg ttcatcttgt tgtgaagcac attaggtcca ggtccttccc tctgggagtc  5220

tgactgtgaa actctttaac ccaacaactc aattagcccc tgtagataag acatgcttcc  5280

cagagtgaga tttttgaaat ccccttttca tccagaacta tatttaccca cctattgtaa  5340

ctattcaaat agagcaaaat taggaggctt gataaatact aagaatttag taccacagaa  5400

attatttatt attttccctg tagtccacaa ttagtgataa cgaatcctat ttttgttaac  5460

tgtgacataa ctttgatgtc atatgttgtc ctatgtggtt cttcctaagt aaactctgta  5520

ctgattatat actgacttag caatgtggcc ttggaatgct gagcaaaatg tggatgtact  5580

ggttgtaaat gtttatatat tgtacagtac ctttatatat acacttgagg ttctgattag  5640

<210>10

<211>457

<212>DNA

<213>人

<220>

<221>其它特征

<222>(242)..(242)

<223>任意碱基

<220>

<221>其它特征

<222>(369)..(369)

<223>任意碱基

<220>

<221>其它特征

<222>(394)..(394)

<223>任意碱基

<220>

<221>其它特征

<222>(406)..(406)

<223>任意碱基

<220>

<221>其它特征

<222>(457)..(457)

<223>任意碱基

<400>10

tcagtcactc tttcaccctg ccaaagcttc actgtcctac tgattgaatt gtatgtgaga   60

aataaaatgt catcatatta agccactggg atttgtatgt ttatctgtta tagcagcaag   120

tcttaattta cctaatacac acattgtgac agatgttctt aatgtcccac cccatattgt   180

tacatgtcca gctttgagga tccctggcat gtgggggtag gagtttctgg gcatgctgga   240

tncaattccc acttttaagg catctgtggc ctctgtggcc tctgtggcct tcactgttat   300

ggaagggatt tatctggggc accataggaa actttaccat ggcacagtgg acaacctagg   360

agggggtgng gaggaggggc cttcaggccc aacngggggg accagngttc gtggggttag   420

ggtggtttgg ggggttttcc ctcttacccg tgggggn                            457

<210>11

<211>1493

<212>DNA

<213>人

<400>11

aatagggttg gcggctgcag cgggcggcaa acagcccgcc cggcaccacc atgctcgccc    60

tggaggctgc acagctcgac gggccacact tcagctgtct gtacccagat ggcgtcttct   120

atgacctgga cagctgcaag cattccagct accctgattc agagggggct cctgactccc   180

tgtgggactg gactgtggcc ccacctgtcc cagccacccc ctatgaagcc ttcgacccgg   240

cagcagccgc ttttagccac ccccaggctg cccagctctg ctacgaaccc cccacctaca   300

gccctgcagg gaacctcgaa ctggccccca gcctggaggc cccggggcct ggcctccccg   360

cataccccac ggagaacttc gctagccaga ccctggttcc cccggcatat gccccgtacc   420

ccagccctgt gctatcagag gaggaagact taccgttgga cagccctgcc ctggaggtct   480

cggacagcga gtcggatgag gccctcgtgg ctggccccga ggggaaggga tccgaggcag   540

ggactcgcaa gaagctgcgc ctgtaccagt tcctgctggg gctactgacg cgcggggaca   600

tgcgtgagtg cgtgtggtgg gtggagccag gcgccggcgt cttccagttc tcctccaagc   660

acaaggaact cctggcgcgc cgctggggcc agcagaaggg gaaccgcaag cgcatgacct   720

accagaagct ggcgcgcgcc ctccgaaact acgccaagac cggcgagatc cgcaaggtca   780

agcgcaagct cacctaccag ttcgacagcg cgctgctgcc tgcagtccgc cgggcctgag   840

cacacccgag gctcccacct gcggagccgc tgggggacct cacgtcccag ccaggatccc   900

cctggaagaa aaagggcgtc cccacactct aggtgatagg acttacgcat ccccaccttt   960

tggggtaagg ggagtgctgc cctgccataa tccccaagcc cagcccgggc ctgtctggga  1020

ttccccactt gtgcctgggg tccctctggg atttctttgt catgtacaga ctccctggga  1080

tcctcatgtt ttgggtgaca ggacctatgg accactatac tcggggaggc agggtagcag  1140

tgcttccaga gtcccaagag cttctctggg attttcttgt gatatctgat tccccagtga  1200

ggcctgggac ctttttaaga tcgctgtgtg tctgtaaacc ctgaatctca tctggggtgg  1260

gggccctgct ggcaaccctg agccctgtcc aaggttccct cttgtcagat ctgagatttc  1320

ctagttatgt ctggggccct ctgggagctg ttatcatctc agatctcttc gcccatctat  1380

ggctgtgttg tcacatctgt cccctcattt ttgagatccc ccaattctct ggaactattc  1440

tgctgcccct ttttatgtgt ctggagttcc ccaatcacat ctagggctcc tcc         1493

<210>12

<211>2292

<212>DNA

<213>人

<400>12

ccatgggttc ccctt agcc tgtccataca gagtgtgcat tccctggcag gggctcctgc    60

tcacagcctc gcttttaacc ttctggaacc tgccaaacag tgcccagacc aatattgatg   120

tcgtgccgtt caatgtcgca gaagggaagg aggtccttct agtagtccat aatgagtccc   180

agaatcttta tggctacaac tggtacaaag gggaaagggt gcatgccaac tatcgaatta   240

taggatatgt aaaaaatata agtcaagaaa atgccccagg gcccgcacac aacggtcgag   300

agacaatata ccccaatgga accctgctga tccagaacgt tacccacaat gacgcaggat   360

tctataccct acacgttata aaagaaaatc ttgtgaatga agaagtaacc agacaattct   420

acgtattctc ggagccaccc aagccctcca tcaccagcaa caacttcaat ccggtggaga   480

acaaagatat tgtggtttta acctgtcaac ctgagactca gaacacaacc tacctgtggt   540

gggtaaacaa tcagagcctc ctggtcagtc ccaggctgct gctctccact gacaacagga   600

ccctcgttct actcagcgcc acaaagaatg acataggacc ctatgaatgt gaaatacaga   660

acccagtggg tgccagccgc agtgacccag tcaccctgaa tgtccgctat gagtcagtac   720

aagcaagttc acctgacctc tcagctggga ccgctgtcag catcatgatt ggagtactgg   780

ctgggatggc tctgatatag cagccttggt gtagtttctg catttcggga agagtgtttt   840

tattatccac ctgcagactg gactggattc ttctagctcc ttcaatccca ttttctcctg   900

tggcatcact aagtataaga cctgctctct tcctgaagac ctataagctg gaggtggaca   960

actcaatgta aatttcaagg aaaaaccctc atgcctgaga tgtgggccac tcagagctaa  1020

ccaaaatgtt caacaccata actagagaca ctcaaattgc caaccaggac aagaagttga  1080

tgacttcatg ctgtggacag tttttcccaa gatgtcccaa gcctcatcgt gacgaggctc  1140

ttatcccact ccatttttcc ctgctcatgc ctgcctcttt aatttggtaa gataatgctg  1200

taactagaat ttcacaatca gcgccttgtg caggcaattt gacagagtgt tggatgtgtc  1260

atgtcatcat gtcaaaccca aatatttgac ctaagggatc ctttattctg cccagtggct  1320

aactttaaca acatccctaa tacaactgtt tattcaaatg cacggtggtc cctgttagag  1380

ttagacctct agactcacct gttctcacgc cctgttttaa tttaacccag ctatgggatg  1440

ccagataaca gaattgctgc ctacgagctg aacagggagg agtttgtgca gttgctgaca  1500

cttcttgttg cacataaata aatacagtgg gtactataga gactcagttg caaaaattaa  1560

caaatatgct gcttgattaa aatgggtagg cttctcatgt ggctcattct ttaatctatt  1620

ctcttttatt tggtttggtt catggggtct ctgcctatgg atcatacttc aaactcttgg  1680

tgtgatcctc ctgattgtca caatattagt taccctggtg tgctgtattc tctaaaacct  1740

ttaaatgttt gcatgcagcc attcgtcaaa tgtcaaatat tctctctttg gctggaatga  1800

caaaaactca aataaatgta tgattaggag gacatcataa cctatgaatg atggaagtcc  1860

aaaatgatgg taactgacag tagtgttaat gccttatgtt tagtcaaact ctcatttagg  1920

tgacagcctg gtgactccag aatggagcca gtcatgctaa atgccatata ctcacactga  1980

aacatgagga agcaggtaga tcccagaaca gacaaaactt tcctaaaaac atgagagtcc  2040

aggctgtctg agtcagcaca tgaagaaagt cctttctgct ttaactctta gaaaaaagta  2100

atatgaagta ttctgaaatt aaccaatcag tttatttaaa tcaatttatt tatattcttc  2160

tgttcctgga ttcccatttt acaaaaccca ctgttctact gttgtattgc ccagtaggag  2220

ctatcactat attttgcaga atggaaactg ccctgactct tgaatcacaa ataaaagcca  2280

attgtatctg tt                                                      2292

<210>13

<211>519

<212>DNA

<213>人

<220>

<221>其它特征

<222>(212)..(212)

<223>任意碱基

<220>

<221>其它特征

<222>(451)..(451)

<223>任意碱基

<400>13

gaaacaacaa cagtgtaatc tttaacagaa atgttaaagg taagaagtca ggaagataaa    60

ccaaaatgat tgagtatgat aaagaatttt gcatggcgat taaaatagaa aacctataaa   120

tgtagaaaaa gcaggtctgg acttagcaaa gaaacaatat agtttggaga aggcatgaaa   180

taagttcttt tcatgttcac tgctggtcac ancataacag agagtgatgt ggagagcttt   240

gggaaggttt cacgttgagt tacatcagtg gtcaacaatg gagcaacaag actccgtaga   300

ggatgccacc ctgggagaat tgcaagggaa aggaggctga agcacaactg gtaatagcct   360

tcagatattt aatggatatg caaataaagc tctgattaat tgtattttca cttattatat   420

atcatctttg gacctttcta aaagtgggac nctagaaaag atatactgaa actccaaaag   480

aatacttcag ctcgagttga atggattcaa gatgttgtt                          519

<210>14

<211>5294

<212>DNA

<213>人

<400>14

ggctcgcatc cccatagtgc tgggttacag tgaaggtacg ccccgcgctc tgctctggag    60

aggcagggtg ggatagggaa cgtctcgagt ggcgcccgca gtcatggtgg tgttcgttgg   120

ccgccgcctc ccggcgctcc tagggctgtt taagaagaag ggctctgcca aggctgagaa   180

tgacaaacat ctaagtgtag ggcctggcca ggggccaggg tctgcagtgg atgagcacca   240

ggacaacgtc ttctttccca gtgggcgacc cccccacctg gaagagctgc acactcaggc   300

ccaggagggg ctccgctccc tacaacacca agagaaacag aaactgaaca agggtggctg   360

ggaccatgga gacacccaga gtatccagtc ctcccggacg gggccggatg aagacaacat   420

ctccttctgc agtcagacca catcctacgt ggctgagagc tccacagcag aggacgcgct   480

ctccatccgc tcggagatga tccagcgcaa aggctccacc ttccgacccc atgactcatt   540

tcccaaatct ggaaagtcag ggcggcgtcg gcgggagcgg cggagcactg tgctgggact   600

cccgcagcat gtgcagaagg agcttggcct gaggaatgag cgtgaggcac caggcacgcc   660

ccgggctcct ggtgcacggg atgccgtacg catccccaca gtggacggcc gcccccgagg   720

cacctcaggg atgggggccc gggtgtccct gcaggcgctg gaggcggagg cagaggctgg   780

cgctgagaca gaggccatgc tgcagcgcca cattgaccgt gtctaccggg atgacacctt   840

tgttggccgg tccacgggta cccgggcccc accattgacc cggcccatgt ccctagcagt   900

gcctggattg acaggagggg cagggcctgc agagcccctg agcccggcca tgtccatctc   960

cccccaggcc acctacctgt cgaagttgat tccacatgct gtgctgccgc ctacagtgga  1020

cgtggtggcc ctagg cgct gcagcctgcg cacactaagc cgctgcagcc tgcactcggc  1080

cagcccagcc tcagtccgct cgctggggcg cttctcctcc gtctccagcc cacagccccg  1140

cagccgccac ccatcctcct ccagtgacac ctggagccac tctcaatcct ccgacaccat  1200

tgtgtctgac ggttccaccc tctcctctaa gggtggctct gagggccagc cggagagctc  1260

tacggctagc aatagcgtgg taccccctcc ccagggaggc agtgggaggg gctctcccag  1320

tgggggcagc actgctgagg cctcagacac actcagcatt cggagcagtg ggcagttgtc  1380

tggccggagt gtgtccctgc gtaagctgaa gcggcctcca ccccctcccc gccggaccca  1440

ctccctccat cagcggggct tagcagtgcc tgatgggcca ttagggttgc cccctaagcc  1500

tgagcgtaag cagcagcccc agctgcctcg gccacccacc actggtggct cagaaggggc  1560

gggggcagca ccctgtccac ccaacccagc caacagctgg gtacctggct tgtctccggg  1620

tggttcccgg cgccccccac ggtccccaga acggacactt tcgccctcca gtggatactc  1680

gagccaaagt ggtactccca ccctccctcc caagggcctg gcaggtcccc ctgcttcccc  1740

aggcaaggcc cagcccccta aaccagagcg tgtcacgtct cttcgctccc ctggggcctc  1800

cgtctcctct tccctcacgt ctttatgttc ctcctcctct gacccagccc cctcagaccg  1860

ctctgggcca cagatattga cccccctggg tgacaggttt gtcatacctc ctcaccccaa  1920

ggtgcctgcc cccttctccc cacctccctc caagcccagg agccctaacc cagctgcccc  1980

tgctctagcc gcccctgctg tggttcctgg gcctgtttct accactgacg ccagtcctca  2040

gtcccctccc actccccaga caaccttgac tccactgcag gagtctcctg tcatctccaa  2100

agaccagtca cccccacctt ccccaccccc atcttatcat ccacccccac cacccactaa  2160

gaagccagag gtggttgtgg aggcaccatc tgcctcagag actgctgagg agcccctcca  2220

agatcccaac tggccccctc ccccaccccc tgcccctgag gagcaggacc tgtccatggc  2280

tgacttcccc ccaccagagg aggctttttt ctctgtggcc agccctgagc ctgcaggccc  2340

ttcaggctcc ccagagcttg tcagctcccc ggctgcttcg tcctcctcag ctactgcttt  2400

gcagattcag cccccgggta gcccagaccc tcctccagct ccgccagccc cagctcctgc  2460

tagttccgcc ccagggcatg tggccaagct ccctcagaag gaaccggtgg gctgtagcaa  2520

gggtggtggg cctcccaggg aggacgtagg tgcgcccctg gtcacgccct cgctcctgca  2580

gatggtgcgg ctgcgctccg tgggtgctcc aggaggggct cccaccccag cactggggcc  2640

atcggccccc cagaaaccac tgcgaagggc cctgtcaggg cgggccagcc cagtgcctgc  2700

cccctcctca gggctccatg ctgcggtccg actcaaggcc tgcagcctgg ccgccagtga  2760

aggcctctca agtgctcagc ccaacggacc gcctgaggca gagccacggc ctccccagtc  2820

ccctgcctca acggccagtt tcatcttctc caagggctct aggaagctgc agctggagcg  2880

gcccgtgtcc cctgagaccc aggctgacct ccagcggaat ctggtggcag aactccggag  2940

catctcagag cagcggccac cccaggcccc aaagaagtca cctaaggctc ccccacctgt  3000

ggcccgcaag ccgtctgtgg gagtcccccc acccgcctcc cccagttacc ctcgagctga  3060

gccccttact gctcctccca ccaatgggct ccctcacacc caggacagga ctaagaggga  3120

gctggcggag aatggaggtg tcctgcagct ggtgggccca gaggagaaga tgggcctccc  3180

gggctcagac tcacagaaag agctggcctg accaccaggc acctcactgg cactgctgac  3240

ccatcccaga aacacaatct cagggacccg agcagctcca aggacgagag gatacagcag  3300

acacaaccta atagagaggg cgcctgcagc cttaacctcc acggccttcg atacttatgc  3360

aagcctggtg ttgctcctgt cctcagagtc atcctgcgct catgcctttt cccgaatggg  3420

ttcacctctg gcagttgccg cttcagtctt ggccttagcc tcatcttgaa gtgggtagct  3480

ggcgggagag ggtggctgcg ccccctgctg gccctgaggc tgcagagttg ggagcaggac  3540

acctcacctg agtttcattt tttttcatgt ccaaaccatg cacatactat agtccagaat  3600

caaagcactt ttgaaaagtg gctgcatggc catcctccag ggcccaggaa gttgcattcc  3660

aagggcctgt ttacatggca gcagaatcca tccccggcag tcagcccata gcttgggacc  3720

agtctgtgcc ctcctgccca gtccagttta ctcctcttgg ttcctgaagg tggccaagtc  3780

attgtgttcc cacaggcttc tctaggctgg gggcaggtgt ggggctgtgg aattccaaag  3840

cacaaaaggt gcagagggga ttggccttcc tgtgcctcaa ctcaccaacc accctcctgc  3900

cttccagttc tgccaggtgc tccatgctgg ggacaagtag gagactgcca gggcccaaag  3960

aaatgggtga gcagtagagt catctcgggg cacttggcag tgtcaagcac ctgccccttg  4020

cctccttgac cacactgggg tgggtgggcc cccagcactt cagaggcagg agcctttggg  4080

ctgagcaagc actgaggagg tggatggaag ggagcatctg gaggggggga gcttccttga  4140

gcagtgggcc caggcctggc cctccacact tcattctctg acctttctct ctcctcattt  4200

cggtgcatgt cctttctgca gctgcctttc agcacaggtg gttccactgg gggcagctaa  4260

cgctgagtga caaggatggg aagccacagg tgcattttac tcaagtcttc tctagtcaat  4320

gaggggcacc cagtgcttct agggcaggct gggtggtggt cccctaggta tcagcctctc  4380

ttactgtact ctccgggaat gttaaccttt ctattttcag cctgtgccac ctgtctaggc  4440

aagctggctt ccccattggc ccctgtgggt ccacagcagc gtggctgccc cccagggcca  4500

ccgcttcttt cttgatcctc tttccttaac agtgacttgg gcttgagtct ggcaaggaac  4560

cttgctttta gcttcaccac caaggagaga ggttgacatg acctccccgc cccctcacca  4620

aggctgggaa cagaggggat gtggtgagag ccaggttcct ctggccctct ccagggtgtt  4680

ttccactagt cactactgtc ttctccttgt agctaatcaa tcaatattct tcccttgcct  4740

gtgggcagtg gagagtgctg ctgggtgtac gctgcacctg cccactgagt tggggaaaga  4800

ggataatcag tgagcactgt tctgctcaga gctcctgatc taccccaccc cctaggatcc  4860

aggactgggt caaagctgca tgaaaccagg ccctggcagc aacctgggaa tggctggagg  4920

tgggagagaa cctgacttct ctttccctct ccctcctcca acattactgg aactctatcc  4980

tgttaggatc ttctgagctt gtttccctgc tgggtgggac agaggacaaa ggagaaggga  5040

gggtctagaa gaggcagccc ttctttgtcc tctggggtaa atgagcttga cctagagtaa  5100

atggagagac caaaagcctc tgatttttaa tttccataaa atgttagaag tatatatata  5160

catatatata tttctttaaa tttttgagtc tttgatatgt ctaaaaatcc attccctctg  5220

ccctgaagcc tgagtgagac acatgaagaa aactgtgttt catttaaaga tgttaattaa  5280

atgattgaaa cttg                                                    5294

<210>15

<211>988

<212>DNA

<213>人

<400>15

gtcgtgaggc gggccttcgg gctggctcgc cgtcggctgc cggggggttg gcctgggtgt    60

cattggctct gggaagcggc agcagaggca gggaccactc ggggtctggt gtcggcacag   120

ccatggcggg cgcgttggtg cggaaagcgg cggactatgt ccgaagcaag gatttccggg   180

actacctcat gagtacgcac ttctggggcc cagtagccaa ctggggtctt cccattgctg   240

ccatcaatga tatgaaaaag tctccagaga ttatcagtgg gcggatgaca tttgccctct   300

gttgctattc tttgacattc atgagatttg cctacaaggt acagcctcgg aactggcttc   360

tgtttgcatg ccacgcaaca aatgaagtag cccagctcat ccagggaggg cggcttatca   420

aacacgagat gactaaaacg gcatctgcat aacaatggga aaaggaagaa caaggtcttg   480

aagggacagc attgccagct gctgctgagt cacagatttc attataaata gcctccctaa   540

ggaaaataca ctgaatgcta tttttactaa ccattctatt tttatagaaa tagctgagag    600

tttctaaacc aactctctgc tgccttacaa gtattaaata ttttacttct ttccataaag    660

agtagctcaa aatatgcaat taatttaata atttctgatg atgttttatc tgcagtaata    720

tgtatatcat ctattagaat ttacttaatg aaaaactgaa gagaacaaaa tttgtaacca    780

ctagcactta agtactcctg attcttaaca ttgtctttaa tgaccacaag acaaccaaca    840

gctggccacg tacttaaaat tttgtcccca ctgtttaaaa atgttacctg tgtatttcca    900

tgcagtgtat atattgagat gctgtaactt aatggcaata aatgatttaa atatttgtta    960

aaaaaaaaaa aaaaaaaaaa aaaaaaaa                                       988

<210>16

<211>4908

<212>DNA

<213>人

<400>16

ggataacctc gcagggtggg ccggagggcg ggcgccgccg ctgcctgtgc tgcggcgatg    60

gcccagtgtg tacaatcagt gcaggagcta atcccggact ccttcgtccc ctgtgtcgct   120

gcgctgtgca gcgacgaagc cgagcggctc actcgtctca atcacctcag cttcgcggag   180

ctgcttaagc ccttctcccg cctcacttcc gaggttcaca tgagagatcc taataatcaa   240

cttcacgtaa ttaaaaattt gaagatagca gtaagcaaca ttgtcaccca gccacctcag   300

cctggagcca tccggaagct tttgaatgat gttgtttctg gcagtcagcc tgcagaagga   360

ttagtagcta atgtgattac agcaggagat tatgacctta acatcagtgc cactactcca   420

tggtttgagt cttacagaga aacctttctt cagtcgatgc cagcatcgga tcatgaattt   480

ctgaaccact atttagcatg tatgttggta gcgtcatcta gtgaagctga acctgtggaa   540

cagttttcaa agttgtcaca agaacagcat cgaattcagc acaacagtga ttattcctac   600

cccaagtggt ttataccaaa tacacttaaa tactatgtac ttttacatga tgtaagtgca   660

ggagatgaac agagagctga atcaatttat gaagaaatga aacagaaata tggaactcag   720

ggttgctatt tacttaaaat taattctcga acatctaatc gagcatcaga tgaacagata   780

ccagatcctt ggagtcagta tctccagaaa aatagtattc aaaaccagga atcatatgaa   840

gatggccctt gtactataac ttcaaataag aattctgata ataacttgct ttcattggat   900

ggattagata acgaagtcaa agatggctta ccaaataact ttagagctca cccacttcag   960

ttggagcaat ccagtgaccc ttctaacagt attgatggcc cagatcatct aagatctgct  1020

tcatcgttac atgaaacaaa gaaaggaaat actggaataa ttcatggtgc atgtttaaca  1080

cttactgatc atgatagaat tcgacagttt atacaagagt tcacatttcg gggccttttg  1140

ccacatatag agaaaacaat taggcaatta aacgatcagc taatatcaag aaaaggtttg  1200

agtcgatctc tattttctgc aactaaaaaa tggtttagtg gcagtaaagt tccagaaaag  1260

agcattaatg acctgaaaaa tacatctggc ttgctgtatc ctccggaagc accagaactt  1320

caaatcagga aaatggctga cttatgtttt ttggtgcagc attatgattt ggcttacagt  1380

tgctatcata ctgcaaagaa agattttctt aatgatcaag caatgcttta tgcagctggt  1440

gccttggaaa tggcagcagt gtctgctttt cttcaaccag gagcacctag gccatatcct  1500

gctcattaca tggatacagc aattcagaca tacagagata tctgcaagaa tatggtgttg  1560

gctgaaagat gtgtgttgct tagtgctgaa cttttaaaaa gccaaagcaa atattcagag  1620

gctgcagctc tcctaatacg gttgaccagt gaggattctg atcttcgaag tgcacttctt  1680

ttggaacagg cagcacattg ctttataaac atgaaaagtc ccatggttag aaaatatgca  1740

tttcatatga tattggcagg ccatcgattt agtaaagcag ggcagaaaaa gcatgcttta  1800

cgctgttatt gtcaagccat gcaagtttac aaaggaaaag gctggtctct tgcagaggat  1860

cacattaatt tcactattgg gcgccagtcc tatactctta gacagctgga taatgctgtg  1920

tctgctttta ggcatattct aattaatgaa agtaaacaat ctgctgctca acagggggct  1980

ttcctcagag aatatcttta tgtttacaag aatgtaagtc agctgtcacc agatggtcct  2040

ttgccacagc ttcctttacc gtatattaac agttcagcaa cacgggtttt ttttggccat  2100

gacagacgac cagcggatgg tgaaaaacaa gcagctactc atgtaagtct tgatcaagaa  2160

tatgattctg aatcctctca gcagtggcga gaacttgagg aacaagttgt ttctgtggtt  2220

aacaaaggag taattccatc caattttcat cccacacaat actgtttgaa cagttactca  2280

gataattcaa gatttccact tgcagttgta gaagaaccaa ttacagtgga agtggctttt  2340

agaaaccctt tgaaagttct acttttgttg actgatttgt cattgctttg gaagtttcat  2400

cctaaagatt tcagtggaaa ggataatgaa gaagttaaac aactagttac aagtgaacct  2460

gaaatgattg gagctgaagt tatttcagag ttcttaatta atggcgaaga atcaaaagtg  2520

gcaagactaa agctctttcc ccatcacata ggggagctgc atattctggg agttgtttat  2580

aatcttggca ctattcaggg ctctatgaca gtagatggca ttggtgctct tcccggatgt  2640

cacacaggaa aatattcctt gagtatgtca gtccgaggga agcaggattt agaaattcaa  2700

ggtcctcgac ttaacaacac aaaagaagag aaaacatctg ttaaatatgg ccctgatcga  2760

cgtttagatc ccataatcac agaagaaatg ccactgttgg aggtgttctt tatacatttt  2820

cctacagggc ttctctgtgg agaaatccga aaagcatatg tagaatttgt caatgtcagc  2880

aaatgtccac ttactggatt gaaggttgtt tctaaacgtc cagagttctt tactttcggt  2940

ggtaatactg ctgttctaac accactaagt ccctcagctt ctgagaattg tagtgcttac  3000

aagactgttg tgacagatgc tacctctgtg tgtacagcac tcatatcatc agcttcttct  3060

gtagactttg gcattggcac aggaagtcaa ccagaggtga ttcctgttcc ccttcctgac  3120

actgttcttc tacccggagc ctcagtgcag ctgccaatgt ggttacgtgg gcctgatgaa  3180

gaaggtgtcc atgaaattaa ctttttgttt tactatgaaa gtgtcaaaaa gcagccaaaa  3240

atacggcaca gaatattaag acacactgca attatttgta ccagtcggtc tttaaatgta  3300

cgggccactg tctgcagaag taattctctt gaaaatgaag aaggcagagg aggcaatatg  3360

ctagtctttg tggatgtgga aaataccaat actagtgaag caggcgttaa ggaattccac  3420

atagtgcaag tatcaagtag tagcaaacac tggaagttac agaaatctgt aaatctttct  3480

gaaaacaaag atgccaaact tgccagtagg gagaagggaa agttttgctt taaggcaata  3540

agatgtgaga aagaagaagc ggccacacag tcctctgaaa aatatacctt tgcagatatc  3600

atctttggaa atgaacagat aataagttca gcaagcccat gtgcagactt cttttatcga  3660

agtttatctt ctgaattgaa aaaaccacaa gctcacttgc ctgtgcatac agaaaaacag  3720

tcaacagagg atgctgtgag attgattcaa aaatgcagtg aggtagattt gaatattgtc  3780

atattatgga aggcatacgt tgtggaagac agtaaacagc ttattttgga aggtcaacat  3840

catgttattc ttcgcactat aggaaaagaa gccttttcat atcctcagaa acaggagcca  3900

ccagaaatgg aactattgaa atttttcagg ccagaaaaca ttacagtttc ctcaaggcca  3960

tcagtagagc agctttctag tctcattaaa acgagtcttc actacccaga atcatttaat  4020

catccatttc atcaaaaaag cctttgttta gtaccagtca ctcttttact ttccaattgt  4080

tctaaggctg atgtagatgt catagttgat cttcggcata aaacaacaag tccagaagca  4140

ctggaaatcc atggatcatt cacatggctt ggacaaacac agtataaact tcaacttaaa  4200

agccaggaga ttcacagtct gcagctgaaa gcatgctttg ttcatacagg tgtttataac  4260

cttggaactc ctagggtatt tgccaagtta tcggaccaag ttacagtgtt tgaaacaagt  4320

cagcagaatt ccatgcctgc cctgatcatc atcagtaatg tgtgacaact tggaaatttg  4380

tactgaaatc cacaataatc agtttttgct ggatgggttt tacagcagta tttgatatac  4440

ctaacttgtt atggaggttg attgatatct gatccctgca aaatactttg acttgtcatt  4500

ttgttgatga tgcaaagcac gttggactga gaatacttaa cattcttttt ctgtatttct  4560

ttaaaccctg agaataattt acatgctcat aatacaggat atcagcatat ttgtgcacct  4620

tattaagccc catcttaaga aaacacaaag tctaagtctg ctgttacaac ttgtcaatgg  4680

tatacgaata ttaggagatg attctgagaa aggaaaggcc ttgttggcag tactcctgtt  4740

aagccattag tctctaaatt ccagctttac tgtgaagttc tatagagtgt taaatacaaa  4800

ttttcctgtc ttgcttcaca cagttcctta aaatcagttt tgaactttgg tcatagagtc  4860

ttcatatttc agtatttggt ggtccctatg acttatacat aactttgt               4908

<210>17

<211>435

<212>DNA

<213>人

<220>

<221>其它特征

<222>(30)..(30)

<223>任意碱基

<220>

<221>其它特征

<222>(49)..(49)

<223>任意碱基

<220>

<221>其它特征

<222>(75)..(75)

<223>任意碱基

<220>

<221>其它特征

<222>(76)..(76)

<223>任意碱基

<220>

<221>其它特征

<222>(78)..(78)

<223>任意碱基

<220>

<221>其它特征

<222>(79)..(79)

<223>任意碱基

<220>

<221>其它特征

<222>(109)..(109)

<223>任意碱基

<220>

<221>其它特征

<222>(136)..(136)

<223>任意碱基

<220>

<221>其它特征

<222>(137)..(137)

<223>任意碱基

<220>

<221>其它特征

<222>(149)..(149)

<223>任意碱基

<220>

<221>其它特征

<222>(227)..(227)

<223>任意碱基

<220>

<221>其它特征

<222>(236)..(236)

<223>任意碱基

<220>

<221>其它特征

<222>(246)..(246)

<223>任意碱基

<220>

<221>其它特征

<222>(342)..(342)

<223>任意碱基

<220>

<221>其它特征

<222>(363)..(363)

<223>任意碱基

<220>

<221>其它特征

<222>(389)..(389)

<223>任意碱基

<220>

<221>其它特征

<222>(426)..(426)

<223>任意碱基

<400>17

ggtagaaatg attgtgatgt acaaattttn tattttgatc atacttaana agacagagca    60

gactcacatt cattnncnna atagtatcac tgtacacata gcgaatttnt ggcgctttta   120

gattgctctg aaaatnnctg aagagttgnc catagcagcc tggtaagcct tttcctttcc   180

cccaaagctc tcctgccctt tgcagaaaga ctgttggtga caactgntgc taactnaata   240

gcatgnggtt gaacttcgcc aaaatccttc cacctcctcc catagggcaa caggggtgac   300

ttgggcttaa agggcattga gtaagcaagt aggttatcag anaacagagg gaagattcca   360

ttntagataa tttccaaata ttacaattng tggaactcag agttcaactg ctcagttcct   420

tcttcngctg accct                                                    435

<210>18

<211>2224

<212>DNA

<213>人

<400>18

ctttagatct gtgcagcctt tgcgtgccaa acttgtgaaa ttccttttac cttttttgga    60

gtacttgcta taaagccacc tgtcaacaaa cccccattat gtacagaata ggacctatcc   120

agtagccagg ccagtaggca gttggggaag gtgggaagga tccagcgagg cccctgagcc   180

tgcacctgga caggtgtacg tctgcaccca tcaccctcag caccaggcca ccctgcagtc   240

cacttactgt actgtgttgt ggaaggatat gctaagtgat gaaagttgcg agcagtctca   300

ctggtcgtgt aaactttttt ttttttttgg aaattgaagc tgtagagtgc tgcccgaaat   360

ctctaggaag ttggtggcaa gggacagcac tcacactctt ctggtcatga tctctgatct   420

ccacctcaaa tgacaataaa aaactggtcc aacgaagaca ctgctcagca cttcagccat   480

caggactaat ccatcgatga ctggaaaaga ggctagcttt gaggaaaaca gcctgggctc   540

ttgggagcag agtccagtgg gtgtgaggct gacttgccga cggtcggcag gtaatggctc   600

tcagccggcg aggcggtccc acagctctcc tcccagggca gcctgaggag gaggaggccg   660

ggtgcctgtt tggtggcagc ttcagcctag ggatacctga agctgttgag caacaccttt   720

atgaaatgtt gccagagcag caacacttcc ctgtgggcac agccccggga aatccggtac   780

caagtgagca aggtggcagg acccacccaa gcctgatacg catctgggcc cgccgggctc   840

agcaggggag gctgctacgg ctgcccactt cccagcaccg tctgtcaggc ttgaacccct   900

ctgtgctgtt cccttcctgg ctaataggga gacccttcgc aggcacccac tgtttcaact   960

tgaccctccc accccctgct actctcctcc acacacccct ccgttccgct agcctaccct  1020

gtcagccttt caataaaagt tatgcacaaa tgtgaacacc tgagatggag ctgaacattt  1080

cttcactttg ttctttttct gaagtcaaac tcttatcaaa tgccctaaaa ttattaccac  1140

ccaagagaaa caggaaaaag gttacatgtt tttgtttact gagagtaaga tcacctgcat  1200

ctggaagacg ggctggtaaa ttggtttggc tacagaacag aaagaaaaca aaaacaaacc  1260

tcgtaaggga agtatcgcac tcagacacca ccacttccta gagccaaatg agcaatccca  1320

aactgcaagt gccgtaagtg ggcctgtgac gtcacaccgc ccggcccgag gtatcgcatg  1380

tgcgggggag gcccacacta cagctgtcct ctcgtctaga aggcaccacc tcgctttcat  1440

gtcccgtgtg ttttggaaaa gcagtatggt gtgtcatgtc tagcggcgaa cacttccctc  1500

cctctgtcct tgaggttgta atataaaaac tgtgtttctg tacgtgtggg tgggaattct  1560

ctgacggtgc tcgttcatag cacaagctta cgctgagttc tgaactgtcg ttcacagctg  1620

cgtgtctgca tggtgtcgca tctgttgtac ctttggggaa aatttgtatg taaatgtaca  1680

gaaataaaaa cgttgcccca ttaacagatt tcctctggaa tgtcttccct acctcacctg  1740

atggtatcca ccgaagggca tttcactacc attaatggtg agtaataaaa tcctccgtgt  1800

tcattcagac ctcactgcgt cactactttg aacgcctctg taagctgtgt cttcacccgc  1860

cccgaggtgg gtggagggag gcctctcact ctgcttcgag tcctggtctt aaaggtagtc  1920

agaggcagag gctggattaa acacacactg tttaccaagt gccactctca gaccacctga  1980

gagacggggg gccatcagta aaattaagag gaattttttt cccttgttcg tgtatgttct  2040

gctgatccgt ggcctgaagg ttcctagaga cgtcaagaaa tgaatatctt acactgtgat  2100

tctgtgagga aagactggta acccaaaact ctcttctcta atgtattttt taacgaaaat  2160

gacaatattt ctttaataaa gtatttatac caaaaaaaaa aaaaaaaaaa aaaaaaaaaa  2220

aaaa                                                               2224

<210>19

<211>2244

<212>DNA

<213>人

<400>19

gttgtttaaa agcaaggcat gcttgtggat gactctgtaa cagactaatt ggaattgttg   60

aagctgctcc ctggttccac tctggagagt aatctgggac atcttagtgt tttgttttgt   120

ttttttccct cctctttttt tgggggggag tgtgtgtggg gtttgttttt tagtcttgtt   180

tttttaattc attaaccagt ggttagcctt aaggggagga ggacggattg attccacatt   240

ccacttccta gatctagttt agaaaacatg ttccccatct ggtgctctta ggaaggagta   300

tagtaaatgc ctcatttaat aacatactcc tttttgaaag ttgccttttc tctccaccct   360

tgagtagatc cagtatttga tgaaactcat gaaagtgggt ggagcccatc ttccccctcc   420

tcttttctag gacgcactat atgtgactgt gactttaagg acatttgttt gccatttgct   480

gatttttttg ggaagttaat ttctaacttc tttcactgat aaatgaagaa aagtattgca   540

cctttgaaat gcaccaaatg aattgagttt gtaattaaaa aaattttttt tccctttcag   600

tcattgtctt atatgcttag catagatttg cagctcagta gtatatgtgt tcctagaatg   660

cagctgaaga cctgttatgt agaggaaata cgaggggtgg tgctagaaga cagacatctg   720

tggaatgatt cacatcctct caagttagga ggatggaggc ctgcttcatt aagaagctgg   780

gggtagggtg ggggtgggga gaacacttaa caacatgggg accagtcagg ggaatcccct   840

tatttctgtt ttgcatatga ggaaccctag agcagccagg tgaggctctc tagtttaata   900

aaaatcatgg aaagactctt aatgcagact cttcttaagt gttaataggg attttttcag   960

cttattttgg ttgcagtttc caatttttaa aaatgttgag gtaatctttc ccaccttccc  1020

aaacctaatt cttgtagatg cattagtgtt gaaccaatgc ttctcatgtc tcaatcttgt  1080

atatcatctt ttcagatgta ttaacaaaca aaaccttaaa aagagtagat gaattgccaa  1140

acacaattcc taccaataat aaatcgatca actctatcta ttcaggaaag caggaagcat  1200

ttggaccaca gtgcatgaaa acttcaacat tctgttatta gataatgaat caaccaaatg  1260

aacaatccag agaaaagaaa attgcaataa taaaaggtaa attaacagaa agataatata  1320

agcaagatag taatagttga ccattctgaa aagcttataa catcactcat catccagcat  1380

cctttctgaa aacaaaggat ttttaaatca ctttatgcac atatacaaca taggaggttg  1440

gcaaaataat gcactatttc ttaacagcca tgtctcttgt agaacttcaa gttaatctac  1500

aaatgaccat tgtgtcttaa tttagattat gaataccaca ttagtcaggt atttgcacta  1560

acccttaata gtatatacag tttctatgga aaattcagtg gtccaaaaat ttccgtagaa  1620

tttgagagga cgttggtggg ctgaagatag ctccttgagg gtcactgatg taggctgcaa  1680

tgggggttca caaggccctg acaccgtatt tatagtctaa cctttttatg aaaatctgac  1740

tacagctatt taaggagtag tcttaatagc tgaaaatgaa gatagagaaa gacaccaaga  1800

atatgacaca gtttacattc tagtgaggga cacaacaaaa tcaaatttaa aaaagagtgt  1860

aatagatgct gataaatact gtagataaag cacataagaa aatagaaata aaggctgtca  1920

atggagaagt catgattttt attttattta tttatttatt tatttgagac agagtcaggc  1980

tctgtgcagg ctggagtgca atggtgtgat ctcgctcact acaacctctg ctcctggctc  2040

aagctatcct cccacctcag ctctcaagta gctgggatca caggtgcgtg ctaccatgcc  2100

cggctaattt tttgtagaga tgaggttttg ccatgttgcc caggctggtc tcgaactcct  2160

ggactcaact gaccccacct cggcctctca aagtgctgag attataggcg tgcagccggc  2220

agctggccat tgtttatgtt ctgc                                           2244

<210>20

<211>351

<212>DNA

<213>人

<220>

<221>其它特征

<222>(62)..(62)

<223>任意碱基

<220>

<221>其它特征

<222>(121)..(121)

<223>任意碱基

<220>

<221>其它特征

<222>(207)..(207)

<223>任意碱基

<220>

<221>其它特征

<222>(220)..(220)

<223>任意碱基

<220>

<221>其它特征

<222>(276)..(276)

<223>任意碱基

<220>

<221>其它特征

<222>(300)..(300)

<223>任意碱基

<220>

<221>其它特征

<222>(315)..(315)

<223>任意碱基

<220>

<221>其它特征

<222>(336)..(336)

<223>任意碱基

<400>20

tctacttcca catcggcgag accgagaagc gctgtttcat cgaggaaatc cccgacgaga    60

cnatggtcat cggcaactat cgtacccaga tgtgggataa gcagaaggag gtcttcctgc   120

nctcgacccc tggcctgggc atgcacgtgg aagtgaagga ccccgacggc aaggtggtgc   180

tgtcctggca gtacggctcg gagggcnctt tcacgttcan ctcccacacg cccggtgacc   240

atcaaatctg tctgcactcc aattcttacc aggatngctc tctttcgctg gtgggcaaan   300

tgcgtgttgc atctngacat ccaggtttgg gggagnatgc caacaaatta c          351

<210>21

<211>2631

<212>DNA

<213>人

<400>21

accttccaac ccagccctcg gctgagccgc gccgcaccat gcccgccgtg gacaagctcc    60

tgctagagga ggcgttgcag gacagccccc agactcgctc tttactgagc gtgtttgaag   120

aagatgctgg caccctcaca gactatacca accagctgct ccaggcaatg cagcgcgtct   180

atggagccca gaatgagatg tgcctggcca cacaacagct ttctaagcaa ctgctggcat   240

atgaaaaaca gaactttgct cttggcaaag gtgatgaaga agtaatttca acactccact   300

atttttccaa agtggtggat gagcttaatc ttctccatac agagctggct aaacagttgg   360

cagacacaat ggttctacct atcatacaat tccgagaaaa ggatctcaca gaagtaagca   420

ctttaaagga tctatttgga ctcgctagca atgagcatga cctctcaatg gcaaaataca   480

gcaggctgcc taagaaaaag gagaatgaga aggtgaagac cgaagtcgga aaagaggtgg   540

ccgcggcccg gcggaagcag cacctctcct cccttcagta ctactgtgcc ctcaacgcgc   600

tgcagtacag aaagcaaatg gccatgatgg agcccatgat aggctttgcc catggacaga   660

ttaacttttt taagaaggga gcagagatgt tttccaaacg tatggacagc tttttatcct   720

ccgttgcaga catggttcaa agcattcagg tagaactgga accgaggcgg aaaagatgcg   780

ggtgtcccag caagaattac tttctgttga tgaatctgtt tacactccag actctgatgt   840

ggccgcacca cagatcaaca ggaacctcat ccagaaggct ggttacctta atcttagaaa   900

caaaacaggg ctggtcaccg ccacctggga gaggctttat ttcttcaccc aaggcgggaa   960

tctcatgtgt cagcccaggg gagccgtggc tggaggtttg atccaggacc tggacaactg  1020

ctcagtgatg gccgtggatt gcgaagaccg gcgctactgc tttcagatca ccacgcccaa  1080

tggaaaatcg ggaataatcc tccaggctga gagcagaaag gaaaatgaag agtggatatg  1140

tgcaataaac aacatctcca gacagatcta cctgaccgac aaccctgagg cagtcgcgat  1200

caagttgaat cagaccgctc tgcaagcagt gactcctatt acaagttttg gaaaaaaaca  1260

agaaagctca tgccccagcc agaacctgaa aaattcagag atggaaaatg aaaatgacaa  1320

gattgttccc aaagcaacag ccagtctacc tgaagcagag gagctgatcg cgcctggagc  1380

gccgattcaa ttcgatattg tgcttcctgc tacagaattc cttgatcaga acagagggag  1440

caggcgtacc aacccttttg gtgaaactga ggatgaatca tttccagaag cagaagattc  1500

tcttttgcag cagatgttta tagttcggtt tttgggatca atggcagtta aaacagacag  1560

cactactgaa gtgatttatg aagcgatgag acaagtattg gctgctcggg ctattcataa  1620

catcttccgc atgacagaat cccatctgat ggtcaccagc caatctttga ggttgataga  1680

tccacagact caagtatcaa gggccaattt tgaacttacc agtgtcacac aatttgctgc  1740

tcatcaagaa aacaagagac tggttggttt tgtcatccgt gttcctgaat ccactggaga  1800

agaatctctg agtacataca tttttgaaag caactcagaa ggcgaaaaga tatgttatgc  1860

tattaatttg ggaaaagaaa ttattgaggt tcagaaggat ccagaagcac tggctcaatt  1920

aatgctgtcc ataccactaa ccaatgatgg aaaatatgta ctgttaaacg atcaaccaga  1980

tgacgatgat ggaaatccaa atgaacatag aggcgcagaa tccgaagcat aactcacttg  2040

cgcctgtggg ggaagagcga acaggaagga gagctacctc ctaagggttt taacgtctct  2100

gacatacagg cacactgacc tgatttccga aggctgacaa tcgtttgtgg aatgtaatct  2160

tgatgccttg atactgagac ttgggaggga aactaagaaa tggttgacag cgttcccacc  2220

catctacaat gttattttag gtgctttgtg gtaagtcttt tttcttagat tgcgctaaaa  2280

tttcttagat tgttcagcgc tcagaacaaa agtttgaaaa atgcattgtt catatgaatg  2340

tcatctcttt tcagtttcca gtatcctttt taaaaaatgg caaaagccta gatttacaat  2400

ttgatgaaca ctaaatattt cttattaata taatctattt ttgtatttta cttaatgagc  2460

tttaagtgcc tgtcgttctg aaaattgtgt atttataatt cagcttatct cataattgga  2520

cctaatagca tttctttgtg cagttaggtg atgagcactg ctttgaggcc caagcactag  2580

tagagatgcg cgatacaggt ctagtttcgg taactgttcc agacatcaag c           2631

<210>22

<211>2851

<212>DNA

<213>人

<400>22

agcatctcag gccatcatcc tgaaacttgg cagccttcgt ggagtataag gacagcatta    60

ttagccatca ttgggtttac tgccaacaaa aggagaggga gccataggtt ctctagatta   120

cactcctgag gaaagaagag cacttgccaa aaaatcacaa gatttctgtt gtgaaggatg   180

tggctctgcc atgaaggatg tcctgttgcc tttaaaatct ggaagcgatt caagccaagc   240

tgaccaagaa gccaaagaac tggctaggca aataagcttt aaggcagaagt caattcatc   300

tggaaagact atctctgagt cagacttaaa ccactctttt tcactaactg atttacaaga   360

tgatatacct acaacattcc agggtgctac ggccagtaca tcgtacggac tccagaattc   420

ctcagcagca tcctttcatc aacctaccca acctgtagct aagaatacct ccatgagccc   480

tcgacagcgc cgggcccagc agcagagtca gagaaggttg tctacttcac cagatgtaat   540

ccagggccac cagccaagag acaaccacac tgatcatggt gggtcagctg tactgattgt   600

catcctgact ttggcattgg cagctcttat attccgacga atatatctgg caaacgaata   660

catatttgac tttgagttat aatatggttt tgtgacttat gagctgtgac tcaactgctt   720

cattaaacat tctgcattgg gtataatcta agaattgttt acaaaaagat tattttgtat   780

ttacccttca ttcctttttt tgatccttgt aagtttagta taaatatatc tagacattca   840

gactgtgtct agcagttacg tcctgcttaa agggactaga agtcaaagtt ccttgtctca   900

ctatttgatc tgctttgcag ggaaataact tgttttttct catgtttcat cttcttttta   960

tgtaaatttg taatactttc ctatattgcc ctttgaaatt tttggataaa agatgatgtt  1020

ttaagttcca atgagtatta ctagttactc aataccactt attgagtact ctgtttctac  1080

gtatgtagaa tgtataggga tagaagagtt gaaaagggaa agcaaaactt cttaagtggc  1140

ttccttaaaa tgtcattcat aggagatgta ctggaattgc tcattctgtg actttatttg  1200

tgtcctaaac attcttcagt gaaaataatt ttatttcagt caaacattta tgaggaaatg  1260

agatcacatc tttgtcactg gatgctactt gaagagggag tactttgtaa ccactttgat  1320

atgctgttat caccaccccc tgccctctgc tgccataatc acacaaattt aaaaagaaag  1380

aaaacagtct tccatagatt tttaaggaag aaagggccca agtcaggaga tcgcttggtt  1440

ttcttccaga agttaaatgg ggggatctga agatttgaat gttcggtctg ctttgaaatg  1500

tatgtctttt gggaatgtat tatatgccta gctttataat caggtataaa attttaatta  1560

ttcccaggaa tatgcataat attgaatatt tcatgtccta ttttaataga aaacctcagg  1620

gcccaagtaa ccagtgatag aagttagaaa aaccccttta cttagaattg tccacctagt  1680

cagagcccaa gaaagaattt tcagtggaaa aatcaatata taacttagtg ctagctagcg  1740

ccacagactc tagtagataa tattatcatc ataatggctg gtgaaaccat ataatcacag  1800

aaaaacattg ccttcagcat gttcagttcg cagcactgag ggcactcttg agggtgttgt  1860

taatgaagat ttaattttta aatacaggtg gttccaagct ttcaaatagg ttatgctcca  1920

aaagtgttat ttgtaagtta atttttttac aagtcaaaca atgttggaag tggtatttag  1980

gttctagatc ggtccacgaa agttagccca tatgtatatc ttgaatagta taggggaggg  2040

tattcataaa gtccttatgt ggttttaact aagtgaaatt atggacaaga gaaataattg  2100

taaaatcgtc ttaaaggcaa atttaatttt tacccctgtt tatgggacat tcgttctatt  2160

aactgtcaga cacaatttct gttttcatct gagagccagg tttcctttat ttctacatct  2220

aaaataagaa catattgtac actattatat aatacagaat tgtcttacac tttaataaat  2280

tcgcatttta aaggtgttta caggattatt ttttatatct gtagctgaat ttgttaaagt  2340

ctaaaaagct caaggacttt atgaagatct cattatatga ggaaaatcat aggttaccat  2400

tttataactc tattgccata agaaaataca ctctaaaatc ttgatttgaa acatattaga  2460

aaccttgatt cagtgctcag tggtctccta gtaagaagtc accgacggta gcgtcatatg  2520

agaagaaaga aatccccacc acctcaacct ctgctgagat tgtgtgctag gaacagcctt  2580

ccctccgttt cccctcagtc aaacttgagc cagcctctgg atcgatgtga tcttattgca  2640

tgtttccatg gggtgtacct atactttaag ccaatcctgc tgcattcact gctaagttaa  2700

ataaaaagcc aagaagaaaa aaaaaatttt gcactgtgca gatcctttgc tatctgactt  2760

gcatctcttc ccccacctgt cagctagcca cctgcttgtt tgtgttggga tattttttag  2820

cacctgaagc accatctgaa aggggcacca t                                 2851

<210>23

<211>3473

<212>DNA

<213>人

<400>23

aagagcagcg gcgaggcggc ggtggtggct gagtccgtgg tggcagaggc gaaggcgaca    60

gctctagggg ttggcaccgg ccccgagagg aggatgcggg tccggatagg gctgacgctg   120

ctgctgtgtg cggtgctgct gagcttggcc tcggcgtcct cggatgaaga aggcagccag   180

gatgaatcct tagattccaa gactactttg acatcagatg agtcagtaaa ggaccacact   240

actgcaggca gagtagttgc tggtcaaata tttcttgatt cagaagaatc tgaattagaa   300

tcctctattc aagaagagga agacagcctc aagagccaag agggggagag tgtcacagaa   360

gatatcagct ttctagagtc tccaaatcca gaaaacaagg actatgaaga gccaaagaaa   420

gtacggaaac cagctttgac cgccattgaa ggcacagcac atggggagcc ctgccacttc   480

ccttttcttt tcctagataa ggagtatgat gaatgtacat cagatgggag ggaagatggc   540

agactgtggt gtgctacaac ctatgactac aaagcagatg aaaagtgggg cttttgtgaa   600

actgaagaag aggctgctaa gagacggcag atgcaggaag cagaaatggt gtatcaaact   660

ggaatgaaaa tccttaatgg aagcaataag aaaagccaaa aaagagaagc atatcggtat   720

ctccaaaagg cagcaagcat gaaccatacc aaagccctgg agagagtgtc atatgctctt   780

ttatttggtg attacttgcc acagaatatc caggcagcga gagagatgtt tgagaagctg   840

actgaggaag gctctcccaa gggacagact gctcttggct ttctgtatgc ctctggactt   900

ggtgttaatt caagtcaggc aaaggctctt gtatattata catttggagc tcttgggggc   960

aatctaatag cccacatggt tttgggttac agatactggg ctggcatcgg cgtcctccag  1020

agttgtgaat ctgccctgac tcactatcgt cttgttgcca atcatgttgc tagtgatatc  1080

tcgctaacag gaggctcagt agtacagaga atacggctgc ctgatgaagt ggaaaatcca  1140

ggaatgaaca gtggaatgct agaagaagat ttgattcaat attaccagtt cctagctgaa  1200

aaaggtgatg tacaagcaca ggttggtctt ggacaactgc acctgcacgg agggcgtgga  1260

gtagaacaga atcatcagag agcatttgac tacttcaatt tagcagcaaa tgctggcaat  1320

tcacatgcca tggccttttt gggaaagatg tattcggaag gaagtgacat tgtacctcag  1380

agtaatgaga cagctctcca ctactttaag aaagctgctg acatgggcaa cccagttgga  1440

cagagtgggc ttggaatggc ctacctctat gggagaggag ttcaagttaa ttatgatcta  1500

gcccttaagt atttccagaa agctgctgaa caaggctggg tggatgggca gctacagctt  1560

ggttccatgt actataatgg cattggagtc aagagagatt ataaacaggc cttgaagtat  1620

tttaatttag cttctcaggg aggccatatc ttggctttct ataacctagc tcagatgcat  1680

gccagtggca ccggcgtgat gcgatcatgt cacactgcag tggagttgtt taagaatgta  1740

tgtgaacgag gccgttggtc tgaaaggctt atgactgcct ataacagcta taaagatggc  1800

gattacaatg ctgcagtgat ccagtacctc ctcctggctg aacagggcta tgaagtggca  1860

caaagcaatg cagcctttat tcttgatcag agagaagcaa gcattgtagg tgagaatgaa  1920

acttatccca gagctttgct acattggaac agggccgcct ctcaaggcta tactgtggct  1980

agaattaagc tcggagacta ccatttctat gggtttggca ccgatgtaga ttatgaaact  2040

gcatttattc attaccgtct ggcttctgag cagcaacaca gtgcacaagc tatgtttaat  2100

ctgggatata tgcatgagaa aggactgggc attaaacagg atattcacct tgcgaaacgt  2160

ttttatgaca tggcagctga agccagccca gatgcacaag ttccagtctt cctagccctc  2220

tgcaaattgg gcgtcgtcta tttcttgcag tacatacggg aaacaaacat tcgagatatg  2280

ttcacccaac ttgatatgga ccagcttttg ggacctgagt gggaccttta cctcatgacc  2340

atcattgcgc tgctgttggg aacagtcata gcttacaggc aaaggcagca ccaagacatg  2400

cctgcaccca ggcctccagg gccacggcca gctccacccc agcaggaggg gccaccagag  2460

cagcagccac cacagtaata ggcactgggt ccagccttga tcagtgacag cgaaggaagt  2520

tatctgctgg gaacacttgc atttgattta ggaccttgga tcagtggtca cctcccagaa  2580

gaggcacggc acaaggaagc attgaattcc taaagctgct tagaatctga tgcctttatt  2640

ttcagggata agtaactctt acctaaactg agctgaatgt ttgtttcagt gccatatgga  2700

ataacaactt tcagtggctt ttttttttct tttctggaaa catatgtgag acactcagag  2760

taatgtctac tgtatccagc tatctttctt ggatcctttt ggtcattatt tcagtgtgca  2820

taagttctta atgtcaacca tctttaaggt attgtgcatc gacactaaaa actgatcagt  2880

gtaaaaagga aaacccagtt gcaagtttaa acgtgttcga aagtctgaaa atagaacttg  2940

ccttttaagt taaaaaaaaa aaaagctatc ttgaaaatgt tttggaactg cgataactga  3000

gaaactctta ccagtccaca tgcaattaga catattcagc atatttgtta ttttaaaagg  3060

gagggttggg aggtttctta ttggtgattg tcacacggta taccatactc ctctccttca  3120

aagaatgaaa ggccttgtta aggagttttt tgtgagcttt acttctttgg aatggaatat  3180

acttatgcaa aaccttgtga actgactcct tgcactaacg cgagtttgcc ccacctactc  3240

tgtaatttgc ttgtttgttt tgaatataca gagccttgat ccagaagcca gaggatggac  3300

taagtgggag aaattagaaa acaaaacgaa ctctggttgg ggtactacga tcacagacac  3360

agacatactt ttcctaaagt tgaagcattt gttcccagga tttattttac tttgcatttc  3420

cttttgcaca aagaacacat caccatttcc ttttgcacaa agaacacatc acc         3473

<210>24

<211>401

<212>DNA

<213>人

<220>

<221>其它特征

<222>(252)..(252)

<223>任意碱基

<220>

<221>其它特征

<222>(303)..(303)

<223>任意碱基

<220>

<221>其它特征

<222>(390)..(390)

<223>任意碱基

<400>24

ttagattatt ttcaatttat tattcagaat aaatatatct tttttcttta acttctcaaa   60

tagttattga attgtattgg tttaaattaa atgcgtcatg tgtatatatc agtattaatt  120

caagagatac aaaaggaaat tgagtgaaaa ataagtctgc ctccttccca tcactctcat  180

gtctctacct agaggcaatt attgtcaaca gtttttgatg tgtctttcaa aaaatagtcc  240

attaagcctg gngtactaga tctcttttaa aagtttacaa cctgttacag aatatatata  300

aangttcaat tactagtaac accttattac agatacagat tacaacttag gaaatatatt  360

ttcatggacc attgatgtca tttggattcn cccctacaat c                      401

<210>25

<211>1820

<212>DNA

<213>人

<400>25

aatgtcttag aaaaaggctt tctaaaagaa aaagagcaag aggccatttc ttttcaagat    60

agatacaaag aacttcagga aaaacataaa caagaattgg aagacatgag gaaagctggt   120

cacgaagccc tcagcattat tgtggatgaa tataaggcac tactgcagtc ttcagttaag   180

caacaagtag aagctattga aaaacagtac atttctgcaa ttgagaaaca ggcacacaag   240

tgtgaggagt tgctaaatgc tcagcatcag aggctccttg aaatgctaga tacagagaag   300

gaactgttaa aagaaaaaat aaaggaagct ttgattcagc aatctcaaga acagaaggaa   360

atattggaaa agtgtttgga ggaagaaagg caaagaaata aagaggcatt agtatccgct   420

gcaaagcttg aaaaagaagc agtgaaggat gcagttttaa aagtcgtaga agaagaaaga   480

aaaaatttag aaaaagcgca tgctgaagaa agggaattat ggaagacaga acatgcaaaa   540

gatcaagaaa aagtatctca ggaaattcaa aaagctatac aagaacaaag aaaaataagt   600

caggaaactg ttaaggcagc aataatagaa gagcagaaac gaagtgaaaa ggctgtggaa   660

gaggcagtga aaagaacaag agatgaattg atagagtata taaaagaaca gaaaaggctc   720

gatcaagtca tccgccaaag aagcctgtcc agtttggaac tgttcctctc ctgtgcacag   780

aaacagttaa gtgctttaat agctacggaa ccagttgaca ttgaataaaa agaacatgac   840

aaacccacac tggcattgga taaatcatat tacaccttca aaatacacac tctgaattat   900

aaagatgtgt ttgttttctt tccaaatcat gtagaattga tttccagttc aaggataaac   960

caaaacaata tttagaacta tcaagtgatc taatttattt tcttttggtt tcttctttac  1020

atttactgtt attttattat tattagtagt agcagcaaca gagtatgata tgacccaaaa  1080

gccattgtaa agtgccacat taccaaaatt aattaagtaa actttatagc ctgtgggagt  1140

ctattatata ttattttgca aaagtagtaa atatattatt gtttcatgat gactcttgat  1200

gagatgctag aatgtaacca tacatttatc ttattttgag gatagaaata gcatggattt    1260

caacatcact tatttatctg tataattgga aataaaacac cgatatgata gagaatcatt    1320

ccggcattac ctaacctctt ctgcagttgg atctatgtat tttcattggt ctactgaaaa    1380

cgaacaatac aattaaaagc actaaagatt attatattaa ttcaactttg atctgatata    1440

tcacttaaac taaaggggtg tgtgtggtgt atgcttgttt cctatttctg ctctttaaag    1500

atactttgaa tcaataaaac cattagtcta caaatcaaat tgtgaactta atctctagaa    1560

agagaatata actcagccat ttataggaat ttaggttcaa gtacaggata tatgaaatct    1620

tttcccagta tttcagaatg tacttaattc acaggcagga tgcttcaatg caaaatcatg    1680

aatattttta attcaaaact aaaatgtcat taatatgtat gtatgcaaat gttttatctt    1740

attttctgaa atgcatctac tttcatgggc tttgtacgtt tctgagattt ctcagtgtaa    1800

taaaaagagc tcccaaactt                                                1820

<210>26

<211>280

<212>DNA

<213>人

<220>

<221>其它特征

<222>(261)..(261)

<223>任意碱基

<220>

<221>其它特征

<222>(237)..(237)

<223>任意碱基

<400>26

tcaagtcata agataaagtt taatcatttg atcatgttaa aagacacaaa acacagccaa   60

tctaaccaaa tttcaggcat gcatttacat aaatatatta aattaagaaa agaaattgta   120

cacttaaacg tccttttcac ctagaaatca ttaaatccac agatcaacaa taaaaccaat   180

tctctgcatt taccacttca agatacaatt gttctatttt aaagataaca caaactncac   240

tagtctggtt aggaatttat ntgcattata catatattat                         280

<210>27

<211>392

<212>DNA

<213>人

<400>27

ttggtttgaa atggcacccc aggactttgg gcctgcctta cttgatagcc tcgttcagtg    60

agcaaagact tagtgagcag ctcttgtatg ccaagtattt tgctaagctc tggaaaaaag   120

ataaacaaga catggttctt gctttcaagg agtgtgtaat tctttagcca gatatggaaa   180

cctggaccct gagtgggaga aaggagacag atgaaaggag tccgtgattt tgtaaccaag   240

agctgcctgc atggttatga gtatcactga ttttagggac gcccacagag ctaaagcatt   300

tttttaatcc gagaagactt ttgtaactca tattagttaa tcttctagct ctgagatagc  360

aacacagctc ttagaattct gtaagtaagc tt                                392

<210>28

<211>2299

<212>DNA

<213>人

<400>28

cgaaccccca cagctggagg gcgaggccag ctgtacccgg ccccagtgcc ctttcgcggc    60

cacaagcggc cgtcctcctg gtccggtgct ccggcgcctg atctaggttc atggagccgg   120

ggctgtggct ccttttcggg ctcacagtga cctccgccgc aggattcgtg ccttgctccc   180

agtctgggga tgctggcagg cgcggcgtgt cccaggcccc cactgcagcc agatctgagg   240

gggactgtga agagactgtg gctggccctg gcgaggagac tgtggctggc cctggcgagg   300

ggactgtggc cccgacagca ctgcagggtc caagccctgg aagccctggg caggagcagg   360

cggccgaggg ggcccctgag caccaccgat ccaggcgctg cacgtgcttc acctacaagg   420

acaaggagtg tgtctactat tgccacctgg acatcatttg gatcaacact cccgaacaga   480

cggtgcccta tggactgtcc aactacagag gaagcttccg gggcaagagg tctgcggggc   540

cacttccagg gaatctgcag ctctcacatc ggccacactt gcgctgcgct tgtgtgggga   600

gatatgacaa ggcctgcctg cacttttgca cccaaactct ggacgtcagc agacaggttg   660

aagtcaagga ccaacaaagc aagcaggctt tagacctcca ccatccaaag ctcatgcccg   720

gcagtggact cgccctcgct ccatctacct gcccccgctg cctctttcag gaaggagccc   780

cttaggagga caggcctgca gcatcctggt ctcgggaggc ttctgtcatt gctcacacac   840

agttcagatt tccacctctt tatagacaag aagtgaattt gcctggggca gaacacccac   900

ccaaagagtc cccacttaac aatacccccc ccccacggca agaatgccca aatccgaatg   960

accccagttt tcctaatgag taaaatgatc ccagatgtgc cccagagcat gacgcctgca  1020

gctccggttt catgcaggaa attggttttg gagagttttg gcaagttgga aagccactta  1080

ctggcttttg acatgacttc tcttggagaa taagtggact ccaagctaac tctttgcaaa  1140

tgtaaacaca tgtccatctt gtaataaatg caaaatgccc gtgcagcaga agcatgcgac  1200

tttcatatcc ttgcctagaa taggctgcat ggtgtatgtc agtgagggcc acgaggcgtc  1260

ggctttagac acagatcata gctctacagg agtttatgaa tttgaagctt atgggatttt  1320

ggcagagaaa ttttcagctg tgcttgatac ccaccaaaag aatgtatctc gaaagaatga  1380

aggaagaaga aaaaaggatc cttgatgttt gtgacaagaa aatgagaaag ttagtatctg  1440

caatacagag cttgttcctg ttcagtgact gaccctctgt attctgtata gacaccaggc  1500

cgatacacag tggagttccc aggccttgtt tgcaggaagc cgactgtaaa gacagcccca  1560

gctcaaggct attaggttga atatttgctt tcatgagtaa atgtggatct ttggggaatg  1620

gcttcaaaat aagtcacgaa cacaaattct ttgtaaatta tgtaaattcc tgtttatata  1680

aattggcaac aacttatacc gtctgacagt tcaaaatctc tttcagctgc gctcttccca  1740

ccgagccgag cttactgtga gtgtggagat gttatcccac catgtaaagt cgcctgcgca  1800

ggggagggct gcccatctcc ccaacccagt cacagagaga taggaaacgg catttgagtg  1860

ggtgtccagg gccccgtaga gagacattta agatggtgta tgacagagca ttggccttga  1920

ccaaatgtta aatcctctgt gtgtatttca taagttatta caggtataaa agtgatgacc  1980

tatcatgagg aaatgaaagt ggctgatttg ctggtaggat tttgtacagt ttagagaagc  2040

gattatttat tgtgaaactg ttctccactc caactccttt atgtggatct gttcaaagta  2100

gtcactgtat atacgtatag agaggtagat aggtaggtag attttaaatt gcattctgaa  2160

tacaaactca tactccttag agcttgaatt acatttttaa aatgcatatg tgctgtttgg  2220

caccgtggca agatggtatc agagagaaac ccatcaattg ctcaaatact cagaaagtac  2280

tgtcaaaagc ctaataaaa                                               2299

<210>29

<211>1339

<212>DNA

<213>人

<400>29

ctaaacaaaa tcattcactt ccctgatttt gataagaaaa ttcctgtaaa gctgtttcct    60

ctgcctctcc tctacgttgg aaaccacata agtggattat caagcacaag taaattaagc   120

ctaccgatgt tcaccgtgct caggaaattc accattccac ttaccttact tctggaaacc   180

atcatacttg ggaagcagta ttcactcaac atcatcctca gtgtctttgc cattattctc   240

ggggctttca tagcagctgg gtctgacctt gcttttaact tagaaggcta tatttttgta   300

ttcctgaatg atatcttcac atcagcaaat ggagtttata ccaaacagaa aatggaccca   360

aaggagctag ggaaatacgg agtacttttc tacaatgcct gcttcatgat tatcccaact   420

cttattatta gtgtctccac tggagacctc caacaggcta ctgaattcaa ccaatggaag   480

aatgttgtgt ttatcctaca gtttcttctt tcctgttttt tggggtttct gctgatgtac   540

tccacggttc tgtgcagcta ttacaattca gccctgacga cagcagtggt tggagccatc   600

aagaatgtat ccgttgccta cattgggata ttaatcggtg gagactacat tttctctttg   660

ttaaactttg tagggttaaa tatttgcatg gcagggggct tgagatattc ctttttaaca   720

ctgagcagcc agttaaaacc taaacctgtg ggtgaagaaa acatctgttt ggatttgaag   780

agctaaagag tctgcagcag gattggagac tgacttgtga ctgcgggctg ggggggcatt   840

cccagtagga atgtgaagcc agaggtttcg gattcgtgac atccaccccc tgggcaagtg   900

agagcatctg caaaatgcaa agagaactac ctcatatgca ggatgagcca atggcagtct   960

caagaaatgt actcgggcga caccttacct gtggaaagca aatcttttca aaataagcca  1020

ctgggactcg gtaggtggag ccccagctgc tcttctaggg acctatgggg ccttcgtggc  1080

atctctgtgc tgtgtgctgg ggaggaggtt gatgtaatgg tgactctttt ctgatcagca  1140

ccttggccgt gattcccaag gtcccagcca aagcaaaggg ccagttgttt cagtttaaac  1200

agacatgtct ttagtctaat aaaattagtt aactgccagt aaagttattt gttagctttg  1260

atgaaagcta tgttggtatc tttccctaat catcaaagta aataaaaaat catttctatg  1320

taaaaaaaaa aaaaaaaaa                                               1339

<210>30

<211>4250

<212>DNA

<213>人

<400>30

gaacacatcg cgtttgcatc ccagaaagta gtcgccgcga ctatttcccc caaagagaca    60

agcacacatg taggaatgac aaaggcttgc gaaggagaga gcgcagcccg cggcccggag   120

agatcccctc gataatggat tactaaatgg gatacacgct gtaccagttc gctccgagcc   180

ccggccgcct gtccgtcgat gcaccgaaaa gggtgaagta gagaaataaa gtctccccgc   240

tgaactacta tgaggtcaga agccttgctg ctatatttca cactgctaca ctttgctggg   300

gctggtttcc cagaagattc tgagccaatc agtatttcgc atggcaacta tacaaaacag   360

tatccggtgt ttgtgggcca caagccagga cggaacacca cacagaggca caggctggac   420

atccagatga ttatgatcat gaacggaacc ctctacattg ctgctaggga ccatatttat   480

actgttgata tagacacatc acacacggaa gaaatttatt gtagcaaaaa actgacatgg   540

aaatctagac aggccgatgt agacacatgc agaatgaagg gaaaacataa ggatgagtgc   600

cacaacttta ttaaagttct tctaaagaaa aacgatgatg cattgtttgt ctgtggaact   660

aatgccttca acccttcctg cagaaactat aagatggata cattggaacc attcggggat   720

gaattcagcg gaatggccag atgcccatat gatgccaaac atgccaacgt tgcactgttt   780

gcagatggaa aactatactc agccacagtg actgacttcc ttgccattga cgcagtcatt   840

taccggagtc ttggagaaag ccctaccctg cggaccgtca agcacgattc aaaatggttg   900

aaagaaccat actttgttca agccgtggat tacggagatt atatctactt cttcttcagg   960

gaaatagcag tggagtataa caccatggga aaggtagttt tcccaagagt ggctcaggtt  1020

tgtaagaatg atatgggagg atctcaaaga gtcctggaga aacagtggac gtcgttcctg  1080

aaggcgcgct tgaactgctc agttcctgga gactctcatt tttatttcaa cattctccag  1140

gcagttacag atgtgattcg tatcaacggg cgtgatgttg tcctggcaac gttttctaca  1200

ccttataaca gcatccctgg gtctgcagtc tgtgcctatg acatgcttga cattgccagt  1260

gtttttactg ggagattcaa ggaacagaag tctcctgatt ccacctggac accagttcct  1320

gatgaacgag ttcctaagcc caggccaggt tgctgtgctg gctcatcctc cttagaaaga  1380

tatgcaacct ccaatgagtt ccctgatgat accctgaact tcatcaagac gcacccgctc  1440

atggatgagg cagtgccctc catcttcaac aggccatggt tcctgagaac aatggtcaga  1500

taccgcctta ccaaaattgc agtggacaca gctgctgggc catatcagaa tcacactgtg  1560

gtttttctgg gatcagagaa gggaatcatc ttgaagtttt tggccagaat aggaaatagt  1620

ggttttctaa atgacagcct tttcctggag gagatgagtg tttacaactc tgaaaaatgc  1680

agctatgatg gagtcgaaga caaaaggatc atgggcatgc agctggacag agcaagcagc  1740

tctctgtatg ttgcgttctc tacctgtgtg ataaaggttc cccttggccg gtgtgaacga  1800

catgggaagt gtaaaaaaac ctgtattgcc tccagagacc catattgtgg atggataaag  1860

gaaggtggtg cctgcagcca tttatcaccc aacagcagac tgacttttga gcaggacata  1920

gagcgtggca atacagatgg tctgggggac tgtcacaatt cctttgtggc actgaatgac  1980

atttcaactc ctctaccaga taatgaaatg tcttacaaca cagtgtatgg gcattccagt  2040

tccctcttgc ccagcacaac cacatcagat tcgacggctc aagaggggta tgagtctagg  2100

ggaggaatgc tggactggaa gcatctgctt gactcacctg acagcacaga ccctttgggg  2160

gcagtgtctt cccataatca ccaagacaag aagggagtga ttcgggaaag ttacctcaaa  2220

ggccacgacc agctggttcc cgtcaccctc ttggccattg cagtcatcct ggctttcgtc  2280

atgggggccg tcttctcggg catcaccgtc tactgcgtct gtgatcatcg gcgcaaagac  2340

gtggctgtgg tgcagcgcaa ggagaaggag ctcacccact cgcgccgggg ctccatgagc  2400

agcgtcacca agctcagcgg cctctttggg gacactcaat ccaaagaccc aaagccggag  2460

gccatcctca cgccactcat gcacaacggc aagctcgcca ctcccggcaa cacggccaag  2520

atgctcatta aagcagacca gcaccacctg gacctgacgg ccctccccac cccagagtca  2580

accccaacgc tgcagcagaa gcggaagccc agccgcggca gccgcgagtg ggagaggaac  2640

cagaacctca tcaatgcctg cacaaaggac atgcccccca tgggctcccc tgtgattccc  2700

acggacctgc ccctgcgggc ctcccccagc cacatcccca gcgtggtggt cctgcccatc  2760

acgcagcagg gctaccagca tgagtacgtg gaccagccca aaatgagcga ggtggcccag  2820

atggcgctgg aggaccaggc cgccacactg gagtataaga ccatcaagga acatctcagc  2880

agcaagagtc ccaaccatgg ggtgaacctt gtggagaacc tggacagcct gccccccaaa  2940

gttccacagc gggaggcctc cctgggtccc ccgggagcct ccctgtctca gaccggtcta  3000

agcaagcggc tggaaatgca ccactcctct tcctacgggg ttgactataa gaggagctac  3060

cccacgaact cgctcacgag aagccaccag gccaccactc tcaaaagaaa caacactaac  3120

tcctccaatt cctctcacct ctccagaaac cagagctttg gcaggggaga caacccgccg  3180

cccgccccgc agagggtgga ctccatccag gtgcacagct cccagccatc tggccaggcc  3240

gtgactgtct cgaggcagcc cagcctcaac gcctacaact cactgacaag gtcggggctg  3300

aagcgtacgc cctcgctaaa gccggacgta ccccccaaac catcctttgc tcccctttcc  3360

acatccatga agcccaatga tgcgtgtaca taatcccagg gggagggggt caggtgtcga  3420

accagcaggc aaggcgaggt gcccgctcag ctcagcaagg ttctcaactg cctcgagtac  3480

ccaccagacc aagaaggcct gcggcagagc cgaggacgct gggtcctcct ctctgggaca  3540

caggggtact cacgaaaact gggccgcgtg gtttggtgaa ggtttgcaac ggcggggact  3600

caccttcatt ctcttccttc actttccccc acaccctaca acaggtcgga cccacaaaag  3660

acttcagtta tcatcacaaa catgagccaa aagcacatac ctaccccatc ccccaccccc  3720

acacacacac acacatgcac acaacacata cacacacacg cacagaggtg aacagaaact  3780

gaaacatttt gtccacaact tcacgggacg tggccagact gggtttgcgt tccaacctgc  3840

aaaacacaaa tacatttttt aaaatcaaga aaatttaaaa agacaaaaaa aaaagaattc  3900

attgataatt ctaactcaga ctttaacaat ggcagaagtt tactatgcgc aaatactgtg  3960

aaatgcccgc cagtgttaca gctttctgtt gcagcagata aatgccatgt tgggcaacta  4020

tgtcatagat ttctgctcct cctctctttt aatgaaataa cgtgaccgtt aacgcaagta  4080

actctttatt tattgttcac cctttttttc cttaaggaaa ggactcttcc aaatatcatc  4140

ctatgaacag ctcttcagaa agcccattga aagttaaact atttaacgtg aaatccatta  4200

actggaataa ttgagtttct ttatttttac aataaattca ctgagtaaat             4250

<210>31

<211>2785

<212>DNA

<213>人

<400>31

ctttagccca acagtcaaaa ataattgatg ctaccctaca aatgtccaaa actctagtat    60

atcatatttc taagttacag caaatattag tcctgctaaa ccagggagct ttggcaaaaa   120

tgttttttga cagtaaattt gtccttgatt atatattaac tagtcaaaga ggtgtttgta   180

acattattag agcttcttgt tgtaggtggg ttaacaccac caatcaagag gtcattctaa   240

cagaaagcct ggatcagaaa accatcaccc taaaaaaaca tgccttacat atttaacaca   300

ctctgaaatc cagtcaaaat atgactaaag gcccttgcca tgactgatgt attctcctgg   360

ccaacgccaa acaaatggga gcctggttac gagtcagcct tcagggactt gtcacatttc   420

tacttggttt cttccttgtt attgtcataa taaaatgttt tctatgctgt ttagtgcaac   480

ttaggcccta ttctgtagaa gtctcctcta ctattcaggc cactcaaaca ccccaaataa   540

ttgagttcaa aatcgacatc aagatataaa ggaatcagtg actaaatata tttcatatat   600

ggtattttta ttgattattg tgctgtcttg acctagtatg gaggccttgg ctagaggctg   660

gtcagtttcc tctcttgagc agctgattaa atccacaccc caaccacttc ccttatcagg   720

ttctcacact ctggggccac tatgtaccca ctctaatcac cacagggcca gacatcagac   780

aattaaggac agcgcccatg ccccaaagcc cgccaaaatt atgcaaatta ttcaaaatta   840

ttcaacctag ctaaccccac cctttttgct gtacataagc tgcccattcc ccctccagcc   900

tgtggtaccc agtcctcagg tgcaaccccc tgcgtggtcc tctgtggcag ccttctctca   960

ttcagagctg ttttccacag aggtagtgaa aagaactgga ttttcaagtt cactttgcaa  1020

gagaaaaaga aaactcagta gaagataatg gcaagtccag actggggata tgatgacaaa  1080

aatggtcctg aacaatggag caagctgtat cccattgcca atggaaataa ccaatcccct  1140

gttgatatta aaaccagtga aaccaaacat gacacctctc tgaaacctat tagtgtctcc  1200

tacaacccag ccacagccaa agaaattatc aatgtggggc attctttcca tgtaaatttt  1260

gaggacaacg ataaccgatc agtgctgaaa ggtggtcctt tctctgacag ctacaggctc  1320

tttcagtttc attttcactg gggcagtaca aatgagcatg gttcagaaca tacagtggat  1380

ggagtcaaat attctgccga gcttcacgta gctcactgga attctgcaaa gtactccagc  1440

cttgctgaag ctgcctcaaa ggctgatggt ttggcagtta ttggtgtttt gatgaaggtt  1500

ggtgaggcca acccaaagct gcagaaagta cttgatgccc tccaagcaat taaaaccaag  1560

agcaaacgag ccccattcac aaattttgac ccctctactc tccttccttc atccctggat  1620

ttctggacct accctggctc tctgactcat cctcctcttt atgagagtgt aacttggatc  1680

atctgtaagg agagcatcag tgtcagctca gagcagctgg cacaattccg cagccttcta  1740

tcaaatgttg aaggtgataa cgctgtcccc atgcagcaca acaaccgccc aacccaacct  1800

ctgaagggca gaacagtgag agcttcattt tgatgattct gagaagaaac ttgtccttcc  1860

tcaagaacac agccctgctt ctgacataat ccagttaaaa taataatttt taagaaataa  1920

atttatttca atattagcaa gacagcatgc cttcaaatca atctgtaaaa ctaagaaact  1980

taaattttag ttcttactgc ttaattcaaa taataattag taagctagca aatagtaatc  2040

tgtaagcata agcttatctt aaattcaagt ttagtttgag gaattcttta aaattacaac  2100

taagtgattt gtatgtctat ttttttcagt ttatttgaac caataaaata attttatctc  2160

tttctttctg ttgtgcattc agtttctaaa accattaagt ttctactcca tttacattca  2220

aaaatcttaa atactttact tgcaagagta ttttgcttca aatacaacaa cctaagagca  2280

gctggagatg aaatattggg aaattcattt gcttactcct gaagacaaaa atatagctga  2340

gatgaccact ggatttaata tcgttatgct ggcccaacat tgctaccatt tgtgttgtct  2400

gtgatcaaaa tgattatctt ttatatagga agatgacgct tctggatatt gctttcactt  2460

cttctcccca cgttagcaag gacaatgctt ctctgccatt attacaacta gttagtttgc  2520

atggagaatc tttactttaa aattggaaga aaagtcacaa gtgaatggtt tataaaaatg  2580

ctaaagaagt cattcttgct tagaatcata tagaaacatc atgcaatctt ttagtcagat  2640

gtgcgcttca ccttatgcta tttttatctt taattgacac acaataattg tacatgttta  2700

tggagtatag tgtggtgttt tctgtttgtt tgtttgtttt ttgagacaag gtctcactct  2760

gccagtcagg gtggagtgcg atggt                                        2785

<210>32

<211>9588

<212>DNA

<213>人

<400>32

ccgaccaaca ccaacaccca gctccgacgc agctcctctg cgcccttgcc gccctccgag   60

ccacagcttt cctcccgctc ctgcccccgg cccgtcgccg tctccgcgct cgcagcggcc   120

tcgggagggc ccaggtagcg agcagcgacc tcgcgagcct tccgcactcc cgcccggttc   180

cccggccgtc cgcctatcct tggccccctc cgctttctcc gcgccggccc gcctcgctta   240

tgcctcggcg ctgagccgct ctcccgattg cccgccgaca tgagctgcaa cggaggctcc   300

cacccgcgga tcaacactct gggccgcatg atccgcgccg agtctggccc ggacctgcgc   360

tacgaggtga ccagcggcgg cgggggcacc agcaggatgt actattctcg gcgcggcgtg   420

atcaccgacc agaactcgga cggctactgt caaaccggca cgatgtccag gcaccagaac   480

cagaacacca tccaggagct gctgcagaac tgctccgact gcttgatgcg agcagagctc   540

atcgtgcagc ctgaattgaa gtatggagat ggaatacaac tgactcggag tcgagaattg   600

gatgagtgtt ttgcccaggc caatgaccaa atggaaatcc tcgacagctt gatcagagag   660

atgcggcaga tgggccagcc ctgtgatgct taccagaaaa ggcttcttca gctccaagag   720

caaatgcgag ccctttataa agccatcagt gtccctcgag tccgcagggc cagctccaag   780

ggtggtggag gctacacttg tcagagtggc tctggctggg atgagttcac caaacatgtc   840

accagtgaat gtttggggtg gatgaggcag caaagggcgg agatggacat ggtggcctgg   900

ggtgtggacc tggcctcagt ggagcagcac attaacagcc accggggcat ccacaactcc   960

atcggcgact atcgctggca gctggacaaa atcaaagccg acctgcgcga gaaatctgcg  1020

atctaccagt tggaggagga gtatgaaaac ctgctgaaag cgtcctttga gaggatggat  1080

cacctgcgac agctgcagaa catcattcag gccacgtcca gggagatcat gtggatcaat  1140

gactgcgagg aggaggagct gctgtacgac tggagcgaca agaacaccaa catcgctcag  1200

aaacaggagg ccttctccat acgcatgagt caactggaag ttaaagaaaa agagctcaat  1260

aagctgaaac aagaaagtga ccaacttgtc ctcaatcagc atccagcttc agacaaaatt  1320

gaggcctata tggacactct gcagacgcag tggagttgga ttcttcagat caccaagtgc  1380

attgatgttc atctgaaaga aaatgctgcc tactttcagt tttttgaaga ggcgcagtct  1440

actgaagcat acctgaaggg gctccaggac tccatcagga agaagtaccc ctgcgacaag  1500

aacatgcccc tgcagcacct gctggaacag atcaaggagc tggagaaaga acgagagaaa  1560

atccttgaat acaagcgtca ggtgcagaac ttggtaaaca agtctaagaa gattgtacag  1620

ctgaagcctc gtaacccaga ctacagaagc aataaaccca ttattctcag agctctctgt  1680

gactacaaac aagatcagaa aatcgtgcat aagggggatg agtgtatcct gaaggacaac  1740

aacgagcgca gcaagtggta cgtgacgggc ccgggaggcg ttgacatgct tgttccctct  1800

gtggggctga tcatccctcc tccgaaccca ctggccgtgg acctctcttg caagattgag  1860

cagtactacg aagccatctt ggctctgtgg aaccagctct acatcaacat gaagagcctg  1920

gtgtcctggc actactgcat gattgacata gagaagatca gggccatgac aatcgccaag  1980

ctgaaaacaa tgcggcagga agattacatg aagacgatag ccgaccttga gttacattac  2040

caagagttca tcagaaatag ccaaggctca gagatgtttg gagatgatga caagcggaaa  2100

atacagtctc agttcaccga tgcccagaag cattaccaga ccctggtcat tcagctccct  2160

ggctatcccc agcaccagac agtgaccaca actgaaatca ctcatcatgg aacctgccaa  2220

gatgtcaacc ataataaagt aattgaaacc aacagagaaa atgacaagca agaaacatgg  2280

atgctgatgg agctgcagaa gattcgcagg cagatagagc actgcgaggg caggatgact  2340

ctcaaaaacc tccctctagc agaccagggg tcttctcacc acatcacagt gaaaattaac  2400

gagcttaaga gtgtgcagaa tgattcacaa gcaattgctg aggttctcaa ccagcttaaa  2460

gatatgcttg ccaacttcag aggttctgaa aagtactgct atttacagaa tgaagtattt  2520

ggactatttc agaaactgga aaatatcaat ggtgttacag atggctactt aaatagctta  2580

tgcacagtaa gggcactgct ccaggctatt ctccaaacag aagacatgtt aaaggtttat  2640

gaagccaggc tcactgagga ggaaactgtc tgcctggacc tggataaagt ggaagcttac  2700

cgctgtggac tgaagaaaat aaaaaatgac ttgaacttga agaagtcgtt gttggccact  2760

atgaagacag aactacagaa agcccagcag atccactctc agacttcaca gcagtatcca  2820

ctttatgatc tggacttggg caagttcggt gaaaaagtca cacagctgac agaccgctgg  2880

caaaggatag ataaacagat cgactttaga ttatgggacc tggagaaaca aatcaagcaa  2940

ttgaggaatt atcgtgataa ctatcaggct ttctgcaagt ggctctatga tcgtaaacgc  3000

cgccaggatt ccttagaatc catgaaattt ggagattcca acacagtcat gcggtttttg  3060

aatgagcaga agaacttgca cagtgaaata tctggcaaac gagacaaatc agaggaagta  3120

caaaaaattg ctgaactttg cgccaattca attaaggatt atgagctcca gctggcctca  3180

tacacctcag gactggaaac tctgctgaac atacctatca agaggaccat gattcagtcc  3240

ccttctgggg tgattctgca agaggctgca gatgttcatg ctcggtacat tgaactactt  3300

acaagatctg gagactatta caggttctta agtgagatgc tgaagagttt ggaagatctg  3360

aagctgaaaa ataccaagat cgaagttttg gaagaggagc tcagactggc ccgagatgcc  3420

aactcggaaa actgtaataa gaacaaattc ctggatcaga acctgcagaa ataccaggca  3480

gagtgttccc agttcaaagc gaagcttgcg agcctggagg agctgaagag acaggctgag  3540

ctggatggga agtcggctaa gcaaaatcta gacaagtgct acggccaaat aaaagaactc  3600

aatgagaaga tcacccgact gacttatgag attgaagatg aaaagagaag aagaaaatct  3660

gtggaagaca gatttgacca acagaagaat gactatgacc aactgcagaa agcaaggcaa  3720

tgtgaaaagg agaaccttgg ttggcagaaa ttagagtctg agaaagccat caaggagaag  3780

gagtacgaga ttgaaaggtt gagggttcta ctgcaggaag aaggcacccg gaagagagaa  3840

tatgaaaatg agctggcaaa ggtaagaaac cactataatg aggagatgag taatttaagg  3900

aacaagtatg aaacagagat taacattacg aagaccacca tcaaggagat atccatgcaa  3960

aaagaggatg attccaaaaa tcttagaaac cagcttgata gactttcaag ggaaaatcga  4020

gatctgaagg atgaaattgt caggctcaat gacagcatct tgcaggccac tgagcagcga  4080

aggcgagctg aagaaaacgc ccttcagcaa aaggcctgtg gctctgagat aatgcagaag  4140

aagcagcatc tggagataga actgaagcag gtcatgcagc agcgctctga ggacaatgcc  4200

cggcacaagc agtccctgga ggaggctgcc aagaccattc aggacaaaaa taaggagatc  4260

gagagactca aagctgagtt tcaggaggag gccaagcgcc gctgggaata tgaaaatgaa  4320

ctgagtaagg taagaaacaa ttatgatgag gagatcatta gcttaaaaaa tcagtttgag  4380

accgagatca acatcaccaa gaccaccatc caccagctca ccatgcagaa ggaagaggat  4440

accagtggct accgggctca gatagacaat ctcacccgag aaaacaggag cttatctgaa  4500

gaaataaaga ggctgaagaa cactctaacc cagaccacag agaatctcag gagggtggaa  4560

gaagacatcc aacagcaaaa ggccactggc tctgaggtgt ctcagaggaa acagcagctg  4620

gaggttgagc tgagacaagt cactcagatg cgaacagagg agagcgtaag atataagcaa  4680

tctcttgatg atgctgccaa aaccatccag gataaaaaca aggagataga aaggttaaaa  4740

caactgatcg acaaagaaac aaatgaccgg aaatgcctgg aagatgaaaa cgcgagatta  4800

caaagggtcc agtatgacct gcagaaagca aacagtagtg cgacggagac aataaacaaa  4860

ctgaaggttc aggagcaaga actgacacgc ctgaggatcg actatgaaag ggtttcccag  4920

gagaggactg tgaaggacca ggatatcacg cggttccaga actctctgaa agagctgcag  4980

ctgcagaagc agaaggtgga agaggagctg aatcggctga agaggaccgc gtcagaagac  5040

tcctgcaaga ggaagaagct ggaggaagag ctggaaggca tgaggaggtc gctgaaggag  5100

caagccatca aaatcaccaa cctgacccag cagctggagc aggcatccat tgttaagaag  5160

aggagtgagg atgacctccg gcagcagagg gacgtgctgg atggccacct gagggaaaag  5220

cagaggaccc aggaagagct gaggaggctc tcttctgagg tcgaggccct gaggcggcag  5280

ttactccagg aacaggaaag tgtcaaacaa gctcacttga ggaatgagca tttccagaag  5340

gcgatagaag ataaaagcag aagcttaaat gaaagcaaaa tagaaattga gaggctgcag  5400

tctctcacag agaacctgac caaggagcac ttgatgttag aagaagaact gcggaacctg  5460

aggctggagt acgatgacct gaggagagga cgaagcgaag cggacagtga taaaaatgca  5520

accatcttgg aactaaggag ccagctgcag atcagcaaca accggaccct ggaactgcag  5580

gggctgatta atgatttaca gagagagagg gaaaatttga gacaggaaat tgagaaattc  5640

caaaagcagg ctttagaggc atctaatagg attcaggaat caaagaatca gtgtactcag  5700

gtggtacagg aaagagagag ccttctggtg aaaatcaaag tcctggagca agacaaggca  5760

aggctgcaga ggctggagga tgagctgaat cgtgcaaaat caactctaga ggcagaaacc  5820

agggtgaaac agcgcctgga gtgtgagaaa cagcaaattc agaatgacct gaatcagtgg  5880

aagactcaat attcccgcaa ggaggaggct attaggaaga tagaatcgga aagagaaaag  5940

agtgagagag agaagaacag tcttaggagt gagatcgaaa gactccaagc agagatcaag  6000

agaattgaag agaggtgcag gcgtaagctg gaggattcta ccagggagac acagtcacag  6060

ttagaaacag aacgctcccg atatcagagg gagattgata aactcagaca gcgcccatat  6120

gggtcccatc gagagaccca gactgagtgt gagtggaccg ttgacacctc caagctggtg  6180

tttgatgggc tgaggaagaa ggtgacagca atgcagctct atgagtgtca gctgatcgac  6240

aaaacaacct tggacaaact attgaagggg aagaagtcag tggaagaagt tgcttctgaa  6300

atccagccat tccttcgggg tgcaggatct atcgctggag catctgcttc tcctaaggaa  6360

aaatactctt tggtagaggc caagagaaag aaattaatca gcccagaatc cacagtcatg 6420

cttctggagg cccaggcagc tacaggtggt ataattgatc cccatcggaa tgagaagctg 6480

actgtcgaca gtgccatagc tcgggacctc attgacttcg atgaccgtca gcagatatat 6540

gcagcagaaa aagctatcac tggttttgat gatccatttt caggcaagac agtatctgtt 6600

tcagaagcca tcaagaaaaa tttgattgat agagaaaccg gaatgcgcct gctggaagcc 6660

cagattgctt cagggggtgt agtagaccct gtgaacagtg tctttttgcc aaaagatgtc 6720

gccttggccc gggggctgat tgatagagat ttgtatcgat ccctgaatga tccccgagat 6780

agtcagaaaa actttgtgga tccagtcacc aaaaagaagg tcagttacgt gcagctgaag 6840

gaacggtgca gaatcgaacc acatactggt ctgctcttgc tttcagtaca gaagagaagc 6900

atgtccttcc aaggaatcag acaacctgtg accgtcactg agctagtaga ttctggtata 6960

ttgagaccgt ccactgtcaa tgaactggaa tctggtcaga tttcttatga cgaggttggt 7020

gagagaatta aggacttcct ccagggttca agctgcatag caggcatata caatgagacc 7080

acaaaacaga agcttggcat ttatgaggcc atgaaaattg gcttagtccg acctggtact 7140

gctctggagt tgctggaagc ccaagcagct actggcttta tagtggatcc tgttagcaac 7200

ttgaggttac cagtggagga agcctacaag agaggtctgg tgggcattga gttcaaagag 7260

aagctcctgt ctgcagaacg agctgtcact gggtataatg atcctgaaac aggaaacatc 7320

atctctttgt tccaagccat gaataaggaa ctcatcgaaa agggccacgg tattcgctta 7380

ttagaagcac agatcgcaac cggggggatc attgacccaa aggagagcca tcgtttacca 7440

gttgacatag catataagag gggctatttc aatgaggaac tcagtgagat tctctcagat 7500

ccaagtgatg ataccaaagg attttttgac cccaacactg aagaaaatct tacctatctg 7560

caactaaaag aaagatgcat taaggatgag gaaacagggc tctgtcttct gcctctgaaa 7620

gaaaagaaga aacaggtgca gacatcacaa aagaataccc tcaggaagcg tagagtggtc 7680

atagttgacc cagaaaccaa taaagaaatg tctgttcagg aggcctacaa gaagggccta 7740

attgattatg aaaccttcaa agaactgtgt gagcaggaat gtgaatggga agaaataacc 7800

atcacgggat cagatggctc caccagggtg gtcctggtag atagaaagac aggcagtcag 7860

tatgatattc aagatgctat tgacaagggc cttgttgaca ggaagttctt tgatcagtac 7920

cgatccggca gcctcagcct cactcaattt gctgacatga tctccttgaa aaatggtgtc 7980

ggcaccagca gcagcatggg cagtggtgtc agcgatgatg tttttagcag ctcccgacat 8040

gaatcagtaa gtaagatttc caccatatcc agcgtcagga atttaaccat aaggagcagc 8100

tctttttcag acaccctgga agaatcgagc cccattgcag ccatctttga cacagaaaac 8160

ctggagaaaa tctccattac agaaggtata gagcggggca tcgttgacag catcacgggt 8220

cagaggcttc tggaggctca ggcctgcaca ggtggcatca tccacccaac cacgggccag 8280

aagctgtcac ttcaggacgc agtctcccag ggtgtgattg accaagacat ggccaccagc 8340

gtgaagcctg ctcagaaagc cttcataggc ttcgagggtg tgaagggaaa gaagaagatg 8400

tcagcagcag aggcagtgaa agaaaaatgg ctcccgtatg aggctggcca gcgcttcctg  8460

gagttccagt acctcacggg aggtcttgtt gacccggaag tgcatgggag gataagcacc  8520

gaagaagcca tccggaaggg gttcatagat ggccgcgccg cacagaggct gcaagacacc  8580

agcagctatg ccaaaatcct gacctgcccc aaaaccaaat taaaaatatc ctataaggat  8640

gccataaatc gctccatggt agaagatatc actgggctgc gccttctgga agccgcctcc  8700

gtgtcgtcca agggcttacc cagcccttac aacatgtctt cggctccggg gtcccgctcc  8760

ggctcccgct cgggatctcg ctccggatct cgctccgggt cccgcagtgg gtcccggaga  8820

ggaagctttg acgccacagg gaattcttcc tactcttatt cctactcatt tagcagtagt  8880

tctattgggc actagtagtc agttgggagt ggttgctata ccttgacttc atttatatga  8940

atttccactt tattaaataa tagaaaagaa aatcccggtg cttgcagtag agtgatagga  9000

cattctatgc ttacagaaaa tatagccatg attgaaatca aatagtaaag gctgttctgg  9060

ctttttatct tcttagctca tcttaaataa gcagtacact tggatgcagt gcgtctgaag  9120

tgctaatcag ttgtaacaat agcacaaatc gaacttagga tttgtttctt ctcttctgtg  9180

tttcgatttt tgatcaattc tttaattttg gaagcctata atacagtttt ctattcttgg  9240

agataaaaat taaatggatc actgatattt tagtcattct gcttctcatc taaatatttc  9300

catattctgt attaggagaa aattaccctc ccagcaccag cccccctctc aaacccccaa  9360

cccaaaacca agcattttgg aatgagtctc ctttagtttc agagtgtgga ttgtataacc  9420

catatactct tcgatgtact tgtttggttt ggtattaatt tgactgtgca tgacagcggc  9480

aatcttttct ttggtcaaag ttttctgttt attttgcttg tcatattcga tgtactttaa  9540

ggtgtcttta tgaagtttgc tattctggca ataaactttt agactttt               9588

<210>33

<211>366

<212>DNA

<213>人

<220>

<221>其它特征

<222>(351)..(351)

<223>任意碱基

<400>33

gaagtgccat ttatatttat acaaaaatat tacataattc agttagtatt ggtgacataa    60

tttagttagt atgggtgata taatggtcat aatttttagc atctaataaa gatcttttta   120

tgagtcccat ataaaatatg tgaacaaagc aatcttgtca taagatttgt gatgatttag   180

gagaaagtac tttgagataa tttttttctg tctctttgtg aactctctca acagtagttc   240

tctttagatt agagccagca ggtcggccat aacagttttc ttcaaatttg ggcaacagtt   300

atacaaatgc ttgaatttca agacaacata ttaaagggtc tatgaactgg naatctaacc   360

tgggtt                                                              366

<210>34

<211>1466

<212>DNA

<213>人

<400>34

agccccaagc ttaccacctg cacccggaga gctgtgtgtc accatgtggg tcccggttgt    60

cttcctcacc ctgtccgtga cgtggattgg tgctgcaccc ctcatcctgt ctcggattgt   120

gggaggctgg gagtgcgaga agcattccca accctggcag gtgcttgtgg cctctcgtgg   180

cagggcagtc tgcggcggtg ttctggtgca cccccagtgg gtcctcacag ctgcccactg   240

catcaggaac aaaagcgtga tcttgctggg tcggcacagc ctgtttcatc ctgaagacac   300

aggccaggta tttcaggtca gccacagctt cccacacccg ctctacgata tgagcctcct   360

gaagaatcga ttcctcaggc caggtgatga ctccagccac gacctcatgc tgctccgcct   420

gtcagagcct gccgagctca cggatgctgt gaaggtcatg gacctgccca cccaggagcc   480

agcactgggg accacctgct acgcctcagg ctggggcagc attgaaccag aggagttctt   540

gaccccaaag aaacttcagt gtgtggacct ccatgttatt tccaatgacg tgtgtgcgca   600

agttcaccct cagaaggtga ccaagttcat gctgtgtgct ggacgctgga cagggggcaa   660

aagcacctgc tcgggtgatt ctgggggccc acttgtctgt aatggtgtgc ttcaaggtat   720

cacgtcatgg ggcagtgaac catgtgccct gcccgaaagg ccttccctgt acaccaaggt   780

ggtgcattac cggaagtgga tcaaggacac catcgtggcc aacccctgag cacccctatc   840

aaccccctat tgtagtaaac ttggaacctt ggaaatgacc aggccaagac tcaagcctcc   900

ccagttctac tgacctttgt ccttaggtgt gaggtccagg gttgctagga aaagaaatca   960

gcagacacag gtgtagacca gagtgtttct taaatggtgt aattttgtcc tctctgtgtc  1020

ctggggaata ctggccatgc ctggagacat atcactcaat ttctctgagg acacagatag  1080

gatggggtgt ctgtgttatt tgtggggtac agagatgaaa gaggggtggg atccacactg  1140

agagagtgga gagtgacatg tgctggacac tgtccatgaa gcactgagca gaagctggag  1200

gcacaacgca ccagacactc acagcaagga tggagctgaa aacataaccc actctgtcct  1260

ggaggcactg ggaagcctag agaaggctgt gagccaagga gggagggtct tcctttggca  1320

tgggatgggg atgaagtaag gagagggact ggaccccctg gaagctgatt cactatgggg  1380

ggaggtgtat tgaagtcctc cagacaaccc tcagatttga tgatttccta gtagaactca  1440

cagaaataaa gagctgttat actgtg                                       1466

<210>35

<211>187

<212>DNA

<213>人

<400>35

gatctggtgc attccggtcg acactctcgt ttatttggac tgtaagtctg acctctatga    60

ataattactt cagcccctga gtgctcccgg gccaagctcc ttggccaaac tttcacctta   120

gcttctgata agtcttgggc caagctaagc agcatctatc aatcatccct tcagctcctg   180

attgatc                                                            187

<210>36

<211>2913

<212>DNA

<213>人

<400>36

actgggtacc gaggactggg tgtgtttaag gcagacagcc aggtgaggat cccagctact    60

ggggcctgct gtcatctcct gggagtaccc gggggtcagg agcctagggg actcttgcac   120

ttcacatcca gccatgctaa ttacactttt tggcaaagga aacagctagg agcagtttct   180

ttcactccta cagccccgtt ttctcagtgt ttagacctcg aattattact gggctagagg   240

gaaggcagcc tctgaagtgt ggcaggagga ggggaagtct gcctgcatct tggtgtgtct   300

gtcagatgcc agcactaata acctggcttc tgtgaggcct gtcagtgctc tcaggaatga   360

aaggggaccc ctgagaggtg ctcagtacca gcaggctgtg aatgctctct acccaccacc   420

ctcacctcct cgttaaagat ggtgctacct gccacacagc agacatctgg tcgctgcaca   480

cccgaaagac cccaaggcag tctgcccctt gtccagccac acgccagcac ccaccctcct   540

ggcccctgcc tcggcctccc cagaccagct gcacccagcc cccaacacgc accccttctc   600

cagatgtgtg cagggcctca ttttgcagag caaagacaga tgtttcagcc acacgcttta   660

ttaacttcta aaacctgtgc tcaggacact cttcaacagt catgaaaagt ttgatcactt   720

gccacagtca ggacctttgt gtggggctct gatctgatgt tcggtctcat catctcccaa   780

accagcagtc gtttgtaccc caaccctctg ctcaggggct cataccccca aatgattttc   840

ctgatttatg tatttcccta caaagggctt tctataccta gcatctgcct ccagcatgag   900

aagggggaat aggtgagacc catttgccag tagcagacgg ggaccctggg gagaaaatgg   960

cagagcctgt tggagactcc ctgtctccag ctgaccagcc aatgggattc ctcttccctc  1020

cactgtctcc cacaaagtag aagaatcctg gtacatttag cccatgagcc tggcacagat  1080

ccctatctag acatgaggcc ctttagacat gactttggca ttgaccagcc tgttggcaat  1140

gggtcgggga ggcagagggg atgctcacac cagtaattct catcccctga atgcttggga  1200

tcacctgggg agagttcaca aaatactggt gcaggggtcc cacctctgat gatgctgagt  1260

ggtgggtctg gggtgtggcc caggcatcat gatgtttcag gcccccaggt gacttcttag  1320

gcagcccagc taagccccta gagccttgca atttccccca aatgacctca gagggcccga  1380

tttgagggaa atgcctaact tcaggggccg taagaatccc ccagggagca tgtgaaatgc  1440

agataccagg cccaccccca gagatgagct gaggtgggtc aggggtgaag tgcagggatc  1500

agtgtttttc acaagctcca tacctccagg aaatggtgtt gtggttgggc ccgtagaaaa  1560

cattctgaga gtcctgttgc ctgtgccttg gtgcacgtgg ggtggaatcc cagtggccct  1620

gccttgagga ggatgtgcat taacgtggta ggggagacag agacagctcc acctgccccc  1680

tgtcccaccg gggacctcca aaaacttcat ggatgttaga gcaagcagcc atgctgcagc  1740

agaggatgag gctggcggat ttagtaagag ccctctgtgt ttgggctgag ttctttctct  1800

agttgccctg tcatctggcc tctggataac ccacctctcc tccctcatcc taaaattaca  1860

gatggcgaaa gacggccaca tttagtgaga cccctaaggt cctccaacta gggtgggtcc  1920

acagtggccc ctggtgcatg gaccacacac tctcttccct cctctggctc aggactacgg  1980

tctgaaatta gggagatatg aatgtctttc ttgaaaactt ctcttcccag tcttcccact  2040

ttgcttgggg gtccttggtc aaggccagct ttggactagg gcttgttgcg actaccagct  2100

gtctcatttt gctgtactgc aaactcaggc ttggttccaa gcttatgggg gccctgtcct  2160

tcccctagta gggtttgttt tggggtcaca tctggtcata cccttcagag agctcttccc  2220

cagcctctac atcagggaga gaggtaggta gggaggagca ttcaaggatt agaagaagga  2280

ctaaagtaca acagccttgg aggaactgcc aggaactaag ggcgagcact ggagaaggca  2340

acctgggacc ccctgcgctt ctgagcagga agaccaagac cttcaggggc cctaagcact  2400

gaaaacatca ttcctcatcc ccaagccctg gcatccccct gttcttctaa aataattctt  2460

ttctaggtat ttctgattgc aaaattctgg atgggttcat ccaagctgac ctttgctgtt  2520

ttttcccttc ccaacaaggc ctcacttttt ggagccacct tagttggtgc ctaggcagag  2580

gggcagtcag cagtggttat caggatcctg gctctatggg ttgccttcct cctggtctgt  2640

aaagcccctg caggcaggga cttcttagat agctgcttcc ttagggcatg gcatgtggtg  2700

ggtggttaat gaatggaaga gagggaatga gtgatcaagg gagggaggag ggagtggagt  2760

ggagatttct catcctttcc tgttaattta tgacatcctc ctgcctatga gtccttgact  2820

ctggagtttt acaaagcagt cacatttcaa ataaaagtct gggaaagcaa cacatcatcg  2880

ccaactttta attttgctaa ataaggatat tag                               2913

<210>37

<211>1466

<212>DNA

<213>人

<400>37

agccccaagc ttaccacctg cacccggaga gctgtgtgtc accatgtggg tcccggttgt    60

cttcctcacc ctgtccgtga cgtggattgg tgctgcaccc ctcatcctgt ctcggattgt   120

gggaggctgg gagtgcgaga agcattccca accctggcag gtgcttgtgg cctctcgtgg   180

cagggcagtc tgcggcggtg ttctggtgca cccccagtgg gtcctcacag ctgcccactg   240

catcaggaac aaaagcgtga tcttgctggg tcggcacagc ctgtttcatc ctgaagacac   300

aggccaggta tttcaggtca gccacagctt cccacacccg ctctacgata tgagcctcct   360

gaagaatcga ttcctcaggc caggtgatga ctccagccac gacctcatgc tgctccgcct   420

gtcagagcct gccgagctca cggatgctgt gaaggtcatg gacctgccca cccaggagcc   480

agcactgggg accacctgct acgcctcagg ctggggcagc attgaaccag aggagttctt   540

gaccccaaag aaacttcagt gtgtggacct ccatgttatt tccaatgacg tgtgtgcgca   600

agttcaccct cagaaggtga ccaagttcat gctgtgtgct ggacgctgga cagggggcaa   660

aagcacctgc tcgggtgatt ctgggggccc acttgtctgt aatggtgtgc ttcaaggtat   720

cacgtcatgg ggcagtgaac catgtgccct gcccgaaagg ccttccctgt acaccaaggt   780

ggtgcattac cggaagtgga tcaaggacac catcgtggcc aacccctgag cacccctatc   840

aaccccctat tgtagtaaac ttggaacctt ggaaatgacc aggccaagac tcaagcctcc   900

ccagttctac tgacctttgt ccttaggtgt gaggtccagg gttgctagga aaagaaatca   960

gcagacacag gtgtagacca gagtgtttct taaatggtgt aattttgtcc tctctgtgtc  1020

ctggggaata ctggccatgc ctggagacat atcactcaat ttctctgagg acacagatag  1080

gatggggtgt ctgtgttatt tgtggggtac agagatgaaa gaggggtggg atccacactg  1140

agagagtgga gagtgacatg tgctggacac tgtccatgaa gcactgagca gaagctggag  1200

gcacaacgca ccagacactc acagcaagga tggagctgaa aacataaccc actctgtcct  1260

ggaggcactg ggaagcctag agaaggctgt gagccaagga gggagggtct tcctttggca  1320

tgggatgggg atgaagtaag gagagggact ggaccccctg gaagctgatt cactatgggg  1380

ggaggtgtat tgaagtcctc cagacaaccc tcagatttga tgatttccta gtagaactca  1440

cagaaataaa gagctgttat actgtg                                       1466

<210>38

<211>462

<212>DNA

<213>人

<220>

<221>其它特征

<222>(197)..(197)

<223>任意碱基

<220>

<221>其它特征

<222>(116)..(116)

<223>任意碱基

<220>

<221>其它特征

<222>(334)..(334)

<223>任意碱基

<220>

<221>其它特征

<222>(402)..(402)

<223>任意碱基

<220>

<221>其它特征

<2z2>(429)..(429)

<223>任意碱基

<220>

<221>其它特征

<222>(438)..(438)

<223>任意碱基

<220>

<221>其它特征

<222>(443)..(443)

<223>任意碱基

<220>

<221>其它特征

<222>(459)..(459)

<223>任意碱基

<400>38

taaggtttta taattatttt tatttttctt ttcttttttt tttatggctt ggatgacact    60

ttattttcag atccaatact agaagttgtt tccatgttca cattttcctt cctggnttaa   120

aaaaaagagt tgtatttttt ttttttgctt tttttaaatt atactttaag ttttagggta   180

catgtgcaca acgcagnggt tagctacata tgtatacatg tgccatgttg gcgtgctgca   240

tccagtaact cgtcatttaa cattaggtat atctccaaat gctatccttc cccccattgt   300

atttttcata gcttaaaaat cattgacata ggantaattc caactaaagt acggtattaa   360

atccctgggg gaataaattt tgtcttaaca agggtaaggt tngtgaaaag gatggttttg   420

tcacagggna aaaggganat ccncccattt taaaacccnc ct                      462

<210>39

<211>1490

<212>DNA

<213>人

<400>39

ctcgtgcccc ccacggaggg gactgctctc ccccgctgca tcctttctgt gaggtacctt    60

acccacctca gcacctgaga gggtgaaata gaattctaac ctcgacattc gggaagtgtt   120

tttgagaagt ctcggtcggt aagggaagtc ttccaagtcc gtgcagcact aacgtattgg   180

cacctgcctc ctcttcggcc accccccaga tgaggcagct gtgactgtgt caagggaagc   240

cacgactctg accatagtct tctctcagct tccactgccg tctccacagg aaacccagaa   300

gttctgtgaa caagtccatg ctgccatcaa ggcatttatt gcagtgtact atttgcttcc   360

aaaggatcag gggatcaccc tgagaaagct ggtacggggc gccaccctgg acatcgtgga   420

tggcatggct cagctcatgg aagtactttc cgtcactcca actcagagcc ctgagaacaa   480

tgaccttatt tcctacaaca gtgtctgggt tgcgtgccag cagatgcctc agataccaag   540

agataacaaa gctgcagctc ttttgatgct gaccaagaat gtggattttg tgaaggatgc   600

acatgaagaa atggagcagg ctgtggaaga atgtgaccct tactctggcc tcttgaatga   660

tactgaggag aacaactctg acaaccacaa tcatgaggat gatgtgttgg ggtttcccag   720

caatcaggac ttgtattggt cagaggacga tcaagagctc ataatcccat gccttgcgct   780

ggtgagagca tccaaagcct gcctgaagaa aattcggatg ttagtggcag agaatgggaa   840

gaaggatcag gtggcacagc tggatgacat tgtggatatt tctgatgaaa tcagccctag   900

tgtggatgat ttggctctga gcatatatcc acctatgtgt cacctgaccg tgcgaatcaa   960

ttctgcgaaa cttgtatctg ttttaaagaa ggcacttgaa attacaaaag caagtcatgt  1020

gacccctcag ccagaagata gttggatccc tttacttatt aatgccattg atcattgcat  1080

gaatagaatc aaggagctca ctcagagtga acttgaatta tgacttttca ggctcatttg  1140

tactctcttc ccctctcatc gtcatggtca ggctctgata cctgctttta aaatggagct  1200

agaatgcttg ctggattgaa agggagtgcc tatctatatt tagcaagaga cactattacc  1260

aaagattgtt ggttaggcca gattgacacc tatttataaa ccatatgcgt atatttttct  1320

gtgctatata tgaaaaataa ttgcatgatt tctcattcct gagtcatttc tcagagattc  1380

ctaggaaagc tgccttattc tctttttgca gtaaagtatg ttgttttcat tgtaaagatg  1440

ttgatggtct caataaaatg ctaacttgcc agtgattaaa aaaaaaaaaa             1490

<210>40

<211>1677

<212>DNA

<213>人

cttgacccta tttatagtgg ctctaaaggt ggtgttatta tgttttctag agcacttcga     60

ttatacaaac gtcaaggaat ccgagttaat gtgctttgcc ctgagtttgt tgaaacagac    120

atgggcacaa tgatcggtcc caaattcctt agtatgatgg ggggctttgt acctatggaa    180

atggtggtga aaggtgcttt tgagctcatc actgatgaga ataaagccgg cgattgccta    240

tggattacta atcggcgagg tcttgagtac tggcccaccc catcagaaga agcaaagtac    300

ttgctgcgtt ctacacgttc caggagaaga actgaataca aagctccacc aattaaacta    360

cctgagagtt ttgagaaaat agttgttcag accttgactc acaactttcg gaatgctacc    420

agtgtagtaa gagcaccact gagattacct atcaaaccaa actatgttct tgtgaagata    480

atctatgctg gtgtaaatgc tagtgatgta aattttagct caggtcgcta ttttggtggc    540

aataacagtg acactgcatc ccgtcttccg tttgatgcag gatttgaggc tgtgggagta    600

attgcagcag ttggggattc tgttactgac ttgaaagttg gcatgccttg tgcgttcatg    660

acttttggag gctatgctga atttacaatg attccttcga aatacgccct tccaatgcct    720

agaccagaac cggaaggtgt tgccatgctt acatcaggat taacagcttc aattgctcta    780

gaaaaggcag gacagatgga atctggaaaa gtggtccttg ttactgctgc ggcaggagga    840

actggtcagt ttgctgttca gcttgcaaaa ttagctggta ataccgtggt tgccacttgt    900

ggaggtgggg caaaggccaa gcttctgaaa gaattgggag tcgacagagt catagactat    960

cacagtgaag atataaaaac ggttctaagg aaagagttcc cgaaaggtat tgatatcatc   1020

tacgaatctg ttggtgggga catgttaaag ttgtgcttgg atgctttggc agtccatgga   1080

cgactcattg tcattggcat gatttctcag tatcaaggag aaaatggttg gacgccatca   1140

aaatatcctg gactatgtga gaagctcttg tcaaagagtc aaactgtggc tggctttttc   1200

ctggtgcaat atagtcacat gtaccaagaa caccttaaca agttatttga cctttactct  1260

tccggaaaac taaaggttgc tgtggatcca aagagattta taggccttca ttctgttgct  1320

gatgctgttg agtatctcca ttcaggcaaa agcgttggga aggtggttgt ctgcgtggac  1380

ccgaccttcg gtcatcaagt agccaaatta tgaatgaaca cggtgtcaaa tacagaaaga  1440

agtgaagttt tcaattctta gtctagagat tgttctcgaa tgttactgaa aatagctgct  1500

agaccagtgc tggaatattt attctcaatg ctttttcaat tttggattac ttgaaagaat  1560

aatccattta tgtataccat gtttatgttt acactataca acaactatga gcagaagaaa  1620

gcgagatatc tacaaaataa attataatcc tttcatttta aaaaaaaaaa aaaaaaa     1677

<210>41

<211>1330

<212>DNA

<213>人

<400>41

atggcgcagt gggacagctt cactgatcaa caggaggaca ctgatagctg ttcagaatct    60

gtgaagtttg atgctcgctc caatacagct ttgcttcccc caaatcctaa aaatggccct   120

ccacttcaag aaaagctgaa atccttcaaa gctgcactga ttgcccttta tctccttgtg   180

tttgctgttc tcattcctat catcgcaata atggcagctc aactcctgaa gtgggaaatg   240

aagaattgca cagttggttc aattaatgca aacagtgtat cctccagtct cctgggaaga   300

ggaaatgaca gtgaagatga agtgagattt cgagaagttg ttatggaaca cattagcaag   360

atggagaaaa gaatccaata tatttcagat actgaagaaa atctcgtaga ttcagagcat   420

tttcaaaatt tcagtgtgac aactgatcaa cgatttgctg atgttcttct ccaactaagt   480

accttggttc ccacagtcca gggacatggg aatgccgtag atgaaatcac caggtcctta   540

ataagtctga ataccacgct gcttgatttg cacctctatg tagaaacact gaatgtcaaa   600

ttccaggaga atacacttaa agggcaagag gaaatcagca aattaaagga gcgtgtgcac   660

aatgcatcag cagaaattat gtctatgaaa gaagaacaag tgcatttgga acaggaaata   720

aaaagagaag tgaaagtcct gaataacatc actaatgatc tcaggctgaa agattgggaa   780

cattctcaga cgttgagaaa tatcacttta attcaaggtc ctcctggacc cccaggagaa   840

aaaggagata gaggtccaac cggagaaagt ggtccaccag gcgttccagg tccagtaggt   900

cctccaggtc ttaagggtga tcgaggatct attggctttc cgggaagtcg aggatatcca   960

ggacaatcag ggaagactgg gaggacagga tatcctggac caaaaggcca aaagggagaa  1020

aaaggcagtg gaagcatcct gactccttct gcgactgtcc gactggttgg tggccgtggc  1080

cctcatgagg gtagagtgga gatattgcac aatggacagt ggggcacagt ttgtgatgat  1140

cactgggaac tgcgtgccgg gcaggttgtc tgcagagact tgggataccg aggtgttaag  1200

agtgtgcaca agaaagctta ttttggacaa ggtactggtc ccatttggct gaatgaagta  1260

ccctgtttgg ggatggagtc atccattgaa gagtgcaaaa tcagacagtg gggcgtgaga  1320

gtctgttcac                                                         1330

<210>42

<211>431

<212>DNA

<213>人

<220>

<221>其它特征

<222>(97)..(97)

<223>任意碱基

<220>

<221>其它特征

<222>(347)..(347)

<223>任意碱基

<220>

<221>其它特征

<222>(349)..(349)

<223>任意碱基

<220>

<221>其它特征

<222>(361)..(361)

<223>任意碱基

<220>

<221>其它特征

<222>(362)..(362)

<223>任意碱基

<220>

<221>其它特征

<222>(363)..(363)

<223>任意碱基

<220>

<221>其它特征

<222>(401)..(401)

<223>任意碱基

<220>

<221>其它特征

<222>(428)..(428)

<223>任意碱基

<400>42

ctttttatat ttattttcat cgctacacaa acatttttta ggagtttgat tctacctcca    60

ttttggttag atatacaaac tctaccccat gagggantgt atggtgtatt tctagattta   120

gcaacaattt tcttgaaaaa tgtacaatac tatagaaaaa tgaagatagt aaataccagg   180

tataagttaa taacagtgtt tcttttgttc agtaataatg aactgtgtac tagcactgaa   240

ctttaggccc tcctatttgc gtattttctg tttgtatatt tttaaataga ggaattgtga   300

ttataatatt attattttgg aatatcctaa atcataaatt caaaacntna tttagttttt   360

nnnttttttt tttaagatgg agtcccgctt tgtcccaggc nggagtgcag tggcatgatc  420

tcagctcnct g                                                       431

<210>43

<211>669

<212>DNA

<213>人

<220>

<221>其它特征

<222>(641)..(641)

<223>任意碱基

<400>43

ttcttttgga aaaccaaaca tgctttattt catttttttc acaatttatt taaacatctc    60

acatatacaa aataggtaca atttaatttt tctgcttgcc caagaaacaa agcttctgtg   120

gaaccatgga agaagatgaa aatgagactg gcaaagaaca aatgctgaat ctgaagaaga   180

ggacaacttt gggcaaataa tctgcatact tttaattggg aataagatgg aaaatatgaa   240

tgctaaatca aattttttaa aaaatacacc acacgataca actcaataca ggagtatttc   300

ttctcaaatt cttctagcac catcaacatt cttcaagtat ctgaaatact attaattagc   360

acctttgtat tatgaacaaa acaaaacaag gacctcagtt catctctgtc taggtcagca   420

cctaacaatg tggatcacac tcatgggaaa gtgttttgag gtagtttaaa cctttggaag   480

tttgggtttt aaacttccct ctgtggaaga tattcaaaag ccacaagtgg tgcaaatgtt   540

tatggttttt atttttcaat ttttattttg gttttcttac aaaggttgac atttttcata   600

acaggtgtaa gagtgttgaa aaaaaaattt caatttttgg ngggaacggg ggaaggagtt   660

aatgaaact                                                           669

<210>44

<211>287

<212>DNA

<213>人

<400>44

gccggagagt ctacaatgtt acccagcatg ctgttggcat tgttgtaaac aaacaagtta    60

agggcaagat tcttgccaag agaattaatg tgcgtattga gcacattaag cactctaaga   120

gccgagatag cttcctgaaa cgtgtgaagg aaaatgatca gaaaaagaaa gaagccaaag   180

agaaaggtac ctgggttcaa ctaaagcgcc acgctgctcc acccagagaa gcacactttg   240

tgagaaccaa tgggaaggag cctgagctgc tggaacctat tccctat                 287

<210>45

<211>383

<212>DNA

<213>人

<220>

<221>其它特征

<222>(147)..(147)

<223>任意碱基

<220>

<221>其它特征

<222>(309)..(309)

<223>任意碱基

<220>

<221>其它特征

<222>(349)..(349)

<223>任意碱基

<220>

<221>其它特征

<222>(365)..(365)

<223>任意碱基

<220>

<221>其它特征

<222>(372)..(372)

<223>任意碱基

<220>

<221>其它特征

<222>(380)..(380)

<223>任意碱基

<400>45

ggaacggaaa aggagaattc aagtgtgacc ctcatgaggc aacgtgttat gatgatggga    60

agacatacca cgtaggagaa cagtggcaga aggaatatct cggtgccatt tgctcctgca   120

catgctttgg aggccagcgg ggctcgnctt gtgacaactg ccgcagacct ggggggtgaa   180

cccagtcccg aaggcactac tggccagtcc tacaaccagt attcttcaga gataccattc   240

agagaacaaa cactaatgtt taatttgccc aatttgagtg cttcatgcct tttaggatgt   300

tacaggctng acagagaagg ttttcccgag gagttaaatc atctttttnc catttcccga   360

ggggncaagg cntgtttttn ttt                                           383

<210>46

<211>523

<212>DNA

<213>人

<400>46

cagaggggca gggcggacgg ctaggagttc aagaaacatc ctggtctgag ggaaaggctg    60

cagctgcacc gccatgaata agcttttcag cttctggaag aggaagaatg agacccgcag   120

ccagggctac aaccttcgag aaaaggattt aaagaaactt cacagagctg cttcagtcgg   180

ggatttgaag aagctgaagg aataccttca gatcaagaaa tatgatgtaa atatgcagga   240

ctatgaatac agaacacctt tgcacctagc ctgtgctaat ggacatacag atgttgtact   300

tttcctaatt gagcaacaat gcaagataaa tgtccgggat agtgaaaaca aatccccatt   360

gattaaggca gtacagtgtc aaaatgagga ttgtgctact attctgctaa actttggtgc   420

agacccagat ctgagggata ttcgttataa tactgttctt cactatgctg tttgtggtca  480

aagtttgtca ttagttgaaa aactgcttga atacgaagct gat                    523

<210>47

<211>390

<212>DNA

<213>人

<400>47

tccaaggtca tggcaaaaca tctgaagttc atcgccagga ctgtgatggt acaggaaggg    60

aacgtggaaa gcgcatacag gaccctaaac agaatcctca ctatggatgg gctcattgag   120

gacattaagc atcggcggta ttatgagaag ccatgccgcc gcgacagagg gaaagctatg   180

aaaggtgccg gcggatctac aacatggaaa tggctcgcaa gatcaacttc ttgatgcgaa   240

agaatcgggc agatccgtgg cagggctgct gaggcctgtg ggtgggacac cagtgcgaaa   300

ccctcatcca gttttctctc catctctttt ctttgtacaa tcccatttcc tattaccatt   360

ctctgcaata aactcaaatc acatgtctgc                                    390

<210>48

<211>669

<212>DNA

<213>人

<220>

<221>其它特征

<222>(641)..(641)

<223>任意碱基

<400>48

ttcttttgga aaaccaaaca tgctttattt catttttttc acaatttatt taaacatctc     60

acatatacaa aataggtaca atttaatttt tctgcttgcc caagaaacaa agcttctgtg    120

gaaccatgga agaagatgaa aatgagactg gcaaagaaca aatgctgaat ctgaagaaga    180

ggacaacttt gggcaaataa tctgcatact tttaattggg aataagatgg aaaatatgaa    240

tgctaaatca aattttttaa aaaatacacc acacgataca actcaataca ggagtatttc    300

ttctcaaatt cttctagcac catcaacatt cttcaagtat ctgaaatact attaattagc    360

acctttgtat tatgaacaaa acaaaacaag gacctcagtt catctctgtc taggtcagca    420

cctaacaatg tggatcacac tcatgggaaa gtgttttgag gtagtttaaa cctttggaag    480

tttgggtttt aaacttccct ctgtggaaga tattcaaaag ccacaagtgg tgcaaatgtt    540

tatggttttt atttttcaat ttttattttg gttttcttac aaaggttgac atttttcata    600

acaggtgtaa gagtgttgaa aaaaaaattt caatttttgg ngggaacggg ggaaggagtt    660

aatgaaact                                                            669

<210>49

<211>431

<212>DNA

<213>人

<220>

<221>其它特征

<222>(97)..(97)

<223>任意碱基

<220>

<221>其它特征

<222>(347)..(347)

<223>任意碱基

<220>

<221>其它特征

<222>(349)..(349)

<223>任意碱基

<220>

<221>其它特征

<222>(361)..(361)

<223>任意碱基

<220>

<221>其它特征

<222>(362)..(362)

<223>任意碱基

<220>

<221>其它特征

<222>(363)..(363)

<223>任意碱基

<220>

<221>其它特征

<222>(401)..(401)

<223>任意碱基

<220>

<221>其它特征

<222>(428)..(428)

<223>任意碱基

<400>49

ctttttatat ttattttcat cgctacacaa acatttttta ggagtttgat tctacctcca    60

ttttggttag atatacaaac tctaccccat gagggantgt atggtgtatt tctagattta   120

gcaacaattt tcttgaaaaa tgtacaatac tatagaaaaa tgaagatagt aaataccagg   180

tataagttaa taacagtgtt tcttttgttc agtaataatg aactgtgtac tagcactgaa   240

ctttaggccc tcctatttgc gtattttctg tttgtatatt tttaaataga ggaattgtga   300

ttataatatt attattttgg aatatcctaa atcataaatt caaaacntna tttagttttt   360

nnnttttttt tttaagatgg agtcccgctt tgtcccaggc nggagtgcag tggcatgatc   420

tcagctcnct g                                                        431

评估结肠直肠癌.pdf_第1页
第1页 / 共72页
评估结肠直肠癌.pdf_第2页
第2页 / 共72页
评估结肠直肠癌.pdf_第3页
第3页 / 共72页
点击查看更多>>
资源描述

《评估结肠直肠癌.pdf》由会员分享,可在线阅读,更多相关《评估结肠直肠癌.pdf(72页珍藏版)》请在专利查询网上搜索。

1、(10)授权公告号 CN 101603092 B (45)授权公告日 2012.11.07 CN 101603092 B *CN101603092B* (21)申请号 200910148967.3 (22)申请日 2003.03.29 60/368798 2002.03.29 US 03131205.5 2003.03.29 C12Q 1/68(2006.01) (73)专利权人 奥索临床诊断有限公司 地址 美国纽约州 (72)发明人 Y王 (74)专利代理机构 中国专利代理(香港)有限公 司 72001 代理人 梁谋 黄可峻 WO 0012702 A,2000.03.09, BO TH & 。

2、JONASSEN I.New feature subset selection procedures for classification of expression profiles. GENOME BIOLOGY .2002, 第 3 卷 ( 第 4 期 ),1-11. HEGDE, ET AL.Identification of tumor markers in models of human colorectal cancer using a 19200-element complementary DNA microarray.CANCER RESEARCH .2001, 第 61 卷。

3、 ( 第 21 期 ),7792-7797. ZHANG L, ET A.Gene expression profiles in normal and cancer cells. SCIENCE .1997, 第 276 卷 1268-1272. (54) 发明名称 评估结肠直肠癌 (57) 摘要 通过分析一组基因的表达对相信患有结肠直 肠癌的患者的结肠直肠癌存在与否或其可能状态 进行评估的方法。 本发明还涉及多种媒介物, 如微 阵列中基因表达分布图, 也包括含有基因表达分 布图的试剂盒。 (30)优先权数据 (62)分案原申请数据 (51)Int.Cl. (56)对比文件 审查员 温庭江 权。

4、利要求书 1 页 说明书 70 页 (19)中华人民共和国国家知识产权局 (12)发明专利 权利要求书 1 页 说明书 70 页 1/1 页 2 1. 包括 Seq.ID.No.46-49 的基因组合在制备用于评估结肠直肠癌状况方法的试剂中 的应用, 所述方法包括鉴定每个基因相对于正常种群的相同基因的表达的差异调节。 2. 权利要求 1 的应用, 其中被调节的基因表达存在至少 2 倍差异。 3. 权利要求 1 的应用, 其中表示差异调节的 p 值低于 0.05。 4. 权利要求 1 的应用, 进一步包括使用非遗传基础的结肠直肠癌诊断方法。 5. 权利要求 4 的应用, 其中在非遗传基础的结肠直。

5、肠癌诊断方法中使用的非遗传基础 的癌症标记选自癌胚性抗原、 CA19-9、 CA125、 CK-BB 和鸟苷酸环化酶 C。 6. 一种诊断框架, 包括 Seq.ID.No.46-49 的基因组合的分离的核酸序列或其互补序 列。 7. 权利要求 6 的诊断框架, 其位于适合鉴定包含于其上的基因的差异表达的基片上。 8. 权利要求 7 的诊断框架, 其中所述的基片用于微阵列。 9. 权利要求 8 的诊断框架, 其中所述的微阵列是 cDNA 微阵列。 10. 权利要求 8 的诊断框架, 其中所述的微阵列是寡核苷酸微阵列。 11. 一种用于诊断结肠直肠癌的试剂盒, 其包含包括 Seq.ID.No.46。

6、-49 的基因组合的 分离的核酸序列或其互补序列。 12. 权利要求 11 的试剂盒, 进一步包括进行微阵列分析的试剂。 13. 权利要求 11 的试剂盒, 进一步包括媒介物, 所述的核酸序列或其互补序列通过该 媒介物进行检测。 14. 包括 Seq.ID.No.46-49 的基因组合在制备用于评估结肠直肠癌疗效方法的试剂中 的应用, 所述方法包括鉴定每个基因相对于正常种群的相同基因的表达的差异调节。 15. 权利要求 14 的应用, 其中对疗效的评估包括确定患者是否好转, 非好转, 复发, 可 能好转或可能复发。 16. 评估结肠直肠癌状况的制品, 其包含包括 Seq.ID.No.46-49。

7、 的基因组合中的分离 的核酸序列或其互补序列。 17. 评估结肠直肠癌状况的制品, 其包含包括 Seq.ID.No.46-49 的基因组合的分离的 核酸序列或其互补序列的表示物。 权 利 要 求 书 CN 101603092 B 2 1/70 页 3 评估结肠直肠癌 0001 本申请是以下申请的分案申请 : 申请日 : 2003 年 3 月 29 日 ; 申请号 : 03131205.5 ; 发明名称 : 同上。 0002 背景 0003 本申请要求 2002 年 3 月 29 日申请的序列号为 60/368,798 的美国临时申请的利 益。 0004 本发明涉及基于生物样本基因表达分布图的结。

8、肠直肠癌的诊断和预测。 0005 结肠直肠癌是一种异源疾病, 由据认为是通过三种主要分子机制形成的肿瘤组 成 : 1) 与染色体不稳定性相结合的多发性结肠腺癌 (APC) 基因, 或 - 连环蛋白基因的突 变, 2) 与微卫星序列不稳定性相关的 DNA 错配修复基因如 MLH1, MSH2, PMS2 和 MSH6 的突 变, 和包含短重复序列基因的突变, 以及 3) 由肿瘤抑制基因启动子区的过甲基化诱导的基 因沉默。结肠直肠癌个体的遗传互补可能包括遗传不稳定性、 特异突变和基因沉默的不同 结合。染色体不稳定性 (CIN) 一般是癌症的普遍特征。它意味着其中所有的或大部分的染 色体丢失或增加了。

9、的非整倍体表型。伴随短重复序列突变率的增加, 在二倍体肿瘤中发现 了微粒体不稳定性 (MIN)。这两种遗传不稳定性的形式在结肠直肠癌中很普遍。 0006 因此结肠直肠癌具有复杂的起源并且包括不同生物通路间大量的相互作用。 用于 协助提供诊断、 预测或治疗监测结果的血清标记、 组织学和细胞学检查通常不具有所期望 的可信度。同时, 使用单独的遗传标记 ( 例如一特殊基因的表达增加 ) 可能是有益的, 癌症 的多样性使遗传标记的组合可能成为最好的途径。 0007 发明概述 0008 本发明是评估结肠直肠癌存在或不存在, 或者被认为患有结肠直肠癌的患者其可 能状态的方法。在本方法中, 通过分析患者样本。

10、的基因表达分布图确定患者是否得了结肠 直肠癌, 患者是否未得结肠直肠癌, 患者是否可能要得结肠直肠癌, 或正在接受治疗的结肠 直肠癌患者对治疗的反应。 0009 本发明的一个方面涉及用于实施该方法的制品。 这样的制品包括基因表达分布图 或固定于机器可读媒介如计算机可读媒介的基因表达分布图的表现物。 0010 用来鉴别基因表达分布图的制品也可以包括用于捕捉和 / 或显示基因表达存在 与否, 或表达程度的基片或平面, 如微阵列。 0011 发明详述 0012 很少发现组织样本中单纯的特定核苷酸序列的存在或缺失具有诊断或预测价值。 另一方面, 关于多种蛋白、 肽或 mRNA 表达的信息正越来越受到重。

11、视。具有表达蛋白、 肽或 mRNA 的潜在可能的特定核苷酸序列 ( 这样的序列称为 “基因” ) 仅在给定细胞的基因组中 存在这一事实本身, 并不能确定该蛋白、 肽或 mRNA 是否会在给定的细胞中表达。能表达蛋 白、 肽或 mRNA 的给定基因是否表达以及表达到何种程度取决于多种复合因子。不考虑理解 和评估这些因子的困难程度, 检测基因表达可以为如肿瘤发生、 转移、 细胞凋亡以及其他临 床有关现象等重要事件的发生提供有用的信息。 通过基因表达分布图可以发现基因激活或 失活程度的相对指标。本发明的基因表达分布图可用于结肠直肠癌患者的诊断和治疗。 说 明 书 CN 101603092 B 3 2。

12、/70 页 4 0013 样品制备需要收集患者样本。 本发明使用的病例样本是那些疑为含有患病细胞的 样本, 如取自结肠样本或外科切除样本的上皮细胞。获得可疑样本的一种有用技术是激光 捕捉微切片技术(LCM)。 激光捕捉微切片技术提供了一种选择需研究细胞的方法, 并最小化 由细胞种类的不均一性造成的易变性。因此, 正常细胞和癌细胞之间的基因表达中度或细 小的变化都可以被轻易检测到。在优选的方法中, 样本包括从外周血中提取的循环上皮细 胞。这可以按照多种方法获得, 但最优选的方法是 Immunivest 公司的美国专利 6,136,182 所描述的磁性分离技术, 该专利在此引入作为参考。 一旦得到。

13、含有所关注细胞的样本, 就提 取其 RNA, 扩增, 并获得基因表达分布图, 优选的通过微阵列获得合适框架 (portfolio) 中 基因的表达分布图。 0014 确立基因表达分布图的优选方法包括, 确定一个能够编码蛋白质或肽的基因所产 生的 RNA 的量。这可通过逆转录酶 PCR(RT-PCR), 竞争性 RT-PCR, 实时 RT-PCR, 差异显示 RT-PCR, Northern 杂交分析和其他相关实验实现。尽管可能用单个 PCR 反应实施这些技 术, 但最好扩增来自 mRNA 的互补 DNA(cDNA) 或互补 RNA(cRNA) 并用微阵列对其分析。对 本领域的技术人员来说大量不。

14、同的阵列构型及其生产方法是已知的, 并且也在如下的美 国专利中有描述 : 5,445,934 ; 5,532,128 ; 5,556,752 ; 5,242,974 ; 5,384,261 ; 5,405,783 ; 5,412,087 ; 5,424,186 ; 5,429,807 ; 5,436,327 ; 5,472,672 ; 5,527,681 ; 5,529,756 ; 5,545,531 ; 5,554,501 ; 5,561,071 ; 5,571,639 ; 5,593,839 ; 5,599,695 ; 5,624,711 ; 5,658,734 ; 和 5,700,637。

15、 ; 这些专利披露的技术在此引入作为参考。 0015 微阵列技术允许同时检测数千基因的稳定状态的 mRNA 水平, 因此它为检测非控 制的细胞增殖效果, 如启动、 抑制或调节等提供了一个强有力的工具。 现在两种微阵列技术 正被广泛使用。第一种是 cDNA 阵列, 第二种是寡核苷酸阵列。尽管这些芯片在构造上存在 差异, 但其下游数据的分析和输出实质上是相同的。这些分析的结果典型地是对由标记探 针获得的信号强度的测定, 所述的探针用于检测与阵列上已知位点的核酸序列杂交的、 来 自样品的 cDNA 序列。典型地, 所述的信号强度与 cDNA 的含量, 或者说样本细胞中所表达的 mRNA的量成比例。 。

16、有许多这样的技术可以获得并且是有用的。 优选的检测基因表达的方法 可以在美国专利中找到, 如 Linsley 等人的专利 6,271002 ; Friend 等人的专利 6,218,122 ; Peck等人的专利6,218,114 ; Wang等人的专利6,004,755, 其所公开的内容均在此引入作为 参考。 0016 基因表达水平的分析通过比较强度进行。 最好是通过制备一种待测样品中基因表 达强度相对于对照样品中基因表达强度的比值矩阵进行。例如, 可以将疾病组织中基因表 达的强度与相同类型正常组织中的表达强度进行比较 ( 例如患病的结肠组织样本对正常 的结肠组织样本 )。这个表达强度的比值。

17、显示出被测样本和对照样本中基因表达的倍数变 化。 0017 基因表达分布图也可以通过很多方法显示。 最普遍的方法是将原始的荧光强度或 矩阵系数处理成树状图, 其中列表示被测样品, 行表示基因。数据经这样的处理后那些具 有相似表达分布的基因就会相互邻近。每个基因的表达比率可用一种颜色显示。例如, 小 于一的比率 ( 表示下调 ) 可以出现在图谱的蓝色部分, 而大于一的比率 ( 表示上调 ) 可以 出现在图谱的红色部分。商业上可购买到的计算机软件程序很适合显示这样的数据, 包括 Silicon Genetics 有限公司的 “GENESPRING” , Partek 有限公司的 “DISCOVER。

18、Y” 和 “INFER” 说 明 书 CN 101603092 B 4 3/70 页 5 软件。 0018 用于本发明的方法的受调节基因如表 1 所示。差异表达的基因表现为在患病细胞 中上调或下调。上调和下调是相对的术语, 表示可检测到的相对于某种基线的基因表达的 量的差异 ( 超出检测系统的噪音影响 )。在这种情况中, 基线是正常细胞测得的基因表达。 再使用同样的测量方法确定患病细胞中所关注的基因相对于基线水平是上调或下调。 上下 文中, 患病的, 是指伴随细胞非控制增殖而出现的机体状态的改变, 此种改变中断、 扰乱或 潜在的打乱机体功能的适当表现。 当某人基因型或表型的一些方面一致表现出存。

19、在特定疾 病时, 他就被诊断为患有该种疾病。然而, 作出诊断或预测的行为包括确定疾病表象 / 状态 的情况, 如治疗监测。 在治疗监测中, 比较经过一段时间治疗后的基因表达确定基因表达分 布图是否有变化, 或其变化与正常组织的模式更为一致来考虑疗程的效果从而作出临床判 定。 0019 优选的, 上升或下降调节的水平是以杂交的微阵列探针测量强度的成倍变化来区 别的。2 倍差异或 p 值小于 0.5 对于作出这样的辨别是优选的。即当认为与在正常细胞中 相比一个基因在患病细胞中差异表达时, 患病细胞中的强度至少是正常细胞的 2 倍或 1/2。 倍数差异越大, 该基因就越优选用作诊断。本发明选择用作分。

20、析表达分布图的基因具有产 生使该基因区别于正常基因或非调节基因的信号的表达水平, 该信号量超出使用临床实验 室检测设备的背景量。 0020 利用统计值可用于确定地使调节基因与非调节基因和噪音区别开。 通过统计检验 发现在不同样本组之间有最显著差异的基因。Student s T 检验就是一个发现两组之间显 著差异的有力的统计检验的例子。p 值越小, 不同组之间基因显示差异的证据就越有说服 力。然而既然微阵列可以同时检测多个基因, 那么就需要同时进行万次的统计检验。因此, 就存在偶尔看到极小 p 值的可能, 可以利用 Sidak 校正以及随机化 / 排列实验进行调整。T 检验中 p 值小于 .05。

21、 就证明基因是差异显著的。更有说服力的证据是加入 Sidak 校正因子 后 p 值小于 .05。对于每组中的大量样品, 经过随机化 / 排列检验后 p 值小于 .05 是差异显 著的最有说服力的证据。 0021 另一个可用来选择产生强于非调节基因和噪音信号的基因的参数是绝对信号差 异测量值。优选的, 调节基因的表达形成的信号与正常基因或非调节基因 ( 以绝对值为基 础 ) 至少有 20的差异。更优选的, 调节基因形成的表达模式与正常基因或非调节基因至 少有 30的差异。 0022 将基因分组以便于通过获得一组基因中一套基因的信息为诊断、 预测或治疗选择 等相关临床判断提供可靠的基础。 这些套基。

22、因构成了本发明的框架(portfolios)。 此例中, 由该框架支持的判断包括结肠直肠癌。基因表达分布图的框架包含实施例 3 中描述的基因 联合组合。对于大多数诊断标记物来说, 最好使用尽量少的标记物就足以充分作出一个正 确的医学判断。这就避免了使用那些悬而未决需作进一步分析的治疗措施带来的延误, 同 时又避免了时间和资源的不合理使用。此例中, 这样的最小量的框架包含实施例 4 中的基 因组合。 0023 优选的, 构建这样的框架以保证该框架中的基因组合相对于单个基因或随机选择 的基因组合显示出更好的灵敏度和特异性。在本发明中, 框架的灵敏度反映在一个基因在 疾病状态下相对于其在正常状态下所。

23、表现出的基因表达的成倍差异中。 特异性可以反映在 说 明 书 CN 101603092 B 5 4/70 页 6 基因表达信号与所关注疾病相关性的统计测量中。 例如, 标准差就是这样一个有用的度量。 当考虑将一组基因掺入到某一框架中时, 表达测量值的标准差越小其特异性越大。其他检 测变量, 如相关系数也包括在使用范围内。 0024 最优选地, 建立基因表达框架的方法是运用优化算法, 如在确定股票投资中广泛 使用的平均方差算法的。这一方法在同日期的 Tim Jatkoe 等人标题为 “投资组合选择 (Portfolio Selection)” 的同时待审的专利申请中有详细表述。 该方法实质上要求。

24、一套输 入值 ( 金融应用中的股票, 这里指通过强度测定的表达 ), 其可优化收到的回报率 ( 例如形 成的信号 ) 以进行应用, 同时最小化回报率的可变性。许多商业软件程序适合进行这样的 操作。在整个说明书中称为 “Wagner 软件” 的 “Wagner 联合均值 - 方差优化应用程序” 是 优选的。这个软件使用 “Wagner 联合均值 - 方差优化库” 中的功能, 来确定有效边界, 优选 Markowitz 意义上的优化框架。 0025 由于该软件用于金融分析目的, 因此使用这种类型的软件需要将微阵列数据进行 转换, 使数据以股票回报值和风险测量值的方式输入处理。例如, 当 Wagne。

25、r 软件与微阵列 强度测定协同应用时, 要运用以下的数据转换方法。 0026 首先通过确定那些其表达至少显示出某种微小差异水平的基因, 对基因进行预选 择。优选的预选择过程如下所述。选择一个基线组。典型的基线组包含来自未患有所述疾 病的群体的基因。 例如, 在选择所用于诊断乳腺癌的基因框架时, 可以将未患乳腺癌患者的 样本用作制备基线组。一旦选择了基线组, 就可以计算出基线组样本中每个基因的表达指 标的算术平均值和标准差。典型的, 这个指标是微阵列记录的荧光强度。随后将通过计算 得到的统计学数据用于计算每个基因的基线值 (X* 标准差 + 均值 )。这就是基因的基线记 录, 其它所有样本都要与。

26、其相比较。X 是由制定框架的人选择出来的严格变量。X 的数值越 大就越严格。优选的 X 数值范围是 0.5-3, 更优选的是 2-3, 最优选的是 3。 0027 随后计算每个实验样本 ( 那些表现出所关注疾病的样本 ) 与基线记录的比值。再 将这些比值转换成易于软件进行数据处理的底数为 10 的对数值。该方法使下调基因显示 为负值, 这是使用 Wagner 软件并按照 Markman 均值 - 方差算法进行优化所必需的。 0028 将包含这些转换比值的预处理数据作为输入, 替代用于金融分析目的的 Wagner 软件中通常使用的资产回报值。 0029 一旦制定出有效边界, 对于一个给定的输入水。

27、平值 ( 回报率 ) 或对应于边界上的 一个点的方差, 就可以选择出一个优化框架。这些输入值或方差是制定框架的人预先确定 的标准数集。换句话说, 寻求最适框架的人决定一个可接受的输入水平 ( 表明灵敏度 ) 或 者一个给定的方差水平 ( 表明特异性 ), 选择位于该输入水平或方差相应的有效边界的基 因。当选定了输入水平或方差, Wagner 软件就能够选择出这样的基因。Wagner 软件可以像 对股票投资组合中每支股票所做的那样, 分配所述框架中每个基因一个权重。 0030 将患者样本框架中的基因的表达, 与用于构建所述框架的差异表达基因的计算值 相比较, 就可以确定该样本是否患有该框架所诊断。

28、的疾病。 优选的, 首先通过将在选择框架 的过程中给每个基因分配的权重乘以框架中每个基因的强度值, 加和得到框架值。然后用 ( 基线组中框架的 Y* 标准差 + 均值 ) 计算边界值, 其中 Y 是一个严格数值, 具有与上述 X 相 同的含义。一个样本具有的框架值大于基线组的框架值, 则此样本就被归为患有该病。需 要时, 可以根据提高可信度水平的已知统计学方法重复上述过程。 说 明 书 CN 101603092 B 6 5/70 页 7 0031 任选的, 可以重复进行上述过程直到获得预期的最高准确度。 0032 框架选择的过程和未知量的表征过程概括如下 : 0033 1. 选择基线组 003。

29、4 2. 计算基线组样本中每个基因的均值和标准差 0035 3. 计算每个基因的 (X* 标准差 + 均值 )。这就是基线记录, 其它所有的样本都要 与这个基线记录相比较。X 是一严格变量, X 数值越大就越严格。 0036 4. 计算每个实验样本对根据步骤 3 得到的基线记录的比值。 0037 5. 转换比值, 使值小于 1 的比值成为负数 ( 例如使用底数为 10 的对数 )。( 现在 下调的基因有正确的负值以符合 MV 优化的需要 )。 0038 6. 将这些转换的比值作为输入值, 替换软件应用中通常使用的资产回报值。 0039 7. 该软件将标绘出有效的边界线, 并且返回一组沿此有效边。

30、界线上任意一点的优 化框架。 0040 8. 在此有效边界线上选择一个所需的回报率或者方差。 0041 9. 通过将在选择框架的算法中所给定的权重乘以每个基因的强度值, 加和计算每 个样本的框架值。 0042 10. 将基线组的框架值的均值加上 Y 与基线组的框架值的标准差的乘积, 计算出 边界值。大于该边界值的数值应被归为实验组。 0043 11. 任选的, 可以重复进行上述过程, 直到获得预期的最佳准确度。 0044 可选择的, 首先通过确定那些其表达显示出某种微小差异水平的基因, 对基因进 行预选择。在这个可选择的方法中, 预选择优选的以给出的阈值为基础, 其中 t 是已知患有该疾病或病。

31、症的样本子集的均值, n是正常样本子集的均值, t+n表示联合 标准差。 通过根据如的关系式对数据的预选择, 也可在其中使用信噪比截止值。 这就确保基于差异调节进行预选择的基因具有临床上的显著差异。 即超过了适于测定各种 临床参数的仪器产生的噪音水平。对于根据这些标准预选的每个标记物建立一个矩阵, 其 中列表示样本, 行表示标记物, 并且每个元件都是根据对该标记物的表达进行标准 化后所得到的强度测量值, 其中 I 代表强度测量值。 0045 也可以通过设置附加的边界条件来定义优化框架。例如, 框架的大小可限定为固 定的值域或标记物的数目。这或者可以通过制定更为严格的预选标准 ( 例如以 代替)。

32、 或通过使用程序特征如限制组合大小来实现。例如可以设置边界条件使 有效边界线从最优化的 10 个基因中选出。也可以使用所有的预选基因确定有效边界线后 再限定所选择基因的数目 ( 例如不超过 10 个 )。 0046 选择框架的过程也包括应用探索式的规则。优选的, 这样的规则是基于生物学和 对用于产生临床结果的技术理解的基础上制定的。更优选的是, 它们应用到优化方法的输 出数据中。例如, 选择框架的均方差法可以应用于乳腺癌样本中大量差异表达基因的微阵 说 明 书 CN 101603092 B 7 6/70 页 8 列数据。这种方法得到的输出数据将会是一套优化的基因, 包括既在外周血中表达也在患 。

33、病乳腺组织中表达的一些基因。如果这种检测方法用到的样本来自外周血, 并且某些基因 既在乳腺癌个例也在外周血中差异表达, 那么就可以应用探索式的规则, 从排除了那些在 外周血中差异表达的基因而得到的有效边界线上选择框架。当然, 这个规则可以在形成有 效边界线前应用, 例如, 将该规则应用到数据的预先选择中。 0047 可以应用其他与所考虑的生物学问题无必然联系的探索式规则。例如, 可以应用 只有给定百分比的框架可用特定的基因表示的规则。商业上可购买的软件如 Wagner 软件 就提供了这类型的探索式规则。这是非常有用的, 例如, 除了正确度和精密度等, 其他因素 ( 例如, 预期许可费 ) 也会。

34、影响包括一个或多个基因的可用性。 0048 本发明的一个方法包括如上所述比较多种基因(或框架)的基因表达分布图以进 行诊断。将构成框架的每个基因的基因表达分布图固定于如计算机可读的媒介物上。这可 以采取很多形式。例如, 可以建立一个输入表示疾病的信号范围 ( 例如强度测定值 ) 的表 格。 可以将患者的实际数据与表格中的值进行比较以确定该患者的样品属于是正常的或患 病的。在一个改进的具体实例中, 表达信号的模式 ( 例如荧光强度 ) 以数字或图形方式记 录。再将与患者样本相结合使用的基因框架中的基因表达模式与上述表达模式比较。然后 利用模式比较软件确定该患者本是否具有表示所讨论的疾病的模式。 。

35、当然这些比较也可用 于确定该患者的结果是否正常。再将样本的表达分布图与正常或对照细胞的框架相比较。 如果样本表达模式与结肠直肠癌的表达模式一致, 那么 ( 无抵消性的医学理由 ) 该患者就 被诊断为结肠直肠癌阳性。如果样本表达模式与正常或对照细胞的表达模式一致, 那么该 患者就被诊断为结肠直肠癌阴性。 0049 许多公知的识别模式的方法是适用的。下列参考提供了一些例子 : 0050 加权阈值 Weighted Voting : 0051 Golub, TR., Sclonim, DK., Tamaya, P., Huard, C., Gaasenbeek, M., Mesirov, JP., 。

36、Coller, H., Loh, L., Downing, JR., Caligiuri, MA., Bloomfield, CD., Lander, ES. 癌症的 分子分类 : 利用基因表达检测的分类发现和分类预测。科学 Science 286 : 531-537, 1999 0052 支持矢量机器 Support Vector Machine : 0053 Su, AI., Welsh, JB., Sapinoso, LM., Kern, SG., Dimitrov, P., Lapp, H., Schultz, PG., Powell, SM., Moskaluk, CA., Frie。

37、rson, HF.Jr., Hampton, GM. 利用基因表达信号的人 类癌症的分子分类。癌症研究 Cancer Research 61 : 7388-93, 2001 0054 Ramaswamy, S., Tamayo, P., Rifkin, R., Mukherjee, S., Yeang, GH., Angelo, M., Ladd, C., Reich, M., Latulippe, E., Mesirov, JP., Poggio, T., Gerald, W., Loda, M., Lander, ES., Gould, TR. 利用肿瘤基因表达信号的多种类癌症诊断。美国国。

38、家科学院院刊 Proceedingsof the National Academy of Sciences of the USA 98 : 15149-15154, 2001 0055 K- 最邻近值 K-nearest Neighbors : 0056 Ramaswamy, S., Tamayo, P., Rifkin, R., Mukherjee, S., Yeang, GH., Angelo, M., Ladd, C., Reich, M., Latulippe, E., Mesirov, JP., Poggio, T., Gerald, W., Loda, M., Lander, ES。

39、., Gould, TR. 利用肿瘤基因表达信号的多种类癌症诊断。美国国家科学院院刊 Proceedingsof the National Academy of Sciences of the USA 98 : 15149-15154, 2001 0057 相关系数 Correlation Coefficients : 说 明 书 CN 101603092 B 8 7/70 页 9 0058 van t Veer LJ, Dai H, van de Vijver MJ, He YD, Hart AA, Mao M, Peterse HL, vander Kooy K, Marton MJ, W。

40、itteveen AT, Schreiber GJ, Kerkhoven RM, Roberts C, LinsleyPS, Bernards R, Friend SH. 基因表达分布图预测乳腺癌的临床结果。自然 Nature.2002 Jan 31 : 415(6871) : 530-6 0059 本发明的基因表达分布图也可以与其他在癌症诊断、 预测、 或治疗监测中所使用 的非遗传的诊断方法联合使用。 例如, 在一些情况中, 将如上所述的基于基因表达诊断能力 的方法与从如血清蛋白标记(例如癌胚性抗原)的传统标记物中得到的数据结合使用是很 有益的。存在许多这样的标记物, 包括如 CA19-9,。

41、 CA125, CK-BB 和鸟苷酸环化酶 C 的分析 物。 在这样的一个方法中, 对治疗患者周期性采血, 然后将血样作上述血清标记之一的酶联 免疫检测。当标记的浓度暗示了肿瘤复发或治疗失败时, 可以随后对样本源作基因表达分 析。如果存在所怀疑的肿块, 取细针吸取物并如上所述对取自肿块的细胞进行基因表达分 布图分析。可选择的, 组织样本可以取自先前摘取了肿瘤的组织的邻近区域。当其他检测 结果不确定时, 这种方式特别有用。 0060 当其它诊断的可靠性值得怀疑时, 联合使用遗传标记和其他诊断是最优选的。例 如, 众所周知 CEA 血清水平在相当程度上受到与患者癌症状态毫无关系的因子的影响。当 一。

42、个患者被监测到在接受结肠癌治疗后显示常规 CEA 检测高水平时, 那联合进行基因表达 /CEA 检测是有益的。 0061 本发明的制品包括用于治疗、 诊断、 预测和其它疾病评估的基因表达分布图的表 示物。这些分布图表示物简化为可被机器自动可读的媒介物, 如计算机可读媒介 ( 磁性的, 光学的及类似的)。 制品也包括在这种媒介中评估基因表达分布图的指令说明。 例如, 制品 可能包括具有用于比较上述基因框架的基因表达分布图的计算机指令的 CD ROM。制品可 能也含有基因表达分布图的数字记录以用于与患者样本的基因表达数据进行比较。 可选择 的, 所述的分布图可以不同的表现格式记录。图形记录就是这样。

43、的一种格式。上文提到的 “GENESPRING” 和 “DISCOVER” 计算机程序中整合的聚类算法就可很好的协助这些数据形象 化。 0062 根据本发明生产制造的不同类型的物品是指用于揭示基因表达分布图的媒介物 或格式化检测。这些可以包括, 例如微阵列, 其中将序列互补物或探针固定于基片上, 它与 表示所关注基因的序列联合建立一个有关其存在的易读行列式。可选择的, 根据本发明的 制品可以被制作成用于进行杂交、 扩增, 以及形成表示所关注的基因表达水平的信号以用 来检测结肠直肠癌的试剂盒。 0063 根据本发明制备的试剂盒包括确定基因表达分布图的格式化检测。 这就包括了进 行检测所需的如试剂。

44、和说明指令等所有或部分材料。 0064 本发明进一步用下列非限定性的实施例说明。 0065 实施例 : 根据本发明分析的基因是通过参考 GenBank 数据库中的基因 ID 号鉴定 的。它们通常与编码产生蛋白质或肽的全长核苷酸序列相关。本领域的技术人员公认全长 核苷酸序列的鉴定不是一个分析观点所必需的。 即可以根据公知的为评估相关基因的基因 表达设计探针的原理进行部分序列或 ESTs 选择。 0066 实施例 1- 样品处理和 LCM 0067 收集接受结肠直肠肿瘤外科手术患者的 27 个新鲜冷冻组织样本。19 个样本是结 说 明 书 CN 101603092 B 9 8/70 页 10 肠直。

45、肠恶性肿瘤样本, 8个样本是正常的结肠粘膜。 组织在获得后的20-30分钟内快速液氮 冷冻, 并随后贮存于 -80。为了激光捕捉, 将样本切片 (6m), 一切片封固于玻璃载片上, 另一切片封固于已被固定于玻璃载片 (Micro SlidesColorfrost, VWR Scientific, Media, PA) 上的膜 (P.A.L.M.) 上 . 封固于玻璃载片上的切片在冷的丙酮中固定, 并用 Mayer s 苏 木精 (Sigma, St.Louis, MO) 染色 . 病理学家为诊断和定级分析样本。使用 Dukes 分级, 由 附带的外科病理学和临床报告进行临床阶段评估。封固于膜上。

46、的切片在 100乙醇中固定 5分钟, 在曙红/100乙醇(100g曙红溶于100ml脱水乙醇)中复染1分钟, 快速在100 乙醇中浸泡一次以除去未结合染料, 空气中干燥 10 分钟。 0068 结肠直肠腺癌中的两个为等级 1, 10 个为等级 2, 5 个为等级 3。一个恶性肿瘤样 本是盲肠的类癌瘤, 另一个是转移的黑色素瘤病变。 两个腺癌样本表现为粘蛋白状亚型, 一 个为章形细胞亚型。腺癌样本按 Dukes 分级划分如下 : DukesA : 2, Dukes B : 5, Dukes C : 7, Dukes D : 3。六个腺癌样本在手术前放疗过。 0069 在 LCM 中使用前, 膜 。

47、(LPC-MEMBERANE PEN FOIL 1.35mNo.8100, P.A.L.M.GmbH Mikrolaser Technologie, Bernried, Germany) 和载片经过预处理以除去 RNA 酶, 并且 增强组织样品在膜上的吸附。简要的, 载片用 DEPH2O 洗涤, 膜用 RNase AWAY(Molecular Bioproducts, Inc., San Diego, CA) 洗涤并用 DEP H2O 冲洗。膜粘附到玻璃载片上后, 载片 于 120烘烤 8 小时, 用 TI-SAD 处理 (Diagnostic Products Corporation, Lo。

48、s Angeles, CA, 以 1 50 溶于 DEPH2O, 用脱脂棉过滤 ), +37孵育 30 分钟。临使用前, 将 10l 小份的 RNA酶抑制剂溶液(RNA酶蛋白质抑制剂2500U33U/l N211A, Promega GmbH, Mannheim, Germany, 0.5l溶于400l冷的含有0.15mol NaCl, 10mmol TrispH8.0, 0.25mmol二硫苏 糖醇的溶液 ) 铺展到待封固组织样本的膜上。 0070 封 固 于 膜 上 的 组 织 切 片 用 于 LCM。 利 用 PALM 自 动 微 光 束 技 术 (P.A.L.M.Microlaser 。

49、Technologie, Carl Zeiss, Inc., Thomwood, NY) 捕 捉 约 2000 个 上皮细胞样品, 并连接到 Zeiss Axiovert 135 显微镜中 (Carl Zeiss Jena GmbH, Jena, Germany)。正常粘膜的外周基质和癌症样本中偶然的干扰基质成分都包括在内。捕捉到的 细胞置于 100乙醇的小管中于 -80保存。 0071 实施例 2-RNA 提取和扩增 0072 利用 Zymo-Spin 柱 (Zymo Research, Orange, CA92867) 提取通过 LCM 捕捉的细胞 的总 RNA。将约 2ng 总 RNA 重悬于 10l 水并且利用 T7 RNA 聚合酶进行两轮扩增, 扩增的 RNA 产量约为 50g。 0073 实施例 3-cDNA 微阵列杂交和定量 0074 利用一套由约 20,000 个人 cDNA 克隆组成的 cDNA 微阵列检测样本。将约 30 个 植物基因印迹到微阵列上作为非特异杂交对照。利用 LCM 捕捉细胞的 5g aRNA 合成 Cy3 标记的 cDNA 探针。探针用 Qiagen s 核苷酸去除柱 (Nucleotide Removal Columns) 纯化 然后经 14-16 小时杂交到微阵列上。载片在扫描前经过洗涤并于空中干燥。扫描微阵列的 C。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 化学;冶金 > 生物化学;啤酒;烈性酒;果汁酒;醋;微生物学;酶学;突变或遗传工程


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1