一种构建鸡肌肉肌苷酸合成途径相关关键酶基因网络调控方法.pdf

上传人:62****3 文档编号:1566238 上传时间:2018-06-25 格式:PDF 页数:19 大小:2.89MB
返回 下载 相关 举报
摘要
申请专利号:

CN201210497419.3

申请日:

2012.11.29

公开号:

CN103150487A

公开日:

2013.06.12

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):G06F 19/12申请日:20121129|||公开

IPC分类号:

G06F19/12(2011.01)I

主分类号:

G06F19/12

申请人:

扬州大学

发明人:

陈国宏; 常国斌; 栾德琴; 陈蓉; 张颖; 马腾; 夏明秀; 戴爱琴; 翟飞; 刘璐; 陈静; 王洪志; 徐璐

地址:

225009 江苏省扬州市大学南路88号

优先权:

专利代理机构:

南京知识律师事务所 32207

代理人:

卢亚丽

PDF下载: PDF下载
内容摘要

本发明属于动物育种学、发育生物学和细胞生物学领域。涉及一种利用表达谱数据及相关生物信息工具分析和构建网络调控的方法。该方法首先是建立肌苷酸相关基因的数据集,计算各基因的权重模型,初步选择基因表达调控,其次是求相关系数并求解,构建网络图,最后是结合建立的整数非线性规划模型,并基于KEGG数据库构建肌苷酸相关基因的网络调控图。本发明本研究以我国地方鸡种如皋黄鸡为素材,构建IMP合成途径中8个关键酶的寡核苷酸探针,在分子杂交的基础上筛选出基于RNA水平上的调控模型,揭示风味物质—IMP合成关键酶在转录水平上的表达差异。为“优质鸡”的培育和产业发展提供理论依据。

权利要求书

权利要求书一种构建鸡肌肉肌苷酸合成途径相关关键酶基因网络调控方法,
其特征是:首先是建立肌苷酸相关基因的数据集,计算各基因的权重模型,初步选择基因表达调控,其次是求相关系数并求解,构建网络图,最后是结合建立的整数非线性规划模型,并基于KEGG数据库构建肌苷酸相关基因的网络调控图。
根据权利要求1所述构建鸡肌肉肌苷酸合成途径相关关键酶基因网络调控方法,其特征在于具体步骤如下:
(1)建立肌苷酸相关基因的数据集:从24张肌肉组织芯片中获得8个肌苷酸关键酶基因在6个时间点的表达数据,构成一个8*6的基因表达矩阵;
(2)各基因的权重模型:将基因芯片数据标准化后,利用熵对各基因赋权,构成赋以权重的基因表达矩阵;
(3)基因表达调控的初步选择:将所有研究的基因作为一个系统,以所有基因被调控的误差平方和最小为目标,建立整数非线性规划模型,判断基因之间的调控指向;

zk取‑1, 0, 1分别表示基因k对基因i起抑制作用、无调控关系和促进作用;
n个基因m 个时间点的基因表达构成一个n ×m 的矩阵A = ( xij ) n ×m , xij为第i个基因在时刻j的表达水平;
(4)求相关系数:为了进一步确认基因之间的调控关系,用Pearson相关系数来再次判别,通过相关的显著性筛选起调控作用的基因,矩阵中任意第i个基因和第k个基因的表达向量s = ( xi1 , xi2 , …., xim ) 、t = ( xk1 , xk2 , …,kkm )的相关系数模型:

(5)求解,构建网络图:结合cotyscape软件,R语言,运用相关系数模型法建立肌苷酸关键酶相关基因的网络调控图;
(6)结合建立的整数非线性规划模型,并基于KEGG数据库构建肌苷酸相关基因的网络调控图。
根据权利要求2所述构建鸡肌肉肌苷酸合成途径相关关键酶基因网络调控方法,其特征在于步骤(5)求解,构建网络图的是:
1)、从原始的芯片数据中挑选有效基因数据;
2)、将有效数据上传至服务器运行计算;
3)、将生成的源文件通过计算机语言寻找基因间的线性相关,相关系数分别设0.75、0.80、0.85、0.90;
4)、构建genelist文件选择肌苷酸相关基因;
5)、导入Cytoscape生成调控网络图。

说明书

说明书一种构建鸡肌肉肌苷酸合成途径相关关键酶基因网络调控方法 
技术领域
本发明属于动物育种学、发育生物学和细胞生物学领域。涉及一种利用表达谱数据及相关生物信息工具分析和构建网络调控的方法。 
背景技术
涉及肌苷酸(IMP)合成通路中分子调控机理方面,一般而言,在整个IMP合成通路中,特别是第一阶段形成咪唑五元环和第二阶段的形成嘧啶六元环的过程中,关键酶的调控是导致表达水平差异的主要原因。然而,在IMP合成途径的关键酶方面研究较少,通过地方鸡种肌苷酸含量相关候选基因SNP(single nucleotide polymorphism)筛查,发现腺苷琥珀酸裂解酶基因1(ADSL)位点可以作为肌肉IMP含量的辅助选择标记,甘氨酰胺核苷酸合成酶(GARS)、5‑氨基咪唑核苷酸合成酶(AIRS)和甘氨酰胺核苷酸转甲基酶(GART)基因(GARS‑AIRS‑GART)合并基因型对鸡的肉质风味性状可进行标记辅助选择。并发现在白耳鸡的不同生长阶段(3,6,9,12和15周龄)不同组织中ADSL和GARS‑AIRS‑GART mRNA都被检测到,并且在所有组织中表达量的变化趋势基本一致。ADSL在肝脏中的表达量最高,在大肠中表达量最低。GARS‑AIRS‑GART在肾脏中的表达量最高,在腿肌,心脏,大肠,小肠中的表达量也较高,在胸肌中表达量最低。另外,除ADSL,GARS‑AIRS‑GART外,PPAT、PAICS(AIRC)和AMPD也被证实在IMP表达水平差异方面起着调控作用。 
综上,在IMP的表达差异方面,关键酶起着决定性作用,但由于IMP的合成涉及到多个关键酶及相应的纤连蛋白、粘附分子与细胞因子等,而且每个关键酶的调控存在互作关联,所以有必要对整个关键酶的调控体系和相互作用网络进行研究,即对DNA‑蛋白质信息贮存与表达调控模式进行探讨。在此网络中,转录水平的基因表达调控网络由于目标明确,分析模式清晰,效果准确等优势,更能直接地反映遗传性状表达调控网络的效应,更好地帮助我们理解复杂的分子或细胞过程机理,倍受青睐,正逐渐成为国际热点研究课题。 
就调控网络的构建问题,国内外学者均已经开展了大量相关研究工作。现有调控网络的实验资料主要来源于对大肠杆菌、酿酒酵母和线虫的调控网络的研究。有学者基于实验的基因组定位分析方法,构建了转录因子启动子结合网络,以此推导出调控网络。然而,定位分析实验方法只适用于特定的实验条件,在其它实验条件下,该方法可能失效。迄今为止,各种统计数据挖掘工具已经用于发现基因表达调控网络。其中普遍使用的有代表性的模型包括:①基于相关系数的网络模型。②基于条件概率的网络模型。它是一个用来描述一系列随机变量之间的条件独立性的一种方向性模型。③基于时间序列的网络模型。它是针对很多时间序列的基因芯片数据而开发的,包括动态贝叶斯网络模型和事件模型,需要设置很多参数。④ 根据基因扰动(Gene Perturbation)数据来推导基因调控关系。为了避免计算复杂性问题,把基因表达数据、DNA序列和功能注释整合成一个可以理解的模型,以构建基因表达转录调控网络。此外,利用基因表达数据、启动子序列和转录因子结合位点数据来构建转录调控网络。这种方法需要假设数据满足正态分布,而这种假设还没有得到证实,导致所得结果的可信度不高。因此,针对具体的生物学事件,发展更加适用的基因调控网络构建方法是一项十分重要的研究工作。 
本研究以我国地方鸡种如皋黄鸡为素材,构建IMP合成途径中8个关键酶的寡核苷酸探针(公知),在分子杂交的基础上筛选出基于RNA水平上的调控模型,揭示风味物质—IMP合成关键酶在转录水平上的表达差异,意义在于:①探明IMP合成途径中关键酶之间的相互作用机理,明确调控网络模型(立体式网络或级联式网络);②通过不同模式网络的筛选,建立RNA介导的IMP的不同时空表达的网络调控模型,从分子水平上认识细胞、组织的功能;③我国具有丰富鸡品种遗传资源,这些资源是我国养鸡业可持续发展的基石,尤其是地方鸡种良好的肉品质、独特的风味将会成为未来市场竞争中新的支撑点。阐明适合我国地方鸡种主要风味物质‑IMP的种间和时空表达差异的分子机理,为“优质鸡”的培育和产业发展提供理论依据。 
发明内容
本发明的目的是构建IMP合成途径中8个关键酶的寡核苷酸探针,在分子杂交的基础上筛选出基于RNA水平上的调控模型。 
本发明是在如皋黄鸡基因芯片(本实验所用表达谱芯片是根据实验需要定制的鸡表达谱芯片,使用哪些探针等设计方案是定制的,但是其探针本身的序列号以及探针本身的碱基序列都是安捷伦公司生产商业化鸡表达谱芯片所用探针,其设计方案和注释信息可在安捷伦公司的官方网站上中查询)数据的基础上,运用Perl语言和皮尔森系数方程求解相关基因间线性关系,结合Cytoscape和GO将影响肌肉组织中肌苷酸关键酶相关基因的网络调控图进行了分析,构建了影响IMP合成途径中关键酶基因网络调控图,以期探明肌肉组织中IMP合成途径中关键酶之间的相互作用机理。 
本发明一种构建鸡肌肉肌苷酸合成途径相关关键酶基因网络调控方法,首先是建立肌苷酸相关基因的数据集,计算各基因的权重模型,初步选择基因表达调控,其次是求相关系数并求解,构建网络图,最后是结合建立的整数非线性规划模型,并基于KEGG数据库构建肌苷酸相关基因的网络调控图。 
本发明方法的具体步骤如下: 
(1)建立肌苷酸相关基因的数据集:从24张肌肉组织芯片(本实验所用表达谱芯片是 根据实验需要定制的鸡表达谱芯片,使用哪些探针等设计方案是定制的,但是其探针本身的序列号以及探针本身的碱基序列都是安捷伦公司生产商业化鸡表达谱芯片所用探针,其设计方案和注释信息可在安捷伦公司的官方网站上中查询)中获得8个肌苷酸关键酶基因(公知)在6个时间点的表达数据,构成一个8*6的基因表达矩阵; 
(2)各基因的权重模型:将基因芯片数据标准化后,利用熵对各基因赋权,构成赋以权重的基因表达矩阵; 
(3)基因表达调控的初步选择:将所有研究的基因作为一个系统,以所有基因被调控的误差平方和最小为目标,建立整数非线性规划模型,判断基因之间的调控指向; 

zk取‑1,0,1分别表示基因k对基因i起抑制作用、无调控关系和促进作用。 
n个基因m个时间点的基因表达构成一个n×m的矩阵A=(xij)n×m,xij为第i个基因在时刻j的表达水平; 
(4)求相关系数:为了进一步确认基因之间的调控关系,用Pearson相关系数来再次判别,通过相关的显著性筛选起调控作用的基因,矩阵中任意第i个基因和第k个基因的表达向量s=(xi1,xi2,….,xim)、t=(xk1,xk2,…,kkm)的相关系数模型: 

(5)求解,构建网络图:结合cotyscape软件,R语言,运用相关系数模型法(RelevanceNetworks)建立肌苷酸关键酶相关基因的网络调控图; 
(6)结合建立的整数非线性规划模型,并基于KEGG数据库构建肌苷酸相关基因的网络调控图。 
其中,步骤(5)求解,构建网络图是: 
1)、从原始的芯片数据中挑选有效基因数据; 
2)、将有效数据上传至服务器运行计算; 
3)、将生成的源文件通过计算机语言寻找基因间的线性相关,相关系数分别设0.75、0.80、0.85、0.90; 
4)、构建genelist文件选择肌苷酸相关基因; 
5)、导入Cytoscape生成调控网络图。 
附图说明
图1:挑选有效基因的Perl语言 
图2:将有效数据上传至服务器的Perl语言 
图3:生成源文件的的Perl语言 
图4a:肌苷酸关键酶相关基因的网络图,图中黄色点即代表肌苷酸关键酶相关基因b:肌苷酸关键酶相关基因的网络图,图中字母数字即代表探针号(探针号为安捷伦公司生产商业化鸡表达谱芯片的探针号,可在各大公共数据库中查询到相应的信息和注释),一个探针号代表一个基因 
图5:相关系数大于等于0.75的肌苷酸基因及其相关基因的网络图 
图6:相关系数大于等于0.80的肌苷酸基因及其相关基因的网络图 
图7:相关系数大于等于0.85的肌苷酸基因及其相关基因的网络图 
图8:相关系数大于等于0.90的肌苷酸基因及其相关基因的网络调控图 
图9:基于基因芯片肌苷酸关键酶相关基因网络调控图 
图10:基于KEGG肌苷酸关键酶相关基因网络调控图 
图11:GO功能分类,图中不同颜色代表不同的生物功能过程 
具体实施方式
1材料与方法 
1.1材料 
1.1.试验动物 
实验鸡群的组建:全同胞如皋黄鸡家系,来自中国农业科学院家禽研究所国家地方禽种资源基因库保种群中,分别于2、4、6、8、10、12周龄时采取肌肉组织样2g左右,每周龄各6只(3♂,3♀),液氮中速冻,‑70℃保存备用。 
1.2基因芯片实验 
将提出的肌肉RNA,利用Agilent表达谱芯片技术进行实验,以Quant Array 3.0软件进行分析样点信噪比(signal noise ratio,SNR)。用数据分析程序统计分析杂交后的每一关键酶基因、空白对照点平均SNR(mSNR),判定杂交信号的强弱。同时对原始荧光数据进行数据过滤,分别取基因表达荧光强度的log值,作为筛选差异表达基因的标准,按照标准化方程,对数据进行标准化。 
1.3相关系数模型构建肌苷酸相关基因的网络调控图 
基因调控网络模型筛选:运用基于相关系数的网络模型、基于条件概率的网络模型、基于时间序列的网络模型和基于基因扰动数据模型等模型的特点和适用范围,筛选出适合本研究的最佳模型。本研究利用熵对各基因赋权,在此基础之上建立整数非线性规划(integernonlinear programming,IN‑LP)模型,辅以相关系数加以筛选判别,最终构建肌苷酸相关关键酶基因表达调控网络。 
具体步骤: 
(1)建立肌苷酸相关基因的数据集:从24张肌肉组织芯片中获得8个肌苷酸关键酶基因(IMP合成参与的基因中有报道8个基因,是实验关注的中心,围绕这个8个基因展开分析,这个8个基因是:ADSL,GARS,AIRS,GART,GARS‑AIRS‑GART,PPAT,PAICS,AMPD)在6个时间点的表达数据,构成一个8*6的基因表达矩阵 
(2)各基因的权重模型:将基因芯片数据标准化后,利用熵对各基因赋权,构成赋以权重的基因表达矩阵。 
(3)基因表达调控的初步选择:将所有研究的基因作为一个系统,以所有基因被调控的误差平方和最小为目标,建立整数非线性规划模型,判断基因之间的调控指向。 

zk取‑1,0,1分别表示基因k对基因i起抑制作用、无调控关系和促进作用。 
n个基因m个时间点的基因表达构成一个n×m的矩阵A=(xij)n×m,xij为第i个基因在时刻j的表达水平。 
(4)求相关系数:为了进一步确认基因之间的调控关系,用Pearson相关系数来再次判别,通过相关的显著性筛选起调控作用的基因,矩阵中任意第i个基因和第k个基 
因的表达向量s=(xi1,xi2,….,xim)、t=(xk1,xk2,…,kkm)的相关系数模型: 

(5)求解,构建网络图:结合cotyscape软件,R语言,运用相关系数模型法(RelevanceNetworks)建立肌苷酸关键酶相关基因的网络调控图。具体步骤简单如下:1)、从原始的芯片数据中挑选有效基因数据,见图1;2)、将有效数据上传至服务器运行计算(time:2d), 见图2;3)、将生成的源文件通过计算机语言寻找基因间的线性相关(相关系数分别设0.75、0.80、0.85、0.90),见图3;4)、构建genelist文件(选择肌苷酸相关基因),见表5;5)、导入Cytoscape生成调控网络图,见图4(a、b)。 
(6)结合建立的整数非线性规划模型,并基于KEGG数据库构建肌苷酸相关基因的网络调控图。 
2结果 
2.1相关系数求解基因线性相关及其网络图分析 
运用Perl语言和皮尔森相关系数方程求解相关基因线性相关,我们分别得到相关系数大于等于0.75、0.80、0.85和0.90的相关基因列表,分别见表1,2,3,4。将相关基因列表导入Cytoscape软件,结合肌苷酸基因探针列表(表5),分别作出肌苷酸基因及其相关基因的网络图,详见图5、6、7、8。 
表1相关系数大于等于0.75的部分基因 


注:前两列为探针号(探针号为安捷伦公司生产商业化鸡表达谱芯片的探针号,可在各大公共数据库中查询到相应的信息和注释),一个探针号代表一基因名称。 
表2相关系数大于等于0.80的部分基因 


注:前两列为探针号,一个探针号代表一基因名称。 
表3相关系数大于等于0.85的部分基因 


注:前两列为探针号,一个探针号代表一基因名称。 
表4相关系数大于等于0.90的部分基因 

注:前两列为探针号,一个探针号代表一基因名称。 
表5探针号和及其标注的肌苷酸关键酶基因 

2.2肌苷酸相关基因网络调控的构建 
在基因相关线性关系网络图的基础上,结合建立整数非线性规划模型,并分别基于芯片数据和KEGG数据库构建肌苷酸相关基因网络调控图,见图9(Genespring软件中生成),10。 
(1)KEGG Pathway分析:对于合并数据集网络,为了分析鸡肌肉肌苷酸关键酶相关基 因的网络调控关系,我们运用KEGG中“PathwayMap”工具,结合KEGG数据库所做的分析显示两条途径分别是:(1) 

(2)GO功能分类分析:GO构建了3个相对独立的本体论,其中,生物过程(biologicalprocess)、分子功能(molecular function)和细胞成分(cellular component)是所有基因和基因产物的共有属性,本研究运用基因本体论对相互作用网络的拓扑结构进行了分析。Cytoscape‑BINGO是应用于在生物过程中检测显著差异基因所占比例过。结合Cytoscape和GO将肌苷酸关键酶相关基因的网络调控图进行了功能分类,见图11,图中黄色圆圈代表的是肌苷酸关键酶相关基因及其相关基因,红色圆圈代表的是细胞增殖过程中相关基因,蓝色圆圈代表的是免疫系统过程中相关基因,军绿色圆圈代表的是生长发育过程中相关基因,绿色圆圈代表的是应激应答过程中相关基因,紫色方框代表的是未知基因,由于鸡肌肉生长发育往往由多基因控制,涉及到一系列基因的差异表达。

一种构建鸡肌肉肌苷酸合成途径相关关键酶基因网络调控方法.pdf_第1页
第1页 / 共19页
一种构建鸡肌肉肌苷酸合成途径相关关键酶基因网络调控方法.pdf_第2页
第2页 / 共19页
一种构建鸡肌肉肌苷酸合成途径相关关键酶基因网络调控方法.pdf_第3页
第3页 / 共19页
点击查看更多>>
资源描述

《一种构建鸡肌肉肌苷酸合成途径相关关键酶基因网络调控方法.pdf》由会员分享,可在线阅读,更多相关《一种构建鸡肌肉肌苷酸合成途径相关关键酶基因网络调控方法.pdf(19页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 103150487 A(43)申请公布日 2013.06.12CN103150487A*CN103150487A*(21)申请号 201210497419.3(22)申请日 2012.11.29G06F 19/12(2011.01)(71)申请人扬州大学地址 225009 江苏省扬州市大学南路88号(72)发明人陈国宏 常国斌 栾德琴 陈蓉张颖 马腾 夏明秀 戴爱琴翟飞 刘璐 陈静 王洪志 徐璐(74)专利代理机构南京知识律师事务所 32207代理人卢亚丽(54) 发明名称一种构建鸡肌肉肌苷酸合成途径相关关键酶基因网络调控方法(57) 摘要本发明属于动物育种学、发育生。

2、物学和细胞生物学领域。涉及一种利用表达谱数据及相关生物信息工具分析和构建网络调控的方法。该方法首先是建立肌苷酸相关基因的数据集,计算各基因的权重模型,初步选择基因表达调控,其次是求相关系数并求解,构建网络图,最后是结合建立的整数非线性规划模型,并基于KEGG数据库构建肌苷酸相关基因的网络调控图。本发明本研究以我国地方鸡种如皋黄鸡为素材,构建IMP合成途径中8个关键酶的寡核苷酸探针,在分子杂交的基础上筛选出基于RNA水平上的调控模型,揭示风味物质IMP合成关键酶在转录水平上的表达差异。为“优质鸡”的培育和产业发展提供理论依据。(51)Int.Cl.权利要求书1页 说明书10页 附图7页(19)中。

3、华人民共和国国家知识产权局(12)发明专利申请权利要求书1页 说明书10页 附图7页(10)申请公布号 CN 103150487 ACN 103150487 A1/1页21.一种构建鸡肌肉肌苷酸合成途径相关关键酶基因网络调控方法,其特征是:首先是建立肌苷酸相关基因的数据集,计算各基因的权重模型,初步选择基因表达调控,其次是求相关系数并求解,构建网络图,最后是结合建立的整数非线性规划模型,并基于KEGG数据库构建肌苷酸相关基因的网络调控图。2.根据权利要求1所述构建鸡肌肉肌苷酸合成途径相关关键酶基因网络调控方法,其特征在于具体步骤如下:(1)建立肌苷酸相关基因的数据集:从24张肌肉组织芯片中获得。

4、8个肌苷酸关键酶基因在6个时间点的表达数据,构成一个8*6的基因表达矩阵;(2)各基因的权重模型:将基因芯片数据标准化后,利用熵对各基因赋权,构成赋以权重的基因表达矩阵;(3)基因表达调控的初步选择:将所有研究的基因作为一个系统,以所有基因被调控的误差平方和最小为目标,建立整数非线性规划模型,判断基因之间的调控指向;zk取-1, 0, 1分别表示基因k对基因i起抑制作用、无调控关系和促进作用;n个基因m 个时间点的基因表达构成一个n m 的矩阵A = (xij ) n m , xij为第i个基因在时刻j的表达水平;(4)求相关系数:为了进一步确认基因之间的调控关系,用Pearson相关系数来再。

5、次判别,通过相关的显著性筛选起调控作用的基因,矩阵中任意第i个基因和第k个基因的表达向量s = (xi1 , xi2 , ., xim ) 、t = (xk1 , xk2 , ,kkm )的相关系数模型:(5)求解,构建网络图:结合cotyscape软件,R语言,运用相关系数模型法建立肌苷酸关键酶相关基因的网络调控图;(6)结合建立的整数非线性规划模型,并基于KEGG数据库构建肌苷酸相关基因的网络调控图。3.根据权利要求2所述构建鸡肌肉肌苷酸合成途径相关关键酶基因网络调控方法,其特征在于步骤(5)求解,构建网络图的是:1)、从原始的芯片数据中挑选有效基因数据;2)、将有效数据上传至服务器运行计。

6、算;3)、将生成的源文件通过计算机语言寻找基因间的线性相关,相关系数分别设0.75、0.80、0.85、0.90;4)、构建genelist文件选择肌苷酸相关基因;5)、导入Cytoscape生成调控网络图。权 利 要 求 书CN 103150487 A1/10页3一种构建鸡肌肉肌苷酸合成途径相关关键酶基因网络调控方法 技术领域0001 本发明属于动物育种学、发育生物学和细胞生物学领域。涉及一种利用表达谱数据及相关生物信息工具分析和构建网络调控的方法。 背景技术0002 涉及肌苷酸(IMP)合成通路中分子调控机理方面,一般而言,在整个IMP合成通路中,特别是第一阶段形成咪唑五元环和第二阶段的形。

7、成嘧啶六元环的过程中,关键酶的调控是导致表达水平差异的主要原因。然而,在IMP合成途径的关键酶方面研究较少,通过地方鸡种肌苷酸含量相关候选基因SNP(single nucleotide polymorphism)筛查,发现腺苷琥珀酸裂解酶基因1(ADSL)位点可以作为肌肉IMP含量的辅助选择标记,甘氨酰胺核苷酸合成酶(GARS)、5-氨基咪唑核苷酸合成酶(AIRS)和甘氨酰胺核苷酸转甲基酶(GART)基因(GARS-AIRS-GART)合并基因型对鸡的肉质风味性状可进行标记辅助选择。并发现在白耳鸡的不同生长阶段(3,6,9,12和15周龄)不同组织中ADSL和GARS-AIRS-GART mR。

8、NA都被检测到,并且在所有组织中表达量的变化趋势基本一致。ADSL在肝脏中的表达量最高,在大肠中表达量最低。GARS-AIRS-GART在肾脏中的表达量最高,在腿肌,心脏,大肠,小肠中的表达量也较高,在胸肌中表达量最低。另外,除ADSL,GARS-AIRS-GART外,PPAT、PAICS(AIRC)和AMPD也被证实在IMP表达水平差异方面起着调控作用。 0003 综上,在IMP的表达差异方面,关键酶起着决定性作用,但由于IMP的合成涉及到多个关键酶及相应的纤连蛋白、粘附分子与细胞因子等,而且每个关键酶的调控存在互作关联,所以有必要对整个关键酶的调控体系和相互作用网络进行研究,即对DNA-蛋。

9、白质信息贮存与表达调控模式进行探讨。在此网络中,转录水平的基因表达调控网络由于目标明确,分析模式清晰,效果准确等优势,更能直接地反映遗传性状表达调控网络的效应,更好地帮助我们理解复杂的分子或细胞过程机理,倍受青睐,正逐渐成为国际热点研究课题。 0004 就调控网络的构建问题,国内外学者均已经开展了大量相关研究工作。现有调控网络的实验资料主要来源于对大肠杆菌、酿酒酵母和线虫的调控网络的研究。有学者基于实验的基因组定位分析方法,构建了转录因子启动子结合网络,以此推导出调控网络。然而,定位分析实验方法只适用于特定的实验条件,在其它实验条件下,该方法可能失效。迄今为止,各种统计数据挖掘工具已经用于发现。

10、基因表达调控网络。其中普遍使用的有代表性的模型包括:基于相关系数的网络模型。基于条件概率的网络模型。它是一个用来描述一系列随机变量之间的条件独立性的一种方向性模型。基于时间序列的网络模型。它是针对很多时间序列的基因芯片数据而开发的,包括动态贝叶斯网络模型和事件模型,需要设置很多参数。 根据基因扰动(Gene Perturbation)数据来推导基因调控关系。为了避免计算复杂性问题,把基因表达数据、DNA序列和功能注释整合成一个可以理解的模型,以构建基因表达转录调控网络。此外,利用基因表达数据、启动子序列和转录因子结合位点数据来构建转录调控网络。这种方法需要假设数据满足正态分布,而这种假设还没有。

11、说 明 书CN 103150487 A2/10页4得到证实,导致所得结果的可信度不高。因此,针对具体的生物学事件,发展更加适用的基因调控网络构建方法是一项十分重要的研究工作。 0005 本研究以我国地方鸡种如皋黄鸡为素材,构建IMP合成途径中8个关键酶的寡核苷酸探针(公知),在分子杂交的基础上筛选出基于RNA水平上的调控模型,揭示风味物质IMP合成关键酶在转录水平上的表达差异,意义在于:探明IMP合成途径中关键酶之间的相互作用机理,明确调控网络模型(立体式网络或级联式网络);通过不同模式网络的筛选,建立RNA介导的IMP的不同时空表达的网络调控模型,从分子水平上认识细胞、组织的功能;我国具有丰。

12、富鸡品种遗传资源,这些资源是我国养鸡业可持续发展的基石,尤其是地方鸡种良好的肉品质、独特的风味将会成为未来市场竞争中新的支撑点。阐明适合我国地方鸡种主要风味物质-IMP的种间和时空表达差异的分子机理,为“优质鸡”的培育和产业发展提供理论依据。 发明内容0006 本发明的目的是构建IMP合成途径中8个关键酶的寡核苷酸探针,在分子杂交的基础上筛选出基于RNA水平上的调控模型。 0007 本发明是在如皋黄鸡基因芯片(本实验所用表达谱芯片是根据实验需要定制的鸡表达谱芯片,使用哪些探针等设计方案是定制的,但是其探针本身的序列号以及探针本身的碱基序列都是安捷伦公司生产商业化鸡表达谱芯片所用探针,其设计方案。

13、和注释信息可在安捷伦公司的官方网站上中查询)数据的基础上,运用Perl语言和皮尔森系数方程求解相关基因间线性关系,结合Cytoscape和GO将影响肌肉组织中肌苷酸关键酶相关基因的网络调控图进行了分析,构建了影响IMP合成途径中关键酶基因网络调控图,以期探明肌肉组织中IMP合成途径中关键酶之间的相互作用机理。 0008 本发明一种构建鸡肌肉肌苷酸合成途径相关关键酶基因网络调控方法,首先是建立肌苷酸相关基因的数据集,计算各基因的权重模型,初步选择基因表达调控,其次是求相关系数并求解,构建网络图,最后是结合建立的整数非线性规划模型,并基于KEGG数据库构建肌苷酸相关基因的网络调控图。 0009 本。

14、发明方法的具体步骤如下: 0010 (1)建立肌苷酸相关基因的数据集:从24张肌肉组织芯片(本实验所用表达谱芯片是 根据实验需要定制的鸡表达谱芯片,使用哪些探针等设计方案是定制的,但是其探针本身的序列号以及探针本身的碱基序列都是安捷伦公司生产商业化鸡表达谱芯片所用探针,其设计方案和注释信息可在安捷伦公司的官方网站上中查询)中获得8个肌苷酸关键酶基因(公知)在6个时间点的表达数据,构成一个8*6的基因表达矩阵; 0011 (2)各基因的权重模型:将基因芯片数据标准化后,利用熵对各基因赋权,构成赋以权重的基因表达矩阵; 0012 (3)基因表达调控的初步选择:将所有研究的基因作为一个系统,以所有基。

15、因被调控的误差平方和最小为目标,建立整数非线性规划模型,判断基因之间的调控指向; 0013 说 明 书CN 103150487 A3/10页50014 zk取-1,0,1分别表示基因k对基因i起抑制作用、无调控关系和促进作用。 0015 n个基因m个时间点的基因表达构成一个nm的矩阵A=(xij)nm,xij为第i个基因在时刻j的表达水平; 0016 (4)求相关系数:为了进一步确认基因之间的调控关系,用Pearson相关系数来再次判别,通过相关的显著性筛选起调控作用的基因,矩阵中任意第i个基因和第k个基因的表达向量s=(xi1,xi2, .,xim)、t=(xk1,xk2,kkm)的相关系数。

16、模型: 0017 0018 (5)求解,构建网络图:结合cotyscape软件,R语言,运用相关系数模型法(RelevanceNetworks)建立肌苷酸关键酶相关基因的网络调控图; 0019 (6)结合建立的整数非线性规划模型,并基于KEGG数据库构建肌苷酸相关基因的网络调控图。 0020 其中,步骤(5)求解,构建网络图是: 0021 1)、从原始的芯片数据中挑选有效基因数据; 0022 2)、将有效数据上传至服务器运行计算; 0023 3)、将生成的源文件通过计算机语言寻找基因间的线性相关,相关系数分别设0.75、0.80、0.85、0.90; 0024 4)、构建genelist文件选。

17、择肌苷酸相关基因; 0025 5)、导入Cytoscape生成调控网络图。 附图说明0026 图1:挑选有效基因的Perl语言 0027 图2:将有效数据上传至服务器的Perl语言 0028 图3:生成源文件的的Perl语言 0029 图4a:肌苷酸关键酶相关基因的网络图,图中黄色点即代表肌苷酸关键酶相关基因b:肌苷酸关键酶相关基因的网络图,图中字母数字即代表探针号(探针号为安捷伦公司生产商业化鸡表达谱芯片的探针号,可在各大公共数据库中查询到相应的信息和注释),一个探针号代表一个基因 0030 图5:相关系数大于等于0.75的肌苷酸基因及其相关基因的网络图 0031 图6:相关系数大于等于0.。

18、80的肌苷酸基因及其相关基因的网络图 0032 图7:相关系数大于等于0.85的肌苷酸基因及其相关基因的网络图 0033 图8:相关系数大于等于0.90的肌苷酸基因及其相关基因的网络调控图 0034 图9:基于基因芯片肌苷酸关键酶相关基因网络调控图 说 明 书CN 103150487 A4/10页60035 图10:基于KEGG肌苷酸关键酶相关基因网络调控图 0036 图11:GO功能分类,图中不同颜色代表不同的生物功能过程 具体实施方式0037 1材料与方法 0038 1.1材料 0039 1.1.试验动物 0040 实验鸡群的组建:全同胞如皋黄鸡家系,来自中国农业科学院家禽研究所国家地方禽。

19、种资源基因库保种群中,分别于2、4、6、8、10、12周龄时采取肌肉组织样2g左右,每周龄各6只(3,3),液氮中速冻,-70保存备用。 0041 1.2基因芯片实验 0042 将提出的肌肉RNA,利用Agilent表达谱芯片技术进行实验,以Quant Array 3.0软件进行分析样点信噪比(signal noise ratio,SNR)。用数据分析程序统计分析杂交后的每一关键酶基因、空白对照点平均SNR(mSNR),判定杂交信号的强弱。同时对原始荧光数据进行数据过滤,分别取基因表达荧光强度的log值,作为筛选差异表达基因的标准,按照标准化方程,对数据进行标准化。 0043 1.3相关系数模。

20、型构建肌苷酸相关基因的网络调控图 0044 基因调控网络模型筛选:运用基于相关系数的网络模型、基于条件概率的网络模型、基于时间序列的网络模型和基于基因扰动数据模型等模型的特点和适用范围,筛选出适合本研究的最佳模型。本研究利用熵对各基因赋权,在此基础之上建立整数非线性规划(integernonlinear programming,IN-LP)模型,辅以相关系数加以筛选判别,最终构建肌苷酸相关关键酶基因表达调控网络。 0045 具体步骤: 0046 (1)建立肌苷酸相关基因的数据集:从24张肌肉组织芯片中获得8个肌苷酸关键酶基因(IMP合成参与的基因中有报道8个基因,是实验关注的中心,围绕这个8个。

21、基因展开分析,这个8个基因是:ADSL,GARS,AIRS,GART,GARS-AIRS-GART,PPAT,PAICS,AMPD)在6个时间点的表达数据,构成一个8*6的基因表达矩阵 0047 (2)各基因的权重模型:将基因芯片数据标准化后,利用熵对各基因赋权,构成赋以权重的基因表达矩阵。 0048 (3)基因表达调控的初步选择:将所有研究的基因作为一个系统,以所有基因被调控的误差平方和最小为目标,建立整数非线性规划模型,判断基因之间的调控指向。 0049 0050 zk取-1,0,1分别表示基因k对基因i起抑制作用、无调控关系和促进作用。 0051 n个基因m个时间点的基因表达构成一个nm。

22、的矩阵A=(xij)nm,xij为第i个基因在时刻j的表达水平。 说 明 书CN 103150487 A5/10页70052 (4)求相关系数:为了进一步确认基因之间的调控关系,用Pearson相关系数来再次判别,通过相关的显著性筛选起调控作用的基因,矩阵中任意第i个基因和第k个基 0053 因的表达向量s=(xi1,xi2, .,xim)、t=(xk1,xk2,kkm)的相关系数模型: 0054 0055 (5)求解,构建网络图:结合cotyscape软件,R语言,运用相关系数模型法(RelevanceNetworks)建立肌苷酸关键酶相关基因的网络调控图。具体步骤简单如下:1)、从原始的芯。

23、片数据中挑选有效基因数据,见图1;2)、将有效数据上传至服务器运行计算(time:2d), 见图2;3)、将生成的源文件通过计算机语言寻找基因间的线性相关(相关系数分别设0.75、0.80、0.85、0.90),见图3;4)、构建genelist文件(选择肌苷酸相关基因),见表5;5)、导入Cytoscape生成调控网络图,见图4(a、b)。 0056 (6)结合建立的整数非线性规划模型,并基于KEGG数据库构建肌苷酸相关基因的网络调控图。 0057 2结果 0058 2.1相关系数求解基因线性相关及其网络图分析 0059 运用Perl语言和皮尔森相关系数方程求解相关基因线性相关,我们分别得到。

24、相关系数大于等于0.75、0.80、0.85和0.90的相关基因列表,分别见表1,2,3,4。将相关基因列表导入Cytoscape软件,结合肌苷酸基因探针列表(表5),分别作出肌苷酸基因及其相关基因的网络图,详见图5、6、7、8。 0060 表1相关系数大于等于0.75的部分基因 0061 说 明 书CN 103150487 A6/10页80062 0063 注:前两列为探针号(探针号为安捷伦公司生产商业化鸡表达谱芯片的探针号,可在各大公共数据库中查询到相应的信息和注释),一个探针号代表一基因名称。 0064 表2相关系数大于等于0.80的部分基因 0065 说 明 书CN 103150487 A7/10页90066 0067 注:前两列为探针号,一个探针号代表一基因名称。 0068 表3相关系数大于等于0.85的部分基因 0069 说 明 书CN 103150487 A8/10页100070 说 明 书CN 103150487 A10。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1