一种通过量子化学方法构建定量构效关系模型来预测有机化合物急性毒性的方法.pdf

上传人:zhu****_FC 文档编号:5780334 上传时间:2019-03-18 格式:PDF 页数:8 大小:831.16KB
返回 下载 相关 举报
摘要
申请专利号:

CN201310705921.3

申请日:

2013.12.19

公开号:

CN103646180A

公开日:

2014.03.19

当前法律状态:

驳回

有效性:

无权

法律详情:

发明专利申请公布后的驳回IPC(主分类):G06F 19/00申请公布日:20140319|||实质审查的生效IPC(主分类):G06F 19/00申请日:20131219|||公开

IPC分类号:

G06F19/00(2011.01)I

主分类号:

G06F19/00

申请人:

山东大学

发明人:

张庆竹; 吴秀超; 孙孝敏

地址:

250100 山东省济南市历城区山大南路27号

优先权:

专利代理机构:

济南金迪知识产权代理有限公司 37219

代理人:

王绪银

PDF下载: PDF下载
内容摘要

本发明公开了一种通过量子化学方法构建定量构效关系模型来预测有机化合物急性毒性的方法,是运用Gaussian程序对化合物结构进行几何全优化,得出分子的体积、相对分子质量、最高占据轨道能、最低空轨道能、前线轨道能级差、偶极矩、溶剂化能、电子能等量子化学参数,将它们和疏水性参数作为结构描述符,结合毒性数据,通过编写的基于偏最小二乘逐步线性回归的程序,建立各种结构描述符与毒性之间的定量关系方程,得到方程的复相关系数,F-检验值和残差平方和,然后验证模型,以保证其外部预测能力。由此,可以快捷、有效的预测所要研究的有机化合物的毒性,为化学品的风险评价和监管提供必要的基础数据。

权利要求书

权利要求书
1.  一种通过量子化学方法构建定量构效关系模型来预测有机化合物急性毒性的方法,步骤如下:
1)通过进行毒性试验或者通过查阅毒性数据库和相关文献,获得所要研究的有机化合物的急性毒性数据:半数致死剂量LD50或半数致死浓度LC50;
2)利用量子化学软件Gaussian对所要研究的有机化合物进行几何结构优化,获得量子化学参数:分子体积MV、相对分子质量MW、分子最高占据轨道能EHOMO、分子最低空轨道能ELUMO、前线轨道能级差ΔE、分子偶极矩μ、分子的溶剂化能Esol、分子的电子能ET、分子的最正原子净电荷Q+、分子的最负原子净电荷Q-、分子的最正氢原子净电荷QH,同时加入源于SciFinder数据库的疏水性参数logP,共同作为结构描述符;
3)将得到的毒性数据按其毒性大小抽取1/4~1/5作为验证集数据,其余为训练集数据,训练集用来构建预测模型,验证集用来验证模型的预测能力;
4)以通过量子化学计算所得训练集有机化合物的逐个量子化学参数为自变量,有机化合物对生物毒性数据为因变量,编写基于偏最小二乘逐步线性回归的程序,得到各个参数的复相关系数、F-检验值、残差平方和,建立各种结构描述符与毒性之间的定量关系模型;在此过程中观察各参数的相关性,以减少多元统计分析中的共线性,当两参数的相关性大于0.7时,剔除其中之一,最后获得回归方程,回归方程的复相关系数R2大于0.7时,预示建立的模型拟合效果良好,R2越大,拟合效果越好;
5)将验证集数据带入获得的回归方程,得到其预测值,然后根据外部预测能力评价系数Q2ext的值判定外部预测能力的好坏;当Q2ext大于0.7时,预示建立的模型具有良好的外部预测能力,Q2ext越大,外部预测能力越好。

2.  如权利要求1所述通过量子化学方法构建定量构效关系模型来预测有机化合物急性毒性的方法,其特征在于:步骤1)所述有机化合物是苯胺衍生物或卤代苯衍生物。

说明书

说明书一种通过量子化学方法构建定量构效关系模型来预测有机化合物急性毒性的方法
技术领域
本发明涉及一种通过量子化学方法构建定量构效关系模型来预测有机化合物急性毒性的方法,属于生态风险评价测试策略领域。
背景技术
定量结构-活性相关(QSAR),最初作为定量药物设计的一个研究分支,是为了适应合理设计生物活性分子的需要而发展起来的。所谓定量构效关系,就是定量的描述和研究有机物的结构和活性之间的相互关系。定量构效关系分析是指利用理论计算和各种统计分析工具来研究同系列化合物(包括二维分子结构、三维分子结构和电子结构)与其效应(如遗传毒性和生物活性等)之间的定量关系,即采用数字模型、借助理化参数或结构参数来描述有机小分子化合物(药物、底物、抑制剂等)与有机大分子化合物(酶、辅酶或有机分子)或组织(受体、细胞、动物)之间的相互作用关系。目前,许多环境科学研究者通过QSAR建立了很多具有预测能力的环境模型,如大连理工大学发明的专利“一种通过定量构效关系模型预测有机物液相蒸汽压的方法”(中国专利申请号201110410088.0)和“通过定量构效关系和溶剂化模型预测不同温度下的正辛醇空气分配系数KOA的方法”(中国专利申请号201210505935.6)。这对已经进入环境的污染物及尚未投放市场的各种各样的新化合物的生物活性、毒性乃至环境行为进行了成功的预测、评价和筛选,显示出QSAR极其广阔的应用前景。
随着现代化学工业的飞速发展,已有数以万计的新的化学物质进入了人类生产和生活。据估计,人类目前常用的化学品已达8万种之多,并且这个数字正以每年近千种的速度增加。截止2007年末,美国化学文摘(CAS)登记的化学品已达3300多万种,其中绝大多数是有机化合物。而很多有机化合物会对人类和其他生物的健康,生长,发育等造成不同等级的危害。因此获得有机化合物危险性质,如急性毒性,致癌性等对于危险物质的风险评估,管理控制,工程应用等具有重要的理论和实际意义。传统的生态风险评价包括下列四个步骤:危害识别,剂量-反应评价,暴露评价,风险表征。进行生态风险评价,需要首先获得大量的数据:化合物对生物或人体的毒性,在环境中的迁移和转化等。这些数据的获取要通过实验获得,而面对这么多已存在的和即将生产和使用的有机化合物,其工作量之大,是可想而知的。因此仅仅依靠实验来完成积累数据并进行生态风险评价,是不可能的,而且在时间上是永远滞后的。具有强大预测功能的QSAR方法为有机物的生态风险评价提供了一个重要的、必不 可少的手段。可以说,QSAR的理论研究具有重要的理论价值和实际意义,是污染防治的理论基础,是可持续发展的技术前提。利用QSAR方法检测并筛选出具有潜在危害的化学品,可以节省大量的毒性试验工作及昂贵费用。
发明内容
本发明的目的是发展一种简单、快捷、高效预测有机化合物毒性的方法。该方法可以根据化合物结构预测出其毒性,从而为化学品风险评价和环境监管提供必要的基础数据。
本发明的原理是对已知毒性的有机化合物,运用Gaussian程序进行几何全优化,得出相关的分子结构参数。结合毒性数据,通过编写的基于偏最小二乘逐步线性回归的程序,得到各个参数的偏回归平方和,估计的标准偏差,各个回归系数的标准偏差,复相关系数,F-检验值,残差平方和及规格化的相关系数,建立各种结构描述符与毒性之间的定量关系。由此,可以快捷、有效的预测有机化合物的毒性。
分子结构参数的选用的好坏是QSAR成功与否的关键。描述分子结构方面的参数已经达200多个。一般可分为三类:间接结构参数(理化参数)、分子几何结构方面的特征参数(如分子拓扑指数)和电子构型方面的特征参数(如某些量子化学参数)。常用的间接结构参数是以代表物质结构的某种性质作为基础,从而间接地表示物质在该方面的结构特点。最经常采用的是辛醇—水分配系数,用以表示物质的极性或者憎水性。几何结构参数包括分子的长度、体积、表面积、价键角度、立体空间结构及分子拓扑指数。分子的电子构型包括原子的种类、价键的类型、偶极矩、轨道构型、电子云密度、氢键、官能团及其他量子化学参数等。各种结构参数分别用于描述污染物在宏观、中观及微观层次上的分子结构,形成了基于经验的宏观性理论、基于污染物官能团性质的分子片理论、基于污染物几何构型的几何结构里理论、基于有机物分子分支图形的拓扑学理论、基于污染物分子的价键和电子跃迁的量子理论等等。
Hansch认为,有机物的生物活性与分子的疏水性、立体效应、电子效应呈良好的相关性。生物中毒可分为两个过程,首先是有机物分子透过生物膜进入机体内,其次是有机物分子与机体内“靶位”(如蛋白酶、DNA等)发生作用.这两个过程可分别用化合物的亲脂性参数(1ogP),以及分子的立体效应参数和电子效应参数来描述。而Abernethy提出的“体积理论”则表明,溶解的毒物可使神经细胞膜的双层磷脂层的体积膨胀,而对机体产生毒性。
大量研究成果都证明了物质的亲脂性参数能够描述污染物在环境中的分布和迁移特性,能够描述污染物质在生物体内的富集和累积,以及污染物质分子本身的聚合和卷曲等特性,是目前应用最广的宏观特性参数之一。而分子的释质子能力越大,亲电能力越大,毒性也越大。
线性自由能相关理论则认为:对于一定范围内的系列化合物与同一种受体发生反应时, 化合物与受体之间的作用方式相类似,从而使得化合物-受体反应的自由能变化△G与化合物本身的反应活性之间存在线性相关关系。
基于以上基础理论的分析,本发明提供了一种通过量子化学方法构建定量构效关系模型来预测有机化合物急性毒性的方法,步骤如下:
1)通过进行毒性试验或者通过查阅毒性数据库和相关文献,获得所要研究的有机化合物的急性毒性数据:半数致死剂量LD50或半数致死浓度LC50;
2)利用量子化学软件Gaussian对所要研究的有机化合物进行几何结构优化,获得量子化学参数:分子体积MV、相对分子质量MW、分子最高占据轨道能EHOMO、分子最低空轨道能ELUMO、前线轨道能级差ΔE、分子偶极矩μ、分子的溶剂化能Esol、分子的电子能ET、分子的最正原子净电荷Q+、分子的最负原子净电荷Q-、分子的最正氢原子净电荷QH,同时加入源于SciFinder数据库的疏水性参数logP,共同作为结构描述符;
3)将得到的毒性数据按其毒性大小抽取1/4~1/5作为验证集数据,其余为训练集数据,训练集用来构建预测模型,验证集用来验证模型的预测能力;
4)以通过量子化学计算所得训练集有机化合物的逐个量子化学参数为自变量,有机化合物对生物毒性数据为因变量,编写基于偏最小二乘逐步线性回归的程序,得到各个参数的复相关系数、F-检验值、残差平方和,建立各种结构描述符与毒性之间的定量关系模型;在此过程中观察各参数的相关性,以减少多元统计分析中的共线性,当两参数的相关性大于0.7时,剔除其中之一,最后获得回归方程,回归方程的复相关系数R2大于0.7时,预示建立的模型拟合效果良好,R2越大,拟合效果越好;
5)将验证集数据带入获得的回归方程,得到其预测值,然后根据外部预测能力评价系数Q2ext的值判定外部预测能力的好坏;当Q2ext大于0.7时,预示建立的模型具有良好的外部预测能力,Q2ext越大,外部预测能力越好。
其中,上述外部预测能力评价系数Q2ext如公式(1)所示:
Qext2=1-Σi=1next(yi-y^i)2Σi=1next(yi-y‾)2---(1)]]>
(yi为验证集实验值,为验证集预测值,为训练集实验值均值)。
上述通过量子化学方法构建定量构效关系模型来预测有机化合物的急性毒性的方法中:步骤1)所述有机化合物优选是苯胺衍生物或卤代苯衍生物。
本发明提供的通过量子化学方法构建定量构效关系模型来预测化合物毒性的方法,可以根据化合物结构快捷、有效的预测出其毒性,从而为化学品风险评价和环境监管提供必要的基础数据,具有重要的社会价值和经济价值。
附图说明
图1为训练集苯胺衍生物对黑头呆鱼急性毒性lnLC50的实验值,预测值和残差值的分布图。
图2为验证集苯胺衍生物对黑头呆鱼急性毒性lnLC50的实验值,预测值和残差值的分布图。
图3为QSAR模型建立的示意图。
具体实施方式
实施例1:通过量子化学手段构建苯胺衍生物对黑头呆鱼急性毒性的预测模型。
通过从QSAR toolbox查得50个苯胺衍生物对黑头呆鱼急性毒性数据LC50,按其毒性大小排列后每五个取一种物质作为验证集数据,总数为10种,其余40种物质的急性毒性作为训练集。
运用量子化学软件Gaussian,选取分子体积MV、相对分子质量MW、分子最高占据轨道能EHOMO,分子最低空轨道能ELUMO,前线轨道能级差ΔE,分子偶极矩μ、分子的溶剂化能Esol、分子的电子能ET、分子的最正原子净电荷Q+、分子的最负原子净电荷Q-、分子的最正氢原子净电荷QH等十几个量子化学参数和疏水性参数logP作为自变量,lnLC50作为因变量,运用自编的基于偏最小二乘逐步线性回归的程序,建立定量构效关系模型。在此过程中观察各参数的相关性,以减少多元统计分析中的共线性,当两参数的相关性较高时(大于0.7),剔除其中之一,最后获得回归方程如下:
(判定标准:回归方程的复相关系数R2大于0.7时说明模型的拟合效果良好,R2越大,拟合效果越好。当Q2ext大于0.7时,说明模型具有较好的外部预测能力,Q2ext越大,外部预测能力越好。)
lnLC50=-0.033MV+0.002ET+8.330  (2)
(R2=0.908,F=183.576,n=40)
R2=0.908,说明模型的拟合能力优秀。
将验证集的数据带入获得的回归方程(2),得到其预测值。根据公式(1)得Q2ext=0.884,说明模型具有良好的外部预测能力。结果见附图。
实施例2:通过量子化学手段构建卤代苯衍生物对大型蚤急性毒性的预测模型。
通过从QSAR toolbox查得40个卤代苯衍生物对大型蚤急性毒性数据LC50,按其毒性大小排列后每五个取一种物质作为验证集数据,总数为8种,其余32种物质的急性毒性作为训练集。
(变量选择和判定标准与实例1相同)
拟合公式为:lnLC50=-1.180logp+5.529
(R2=0.730,F=75.883,Q2ext=0.839,n=32)
(附图类似实施例1)。
实施例3:通过量子化学手段构建有机磷农药对绿藻急性毒性的预测模型。
通过从QSAR toolbox查得40个有机磷农药对绿藻急性毒性数据LC50,按其毒性大小排列后每五个取一种物质作为验证集数据,总数为8种,其余32种物质的急性毒性作为训练集。(变量选择和判定标准与实例1相同)
拟合公式为:lnEC50=-1.886log p+0.027MV+2.64
(R2=0.805,F=53.537,Q2ext=0.706,n=32)
(附图类似实例1)。

一种通过量子化学方法构建定量构效关系模型来预测有机化合物急性毒性的方法.pdf_第1页
第1页 / 共8页
一种通过量子化学方法构建定量构效关系模型来预测有机化合物急性毒性的方法.pdf_第2页
第2页 / 共8页
一种通过量子化学方法构建定量构效关系模型来预测有机化合物急性毒性的方法.pdf_第3页
第3页 / 共8页
点击查看更多>>
资源描述

《一种通过量子化学方法构建定量构效关系模型来预测有机化合物急性毒性的方法.pdf》由会员分享,可在线阅读,更多相关《一种通过量子化学方法构建定量构效关系模型来预测有机化合物急性毒性的方法.pdf(8页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 103646180 A (43)申请公布日 2014.03.19 CN 103646180 A (21)申请号 201310705921.3 (22)申请日 2013.12.19 G06F 19/00(2011.01) (71)申请人 山东大学 地址 250100 山东省济南市历城区山大南路 27 号 (72)发明人 张庆竹 吴秀超 孙孝敏 (74)专利代理机构 济南金迪知识产权代理有限 公司 37219 代理人 王绪银 (54) 发明名称 一种通过量子化学方法构建定量构效关系模 型来预测有机化合物急性毒性的方法 (57) 摘要 本发明公开了一种通过量子化学方法构建定。

2、 量构效关系模型来预测有机化合物急性毒性的方 法, 是运用 Gaussian 程序对化合物结构进行几何 全优化, 得出分子的体积、 相对分子质量、 最高占 据轨道能、 最低空轨道能、 前线轨道能级差、 偶极 矩、 溶剂化能、 电子能等量子化学参数, 将它们和 疏水性参数作为结构描述符, 结合毒性数据, 通过 编写的基于偏最小二乘逐步线性回归的程序, 建 立各种结构描述符与毒性之间的定量关系方程, 得到方程的复相关系数, F- 检验值和残差平方 和, 然后验证模型, 以保证其外部预测能力。 由此, 可以快捷、 有效的预测所要研究的有机化合物的 毒性, 为化学品的风险评价和监管提供必要的基 础数据。

3、。 (51)Int.Cl. 权利要求书 1 页 说明书 4 页 附图 2 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书1页 说明书4页 附图2页 (10)申请公布号 CN 103646180 A CN 103646180 A 1/1 页 2 1. 一种通过量子化学方法构建定量构效关系模型来预测有机化合物急性毒性的方法, 步骤如下 : 1) 通过进行毒性试验或者通过查阅毒性数据库和相关文献, 获得所要研究的有机化合 物的急性毒性数据 : 半数致死剂量 LD50或半数致死浓度 LC50; 2) 利用量子化学软件 Gaussian 对所要研究的有机化合物进行几何结构优化。

4、, 获得量 子化学参数 : 分子体积 MV、 相对分子质量 MW、 分子最高占据轨道能 EHOMO、 分子最低空轨道能 ELUMO、 前线轨道能级差 E、 分子偶极矩 、 分子的溶剂化能 Esol、 分子的电子能 ET、 分子的最 正原子净电荷 Q+、 分子的最负原子净电荷 Q-、 分子的最正氢原子净电荷 QH, 同时加入源于 SciFinder 数据库的疏水性参数 logP, 共同作为结构描述符 ; 3) 将得到的毒性数据按其毒性大小抽取 1/4 1/5 作为验证集数据, 其余为训练集数 据, 训练集用来构建预测模型, 验证集用来验证模型的预测能力 ; 4) 以通过量子化学计算所得训练集有机。

5、化合物的逐个量子化学参数为自变量, 有机化 合物对生物毒性数据为因变量, 编写基于偏最小二乘逐步线性回归的程序, 得到各个参数 的复相关系数、 F- 检验值、 残差平方和, 建立各种结构描述符与毒性之间的定量关系模型 ; 在此过程中观察各参数的相关性, 以减少多元统计分析中的共线性, 当两参数的相关性大 于 0.7 时, 剔除其中之一, 最后获得回归方程, 回归方程的复相关系数 R2大于 0.7 时, 预示 建立的模型拟合效果良好, R2越大, 拟合效果越好 ; 5) 将验证集数据带入获得的回归方程, 得到其预测值, 然后根据外部预测能力评价系 数 Q2ext的值判定外部预测能力的好坏 ; 当。

6、 Q2ext大于 0.7 时, 预示建立的模型具有良好的外 部预测能力, Q2ext越大, 外部预测能力越好。 2. 如权利要求 1 所述通过量子化学方法构建定量构效关系模型来预测有机化合物急 性毒性的方法, 其特征在于 : 步骤 1) 所述有机化合物是苯胺衍生物或卤代苯衍生物。 权 利 要 求 书 CN 103646180 A 2 1/4 页 3 一种通过量子化学方法构建定量构效关系模型来预测有机 化合物急性毒性的方法 技术领域 0001 本发明涉及一种通过量子化学方法构建定量构效关系模型来预测有机化合物急 性毒性的方法, 属于生态风险评价测试策略领域。 背景技术 0002 定量结构 - 活。

7、性相关 (QSAR), 最初作为定量药物设计的一个研究分支, 是为了适 应合理设计生物活性分子的需要而发展起来的。所谓定量构效关系, 就是定量的描述和研 究有机物的结构和活性之间的相互关系。定量构效关系分析是指利用理论计算和各种统 计分析工具来研究同系列化合物 (包括二维分子结构、 三维分子结构和电子结构) 与其效应 ( 如遗传毒性和生物活性等) 之间的定量关系, 即采用数字模型、 借助理化参数或结构参数 来描述有机小分子化合物 (药物、 底物、 抑制剂等) 与有机大分子化合物 (酶、 辅酶或有机分 子) 或组织 (受体、 细胞、 动物) 之间的相互作用关系。目前, 许多环境科学研究者通过 Q。

8、SAR 建立了很多具有预测能力的环境模型, 如大连理工大学发明的专利 “一种通过定量构效关 系模型预测有机物液相蒸汽压的方法” (中国专利申请号 201110410088.0) 和 “通过定量构 效关系和溶剂化模型预测不同温度下的正辛醇空气分配系数 KOA的方法” (中国专利申请号 201210505935.6) 。这对已经进入环境的污染物及尚未投放市场的各种各样的新化合物的 生物活性、 毒性乃至环境行为进行了成功的预测、 评价和筛选, 显示出 QSAR 极其广阔的应 用前景。 0003 随着现代化学工业的飞速发展, 已有数以万计的新的化学物质进入了人类生产和 生活。据估计, 人类目前常用的化。

9、学品已达 8 万种之多, 并且这个数字正以每年近千种的 速度增加。截止 2007 年末, 美国化学文摘 (CAS) 登记的化学品已达 3300 多万种, 其中绝大 多数是有机化合物。 而很多有机化合物会对人类和其他生物的健康, 生长, 发育等造成不同 等级的危害。 因此获得有机化合物危险性质, 如急性毒性, 致癌性等对于危险物质的风险评 估, 管理控制, 工程应用等具有重要的理论和实际意义。 传统的生态风险评价包括下列四个 步骤 : 危害识别, 剂量 - 反应评价, 暴露评价, 风险表征。进行生态风险评价, 需要首先获得 大量的数据 : 化合物对生物或人体的毒性, 在环境中的迁移和转化等。 这。

10、些数据的获取要通 过实验获得, 而面对这么多已存在的和即将生产和使用的有机化合物, 其工作量之大, 是可 想而知的。 因此仅仅依靠实验来完成积累数据并进行生态风险评价, 是不可能的, 而且在时 间上是永远滞后的。具有强大预测功能的 QSAR 方法为有机物的生态风险评价提供了一个 重要的、 必不可少的手段。可以说, QSAR 的理论研究具有重要的理论价值和实际意义, 是污 染防治的理论基础, 是可持续发展的技术前提。利用 QSAR 方法检测并筛选出具有潜在危害 的化学品, 可以节省大量的毒性试验工作及昂贵费用。 发明内容 0004 本发明的目的是发展一种简单、 快捷、 高效预测有机化合物毒性的方。

11、法。该方法 说 明 书 CN 103646180 A 3 2/4 页 4 可以根据化合物结构预测出其毒性, 从而为化学品风险评价和环境监管提供必要的基础数 据。 0005 本发明的原理是对已知毒性的有机化合物, 运用 Gaussian 程序进行几何全优化, 得出相关的分子结构参数。结合毒性数据, 通过编写的基于偏最小二乘逐步线性回归的程 序, 得到各个参数的偏回归平方和, 估计的标准偏差, 各个回归系数的标准偏差, 复相关系 数, F- 检验值, 残差平方和及规格化的相关系数, 建立各种结构描述符与毒性之间的定量关 系。由此, 可以快捷、 有效的预测有机化合物的毒性。 0006 分子结构参数的。

12、选用的好坏是 QSAR 成功与否的关键。描述分子结构方面的参数 已经达 200 多个。 一般可分为三类 : 间接结构参数 (理化参数) 、 分子几何结构方面的特征参 数 (如分子拓扑指数) 和电子构型方面的特征参数 (如某些量子化学参数) 。常用的间接结构 参数是以代表物质结构的某种性质作为基础, 从而间接地表示物质在该方面的结构特点。 最经常采用的是辛醇水分配系数, 用以表示物质的极性或者憎水性。几何结构参数包括 分子的长度、 体积、 表面积、 价键角度、 立体空间结构及分子拓扑指数。 分子的电子构型包括 原子的种类、 价键的类型、 偶极矩、 轨道构型、 电子云密度、 氢键、 官能团及其他量。

13、子化学参 数等。 各种结构参数分别用于描述污染物在宏观、 中观及微观层次上的分子结构, 形成了基 于经验的宏观性理论、 基于污染物官能团性质的分子片理论、 基于污染物几何构型的几何 结构里理论、 基于有机物分子分支图形的拓扑学理论、 基于污染物分子的价键和电子跃迁 的量子理论等等。 0007 Hansch 认为, 有机物的生物活性与分子的疏水性、 立体效应、 电子效应呈良好的相 关性。 生物中毒可分为两个过程, 首先是有机物分子透过生物膜进入机体内, 其次是有机物 分子与机体内 “靶位” ( 如蛋白酶、 DNA 等 ) 发生作用 . 这两个过程可分别用化合物的亲脂性 参数(1ogP), 以及分。

14、子的立体效应参数和电子效应参数来描述。 而Abernethy提出的 “体积 理论” 则表明, 溶解的毒物可使神经细胞膜的双层磷脂层的体积膨胀, 而对机体产生毒性。 0008 大量研究成果都证明了物质的亲脂性参数能够描述污染物在环境中的分布和迁 移特性, 能够描述污染物质在生物体内的富集和累积, 以及污染物质分子本身的聚合和卷 曲等特性, 是目前应用最广的宏观特性参数之一。而分子的释质子能力越大, 亲电能力越 大, 毒性也越大。 0009 线性自由能相关理论则认为 : 对于一定范围内的系列化合物与同一种受体发生反 应时 , 化合物与受体之间的作用方式相类似 , 从而使得化合物 - 受体反应的自由。

15、能变化 G 与化合物本身的反应活性之间存在线性相关关系。 0010 基于以上基础理论的分析, 本发明提供了一种通过量子化学方法构建定量构效关 系模型来预测有机化合物急性毒性的方法, 步骤如下 : 0011 1) 通过进行毒性试验或者通过查阅毒性数据库和相关文献, 获得所要研究的有机 化合物的急性毒性数据 : 半数致死剂量 LD50或半数致死浓度 LC50; 0012 2) 利用量子化学软件 Gaussian 对所要研究的有机化合物进行几何结构优化, 获 得量子化学参数 : 分子体积 MV、 相对分子质量 MW、 分子最高占据轨道能 EHOMO、 分子最低空轨 道能ELUMO、 前线轨道能级差E。

16、、 分子偶极矩、 分子的溶剂化能Esol、 分子的电子能ET、 分子 的最正原子净电荷Q+、 分子的最负原子净电荷Q-、 分子的最正氢原子净电荷QH, 同时加入源 于 SciFinder 数据库的疏水性参数 logP, 共同作为结构描述符 ; 说 明 书 CN 103646180 A 4 3/4 页 5 0013 3) 将得到的毒性数据按其毒性大小抽取 1/4 1/5 作为验证集数据, 其余为训练 集数据, 训练集用来构建预测模型, 验证集用来验证模型的预测能力 ; 0014 4) 以通过量子化学计算所得训练集有机化合物的逐个量子化学参数为自变量, 有 机化合物对生物毒性数据为因变量, 编写基。

17、于偏最小二乘逐步线性回归的程序, 得到各个 参数的复相关系数、 F- 检验值、 残差平方和, 建立各种结构描述符与毒性之间的定量关系模 型 ; 在此过程中观察各参数的相关性, 以减少多元统计分析中的共线性, 当两参数的相关性 大于 0.7 时, 剔除其中之一, 最后获得回归方程, 回归方程的复相关系数 R2大于 0.7 时, 预 示建立的模型拟合效果良好, R2越大, 拟合效果越好 ; 0015 5) 将验证集数据带入获得的回归方程, 得到其预测值, 然后根据外部预测能力评 价系数 Q2ext的值判定外部预测能力的好坏 ; 当 Q2ext大于 0.7 时, 预示建立的模型具有良好 的外部预测能。

18、力, Q2ext越大, 外部预测能力越好。 0016 其中, 上述外部预测能力评价系数 Q2ext如公式 (1) 所示 : 0017 0018 (yi为验证集实验值,为验证集预测值, 为训练集实验值均值) 。 0019 上述通过量子化学方法构建定量构效关系模型来预测有机化合物的急性毒性的 方法中 : 步骤 1) 所述有机化合物优选是苯胺衍生物或卤代苯衍生物。 0020 本发明提供的通过量子化学方法构建定量构效关系模型来预测化合物毒性的方 法, 可以根据化合物结构快捷、 有效的预测出其毒性, 从而为化学品风险评价和环境监管提 供必要的基础数据, 具有重要的社会价值和经济价值。 附图说明 0021。

19、 图1为训练集苯胺衍生物对黑头呆鱼急性毒性lnLC50的实验值, 预测值和残差值 的分布图。 0022 图2为验证集苯胺衍生物对黑头呆鱼急性毒性lnLC50的实验值, 预测值和残差值 的分布图。 0023 图 3 为 QSAR 模型建立的示意图。 具体实施方式 0024 实施例 1 : 通过量子化学手段构建苯胺衍生物对黑头呆鱼急性毒性的预测模型。 0025 通过从 QSAR toolbox 查得 50 个苯胺衍生物对黑头呆鱼急性毒性数据 LC50, 按其 毒性大小排列后每五个取一种物质作为验证集数据, 总数为10种, 其余40种物质的急性毒 性作为训练集。 0026 运用量子化学软件 Gaus。

20、sian, 选取分子体积 MV、 相对分子质量 MW、 分子最高占据 轨道能 EHOMO, 分子最低空轨道能 ELUMO, 前线轨道能级差 E, 分子偶极矩 、 分子的溶剂化 说 明 书 CN 103646180 A 5 4/4 页 6 能 Esol、 分子的电子能 ET、 分子的最正原子净电荷 Q+、 分子的最负原子净电荷 Q-、 分子的最 正氢原子净电荷 QH等十几个量子化学参数和疏水性参数 logP 作为自变量, lnLC50 作为因 变量, 运用自编的基于偏最小二乘逐步线性回归的程序, 建立定量构效关系模型。 在此过程 中观察各参数的相关性, 以减少多元统计分析中的共线性, 当两参数的。

21、相关性较高时 (大于 0.7) , 剔除其中之一, 最后获得回归方程如下 : 0027 (判定标准 : 回归方程的复相关系数 R2大于 0.7 时说明模型的拟合效果良好, R2越 大, 拟合效果越好。当 Q2ext大于 0.7 时, 说明模型具有较好的外部预测能力, Q2ext越大, 外部 预测能力越好。 ) 0028 lnLC50=-0.033MV+0.002ET+8.330 (2) 0029 (R2=0.908,F=183.576, n=40) 0030 R2=0.908, 说明模型的拟合能力优秀。 0031 将验证集的数据带入获得的回归方程 (2) , 得到其预测值。根据公式 (1)得 。

22、Q2ext=0.884, 说明模型具有良好的外部预测能力。结果见附图。 0032 实施例 2 : 通过量子化学手段构建卤代苯衍生物对大型蚤急性毒性的预测模型。 0033 通过从 QSAR toolbox 查得 40 个卤代苯衍生物对大型蚤急性毒性数据 LC50, 按其 毒性大小排列后每五个取一种物质作为验证集数据, 总数为 8 种, 其余 32 种物质的急性毒 性作为训练集。 0034 (变量选择和判定标准与实例 1 相同) 0035 拟合公式为 : lnLC50=-1.180logp+5.529 0036 (R2=0.730, F=75.883,Q2ext=0.839, n=32) 0037。

23、 (附图类似实施例 1) 。 0038 实施例 3 : 通过量子化学手段构建有机磷农药对绿藻急性毒性的预测模型。 0039 通过从 QSAR toolbox 查得 40 个有机磷农药对绿藻急性毒性数据 LC50, 按其毒性 大小排列后每五个取一种物质作为验证集数据, 总数为 8 种, 其余 32 种物质的急性毒性作 为训练集。 (变量选择和判定标准与实例 1 相同) 0040 拟合公式为 : lnEC50=-1.886log p+0.027MV+2.64 0041 (R2=0.805,F=53.537,Q2ext=0.706,n=32) 0042 (附图类似实例 1) 。 说 明 书 CN 103646180 A 6 1/2 页 7 图 1 图 2 说 明 书 附 图 CN 103646180 A 7 2/2 页 8 图 3 说 明 书 附 图 CN 103646180 A 8 。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1