《机器学习和工艺仿真的污水处理目标参数预测方法.pdf》由会员分享,可在线阅读,更多相关《机器学习和工艺仿真的污水处理目标参数预测方法.pdf(11页珍藏版)》请在专利查询网上搜索。
1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201910409208.1 (22)申请日 2019.05.17 (71)申请人 中冶华天工程技术有限公司 地址 243000 安徽省马鞍山市经济技术开 发区湖西南路259号福昌工业园 申请人 中冶华天南京工程技术有限公司 (72)发明人 钱小聪韦雪文高心宇王星星 周煜申 (74)专利代理机构 马鞍山市金桥专利代理有限 公司 34111 代理人 王益西 (51)Int.Cl. G06F 17/50(2006.01) G06Q 10/04(2012.01) G06N 20/00(。
2、2019.01) (54)发明名称 一种机器学习和工艺仿真的污水处理目标 参数预测方法 (57)摘要 本发明公开了一种机器学习和工艺仿真的 污水处理目标参数预测方法, 涉及污水处理技术 领域。 该机器学习和工艺仿真的污水处理目标参 数预测方法, 包括如下步骤: 同时建立和维护工 艺仿真模型和机器学习模型。 该机器学习和工艺 仿真的污水处理目标参数预测方法, 把机器学习 和工艺仿真进行集成, 对污水处理的某个或多个 目标参数进行预测, 不同于单一的机器学习, 也 不同于单一工艺仿真模型, 而是巧妙地把仿真模 型和机器学习模型在数据构建和误差验证上进 行互补, 成为一种新的智能模型, 从而很好的保。
3、 证了污水处理过程积累的历史样本的质量, 以及 保证了正负样本的平衡, 同时加强了样本空间分 布的合理性, 加强了机器学习的效果。 权利要求书2页 说明书5页 附图3页 CN 110110466 A 2019.08.09 CN 110110466 A 1.一种机器学习和工艺仿真的污水处理目标参数预测方法, 其特征在于: 包括如下步 骤: S1、 同时建立和维护工艺仿真模型和机器学习模型, 并把工艺仿真模型在软件上开发 实现为工艺仿真模块, 把机器学习模型在软件上开发实现为机器学习引擎; S2、 工艺仿真模型的仿真输出记录到数据库里形成记录, 为机器学习模型建模和优化 提供样本, 机器学习模型的。
4、性能评价, 通过分析得出新增的仿真需求, 对工艺仿真模型进行 驱动; S3、 建立污水处理目标参数预测模型, 具体操作如下: 3-1.根据数据库里保存的污水处理厂生产运行历史记录, 完成工艺仿真模块中各配置 项的校准。 3-2.对于校准好的工艺仿真模块, 根据输入数据(进水数据、 环境数据以及过去时刻的 输出数据), 得到仿真计算的输出。 3-3.把通过仿真得到各组数据, 以记录的方式, 逐条加入到数据库中, 和历史数据记录 合并, 作为机器学习所使用的样本库。 3-4.把样本库里的样本划分为训练集和测试集, 划分的方法包括交叉验证和hold- out、 bootstrapping方法。 3-。
5、5.建立机器学习模型。 3-6.评价机器学习模型的性能, 如果接受评价结果, 转入步骤3-7, 否则转入步骤3-8。 3-7.将模型参数配置到实际预测所用的机器学习引擎中。 3-8.进一步判断性能不理想的原因在于机器学习模型的参数, 还是样本数据本身的问 题, 如果原因在于机器学习模型的参数, 则进行步骤3-9, 否则进入步骤3-10。 3-9.尝试通过调整机器学习模型的参数对模型进行改进。 3-10.评估需要扩充样本的类型Ti, 和每类样本的数量qi, i1,2,.,N。 3-11.对于每类样本Ti, 通过专业知识映射出相应的工艺场景Ci。 3-12.在工艺仿真模块中, 配置符合工艺场景Ci。
6、的输入参数集合, 这样的集合共有qi套。 当每一套输入进行仿真计算得到输出后, 形成一条完整的记录。 3-13.把条构建的记录加入到样本空间中; S4、 应用污水处理目标参数预测模型进行计算, 具体操作如下: 4-1.通过传感器、 仪器仪表和PLC设备实时采集并检测得到污水处理厂的进水数据、 出 水数据和与工艺有关的数据。 4-2.把步骤4-1得到的数据, 送入机器学习引擎, 得到目标参数的预测值。 4-3.当检测或化验获得目标参数真实值时, 把它与目标参数预测值按照误差评价准则 进行评价计算。 4-4.根据误差评价结果, 对机器学习模型参数进行调整。 4-5.根据误差评价结果, 结合专业知识。
7、, 对仿真器模型参数进行调整。 4-6.将步骤4-1采集到数据和步骤4-3中采集到的目标参数真实值, 构成完整的记录, 写入到历史数据库中。 2.根据权利要求1所述的一种机器学习和工艺仿真的污水处理目标参数预测方法, 其 权利要求书 1/2 页 2 CN 110110466 A 2 特征在于: 在步骤S3中的步骤3-1中, 进水数据包括且不局限于水量、 水温和水质(COD、 氨 氮、 pH、 SS和ORP)数据; 出水数据包括且不局限于水量和水质(COD、 氨氮、 总氮和总磷)数据; 与工艺有关的数据包括各工艺段与污水有关的监测数据(溶解氧、 COD、 氨氮、 硝氮、 SS、 pH、 水温和碱。
8、度)、 与污泥有关的监测数据、 生产设备(曝气装置、 鼓风机和泵站)运行数据、 药物 投放数据。 3.根据权利要求1所述的一种机器学习和工艺仿真的污水处理目标参数预测方法, 其 特征在于: 在步骤S3中的步骤3-1中, 对于不具备实时检测条件, 采用实验室化验得到数据, 也将被记录下来, 通过适当处理后, 和实时检测到的数据一起作为输入数据。 4.根据权利要求1所述的一种机器学习和工艺仿真的污水处理目标参数预测方法, 其 特征在于: 在步骤S3中的步骤3-5中, 所用模型可以是基于神经网络的、 基于支持向量机的、 基于决策树的、 基于贝叶斯决策的、 基于概率图的、 基于深度学习的, 也可以是上。
9、述模型的 改进或变种, 还可以是在上述模型中同时选择若干种作为基学习器并在其基础上进行集成 学习。 权利要求书 2/2 页 3 CN 110110466 A 3 一种机器学习和工艺仿真的污水处理目标参数预测方法 技术领域 0001 本发明涉及污水处理技术领域, 具体为一种机器学习和工艺仿真的污水处理目标 参数预测方法。 背景技术 0002 当前, 活性污泥法是城镇污水处理、 工业废水处理过程中普遍使用的工艺。 在采用 活性污泥法进行污水处理的生产过程中, 经常需要对一些指标进行重点监测, 比如出水的 水质是否达标, 工艺的关键控制参数是否匹配当前进水和环境的变化, 由于这些指标的采 集化验存在。
10、时间上的迟滞, 因此把指标作为目标参数进行预测是污水处理过程中普遍的需 求。 但是, 污水处理过程本身就是一个多时变、 高耦合、 大时滞的非线性系统, 给目标参数的 预测带来了很大的困难。 0003 为了更好地对目标参数的预测, 基于国际水协会发布的活性污泥模型(包括ASM1、 ASM2、 ASM2d、 ASM3模型)构建计算机仿真模型, 计算污水处理过程的目标参数, 是一种解决 方案, 并已在一些污水处理厂的设计和运行中得到应用。 但是, 基于活性污泥模型的计算机 仿真方法不仅在初始建模时需要基于专业知识进行大量的仿真参数调试工作, 而且在实际 应用中仍然需要根据历史数据周期性地去优化参数,。
11、 即使这样, 仍难以根据污水处理实际 运行中进水的变化做出实时反应并给出有效的控制策略。 0004 在现有技术中, 采用机器学习来进行污水处理目标参数的预测, 但是在实际应用 中, 机器学习的效果不仅与选择的模型和参数有关, 还与是否具备足够数量的合格样本息 息相关, 污水处理过程积累的历史样本往往存在质量问题(比如仪表示数的漂移、 测量误 差), 以及正负样本的不平衡(比如记录出水水质超标的负样本数量不足), 存在样本空间分 布的不合理, 直接导致机器学习的效果低于预期。 发明内容 0005 (一)解决的技术问题 0006 针对现有技术的不足, 本发明提供了一种机器学习和工艺仿真的污水处理目。
12、标参 数预测方法, 解决了污水处理目标参数预测的机器学习方法实际应用效果不佳问题。 这是 因为机器学习的效果不仅与选择的模型和参数有关, 还与是否具备足够数量的合格样本息 息相关。 污水处理过程积累的历史样本往往存在质量问题(比如仪表示数的漂移、 测量误 差), 以及正负样本的不平衡(比如记录出水水质超标的负样本数量不足), 存在样本空间分 布的不合理, 直接导致机器学习的效果低于预期的问题。 0007 (二)技术方案 0008 为实现以上目的, 本发明通过以下技术方案予以实现: 一种机器学习和工艺仿真 的污水处理目标参数预测方法, 包括如下步骤: 0009 S1、 同时建立和维护工艺仿真模型。
13、和机器学习模型, 并把工艺仿真模型在软件上 开发实现为工艺仿真模块, 把机器学习模型在软件上开发实现为机器学习引擎; 说明书 1/5 页 4 CN 110110466 A 4 0010 S2、 工艺仿真模型的仿真输出记录到数据库里形成记录, 为机器学习模型建模和 优化提供样本, 机器学习模型的性能评价, 通过分析得出新增的仿真需求, 对工艺仿真模型 进行驱动; 0011 S3、 建立污水处理目标参数预测模型, 具体操作如下: 0012 3-1.根据数据库里保存的污水处理厂生产运行历史记录, 完成工艺仿真模块中各 配置项的校准。 0013 3-2.对于校准好的工艺仿真模块, 根据输入数据(进水数。
14、据、 环境数据以及过去时 刻的输出数据), 得到仿真计算的输出。 0014 3-3.把通过仿真得到各组数据, 以记录的方式, 逐条加入到数据库中, 和历史数据 记录合并, 作为机器学习所使用的样本库。 0015 3-4.把样本库里的样本划分为训练集和测试集, 划分的方法包括交叉验证和 hold-out、 bootstrapping方法。 0016 3-5.建立机器学习模型。 0017 3-6.评价机器学习模型的性能, 如果接受评价结果, 转入步骤3-7, 否则转入步骤 3-8。 0018 3-7.将模型参数配置到实际预测所用的机器学习引擎中。 0019 3-8.进一步判断性能不理想的原因在于机。
15、器学习模型的参数, 还是样本数据本身 的问题, 如果原因在于机器学习模型的参数, 则进行步骤3-9, 否则进入步骤3-10。 0020 3-9.尝试通过调整机器学习模型的参数对模型进行改进。 0021 3-10.评估需要扩充样本的类型Ti, 和每类样本的数量qi, i1,2,.,N。 0022 3-11.对于每类样本Ti, 通过专业知识映射出相应的工艺场景Ci。 0023 3-12.在工艺仿真模块中, 配置符合工艺场景Ci的输入参数集合, 这样的集合共有 qi套。 当每一套输入进行仿真计算得到输出后, 形成一条完整的记录。 00243-13.把条构建的记录加入到样本空间中; 0025 S4、 。
16、应用污水处理目标参数预测模型进行计算, 具体操作如下: 0026 4-1.通过传感器、 仪器仪表和PLC设备实时采集并检测得到污水处理厂的进水数 据、 出水数据和与工艺有关的数据。 0027 4-2.把步骤4-1得到的数据, 送入机器学习引擎, 得到目标参数的预测值。 0028 4-3.当检测或化验获得目标参数真实值时, 把它与目标参数预测值按照误差评价 准则进行评价计算。 0029 4-4.根据误差评价结果, 对机器学习模型参数进行调整。 0030 4-5.根据误差评价结果, 结合专业知识, 对仿真器模型参数进行调整。 0031 4-6.将步骤4-1采集到数据和步骤4-3中采集到的目标参数真。
17、实值, 构成完整的记 录, 写入到历史数据库中。 0032 优选的, 在步骤S3中的步骤3-1中, 进水数据包括且不局限于水量、 水温和水质 (COD、 氨氮、 pH、 SS和ORP)数据; 出水数据包括且不局限于水量和水质(COD、 氨氮、 总氮和总 磷)数据; 与工艺有关的数据包括各工艺段与污水有关的监测数据(溶解氧、 COD、 氨氮、 硝 氮、 SS、 pH、 水温和碱度)、 与污泥有关的监测数据、 生产设备(曝气装置、 鼓风机和泵站)运行 说明书 2/5 页 5 CN 110110466 A 5 数据、 药物投放数据。 0033 优选的, 在步骤S3中的步骤3-1中, 对于不具备实时检。
18、测条件, 采用实验室化验得 到数据, 也将被记录下来, 通过适当处理后, 和实时检测到的数据一起作为输入数据。 0034 优选的, 在步骤S3中的步骤3-5中, 所用模型可以是基于神经网络的、 基于支持向 量机的、 基于决策树的、 基于贝叶斯决策的、 基于概率图的、 基于深度学习的, 也可以是上述 模型的改进或变种, 还可以是在上述模型中同时选择若干种作为基学习器并在其基础上进 行集成学习。 0035 (三)有益效果 0036 本发明提供了一种机器学习和工艺仿真的污水处理目标参数预测方法。 具备以下 有益效果: 该机器学习和工艺仿真的污水处理目标参数预测方法, 把机器学习和工艺仿真 进行集成,。
19、 对污水处理的某个或多个目标参数进行预测, 不同于单一的机器学习, 也不同于 单一工艺仿真模型, 而是巧妙地把仿真模型和机器学习模型在数据构建和误差验证上进行 互补, 成为一种新的智能模型, 一方面采集并记录入水数据、 出水数据和污水处理运行的工 艺数据, 形成历史数据集, 另一方面根据专业知识、 设计数据和历史数据, 建立并维护工艺 仿真模型, 并通过模型仿真出更多机器学习所需的数据, 最后, 把历史数据和仿真数据合并 为训练数据集合, 通过机器学习方法去对污水处理过程的目标参数进行预测, 从而很好的 保证了污水处理过程积累的历史样本的质量, 以及保证了正负样本的平衡, 同时加强了样 本空间。
20、分布的合理性, 加强了机器学习的效果。 附图说明 0037 图1是机器学习和工艺仿真和耦合关系暨整体模型的框图 0038 图2是本发明中建模步骤的说明。 0039 图3是本发明的应用流程说明。 具体实施方式 0040 下面将结合本发明实施例中的附图, 对本发明实施例中的技术方案进行清楚、 完 整地描述, 显然, 所描述的实施例仅仅是本发明一部分实施例, 而不是全部的实施例。 基于 本发明中的实施例, 本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他 实施例, 都属于本发明保护的范围。 0041 请参阅图1-3, 本发明提供一种技术方案: 一种机器学习和工艺仿真的污水处理目 标参数预。
21、测方法, 包括如下步骤: 0042 S1、 同时建立和维护工艺仿真模型和机器学习模型, 并把工艺仿真模型在软件上 开发实现为工艺仿真模块, 把机器学习模型在软件上开发实现为机器学习引擎; 0043 S2、 工艺仿真模型的仿真输出记录到数据库里形成记录, 为机器学习模型建模和 优化提供样本, 机器学习模型的性能评价, 通过分析得出新增的仿真需求, 对工艺仿真模型 进行驱动; 0044 S3、 建立污水处理目标参数预测模型, 具体操作如下: 0045 3-1.根据数据库里保存的污水处理厂生产运行历史记录, 完成工艺仿真模块中各 配置项的校准。 说明书 3/5 页 6 CN 110110466 A 。
22、6 0046 3-2.对于校准好的工艺仿真模块, 根据输入数据(进水数据、 环境数据以及过去时 刻的输出数据), 得到仿真计算的输出。 0047 3-3.把通过仿真得到各组数据, 以记录的方式, 逐条加入到数据库中, 和历史数据 记录合并, 作为机器学习所使用的样本库。 0048 3-4.把样本库里的样本划分为训练集和测试集, 划分的方法包括交叉验证和 hold-out、 bootstrapping方法。 0049 3-5.建立机器学习模型。 0050 3-6.评价机器学习模型的性能, 如果接受评价结果, 转入步骤3-7, 否则转入步骤 3-8。 0051 3-7.将模型参数配置到实际预测所用。
23、的机器学习引擎中。 0052 3-8.进一步判断性能不理想的原因在于机器学习模型的参数, 还是样本数据本身 的问题, 如果原因在于机器学习模型的参数, 则进行步骤3-9, 否则进入步骤3-10。 0053 3-9.尝试通过调整机器学习模型的参数对模型进行改进。 0054 3-10.评估需要扩充样本的类型Ti, 和每类样本的数量qi, i1,2,.,N。 0055 3-11.对于每类样本Ti, 通过专业知识映射出相应的工艺场景Ci。 0056 3-12.在工艺仿真模块中, 配置符合工艺场景Ci的输入参数集合, 这样的集合共有 qi套。 当每一套输入进行仿真计算得到输出后, 形成一条完整的记录。 。
24、00573-13.把条构建的记录加入到样本空间中; 0058 S4、 应用污水处理目标参数预测模型进行计算, 具体操作如下: 0059 4-1.通过传感器、 仪器仪表和PLC设备实时采集并检测得到污水处理厂的进水数 据、 出水数据和与工艺有关的数据(进水数据包括且不局限于水量、 水温和水质(COD、 氨氮、 pH、 SS和ORP)数据; 出水数据包括且不局限于水量和水质(COD、 氨氮、 总氮和总磷)数据; 与 工艺有关的数据包括各工艺段与污水有关的监测数据(溶解氧、 COD、 氨氮、 硝氮、 SS、 pH、 水 温和碱度)、 与污泥有关的监测数据、 生产设备(曝气装置、 鼓风机和泵站)运行数。
25、据、 药物投 放数据, 对于不具备实时检测条件, 采用实验室化验得到数据, 也将被记录下来, 通过适当 处理后, 和实时检测到的数据一起作为输入数据)。 0060 4-2.把步骤4-1得到的数据, 送入机器学习引擎, 得到目标参数的预测值。 0061 4-3.当检测或化验获得目标参数真实值时, 把它与目标参数预测值按照误差评价 准则进行评价计算。 0062 4-4.根据误差评价结果, 对机器学习模型参数进行调整。 0063 4-5.根据误差评价结果, 结合专业知识, 对仿真器模型参数进行调整(所用模型可 以是基于神经网络的、 基于支持向量机的、 基于决策树的、 基于贝叶斯决策的、 基于概率图 。
26、的、 基于深度学习的, 也可以是上述模型的改进或变种, 还可以是在上述模型中同时选择若 干种作为基学习器并在其基础上进行集成学习)。 0064 4-6.将步骤4-1采集到数据和步骤4-3中采集到的目标参数真实值, 构成完整的记 录, 写入到历史数据库中。 0065 综上所述, 该机器学习和工艺仿真的污水处理目标参数预测方法, 把机器学习和 工艺仿真进行集成, 对污水处理的某个或多个目标参数进行预测, 不同于单一的机器学习, 说明书 4/5 页 7 CN 110110466 A 7 也不同于单一工艺仿真模型, 而是巧妙地把仿真模型和机器学习模型在数据构建和误差验 证上进行互补, 成为一种新的智能。
27、模型, 一方面采集并记录入水数据、 出水数据和污水处理 运行的工艺数据, 形成历史数据集, 另一方面根据专业知识、 设计数据和历史数据, 建立并 维护工艺仿真模型, 并通过模型仿真出更多机器学习所需的数据, 最后, 把历史数据和仿真 数据合并为训练数据集合, 通过机器学习方法去对污水处理过程的目标参数进行预测, 从 而很好的保证了污水处理过程积累的历史样本的质量, 以及保证了正负样本的平衡, 同时 加强了样本空间分布的合理性, 加强了机器学习的效果。 0066 需要说明的是, 在本文中, 诸如第一和第二等之类的关系术语仅仅用来将一个实 体或者操作与另一个实体或操作区分开来, 而不一定要求或者暗。
28、示这些实体或操作之间存 在任何这种实际的关系或者顺序。 而且, 术语 “包括” 、“包含” 或者其任何其他变体意在涵盖 非排他性的包含, 从而使得包括一系列要素的过程、 方法、 物品或者设备不仅包括那些要 素, 而且还包括没有明确列出的其他要素, 或者是还包括为这种过程、 方法、 物品或者设备 所固有的要素。 0067 以上示意性的对本发明及其实施方式进行了描述, 该描述没有限制性, 附图中所 示的也只是本发明的实施方式之一, 实际的结构并不局限于此。 所以, 如果本领域的普通技 术人员, 在不脱离本发明创造宗旨的情况下, 设计出与该技术方案相似的结构方式及实施 例, 均应属于本发明的保护范围。 说明书 5/5 页 8 CN 110110466 A 8 图1 说明书附图 1/3 页 9 CN 110110466 A 9 图2 说明书附图 2/3 页 10 CN 110110466 A 10 图3 说明书附图 3/3 页 11 CN 110110466 A 11 。