基于多因子小波神经网络模型的水文时间序列预测方法.pdf

上传人:b*** 文档编号:973670 上传时间:2018-03-22 格式:PDF 页数:16 大小:500.43KB
返回 下载 相关 举报
摘要
申请专利号:

CN201110130040.4

申请日:

2011.05.19

公开号:

CN102323970A

公开日:

2012.01.18

当前法律状态:

驳回

有效性:

无权

法律详情:

发明专利申请公布后的驳回IPC(主分类):G06F 19/00申请公布日:20120118|||实质审查的生效IPC(主分类):G06F 19/00申请日:20110519|||公开

IPC分类号:

G06F19/00(2011.01)I; G06N3/02

主分类号:

G06F19/00

申请人:

河海大学

发明人:

朱跃龙; 李士进; 王继民; 范青松; 冯钧; 万定生

地址:

210098 江苏省南京市鼓楼区西康路1号

优先权:

专利代理机构:

南京经纬专利商标代理有限公司 32200

代理人:

许方

PDF下载: PDF下载
内容摘要

本发明公开了一种基于多因子小波神经网络模型的水文时间序列预测方法。本发明提出了一种多因子小波神经网络预测模型用于水文时间序列预测,该模型以多时间序列信息作为输入,不仅包括预测目标时间序列的当前小波系数,还包括与此时间序列相关的其它时间序列的当前小波系数,并根据其与预测目标时间序列之间互信息作为评判两者相关性的度量,选择相关性强的其它时间序列;进一步利用基于加权相关系数的小波函数选择标准,为该模型选择最优的小波函数。相比现有技术,本发明方法具有更高的预测准确性,以及更好的可扩展性和实用价值。

权利要求书

1: 一种基于多因子小波神经网络模型的水文时间序列预测方法, 该方法首先根据待预 测的水文时间序列建立小波神经网络水文时间序列预测模型, 然后按照建立的预测模型进 行水文时间序列预测, 其特征在于, 所述小波神经网络水文时间序列预测模型为多因子小 波神经网络水文时间序列预测模型, 以多时间序列信息作为输入, 不仅包括预测目标时间 序列的当前小波系数, 还包括与此时间序列相关的其它时间序列的当前小波系数。
2: 如权利要求 1 所述基于多因子小波神经网络模型的水文时间序列预测方法, 其特征 在于, 所述与预测目标时间序列相关的其它时间序列, 是根据其与预测目标时间序列之间 互信息作为评判两者相关性的度量, 互信息值较大, 则相关性强 ; 具体按照以下方法确定 : 步骤 1、 提供与待预测序列 O 可能有关的若干原始输入序列 I1,I2,… ,In, n 是输入序 列数目 ; 步骤 2、 对待预测序列 O 和原始输入序列 I1,I2,… ,In 进行离散化, 得到离散序列 Do,D1,D2,… ,Dn ; 步骤 3、 分别计算 Do 与 D1,D2,… ,Dn 之间的互信息, 结果记为 M1,M2,… ,Mn; 步骤 4、 根据 M1,M2,…,Mn, 选择 Mi>Th 的原始输入序列 Ii 作为待预测序列小波神经网 络建模时的相关序列, i 为 1 到 N 之间的整数 ; Th 为预先设定的阈值。
3: 如权利要求 2 所述基于多因子小波神经网络模型的水文时间序列预测方法, 其特征 在于, 采用等概率划分法对待预测序列 O 和原始输入序列 I1,I2,… ,In 进行离散化。
4: 如权利要求 2 所述基于多因子小波神经网络模型的水文时间序列预测方法, 其特征 在于, 所述阈值 Th 的值为 0.15。
5: 如权利要求 1—4 任一项所述基于多因子小波神经网络模型的水文时间序列预测方 法, 其特征在于, 所述多因子小波神经网络水文时间序列预测模型中所使用的小波函数按 照以下方法确定 : 步骤 1、 分别使用待选的小波函数构建小波神经网络水文时间序列预测模型并进行预 测; 步骤 2、 对于每一种待选的小波函数, 分别按照以下方法得到相关系数向量 : 对不同水平上的小波分解序列, 分别统计预测目标时间序列的小波序列自相关系数, 以及预测目标时间序列和与预测目标时间序列相关的其它时间序列的小波系数序列的相 关系数 ; 最后采用加权的方法综合各个水平上的相关系数, 得到相关系数向量 ; 步骤 3、 根据采用各小波函数预测所得到的相关系数向量, 确定最终使用的小波函数。
6: 如权利要求 5 所述基于多因子小波神经网络模型的水文时间序列预测方法, 其特征 在于, 两个时间序列的相关系数, 按照以下方法得到 : 假设两个时间序列分别为 、 , 时间序列的长 度为 N ; 则这两个时间序列之间的相关系数按照下式计算, , 2 式中, 是两个序列时滞为 T 的相关系数, 是第一个序列的均值, 是第二个序列 的均值 ; 单个时间序列的时滞为 T 的自相关系数, 按照以下方法得到 : 将该时间序列向右移动 T 个位置生成一个新的时间序列, 然后按照上式计算该时间序 列与新生成的时间序列的相关系数, 得到的相关系数即为该时间序列时滞为 T 的自相关系 数。

说明书


基于多因子小波神经网络模型的水文时间序列预测方法

    技术领域 本发明涉及一种复杂时间序列预测方法, 尤其涉及一种基于多因子小波神经网络 模型的水文时间序列预测方法, 属于水文预报技术领域。
     背景技术 时间序列数据挖掘研究主要包括 : 预测、 分类、 相似性搜索及序列模式挖掘, 而复 杂时间序列预测是数据挖掘领域具有挑战性的问题之一。 解决复杂时间序列预测问题的一 个较好的方法是基于小波神经网络模型的时间序列预测方法。
     小波分析是 Fourier 分析发展史上的一个里程碑式的进展, 具有时、 频同时局部 化的优点, 因此被誉为数学 “显微镜” 。与傅立叶分析仅能够提供频域表示相比较, 小波变 换能够同时提供时频局部化特征, 且克服了短时傅立叶变换的分辨率有限的缺点。离散小 波分解可以对时间序列进行多尺度分解, 能够提取不同频率区间的成分序列, 实现对时间 序列的分频研究。借助于小波的多分辨分解功能, 可以从原始序列得到分辨率 “从粗到细”
     的多尺度特征, 通过对这些小波特征的学习可以对时间序列的潜在的多因素变化过程有更 加显性的描述, 所以网络更加容易 “抓住” 输入和输出数据之间的内在的联系和规律。相 反, 基于传统的单分辨率学习的网络通常很难描述复杂的时间序列, 例如混沌序列, 其收敛 速度慢, 泛化能力差。小波变换将复杂的时间序列分解成若干不同频率的细节信号和背景 信号, 细节信号是高频部分, 背景信号是低频部分, 它们是原始时间序列在不同频率区间上 的表现, 相对原始序列的比重不同, 因而对原始时间序列的预测起到的作用不同。小波网 络模型结合了小波分析的在信号处理上的时间域 - 频率域的多分辨性, 和神经网络的强大 的非线性逼近特性, 兼有二者的优点。以上述方式建立的模型称为小波网络模型 (Wavelet Network Model), 简记为 WNN。
     很多学者对小波网络模型对不同领域的时间序列预测进行了研究, 例如 : [Chen Yue-hui, Yang Bo, Dong Ji-wen.Time-series prediction using a local linear wavelet neural network.Neurocomputing, 2006, 69(6) : 449-465]、 [Dash P.K., Nayak Maya, Senapati M.R., et al, Mining for similarities in time series data using wavelet-based feature vectors and neural networks, Engineering Applications of Artificial Intelligence, 2007, 20(2) : 185-201]、 [Gan Xiaobing, Liu Ying, and Austin Francis R. : A prediction method for time series based on wavelet neural networks.Proceedings of CIS2005, pp : 902-908]、 [Benaouda D., Murtagh Fionn, and Starck Jean-Luc, et al.Wavelet-based nonlinear multiscale decomposition model for electricity load forecasting.Neurocomputing, 2006, 70(1-3) : 139-154]、 [Chen Di ; Feng Hai-Hang ; Lin Qing-jia ; et al, Multi-scale Internet traffic prediction using wavelet neural network combined model, Proceedings of First International Conference on Communications and Networking in China, 2006, pp : 1-5]、 [ 李爱国, 覃 征, 滑动窗口二次自回归模型预测非线性时间序列, 计算机学报, 2004, 27(07) : 1004-1008]等。但这些文献仅仅是利用小波分解对单道时间序列进行分解。仅仅依靠预测时间序列自 身提供的信息, 对于预测精度提高的作用具有一定局限性。 而在物理意义上, 一个系统内的 多时间序列往往具有相关性。
     水文预报 ( 例如径流预报 ) 对水资源的调配管理和防洪减灾的决策有着重要的意 义。 然而由于气候和下垫面等因素的综合影响, 径流表现出复杂的非线性和非平稳性特征, 一般包括确定性成分和随机成分。 神经网络具有很强的处理大规模复杂非线性动力学系统 的能力, 被广泛用于河道水情预报, 可以识别水流运动变化过程与其影响因子之间的复杂 非线性关系, 为河道水情预报提供了一条新的途径。 径流序列自身的组成比较复杂, 在一个 径流中含有多种频率成份, 所以有必要对其进行分频率研究, 而小波变换的方法提供了一 种便利的时频分析技术。小波和神经网络结合使用的方法近年来得到广泛关注, 利用此组 合模型进行水文预测成为研究热点。文献 [ 王文圣, 熊华康, 丁晶, 日流量预测的小波网络 模型初探, 水科学进展, 2004, 15(3) : 382-386] 中提出了一种小波网络模型用于对日流量 进行预测。该小波网络模型是在三层神经网络的基础上, 以 t 时刻原始信号分解的小波系 数 作为输入, 以 t+T 时刻的原始信号 f(t+T) 为输出而构建的模型 (T 是预 见期 )。然而该小波网络模型也仅利用单时间序列分解出来的小波系数, 对未来进行预测, 模型的预测能力是有限的。由于从原始时间序列分解出来的小波系数, 已经包含对时间序 列前期变化中长时间记忆和短时间记忆, 加入更多的前期小波系数往往不能够对预测目标 起到更好的辅助作用。 而且前期小波系数的加入, 使得模式输入个数增加, 相应的训练模式 集的复杂度也增加, 对神经网络结构的确定和训练时间提出更高要求。对于更加复杂时间 序列, 仅仅根据本时间序列的前期小波系数, 不能对时间序列未来的演变进行更好的刻画。 径流实际上跟系统内的其他水文要素具有相关关系, 如上下游关系站或相关站的水文要素 ( 包括流量、 水位、 气温和降水等 ) 对径流产生具有明显的影响关系。
     不同领域的时间序列数据具有不同特性, 仅利用同一种小波函数进行分解是不 合适的。文献 [ 桑燕芳, 王栋, 水文序列小波分析中小波函数选择方法, 水利学报, 2008, 39(3) : 295-300] 从序列重构角度, 应用蒙特卡罗方法, 通过模拟数据以及黄河利津站和浙 江白溪流域的实测水文序列, 探讨小波分析影响小波函数选择的因素, 进而建立合理选择 小波函数的依据。研究结果表明序列自身的变化特性是小波函数选择的重要影响因素。文 献 [ 刘素一, 权先璋, 张勇传, 不同小波函数对径流分析结果的影响, 水电能源科学, 2003, 21(1) : 29-31.] 通过训练多尺度预测模型的实验方法, 对比了几种小波函数对多尺度框架 下径流预测的影响。对于不同数据, 特别是大量数据情况下, 使用这种类似特征选择中的 Wrapper 方法确定最优的小波函数比较耗时。 发明内容 本发明所要解决的技术问题在于克服现有技术以单一时间序列作为小波神经网 络模型的输入进行水文时间序列预测的不足, 提供一种基于多因子小波神经网络模型的水 文时间序列预测方法。
     本发明的基于多因子小波神经网络模型的水文时间序列预测方法, 首先根据待预 测的水文时间序列建立小波神经网络水文时间序列预测模型, 然后按照建立的预测模型进 行水文时间序列预测, 其特征在于, 所述小波神经网络水文时间序列预测模型为多因子小
     波神经网络水文时间序列预测模型, 以多时间序列信息作为输入, 不仅包括预测目标时间 序列的当前小波系数, 还包括与此时间序列相关的其它时间序列的当前小波系数。
     进一步地, 所述与预测目标时间序列相关的其它时间序列, 是根据其与预测目标 时间序列之间互信息 (mutual information) 作为评判两者相关性的度量, 互信息值较大, 则相关性强 ; 具体按照以下方法确定 :
     步骤 1、 提供与待预测序列 O 可能有关的若干原始输入序列 I1, I2, ..., In, n 是输 入序列数目 ;
     步骤 2、 对待预测序列 O 和原始输入序列 I1, I2, ..., In 进行离散化, 得到离散序 列 Do, D1, D2, ..., Dn ;
     步骤 3、 分别计算 Do 与 D1, D2, ..., Dn 之间的互信息, 结果记为 M1, M2, ..., Mn ;
     步骤 4、 根据 M1, M2, ..., Mn, 选择 Mi > Th 的原始输入序列 Ii 作为待预测序列小 波神经网络建模时的相关序列, i 为 1 到 N 之间的整数 ; Th 为预先设定的阈值。
     更进一步地, 所述多因子小波神经网络水文时间序列预测模型中所使用的小波函 数按照以下方法确定 :
     步骤 1、 分别使用待选的小波函数构建小波神经网络水文时间序列预测模型并进 行预测 ; 步骤 2、 对于每一种待选的小波函数, 分别按照以下方法得到相关系数向量 :
     对不同水平上的小波分解序列, 分别统计预测目标时间序列的小波序列自相关系 数, 以及预测目标时间序列和与预测目标时间序列相关的其它时间序列的小波系数序列的 相关系数 ; 最后采用加权的方法综合各个水平上的相关系数, 得到相关系数向量 ;
     步骤 3、 根据采用各小波函数预测所得到的相关系数向量, 确定最终使用的小波函 数。
     其中, 两个时间序列的相关系数, 按照以下方法得到 :
     假设两个时间序列分别为 , 时间 序列的长度为 N ; 则这两个时间序列之间的相关系数按照下式计算,
     式中, 是两个序列时滞为 T 的相关系数, 是第一个序列的均值, 是第二个序列的均值 ;
     单个时间序列的时滞为 T 的自相关系数, 按照以下方法得到 :
     将该时间序列向右移动 T 个位置生成一个新的时间序列, 然后按照上式计算该时 间序列与新生成的时间序列的相关系数, 得到的相关系数即为该时间序列时滞为 T 的自相 关系数。
     本发明提出了一种多因子小波神经网络预测模型用于水文时间序列预测, 该模型 以多时间序列信息作为输入, 不仅包括预测目标时间序列的当前小波系数, 还包括与此时 间序列相关的其它时间序列的当前小波系数, 并根据其与预测目标时间序列之间互信息作为评判两者相关性的度量, 选择相关性强的其它时间序列 ; 进一步利用基于加权相关系数 的小波函数选择标准, 为该模型选择最优的小波函数。 相比现有技术, 本发明方法具有更高 的预测准确性, 以及更好的可扩展性和实用价值。 附图说明
     图 1 为本发明的多因子小波神经网络预测模型的结构示意图 ; 图 2 为本发明确定相关的其它时间序列的流程示意图 ; 图 3 为本发明选择最优小波函数的流程示意图。具体实施方式
     下面结合附图对本发明的技术方案进行详细说明 :
     本发明的多因子小波神经网络预测模型以多时间序列信息作为输入, 不仅包括预 测目标时间序列的当前小波系数, 还包括与此时间序列相关的其它时间序列的当前小波系 数, 其结构如图 1 所示, 其中要预测的站点为 A, 与 A 相关的站点为 B 至 I。也可将此多因子 小波神经网络预测模型称为河道小波网络模型, 简记为 RWNN。
     本发明的基于多因子小波神经网络模型的水文时间序列预测方法, 按照以下步骤进行 : 步骤 10、 确定相关输入时间序列 ;
     在信息论中, 熵 H(X) 被用来度量随机变量 X 的不确定性。假设 X 是一离散随机变 量, 熵 H(X) 被定义为 :
     与熵只能衡量单一变量的不确定性不同, 互信息可用来衡量两个以上随机变量之 间共有的信息量。假设 Y 是另一离散随机变量, 则 X 和 Y 之间的互信息 I(X ; Y) 被定义为 :
     可以证明互信息和熵有如下关系 :
     I(X ; Y) = H(X)-H(X|Y) = H(Y)-H(Y|X),
     I(X ; Y) = H(X)+H(Y)-H(X, Y)
     显然, 两个随机变量之间互信息越大, 它们之间相关性越强。关于互信息的详细 内容可参见文献 [Cover and Thomas, 1991T.M.Cover and J.A.Thomas, Elements of In formation Theory, Wiley, New York(1991).]。从时间序列预测角度看, 两个序列之间互 信息越大, 则通过其中一个序列预测另一个序列越准确。 并且, 由于小波变换之前的序列之 间可能存在非线性相关, 而互信息恰好能够反映不同变量之间的非线性相关性。 因此, 本发 明将时间序列之间互信息作为评判两者相关性的度量, 提出基于互信息的输入序列确定方 法, 如图 2 所示, 具体按照以下方法确定相关的输入时间序列 :
     步骤 11、 提供与待预测序列 O 可能有关的若干原始输入序列 I1, I2, ..., In, n是 输入序列数目 ;
     步骤 12、 对待预测序列 O 和原始输入序列 I1, I2, ..., In 进行离散化, 得到离散
     序列 Do, D1, D2, ..., Dn ; 常用的连续变量离散化方法主要有两种 : 等距离划分法和等概率 划分法, 一般后者效果比较好, 本发明优选文献 [Fraser and Swinney, 1986 A.M.Fraser an d H.L.Swinney, Independent coordinates for strange attractors from mutual informatio n, Phys.Rev.A 33(2)(1986), pp.1134-1140] 中提出的等概率划分法对时间序 列进行离散化 ;
     步骤 13、 分别计算 Do 与 D1, D2, ..., Dn 之间的互信息, 结果记为 M1, M2, ..., Mn ;
     步骤 14、 根据 M1, M2, ..., Mn, 选择 Mi > Th 的原始输入序列 Ii 作为待预测序列 小波神经网络建模时的相关序列, i 为 1 到 N 之间的整数 ; Th 为预先设定的阈值, 该阈值优 选 0.15。
     步骤 20、 对确定的相关输入序列和目标序列进行小波分解, 根据加权相关系数进 行小波选择 ;
     小波分解是一种有效的问题分解和特征提取工具, 下表 1 列举了目前常见的几种 小波函数及其特性。
     表 1 常用小波函数
     小波 Haar Db2 Db3 bior4.4 B3 spline
     正交性 Yes Yes Yes No No 滤波系数长度 2 4 6 9 5 支撑宽度 1 3 5 8 4 对称性 No Far from Far from Yes Yes但是在具体领域中, 存在不同性质的时间序列数据, 用不同的小波函数对这些 数据进行分解, 所产生的成分序列对建立的预测模型性能会有不同程度的影响。由于小 波滤波器具有不同的支撑长度和自身的滤波性质, 所以应该选择一个合适的小波对具 体的时间序列进行分解, 使得分解后的小波系数序列可以提高预测模型的性能。本发明 使用 t 时刻的不同时间序列的小波系数作为模型的输入, 而输出为预测时间序列的 t+T 原始数据。对于多因子预测模型, 设 t 时刻的模型输入包括预测时间序列的小波系数 和扩展的输入 平上的小波系数
     输出为原始时间序列的未来值 xa(t+T)。预测目标 xa(t+T) 也含有各个频率区间上的对应成分, 即不同水 根据时间序列分析中关于平稳时间序列预测理论 ( 具体可参见文献 [PBrockwell, A.Davis, Time series : theory and methods, 2nd.edition, New York, Springer, (Springer series in statistics), 2002]), 设有预测目标时间序列 {X(t), t= 1, ..., n} 的 T 时间间隔的自相关系数 又存在与 {X(t), t = 1, ..., n} 相关的时间序列 {Y(t), t = 1, ..., n} 且两者之间的 T 时间间隔的相关系数 如果 和 越大, 那么预测目标时间序列 {X(t), t = 1, ..., n} 的预测方差就越小。
     根据上述思想, 本发明针对所提出的多因子小波神经网络模型, 提出了一种基于 加权相关系数的小波函数选择标准, 对不同水平上的小波分解序列, 统计预测目标时间序 列的小波序列自相关系数和预测目标时间序列和多因子时间序列的小波系数序列相关系 数, 最后采用加权的方法综合各个水平上的相关系数, 如图 3 所示, 具体按照以下方法选择 最优的小波函数 :
     步骤 21、 分别使用待选的小波函数构建小波神经网络水文时间序列预测模型并进 行预测 ;
     步骤 22、 对于每一种待选的小波函数, 分别按照以下方法得到相关系数向量 :
     对不同水平上的小波分解序列, 分别统计预测目标时间序列的小波序列自相关系 数, 以及预测目标时间序列和与预测目标时间序列相关的其它时间序列的小波系数序列的 相关系数 ; 最后采用加权的方法综合各个水平上的相关系数, 得到相关系数向量 ;
     步骤 23、 根据采用各小波函数预测所得到的相关系数向量, 确定最终使用的小波 函数。
     其中, 两个时间序列的相关系数, 按照以下方法得到 :
     假设两个时间序列分别为 , 时间 序列的长度为 N ; 则这两个时间序列之间的相关系数按照下式计算,
     式中, 是两个序列时滞为 T 的相关系数, 是第一个序列的均值, 是第二个序列的均值 ; 单个时间序列的时滞为 T 的自相关系数, 按照以下方法得到 :
     将该时间序列向右移动 T 个位置生成一个新的时间序列, 然后按照上式计算该时 间序列与新生成的时间序列的相关系数, 得到的相关系数即为该时间序列时滞为 T 的自相 关系数。
     例如, 对于输入为和输出为 xa(t+1) 的预测模型, 计算方法如表 2, 利用最后一行的加权向量来比较不同小波函数的分解结果。
     表 2 二因子小波网络输入的小波函数选择指标计算方法
     假 设 一 个 时 间 序 列 为 , 另 一 相 关 时 间 序 列 为 , 时间序列的长度为 N。则有相关系数定义如公式 (1), 具体计算方法如公 式 (2)。
     计算单道序列的时滞为 T 自相关系数, 只需要令 向右移 动 T 个位置生成新的序列, 然后以新序列代替 按照公式 (2) 计算 即可。
     步骤 30、 采用选择的小波函数, 对输入时间序列进行小波分解, 建立多因子小波神 经网络模型 ;
     步骤 40、 训练多因子小波神经网络模型 ;
     步骤 50、 根据给定输入时刻的多序列小波变换系数, 作为多因子小波神经网络模 型的输入, 获得最终的预测值。
     下面以王家坝站的汛期日流量预测为例进一步说明本发明的技术方案及有益效 果。
     首先用本发明的基于加权相关系数的小波函数选择标准进行小波函数的选择。 小 波函数的选择应当和具体研究对象有关, 对比不同年份王家坝站的汛期日流量过程, 发现 该站 2003 年日流量序列较为典型, 选择 2003 年汛期日流量序列作为小波函数适应性选择 的数据资料, 实验资料还包括王家坝站的三个主要上游站 ( 班台、 息县和潢川 ) 的 2003 年 同期的汛期日流量数据。本实验选用如下小波对上述四个站点的 2003 年日流量序列数据 进行三水平小波分解, 参与比较的小波与其相应的低通滤波器如表 3。
     表 3 小波函数及其低通滤波器
     因为王家坝站点的日流量序列跟自身的成分相关性较大, 所以令其权重系数 αwjb = 0.6, 又因为班台和潢川站均在小支流上, 息县站在大支流上, 所以令 αxix = 0.2, αbt = 0.1, αhc = 0.1。即权重分配为 {αbt, αxix, αhc, αwjb} = {0.1, 0.2, 0.1, 0.6}。令 T = 1 时, 各个不同的小波函数对时间序列分解结果的相关性统计结果见表 4( 由于篇幅所限, 省 略了加权之前的具体数据, 文中只给出加权后的相关系数 )。
     表 4 各小波分解后加权相关系数
     d1 B3 spline Haar db2 db3 coifl bior1.3 bior2.2 bior4.4 rbio4.4 0.4933 0.3813 0.2286 0.1652 0.1835 0.2875 0.3268 0.1669 0.1730 d2 0.7681 0.7075 0.6299 0.6217 0.6172 0.6843 0.4997 0.5611 0.6472 d3 0.8538 0.8290 0.8009 0.8030 0.7982 0.8210 0.7627 0.7873 0.8080 c3 0.9627 0.9572 0.9492 0.9427 0.9470 0.9518 0.9245 0.9419 0.9440
     从表 4 可知, B3spline 小波分解后序列与目标序列各对应子序列相关系数最大,Haar 小波比 B3spline 的结果略差。我们还可以发现, db2 比 Haar 小波的统计结果要差, 这 说明同一家族中支撑宽度大的小波分解出来的小波系数, 并不会使预测更加容易。如果选 择一个不适合的小波对王家坝等四站的日流量数据进行分解, 将导致很差的统计结果, 例 如 bior2.2 小波, 在各个水平上的统计结果都较差, 说明其对此三站日流量数据进行分解 未能有效提取出对预测有利的特征。
     以王家坝站日流量作为预测对象, 选取与之主要相关的三个观测站 : 班台、 息县、 潢川, 此三站分别为上游三大支流上的站点, 数据时间跨度为 2000 年 -2007 年, 仅包括每年 汛期的日流量数据, 具体为 2000-2005 年数据区间均为 6-1 至 10-1 日, 2006 年数据区间 5-1 至 10-1 日, 2007 年数据区间 5-15 至 10-1。本文将 2000 年至 2005 年的数据作为训练集, 2006 和 2007 年的数据作为测试集。
     ( 一 ) 河道小波网络模型的建立
     根据上面的小波函数选择结果, Haar 小波和 B3spline 小波分解的数据对王家坝 站的河道小波网络模型的适应度在相关系数的意义上是较好的, 所以首先采用这两种小波 对王家坝、 班台、 息县和潢川四站的日流量序列的分别做 3 水平分解。然后以此四站的当日 小波系数作为神经网络的输入, 以王家坝站的预测目标 (1d、 2d、 3d 预测期的日流量 ) 作为 输出, 对两种小波分解的预测结果进行比较。 对神经网络模型训练之前, 对输入作 Mid-Range 标准化, 对输出流量做自然对数 变换后也将其规范化到 [-1, 1], 然后利用 Matlab 的神经网络工具箱来实现神经网络模型 的训练。在标准 BP 算法的基础上, 使用 L-M 数值优化方法来加快神经网络训练速度, 并使 用贝叶斯正则化方法保证训练网络的泛化能力。 采用试错法确定最优的神经网络隐层节点 数目。对于应用 Haar 小波的神经网络模型, 1d、 2d 和 3d 预测期最优隐层节点分别为 4、 5和 5; 而对于应用 B3spline 小波的神经网络模型, 1d、 2d 和 3d 预测期最优隐层节点分别为 5、 4 和 6。然后对不同的初始权值, 采用多次训练的方法选取产生最优模型。最后用训练得到 的网络在测试集上进行模拟, 产生预测输出。网络的原始输出需要进行反 Mid-Range 标准 化, 得到数据 Y, 由于原始流量作为输出做了自然对数变换, 所以需要对 Y 进行反自然对数 变换, 最终得到原始数据的预测结果。
     ( 二 ) 结果评价指标
     对于时间序列预测, 常用的评价标准有平均绝对误差 (MAE) 和平均相对误差 (MRE), 其计算公式如公式 (3) 和 (4)。
     其中 pi, ai 分别是 T 个观测中第 i 个观测的预测值和实际值。
     另外, 按照 《水文情报预报规范》 合格率定义, 计算相对误差在 20%之内的合格预 测数目, 得到合格率, 记为 ER_ZP20。又由于是洪水预报, 我们还考虑了预测方向正确率以 及发生洪水时的高流量方向正确率。方向正确率, 又叫方向变差对称值 (DVS), 如式 (5), 其 中 P 为预测期。为了比较高流量方向判断的准确度, 对流量大于 500 的预测统计其方向正 确率, 记为 DVS_HF。
     ( 三 )Haar 小波和 B3spline 小波分解建模结果比较
     表 5 给出了基于 Haar 小波分解和 B3spline 小波分解的小波网络模型在测试集上 的预测结果。
     表 5Haar 和 B3spline 小波网络模型在测试集上不同预测期结果的比较
     从表 5 可知, 在 1d 预测期上, B3spline 的 ER_ZP20 指标要好于 Haar 的指标 ; 在 MAE 和 MRE 指标上基于 B3spline 小波分解的小波网络模型要比基于 Haar 小波分解的模型 稍差 ; B3spline 的 DVS 和 DVS_HF 更好些 ; 在 2d 预测期上, B3 spline 的 MRE 和合格率指 标均要好于 Haar 的指标, 但是在合格率仅约为 60%的情况下, 从 DVS 和 DVS_HF 指标上看, Haar 小波的预测结果稍好于 B3spline 小波的结果 ; 在 3d 预测期上, 在合格率很低的情况 下, DVS_HF 显示 B3 spline 小波结果稍优于 Haar 小波的结果。
     总体上 B3 spline 小波预测结果要好于 Haar 小波, 这也验证了本发明的小波函数 选择方法的正确性。
     ( 四 ) 与单序列的小波网络模型结果比较
     表 6 显示了本发明的河道小波网络模型 (RWNN) 和小波网络模型 (WNN) 在测试集 合上在不同评价指标上的统计结果。
     表 6 测试集上 WNN 和 RWNN 在不同预测期上的结果比较
     从表 6 可知, RWNN 模型在不同预测期上的所有指标均都优于 WNN 模型, 这充分体 现了扩展模型预测性能的提高。按照 《水文情报预报规范》 评价标准, 对于 1d 预测期, 河道 小波网络模型满足甲级预报的标准, 小波网络模型仅满足乙级预报的标准 ; 对于 2d 的预测 期, 河道小波网络模型满足丙级预报标准, 可用于参考性预报, 而小波网络模型精度低于丙 级; 对于 3d 预测期情况, 两个模型精度均低于丙级, 但是从 DVS 和 DVS_HF 可以看出, 河道小 波网络模型在方向预测性能上表现更好, 特别是在高流量的方向预报正确率 (DVS_HF) 上, 河道小波网络模型高于小波网络模型 15 个百分点, 适合于做 3d 预测期的参考性估报。同 时, 在 DVS_HF 指标上, 1d 预测期的 RWNN 比 WNN 高出 12 个百分点, 达到 86%, 能更加可靠地 回答在洪峰过程中关注的 “次日流量是升高还是降低” 的问题。

基于多因子小波神经网络模型的水文时间序列预测方法.pdf_第1页
第1页 / 共16页
基于多因子小波神经网络模型的水文时间序列预测方法.pdf_第2页
第2页 / 共16页
基于多因子小波神经网络模型的水文时间序列预测方法.pdf_第3页
第3页 / 共16页
点击查看更多>>
资源描述

《基于多因子小波神经网络模型的水文时间序列预测方法.pdf》由会员分享,可在线阅读,更多相关《基于多因子小波神经网络模型的水文时间序列预测方法.pdf(16页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN102323970A43申请公布日20120118CN102323970ACN102323970A21申请号201110130040422申请日20110519G06F19/00201101G06N3/0220060171申请人河海大学地址210098江苏省南京市鼓楼区西康路1号72发明人朱跃龙李士进王继民范青松冯钧万定生74专利代理机构南京经纬专利商标代理有限公司32200代理人许方54发明名称基于多因子小波神经网络模型的水文时间序列预测方法57摘要本发明公开了一种基于多因子小波神经网络模型的水文时间序列预测方法。本发明提出了一种多因子小波神经网络预测模型用于水文时间序列预。

2、测,该模型以多时间序列信息作为输入,不仅包括预测目标时间序列的当前小波系数,还包括与此时间序列相关的其它时间序列的当前小波系数,并根据其与预测目标时间序列之间互信息作为评判两者相关性的度量,选择相关性强的其它时间序列;进一步利用基于加权相关系数的小波函数选择标准,为该模型选择最优的小波函数。相比现有技术,本发明方法具有更高的预测准确性,以及更好的可扩展性和实用价值。51INTCL19中华人民共和国国家知识产权局12发明专利申请权利要求书2页说明书11页附图2页CN102323981A1/2页21一种基于多因子小波神经网络模型的水文时间序列预测方法,该方法首先根据待预测的水文时间序列建立小波神经。

3、网络水文时间序列预测模型,然后按照建立的预测模型进行水文时间序列预测,其特征在于,所述小波神经网络水文时间序列预测模型为多因子小波神经网络水文时间序列预测模型,以多时间序列信息作为输入,不仅包括预测目标时间序列的当前小波系数,还包括与此时间序列相关的其它时间序列的当前小波系数。2如权利要求1所述基于多因子小波神经网络模型的水文时间序列预测方法,其特征在于,所述与预测目标时间序列相关的其它时间序列,是根据其与预测目标时间序列之间互信息作为评判两者相关性的度量,互信息值较大,则相关性强;具体按照以下方法确定步骤1、提供与待预测序列O可能有关的若干原始输入序列I1,I2,IN,N是输入序列数目;步骤。

4、2、对待预测序列O和原始输入序列I1,I2,IN进行离散化,得到离散序列DO,D1,D2,DN;步骤3、分别计算DO与D1,D2,DN之间的互信息,结果记为M1,M2,MN步骤4、根据M1,M2,MN,选择MITH的原始输入序列II作为待预测序列小波神经网络建模时的相关序列,I为1到N之间的整数;TH为预先设定的阈值。3如权利要求2所述基于多因子小波神经网络模型的水文时间序列预测方法,其特征在于,采用等概率划分法对待预测序列O和原始输入序列I1,I2,IN进行离散化。4如权利要求2所述基于多因子小波神经网络模型的水文时间序列预测方法,其特征在于,所述阈值TH的值为015。5如权利要求14任一项。

5、所述基于多因子小波神经网络模型的水文时间序列预测方法,其特征在于,所述多因子小波神经网络水文时间序列预测模型中所使用的小波函数按照以下方法确定步骤1、分别使用待选的小波函数构建小波神经网络水文时间序列预测模型并进行预测;步骤2、对于每一种待选的小波函数,分别按照以下方法得到相关系数向量对不同水平上的小波分解序列,分别统计预测目标时间序列的小波序列自相关系数,以及预测目标时间序列和与预测目标时间序列相关的其它时间序列的小波系数序列的相关系数;最后采用加权的方法综合各个水平上的相关系数,得到相关系数向量;步骤3、根据采用各小波函数预测所得到的相关系数向量,确定最终使用的小波函数。6如权利要求5所述。

6、基于多因子小波神经网络模型的水文时间序列预测方法,其特征在于,两个时间序列的相关系数,按照以下方法得到假设两个时间序列分别为、,时间序列的长度为N;则这两个时间序列之间的相关系数按照下式计算,权利要求书CN102323970ACN102323981A2/2页3式中,是两个序列时滞为T的相关系数,是第一个序列的均值,是第二个序列的均值;单个时间序列的时滞为T的自相关系数,按照以下方法得到将该时间序列向右移动T个位置生成一个新的时间序列,然后按照上式计算该时间序列与新生成的时间序列的相关系数,得到的相关系数即为该时间序列时滞为T的自相关系数。权利要求书CN102323970ACN102323981。

7、A1/11页4基于多因子小波神经网络模型的水文时间序列预测方法技术领域0001本发明涉及一种复杂时间序列预测方法,尤其涉及一种基于多因子小波神经网络模型的水文时间序列预测方法,属于水文预报技术领域。背景技术0002时间序列数据挖掘研究主要包括预测、分类、相似性搜索及序列模式挖掘,而复杂时间序列预测是数据挖掘领域具有挑战性的问题之一。解决复杂时间序列预测问题的一个较好的方法是基于小波神经网络模型的时间序列预测方法。0003小波分析是FOURIER分析发展史上的一个里程碑式的进展,具有时、频同时局部化的优点,因此被誉为数学“显微镜”。与傅立叶分析仅能够提供频域表示相比较,小波变换能够同时提供时频局。

8、部化特征,且克服了短时傅立叶变换的分辨率有限的缺点。离散小波分解可以对时间序列进行多尺度分解,能够提取不同频率区间的成分序列,实现对时间序列的分频研究。借助于小波的多分辨分解功能,可以从原始序列得到分辨率“从粗到细”的多尺度特征,通过对这些小波特征的学习可以对时间序列的潜在的多因素变化过程有更加显性的描述,所以网络更加容易“抓住”输入和输出数据之间的内在的联系和规律。相反,基于传统的单分辨率学习的网络通常很难描述复杂的时间序列,例如混沌序列,其收敛速度慢,泛化能力差。小波变换将复杂的时间序列分解成若干不同频率的细节信号和背景信号,细节信号是高频部分,背景信号是低频部分,它们是原始时间序列在不同。

9、频率区间上的表现,相对原始序列的比重不同,因而对原始时间序列的预测起到的作用不同。小波网络模型结合了小波分析的在信号处理上的时间域频率域的多分辨性,和神经网络的强大的非线性逼近特性,兼有二者的优点。以上述方式建立的模型称为小波网络模型WAVELETNETWORKMODEL,简记为WNN。0004很多学者对小波网络模型对不同领域的时间序列预测进行了研究,例如CHENYUEHUI,YANGBO,DONGJIWENTIMESERIESPREDICTIONUSINGALOCALLINEARWAVELETNEURALNETWORKNEUROCOMPUTING,2006,696449465、DASHPK,。

10、NAYAKMAYA,SENAPATIMR,ETAL,MININGFORSIMILARITIESINTIMESERIESDATAUSINGWAVELETBASEDFEATUREVECTORSANDNEURALNETWORKS,ENGINEERINGAPPLICATIONSOFARTIFICIALINTELLIGENCE,2007,202185201、GANXIAOBING,LIUYING,ANDAUSTINFRANCISRAPREDICTIONMETHODFORTIMESERIESBASEDONWAVELETNEURALNETWORKSPROCEEDINGSOFCIS2005,PP902908、。

11、BENAOUDAD,MURTAGHFIONN,ANDSTARCKJEANLUC,ETALWAVELETBASEDNONLINEARMULTISCALEDECOMPOSITIONMODELFORELECTRICITYLOADFORECASTINGNEUROCOMPUTING,2006,7013139154、CHENDI;FENGHAIHANG;LINQINGJIA;ETAL,MULTISCALEINTERNETTRAFFICPREDICTIONUSINGWAVELETNEURALNETWORKCOMBINEDMODEL,PROCEEDINGSOFFIRSTINTERNATIONALCONFERE。

12、NCEONCOMMUNICATIONSANDNETWORKINGINCHINA,2006,PP15、李爱国,覃征,滑动窗口二次自回归模型预测非线性时间序列,计算机学报,2004,270710041008说明书CN102323970ACN102323981A2/11页5等。但这些文献仅仅是利用小波分解对单道时间序列进行分解。仅仅依靠预测时间序列自身提供的信息,对于预测精度提高的作用具有一定局限性。而在物理意义上,一个系统内的多时间序列往往具有相关性。0005水文预报例如径流预报对水资源的调配管理和防洪减灾的决策有着重要的意义。然而由于气候和下垫面等因素的综合影响,径流表现出复杂的非线性和非平稳性。

13、特征,一般包括确定性成分和随机成分。神经网络具有很强的处理大规模复杂非线性动力学系统的能力,被广泛用于河道水情预报,可以识别水流运动变化过程与其影响因子之间的复杂非线性关系,为河道水情预报提供了一条新的途径。径流序列自身的组成比较复杂,在一个径流中含有多种频率成份,所以有必要对其进行分频率研究,而小波变换的方法提供了一种便利的时频分析技术。小波和神经网络结合使用的方法近年来得到广泛关注,利用此组合模型进行水文预测成为研究热点。文献王文圣,熊华康,丁晶,日流量预测的小波网络模型初探,水科学进展,2004,153382386中提出了一种小波网络模型用于对日流量进行预测。该小波网络模型是在三层神经网。

14、络的基础上,以T时刻原始信号分解的小波系数作为输入,以TT时刻的原始信号FTT为输出而构建的模型T是预见期。然而该小波网络模型也仅利用单时间序列分解出来的小波系数,对未来进行预测,模型的预测能力是有限的。由于从原始时间序列分解出来的小波系数,已经包含对时间序列前期变化中长时间记忆和短时间记忆,加入更多的前期小波系数往往不能够对预测目标起到更好的辅助作用。而且前期小波系数的加入,使得模式输入个数增加,相应的训练模式集的复杂度也增加,对神经网络结构的确定和训练时间提出更高要求。对于更加复杂时间序列,仅仅根据本时间序列的前期小波系数,不能对时间序列未来的演变进行更好的刻画。径流实际上跟系统内的其他水。

15、文要素具有相关关系,如上下游关系站或相关站的水文要素包括流量、水位、气温和降水等对径流产生具有明显的影响关系。0006不同领域的时间序列数据具有不同特性,仅利用同一种小波函数进行分解是不合适的。文献桑燕芳,王栋,水文序列小波分析中小波函数选择方法,水利学报,2008,393295300从序列重构角度,应用蒙特卡罗方法,通过模拟数据以及黄河利津站和浙江白溪流域的实测水文序列,探讨小波分析影响小波函数选择的因素,进而建立合理选择小波函数的依据。研究结果表明序列自身的变化特性是小波函数选择的重要影响因素。文献刘素一,权先璋,张勇传,不同小波函数对径流分析结果的影响,水电能源科学,2003,21129。

16、31通过训练多尺度预测模型的实验方法,对比了几种小波函数对多尺度框架下径流预测的影响。对于不同数据,特别是大量数据情况下,使用这种类似特征选择中的WRAPPER方法确定最优的小波函数比较耗时。发明内容0007本发明所要解决的技术问题在于克服现有技术以单一时间序列作为小波神经网络模型的输入进行水文时间序列预测的不足,提供一种基于多因子小波神经网络模型的水文时间序列预测方法。0008本发明的基于多因子小波神经网络模型的水文时间序列预测方法,首先根据待预测的水文时间序列建立小波神经网络水文时间序列预测模型,然后按照建立的预测模型进行水文时间序列预测,其特征在于,所述小波神经网络水文时间序列预测模型为。

17、多因子小说明书CN102323970ACN102323981A3/11页6波神经网络水文时间序列预测模型,以多时间序列信息作为输入,不仅包括预测目标时间序列的当前小波系数,还包括与此时间序列相关的其它时间序列的当前小波系数。0009进一步地,所述与预测目标时间序列相关的其它时间序列,是根据其与预测目标时间序列之间互信息MUTUALINFORMATION作为评判两者相关性的度量,互信息值较大,则相关性强;具体按照以下方法确定0010步骤1、提供与待预测序列O可能有关的若干原始输入序列I1,I2,IN,N是输入序列数目;0011步骤2、对待预测序列O和原始输入序列I1,I2,IN进行离散化,得到离。

18、散序列DO,D1,D2,DN;0012步骤3、分别计算DO与D1,D2,DN之间的互信息,结果记为M1,M2,MN;0013步骤4、根据M1,M2,MN,选择MITH的原始输入序列II作为待预测序列小波神经网络建模时的相关序列,I为1到N之间的整数;TH为预先设定的阈值。0014更进一步地,所述多因子小波神经网络水文时间序列预测模型中所使用的小波函数按照以下方法确定0015步骤1、分别使用待选的小波函数构建小波神经网络水文时间序列预测模型并进行预测;0016步骤2、对于每一种待选的小波函数,分别按照以下方法得到相关系数向量0017对不同水平上的小波分解序列,分别统计预测目标时间序列的小波序列自。

19、相关系数,以及预测目标时间序列和与预测目标时间序列相关的其它时间序列的小波系数序列的相关系数;最后采用加权的方法综合各个水平上的相关系数,得到相关系数向量;0018步骤3、根据采用各小波函数预测所得到的相关系数向量,确定最终使用的小波函数。0019其中,两个时间序列的相关系数,按照以下方法得到0020假设两个时间序列分别为、,时间序列的长度为N;则这两个时间序列之间的相关系数按照下式计算,00210022式中,是两个序列时滞为T的相关系数,是第一个序列的均值,是第二个序列的均值;0023单个时间序列的时滞为T的自相关系数,按照以下方法得到0024将该时间序列向右移动T个位置生成一个新的时间序列。

20、,然后按照上式计算该时间序列与新生成的时间序列的相关系数,得到的相关系数即为该时间序列时滞为T的自相关系数。0025本发明提出了一种多因子小波神经网络预测模型用于水文时间序列预测,该模型以多时间序列信息作为输入,不仅包括预测目标时间序列的当前小波系数,还包括与此时间序列相关的其它时间序列的当前小波系数,并根据其与预测目标时间序列之间互信息作说明书CN102323970ACN102323981A4/11页7为评判两者相关性的度量,选择相关性强的其它时间序列;进一步利用基于加权相关系数的小波函数选择标准,为该模型选择最优的小波函数。相比现有技术,本发明方法具有更高的预测准确性,以及更好的可扩展性和。

21、实用价值。附图说明0026图1为本发明的多因子小波神经网络预测模型的结构示意图;0027图2为本发明确定相关的其它时间序列的流程示意图;0028图3为本发明选择最优小波函数的流程示意图。具体实施方式0029下面结合附图对本发明的技术方案进行详细说明0030本发明的多因子小波神经网络预测模型以多时间序列信息作为输入,不仅包括预测目标时间序列的当前小波系数,还包括与此时间序列相关的其它时间序列的当前小波系数,其结构如图1所示,其中要预测的站点为A,与A相关的站点为B至I。也可将此多因子小波神经网络预测模型称为河道小波网络模型,简记为RWNN。0031本发明的基于多因子小波神经网络模型的水文时间序列。

22、预测方法,按照以下步骤进行0032步骤10、确定相关输入时间序列;0033在信息论中,熵HX被用来度量随机变量X的不确定性。假设X是一离散随机变量,熵HX被定义为00340035与熵只能衡量单一变量的不确定性不同,互信息可用来衡量两个以上随机变量之间共有的信息量。假设Y是另一离散随机变量,则X和Y之间的互信息IX;Y被定义为00360037可以证明互信息和熵有如下关系0038IX;YHXHX|YHYHY|X,0039IX;YHXHYHX,Y0040显然,两个随机变量之间互信息越大,它们之间相关性越强。关于互信息的详细内容可参见文献COVERANDTHOMAS,1991TMCOVERANDJAT。

23、HOMAS,ELEMENTSOFINFORMATIONTHEORY,WILEY,NEWYORK1991。从时间序列预测角度看,两个序列之间互信息越大,则通过其中一个序列预测另一个序列越准确。并且,由于小波变换之前的序列之间可能存在非线性相关,而互信息恰好能够反映不同变量之间的非线性相关性。因此,本发明将时间序列之间互信息作为评判两者相关性的度量,提出基于互信息的输入序列确定方法,如图2所示,具体按照以下方法确定相关的输入时间序列0041步骤11、提供与待预测序列O可能有关的若干原始输入序列I1,I2,IN,N是输入序列数目;0042步骤12、对待预测序列O和原始输入序列I1,I2,IN进行离散。

24、化,得到离散说明书CN102323970ACN102323981A5/11页8序列DO,D1,D2,DN;常用的连续变量离散化方法主要有两种等距离划分法和等概率划分法,一般后者效果比较好,本发明优选文献FRASERANDSWINNEY,1986AMFRASERANDHLSWINNEY,INDEPENDENTCOORDINATESFORSTRANGEATTRACTORSFROMMUTUALINFORMATION,PHYSREVA3321986,PP11341140中提出的等概率划分法对时间序列进行离散化;0043步骤13、分别计算DO与D1,D2,DN之间的互信息,结果记为M1,M2,MN;00。

25、44步骤14、根据M1,M2,MN,选择MITH的原始输入序列II作为待预测序列小波神经网络建模时的相关序列,I为1到N之间的整数;TH为预先设定的阈值,该阈值优选015。0045步骤20、对确定的相关输入序列和目标序列进行小波分解,根据加权相关系数进行小波选择;0046小波分解是一种有效的问题分解和特征提取工具,下表1列举了目前常见的几种小波函数及其特性。0047表1常用小波函数0048小波正交性滤波系数长度支撑宽度对称性HAARYES21NODB2YES43FARFROMDB3YES65FARFROMBIOR44NO98YESB3SPLINENO54YES0049但是在具体领域中,存在不同。

26、性质的时间序列数据,用不同的小波函数对这些数据进行分解,所产生的成分序列对建立的预测模型性能会有不同程度的影响。由于小波滤波器具有不同的支撑长度和自身的滤波性质,所以应该选择一个合适的小波对具体的时间序列进行分解,使得分解后的小波系数序列可以提高预测模型的性能。本发明使用T时刻的不同时间序列的小波系数作为模型的输入,而输出为预测时间序列的TT原始数据。对于多因子预测模型,设T时刻的模型输入包括预测时间序列的小波系数和扩展的输入输出为原始时间序列的未来值XATT。预测目标XATT也含有各个频率区间上的对应成分,即不同水平上的小波系数0050根据时间序列分析中关于平稳时间序列预测理论具体可参见文献。

27、PBROCKWELL,ADAVIS,TIMESERIESTHEORYANDMETHODS,2NDEDITION,NEWYORK,SPRINGER,SPRINGERSERIESINSTATISTICS,2002,设有预测目标时间序列XT,T1,N的T时间间隔的自相关系数又存在与XT,T1,N相关的时间序列YT,T1,N且两者之间的T时间间隔的相关系数如果和越大,那么预说明书CN102323970ACN102323981A6/11页9测目标时间序列XT,T1,N的预测方差就越小。0051根据上述思想,本发明针对所提出的多因子小波神经网络模型,提出了一种基于加权相关系数的小波函数选择标准,对不同水平。

28、上的小波分解序列,统计预测目标时间序列的小波序列自相关系数和预测目标时间序列和多因子时间序列的小波系数序列相关系数,最后采用加权的方法综合各个水平上的相关系数,如图3所示,具体按照以下方法选择最优的小波函数0052步骤21、分别使用待选的小波函数构建小波神经网络水文时间序列预测模型并进行预测;0053步骤22、对于每一种待选的小波函数,分别按照以下方法得到相关系数向量0054对不同水平上的小波分解序列,分别统计预测目标时间序列的小波序列自相关系数,以及预测目标时间序列和与预测目标时间序列相关的其它时间序列的小波系数序列的相关系数;最后采用加权的方法综合各个水平上的相关系数,得到相关系数向量;0。

29、055步骤23、根据采用各小波函数预测所得到的相关系数向量,确定最终使用的小波函数。0056其中,两个时间序列的相关系数,按照以下方法得到0057假设两个时间序列分别为、,时间序列的长度为N;则这两个时间序列之间的相关系数按照下式计算,00580059式中,是两个序列时滞为T的相关系数,是第一个序列的均值,是第二个序列的均值;0060单个时间序列的时滞为T的自相关系数,按照以下方法得到0061将该时间序列向右移动T个位置生成一个新的时间序列,然后按照上式计算该时间序列与新生成的时间序列的相关系数,得到的相关系数即为该时间序列时滞为T的自相关系数。0062例如,对于输入为和输出为XAT1的预测模。

30、型,计算方法如表2,利用最后一行的加权向量来比较不同小波函数的分解结果。0063表2二因子小波网络输入的小波函数选择指标计算方法说明书CN102323970ACN102323981A7/11页1000640065假设一个时间序列为,另一相关时间序列为,时间序列的长度为N。则有相关系数定义如公式1,具体计算方法如公式2。006600670068计算单道序列的时滞为T自相关系数,只需要令向右移动T个位置生成新的序列,然后以新序列代替按照公式2计算即可。0069步骤30、采用选择的小波函数,对输入时间序列进行小波分解,建立多因子小波神经网络模型;0070步骤40、训练多因子小波神经网络模型;0071。

31、步骤50、根据给定输入时刻的多序列小波变换系数,作为多因子小波神经网络模型的输入,获得最终的预测值。0072下面以王家坝站的汛期日流量预测为例进一步说明本发明的技术方案及有益效果。0073首先用本发明的基于加权相关系数的小波函数选择标准进行小波函数的选择。小波函数的选择应当和具体研究对象有关,对比不同年份王家坝站的汛期日流量过程,发现该站2003年日流量序列较为典型,选择2003年汛期日流量序列作为小波函数适应性选择的数据资料,实验资料还包括王家坝站的三个主要上游站班台、息县和潢川的2003年同期的汛期日流量数据。本实验选用如下小波对上述四个站点的2003年日流量序列数据进行三水平小波分解,参。

32、与比较的小波与其相应的低通滤波器如表3。0074表3小波函数及其低通滤波器0075说明书CN102323970ACN102323981A8/11页110076因为王家坝站点的日流量序列跟自身的成分相关性较大,所以令其权重系数WJB06,又因为班台和潢川站均在小支流上,息县站在大支流上,所以令XIX02,BT01,HC01。即权重分配为BT,XIX,HC,WJB01,02,01,06。令T1时,各个不同的小波函数对时间序列分解结果的相关性统计结果见表4由于篇幅所限,省略了加权之前的具体数据,文中只给出加权后的相关系数。0077表4各小波分解后加权相关系数0078D1D2D3C3B3SPLINE0。

33、4933076810853809627HAAR03813070750829009572DB202286062990800909492DB301652062170803009427COIFL01835061720798209470BIOR1302875068430821009518BIOR2203268049970762709245BIOR4401669056110787309419RBIO440173006472080800944000790080从表4可知,B3SPLINE小波分解后序列与目标序列各对应子序列相关系数最大,说明书CN102323970ACN102323981A9/11页12H。

34、AAR小波比B3SPLINE的结果略差。我们还可以发现,DB2比HAAR小波的统计结果要差,这说明同一家族中支撑宽度大的小波分解出来的小波系数,并不会使预测更加容易。如果选择一个不适合的小波对王家坝等四站的日流量数据进行分解,将导致很差的统计结果,例如BIOR22小波,在各个水平上的统计结果都较差,说明其对此三站日流量数据进行分解未能有效提取出对预测有利的特征。0081以王家坝站日流量作为预测对象,选取与之主要相关的三个观测站班台、息县、潢川,此三站分别为上游三大支流上的站点,数据时间跨度为2000年2007年,仅包括每年汛期的日流量数据,具体为20002005年数据区间均为61至101日,2。

35、006年数据区间51至101日,2007年数据区间515至101。本文将2000年至2005年的数据作为训练集,2006和2007年的数据作为测试集。0082一河道小波网络模型的建立0083根据上面的小波函数选择结果,HAAR小波和B3SPLINE小波分解的数据对王家坝站的河道小波网络模型的适应度在相关系数的意义上是较好的,所以首先采用这两种小波对王家坝、班台、息县和潢川四站的日流量序列的分别做3水平分解。然后以此四站的当日小波系数作为神经网络的输入,以王家坝站的预测目标1D、2D、3D预测期的日流量作为输出,对两种小波分解的预测结果进行比较。0084对神经网络模型训练之前,对输入作MIDRA。

36、NGE标准化,对输出流量做自然对数变换后也将其规范化到1,1,然后利用MATLAB的神经网络工具箱来实现神经网络模型的训练。在标准BP算法的基础上,使用LM数值优化方法来加快神经网络训练速度,并使用贝叶斯正则化方法保证训练网络的泛化能力。采用试错法确定最优的神经网络隐层节点数目。对于应用HAAR小波的神经网络模型,1D、2D和3D预测期最优隐层节点分别为4、5和5;而对于应用B3SPLINE小波的神经网络模型,1D、2D和3D预测期最优隐层节点分别为5、4和6。然后对不同的初始权值,采用多次训练的方法选取产生最优模型。最后用训练得到的网络在测试集上进行模拟,产生预测输出。网络的原始输出需要进行。

37、反MIDRANGE标准化,得到数据Y,由于原始流量作为输出做了自然对数变换,所以需要对Y进行反自然对数变换,最终得到原始数据的预测结果。0085二结果评价指标0086对于时间序列预测,常用的评价标准有平均绝对误差MAE和平均相对误差MRE,其计算公式如公式3和4。008700880089其中PI,AI分别是T个观测中第I个观测的预测值和实际值。0090另外,按照水文情报预报规范合格率定义,计算相对误差在20之内的合格预测数目,得到合格率,记为ER_ZP20。又由于是洪水预报,我们还考虑了预测方向正确率以及发生洪水时的高流量方向正确率。方向正确率,又叫方向变差对称值DVS,如式5,其中P为预测期。

38、。为了比较高流量方向判断的准确度,对流量大于500的预测统计其方向正确率,记为DVS_HF。说明书CN102323970ACN102323981A10/11页1300910092三HAAR小波和B3SPLINE小波分解建模结果比较0093表5给出了基于HAAR小波分解和B3SPLINE小波分解的小波网络模型在测试集上的预测结果。0094表5HAAR和B3SPLINE小波网络模型在测试集上不同预测期结果的比较00950096从表5可知,在1D预测期上,B3SPLINE的ER_ZP20指标要好于HAAR的指标;在MAE和MRE指标上基于B3SPLINE小波分解的小波网络模型要比基于HAAR小波分解。

39、的模型稍差;B3SPLINE的DVS和DVS_HF更好些;在2D预测期上,B3SPLINE的MRE和合格率指标均要好于HAAR的指标,但是在合格率仅约为60的情况下,从DVS和DVS_HF指标上看,HAAR小波的预测结果稍好于B3SPLINE小波的结果;在3D预测期上,在合格率很低的情况下,DVS_HF显示B3SPLINE小波结果稍优于HAAR小波的结果。0097总体上B3SPLINE小波预测结果要好于HAAR小波,这也验证了本发明的小波函数选择方法的正确性。0098四与单序列的小波网络模型结果比较0099表6显示了本发明的河道小波网络模型RWNN和小波网络模型WNN在测试集合上在不同评价指标。

40、上的统计结果。0100表6测试集上WNN和RWNN在不同预测期上的结果比较0101说明书CN102323970ACN102323981A11/11页140102从表6可知,RWNN模型在不同预测期上的所有指标均都优于WNN模型,这充分体现了扩展模型预测性能的提高。按照水文情报预报规范评价标准,对于1D预测期,河道小波网络模型满足甲级预报的标准,小波网络模型仅满足乙级预报的标准;对于2D的预测期,河道小波网络模型满足丙级预报标准,可用于参考性预报,而小波网络模型精度低于丙级;对于3D预测期情况,两个模型精度均低于丙级,但是从DVS和DVS_HF可以看出,河道小波网络模型在方向预测性能上表现更好,特别是在高流量的方向预报正确率DVS_HF上,河道小波网络模型高于小波网络模型15个百分点,适合于做3D预测期的参考性估报。同时,在DVS_HF指标上,1D预测期的RWNN比WNN高出12个百分点,达到86,能更加可靠地回答在洪峰过程中关注的“次日流量是升高还是降低”的问题。说明书CN102323970ACN102323981A1/2页15图1图2说明书附图CN102323970ACN102323981A2/2页16图3说明书附图CN102323970A。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1