一种多源环境生态信息数据同化方法 【技术领域】
本发明涉及环境生态信息融合研究领域和数据同化领域,具体涉及一种环境生态信息的数据同化模型。
背景技术
环境生态信息反映了环境生态系统中的自然生态系统和社会生态系统的特征及演替规律。随着环境生态信息获取手段趋于多元化,获取的环境生态信息越来越多,越来越复杂。进行环境生态分析时,希望环境生态信息在时间上分布在分析时刻,在空间上分布在分析区域,但是不同来源的环境生态信息时间,精度都不同,假若简单地将它们放在一起使用,较高精度的环境生态信息发挥不出它的效用;并且社会经济数据通常是以行政区为单元,逐级统计和汇总获得,而自然环境数据则主要基于自然单元,两者在空间单元上的不重合使得分析某一区域进行环境生态状况变得十分困难,所以多源环境生态信息不能直接用于环境生态状况分析,如何充分利用各种数据以满足环境生态研究的需要是一个不容回避的问题。
目前,我国开展的环境生态信息的获取,以单一信息来源为主,信息融合方法也主要集中在对遥感信息的处理,如申请号为02136098.7,名为多传感器目标信息融合方法,公开号为CN1389710A的申请专利,申请号为200410016869.1,名为动态情况下异步多传感器信息融合方法,公开号为CN1560568A的申请专利,而对不同来源环境生态信息的综合利用研究能力较弱,传统的环境生态数据处理,融合的方法已不能满足研究需要,尤其是对如何将环境生态信息在空间上分布到分析区域上,现有的环境生态信息处理方法实现比较困难。
数据同化是一种多源数据和模型数据集成的数据处理技术,利用数据同化可以获得具有时间一致性、空间一致性和物理一致性的数据集。目前主要的数据同化方法有:插入观测同化法、四维最优插值同化法、变分同化方法、滤波算法同化法、最大条件概率同化法、广义解同化法、伴随方程同化法和平滑样条同化法,但这些方法都产生于大气、海洋科学领域,无法直接应用于环境生态领域,无法直接用于多源环境生态信息的数据同化,无法将环境生态信息在空间上分布到分析区域上。
【发明内容】
本发明的目的在于针对现有技术方法很难如何将环境生态信息在空间上分布到分析区域上的不足,提供一种对多源环境生态信息进行数据同化的方法,可以将观测值从不规则的观测点插到规则构格点,有鉴于此,本发明采取如下技术方案:一种多源环境生态信息数据同化方法,其特征在于包括以下步骤:
S1,根据研究目的,获取多源的环境生态信息数据。
S2,将环境生态信息数据整理成SET软件需求形式,标定数据的缺失值,利用SET软件补充缺失值。
S3,对获得的环境生态信息进行数据标准化处理,形成反映环境生态状况的归一化数据指标。
S4,建立多源环境生态信息数据同化模型。
S5,利用多源环境生态信息数据同化模型对环境生态信息进行数据同化。
S6,对同化后的环境生态信息数据进行处理,输出数据集。
其中,步骤S1获取的环境生态信息包括自然环境条件数据,气候数据,人口数据同化模型,其他社会经济数据。
其中步骤S4数据同化模型的建立包括以下步骤:
S41,建立气象数据的数据同化模型;
S42,建立人口数据的数据同化模型;
S43,建立其他社会经济数据的数据同化模型;
其中步骤S5对环境生态信息进行数据同化包括以下步骤:
S41,气象数据的数据同化;
S42,人口数据的数据同化;
S43,社会经济数据的数据同化;
其中步骤S6输出的为分布在栅格上的自然环境条件、气候数据、人口数据和其他社会经济数据的数据图层。
【附图说明】
图1是本发明实施例的环境生态信息数据同化的流程图。
【具体实施方式】
下面结合图1,对本发明的具体实施方式作进一步详细描述。以下用于说明本发明,但不用来限制本发明的范围。
图1是本发明实施的环境生态信息融合与分析的流程图。如图1所示,本发明包括以下步骤:
S1,根据研究目的,获取多源的环境生态信息,选取自然条件数据,气候数据,人口数据和社会经济数据,实现对区域环境生态状况描述。
S2,将环境生态信息数据整理成SET软件所需形式,标出数据的缺失值。SET软件要求,所处理的数据需是文本文档格式且以制表符(Tab键)为间隔的数据,第一列可以是ID等数据,第二,三列可以是经纬度坐标数据,从第四列开始至倒数第二列为参数列,最后一列即是插值的数据列,例如人口数据(Population),其中空的为待插值项。数据格式如下:
ID X_COORD Y_COORD X1 X2... Xs Population
1 873467.400 4475721000 0.1 12... 111 1000
ID X_COORD Y_COORD X1 X2... Xs Population
2 889467.400 4475721.000 0.2 25... 234
3 905467.400 4475721.000 0.3 43... 324 1200
... ... ... ... ...... ... ...
安装,运行SET软件,点击File菜单,选Open,选择正确的数据文件打开后,就打开了Source Data的窗口,点击Extrapolation菜单,选择Extrapolation进行插值,点击File菜单,选Save保存结果。
S3,对获得的环境生态信息进行数据归一化处理,将多源的环境生态信息的量纲归一化,相同指标数据采用统一度量单位,形成反映环境生态状况的归一化数据指标。
S4,建立多源环境生态信息数据同化模型,其中包括气候数据同化模型,人口数据同化模型,其他社会经济数据同化模型,其中包括以下步骤:
S41,建立气象数据的数据同化模型:采用梯度距离平方反比法,建立气象数据的数据同化模型,其估值公式为:
Z=[Σi=1nZi+(X-Xi)×Cx+(Y-Yi)×Cy+(E-Ei)×Cedi2]/[Σi=1n1di2]]]> 式中,Z为所要估计的栅格点的气象要素;X和X
i为待估点与气象点的X轴坐标值;Y和Y
i为待估值点与气象站点的Y轴坐标值;E和E
i为待估点与气象站点的海拔高程;C
x、C
y和C
e为站点气象要素值与X、Y和海拔高程的回归系数;d
i为待估点到第i站点的大圆距离;n为用于插值的气象站点的数目。
S42,建立人口数据同化模型,模型的一般形式如下:
Pi=Σj=1najxj=Bj]]> 式中,P
i为区内i县的人口总数;a
j为该县第j类土地利用类型的人口分布系数(人/km
2);x
j为该县第j类土地利用类型所占面积(km
2);n为二级土地利用类型总数。
S43,社会经济数据的数据同化模型建立包括以下步骤:
S431,在ArcGIS GRID模块下,利用1∶10万土地利用/覆被矢量图,提取出耕地边界,生成mask模板;
S432,根据收集的相应指标值计算单位耕地面积上的指标权重,并转成1km栅格数据;
S433,以扣除了线状地物的耕地边界为mask模板,通过地图代数运算,获得相应指标的同化数据。
S5,利用多源环境生态信息数据同化模型对环境生态信息进行数据同化,其中对自然环境数据不做处理。多源环境生态信息数据同化包括以下步骤:
S51,气候数据同化包括以下步骤:
S511,确定各栅格点最近的四个气象站点的顺序号并计算距离
在程序运算中,按照栅格中心的大地坐标,计算它与所有气象站点的距离,以冒泡法选取四个最近气象站点的内部ID号。
设气象站点S
i和栅格点G具有相同属性:横坐标(米)x,纵坐标(米)y,年等降水量线(毫米),则栅格点到四个站点的距离平方为:
di2=(Si.x-G.x)2+(Si.y-G.y)2]]> S512,计算各个站点对栅格点的影响因子,即权重W
i。
首先要判断每个站点数据是否有效。如果气象站点S
i的数据为无效数据,则其权值设为0;若数据有效则设为:
Wi=1/di2]]> S513,对气温数据进行数据同化:按照海拔高度每升高100米,日均气温下降0.6℃、日极端最高温下降0.9℃和日极端最低温下降0.4℃的温度递减速率,将温度数据调整到海平面的温度:
S
i.T
*=S
i.T+r×S
i.elv/100.0
其中,S
i为气象站点i,T
*为调整后的温度(包括最高、最低和日均温),T为原始数据,海拔高度(米)elv。然后按照如下公式计算栅格点海平面高度的温度:
G.T*=Σi=14(Wi×Si.T*)Σi=14Wi]]> 最后调整到实际海拔的温度:
G.T=G.T
*-r×G.elv/100.0
S514,降水量、日照时数与气温数据的数据同化过程类似,仅是不需要考虑海拔高度的影响。
S52,人口数据的数据同化包括以下步骤:
S521,收集分县分类数据,按照县级行政单元,逐个县级行政单元校对边界,将所有县级行政边界统一订正到研究目标年的县级行政图上,计算出研究时段的两个时间界点上每个县级行政单元人口自然增长率的1km栅格数据;
S522,以每个县级行政单元为本底,提取出每个县的城镇面积、农村居住用地面积和工矿企业的用地面积,据此计算出每个县的城镇人口密度和农业人口密度;
S523,将分县的城镇用地、农村居住用地和工矿用地转成1km栅格成分数据,通过与第二步计算出的密度栅格数据地图进行代数运算,计算出农牧交错带不同年份的总人口和农业人口数据;
S5241,利用计算出的不同年份的人口数据与分县人口增长率数据计算研究目标年总人口数据、城镇人口数据和农业人口数据,同研究目标年人口数据比对,选择出人口绝对数差异在15%以上的县份,认为是误差数据,由耕地内分布人口所致,通过计算设定并调整耕地系数,并反复进行迭代运算,将总人口和农业人口分配到1km的空间单元上;
S525,基于农业人口1km栅格数据和各县人口乡村劳动力和农林牧渔劳动力占农业人口的比重,通过在5公里、10公里、15公里、20公里、25公里和50公里上的邻域分析,生成乡村劳动力和农林牧渔劳动力的1km栅格数据。
S53,社会经济数据的数据同化包括以下步骤:
S531,农业机械总动力、化肥用量、地膜使用量、农业基础建设投资及支农经费投入、粮食总产量数据的数据同化处理流程是:使用ArcGIS软件,利用1;10万土地利用/土地覆被矢量图,提取出耕地边界,生成mask模板;根据收集的相应指标值计算单位耕地面积上的指标权重,并转成1km栅格数据;以扣除了线状地物的耕地边界为mask模板,通过地图代数运算,获得相应指标的离散化数据。
S532,农林牧渔收入离散化数据的制备过程与此类似。
S533,肉类总产量和蔬菜面积也按照类似的方法被分别分摊到耕地、草地与园地上。
S534,利用农村居民点数据,生成THIESSEN多边形,并根据农村居民点数据进行修正,作为农村用电量、农村居民总收入、人均收入的空间分配本底,实现了这三个指标的空间离散化处理。
S6,整理数据同化结果,输出分布在栅格上的自然环境条件数据、气候数据、人口数据和社会经济数据的数据图层。
以上所述仅是本发明的一般实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变型,这些改进和变型也属于本发明的保护范围。