标准化遥感卫星数据集成通用元数据模型的建立方法技术领域
本发明属于遥感卫星数据集成与应用技术领域,尤其涉及一种标准化遥感卫星数
据集成通用元数据模型的建立方法。
背景技术
世界各国相继发射各类遥感卫星,全球高分观测时代已经到来。卫星遥感对地观
测范围越来越广泛,覆盖水与能量循环、陆地、海洋等多个方面。卫星遥感信息已成为不可
或缺的战略资源和经济资源,其应用产业蕴藏着巨大的跨越式发展机遇。因此,如何提供一
个高效的遥感卫星数据管理与信息整合的途径,支持这些大规模卫星数据的逻辑关联表
达、信息语义集成、协同综合管理成为迫切需要和亟待解决的难题。
元数据是关于数据的数据,在地理空间信息中可用于描述地理数据集的内容、质
量、表示方式、空间参考、管理方式以及数据集的其它特征,是实现地理空间信息共享的核
心标准之一。因此,元数据建模方法正成为遥感卫星数据资源有效管理与应用的重要手段。
公告号为CN 101667192 B的中国专利公开了一种基于SOA架构的多星异构遥感数
据集成方法,通过在遥感应用中心建立数据接入服务程序,遥感信息服务中心的遥感数据
摄入程序调用该数据接入服务程序,数据接入服务程序从本地获得遥感信息元数据,并将
这些本地遥感信息元数据转换为统一的标准遥感元数据,然后对遥感数据摄入程序做出应
答,遥感数据摄入程序将获得的元数据更新到遥感信息服务中心的遥感元数据库中,同时
获取浏览图像并存储到本地文件系统中,完成遥感信息元数据和浏览图的动态快速更新,
实现地面系统遥感元数据的收集。该方法实现了多星异构遥感数据的集成,并从本地获得
遥感信息元数据,但并没有指出如何构建遥感元数据模型来描述遥感元数据的基本结构与
具体内容。
公告号为CN 103838837 A的中国专利公开了一种基于语义模板的遥感元数据集
成方法,为待集成的每一类遥感元数据制作对应的语义模板,并存储语义模板。根据语义模
板解析并存储对应类型的遥感元数据,将遥感元数据字段中的字段值进行类型转化,并将
转化后所得字段与具体的语义关联。将不同语义模板中具有相同语义的字段映射至相同的
公共字段,使遥感元数据具有名字统一的访问接口。该方法针对遥感元数据的特点,通过语
义解决了不同类型遥感元数据的集成,但基于语义模板的方法仍有一定的局限性,缺乏对
语义模板结构与内容的描述,并不能完全满足卫星数据国际标准化应用服务的需要。
国际标准组织ISO/TC 211等制定了一系列地理信息元数据、卫星图像相关的标准
计划来有效地管理地理信息,如ISO制定了19115地理信息元数据(Geographic
Information-Metadata)、19115-2地理信息元数据Part II:影像和栅格数据的扩展
(Metadata Extensions for Imagery and Gridded Data)、19130地理信息影像与栅格数
据的传感器数据模型(Sensor Data Model for Imagery and Gridded Data)等。然而这些
标准各个独立,没有集成起来,因此不能完全满足卫星数据集成系统开发的需要。
归纳起来,现有的元数据集成方法中,仍缺乏一个统一的卫星元数据模型来集成
和描述卫星图像、地面观测和模型模拟等多源异构遥感卫星数据。同时,对地观测数据集成
标准化建设的严重不足也直接影响了遥感卫星数据的开放利用,存在卫星数据“不好用、不
会用”等现实问题。面对卫星遥感对地面观测所形成的地球空间海量信息流,迫切需要对多
源卫星和航空遥感数据、以及不同平台卫星遥感数据、地面观测数据进行集成,建立标准化
的、世界通用的遥感卫星元数据模型,使得全球卫星遥感数据资源都能得到规范化地共享
与应用。
发明内容
本发明的目的是提供一种标准化遥感卫星数据集成通用元数据模型的建立方法。
为达到上述目的,本发明提供的标准化遥感卫星数据集成通用元数据模型的建立
方法,包括步骤:
S1建立标准元数据,本步骤进一步包括:
1.1构建遥感卫星的元数据包,所述的元数据包包括主元数据包、支撑元数据包、
扩展元数据包和特殊元数据包,其中,主元数据包调用支撑元数据包、扩展元数据包和特殊
元数据包;支撑元数据包用来进一步细化主元数据包;扩展元数据包是主元数据包的扩展,
其用来描述遥感图像数据;特殊元数据包用来描述不同专业和/或不同组织机构的特定需
求;
1.2构建遥感卫星的元数据类,所述的元数据类包括核心元数据类、扩展元数据类
和特殊元数据类,其中,核心元数据类用来描述主元数据包和支撑元数据包的特征,扩展元
数据类用来描述扩展元数据包的特征,特殊元数据类用来描述特殊元数据包的特征;
1.3划分遥感卫星的元数据元素层次,将构成核心元数据类、扩展元数据类、特殊
元数据类的元数据元素分别划分为核心类元素、扩展类元素、特殊类元素;
S2采用贝叶斯法自动构建应用元数据与标准元数据间的映射关系,根据映射关系
划分应用元数据元素的类别;所述的应用元数据为从用户需求分析调查中获取的遥感卫星
数据集的基本信息,该信息包括①遥感卫星数据集的主题、②遥感卫星数据集所在的地点、
③遥感卫星数据集的采集日期和/或期限、④订购遥感卫星数据集的联系人、以及⑤专业
和/或组织机构的特定需求等五项;
S3以标签输出格式输出元数据元素列表及其分层结构,并建立遥感卫星的元数据
元素字典。
子步骤1.1进一步包括以下子步骤:
1.1a构建遥感卫星的主元数据包,具体为:
主元数据包从元数据标准ISO 19115的实体集信息、标识信息、约束信息、数据质
量信息、空间表达信息、参考系统信息、内容信息和分布信息中导出,采用实体集信息描述
主元数据包,以实体集信息为中心,将实体集信息分别指向标识信息、约束信息、数据质量
信息、空间表达信息、参考系统信息、内容信息、分布信息;
1.1b构建遥感卫星的支撑元数据包,具体为:
支撑元数据包从ISO 19115的引用和责任方信息、范围信息中导出,将主元数据包
的内容信息指向支撑元数据包的引用和责任方信息,将主元数据包的标识信息指向支撑元
数据包的范围信息;
1.1c构建遥感卫星的扩展元数据包,具体为:
扩展元数据包从图像标准ISO 19130的标识扩展信息、数据质量扩展信息、内容扩
展信息、参考系统扩展信息、空间表达扩展信息中导出,将标识扩展信息、数据质量扩展信
息、内容扩展信息、参考系统扩展信息、空间表达扩展信息分别指向主元数据包的标识信
息、数据质量信息、内容信息、参考系统信息、空间表达信息;
1.1d构建遥感卫星的特殊元数据包,将主元数据包的实体集信息指向特殊元数据
包信息。
子步骤1.3进一步包括以下子步骤:
1.3a用户需求分析,需求分析获取的基本信息包括:①遥感卫星数据集的主题、②
遥感卫星数据集所在的地点、③遥感卫星数据集的采集日期和/或期限、④订购遥感卫星数
据集的联系人、以及⑤专业或组织机构的特定要求;
1.3b核心类元素从ISO 19115定义的核心元数据类的元数据元素中提取,并定义
核心类元素性质为强制性;
1.3c扩展类元素从元数据扩展标准ISO 19115-2和ISO 19130定义的图像元数据
类的元数据元素中提取;
1.3d将特殊类元素划分为专业类元素和组织机构专用元素两个子层次,专业类元
素为满足各不同专业需求的元数据,组织机构专用元素为满足各不同组织机构需求的元数
据。
步骤S2进一步包括以下子步骤:
2.1根据应用元数据和标准元数据的字段名,将它们分别转换为贝叶斯网络模型;
2.2基于现有的WordNet工具,基于字段名计算应用元数据与标准元数据的元素的
语义相似度;保存语义相似度大于给定阈值θ的两个元数据元素的映射关系;
2.3重复子步骤2.2,直至应用元数据和标准元数据的字段名均进行了相应相似度
计算,则得到所有应用元数据与标准元数据间的映射关系;
2.4基于映射关系,划分应用元数据元素的类别,具体为:
将在核心类元素中反映出来的应用元数据直接作为核心类元素;
将在非核心类元素中反映出来的应用元数据作为扩展类元素;
将在扩展元数据类中反映出来的应用元数据作为扩展类元素;
未在元数据元素层次中反映出来的应用元数据,将其作为附加的特殊类元素。
本发明具有如下特点和有益效果:
本发明充分利用现有的卫星数据国际标准,对这些标准进行集成与扩展,构建了
标准化遥感卫星数据集成元数据模型,使成为可世界通用的遥感卫星元数据模型。所构建
的模型能对卫星图像、地面观测数据与模拟模型结果等多源异构数据以及来自不同部门、
不同平台、不同数据归档系统的数据进行有效集成。通过建立共同的标准元数据描述全球
分布卫星遥感数据,确保卫星数据及其应用服务的兼容性和互用性,使得所有的卫星遥感
数据都可以实现全球化地、规范化地共享与应用。
附图说明
图1是本发明通用元数据模型示意图;
图2是本发明建模方法流程图;
图3是映射关系自动生成流程图;
图4是应用元数据与ISO标准元数据的映射图。
具体实施方式
在ISO/TC 211国际卫星标准的基础上,对ISO 19115和ISO 19115-2进行集成与扩
展,并结合ISO 19130中的地理定位信息和传感器特性,同时考虑专业应用和不同组织机构
的特殊需要,构建遥感卫星数据集成通用元数据模型,如图1所示。通过定义元数据公共集、
元数据核心元素及其内在关联、以及元数据的扩展,对卫星数据的基本结构与内容进行描
述,将不同来源的、异构的数据映射成一种规范化形式的数据类型。
见图2,本发明方法的具体步骤如下。
步骤1:构建遥感卫星的元数据包,所述的元数据包包括主元数据包、支撑元数据
包、扩展元数据包和特殊元数据包。
本步骤进一步包括以下子步骤:
步骤1.1:构建遥感卫星的主元数据包。
主元数据包从ISO 19115的实体集信息、标识信息、约束信息、数据质量信息、空间
表达信息、参考系统信息、内容信息、分布信息中导出。采用实体集信息描述主元数据包,并
以实体集信息为中心,将实体集信息分别指向标识信息、约束信息、数据质量信息、空间表
达信息、参考系统信息、内容信息、分布信息,从而建立实体集信息与标识信息、约束信息、
数据质量信息、空间表示信息、参考系统信息、内容信息、分布信息间的关联。
步骤1.2:构建遥感卫星的支撑元数据包。
对主元数据包信息进一步细化即生成支撑元数据包,支撑元数据包由主元数据包
调用。支撑元数据包从ISO 19115的引用和责任方信息、以及范围信息中导出,分别用来进
一步细化主元数据包的内容信息和标识信息。同时,建立主元数据包与支撑元数据包之间
的关联,即将主元数据包的内容信息指向支撑元数据包的引用和责任方信息,将主元数据
包的标识信息指向支撑元数据包的范围信息。
步骤1.3:构建遥感卫星的扩展元数据包。
扩展元数据包对主元数据包进行扩展,用来描述遥感图像数据。扩展元数据包从
ISO 19130的标识扩展信息、数据质量扩展信息、内容扩展信息、参考系统扩展信息、空间表
达扩展信息中导出。同时,将扩展元数据包的标识扩展信息、数据质量扩展信息、内容扩展
信息、参考系统扩展信息、空间表达扩展信息分别指向主元数据包的标识信息、数据质量信
息、内容信息、参考系统信息、空间表达信息,从而建立主元数据包与扩展元数据包间的关
联。
步骤1.4:构建遥感卫星的特殊元数据包。
为需要满足不同专业和/或不同组织机构的特定需求,定义特殊元数据包。同时由
主元数据包的实体集信息指向特殊元数据包信息,建立主元数据包与特殊元数据包间的关
联。
步骤2:构建遥感卫星的元数据类。
元数据包由元数据类进行描述。元数据类即一组描述具有相同卫星数据特征的元
数据,包括核心元数据类、扩展元数据类和特殊元数据类。其中,核心元数据类用来描述主
元数据包和支撑元数据包的特征,扩展元数据类用来描述扩展元数据包的特征,特殊元数
据类用来描述特殊元数据包的特征。
步骤3:划分遥感卫星的元数据元素层次。
各元数据类是由一系列遥感卫星的元数据元素组成,将元数据元素划分为核心类
元素、扩展类元素和特殊类元素三个层次。
本步骤进一步包括以下子步骤:
步骤3.1:用户需求分析。
从用户需求分析调查中获取遥感卫星数据集的基本信息,将获取的基本信息作为
应用源数据。所述基本信息包括①遥感卫星数据集的主题、②遥感卫星数据集所在的地点、
③遥感卫星数据集的采集日期和/或期限、④订购遥感卫星数据集的联系人、以及⑤专业
和/或组织机构的特定需求等五项。
步骤3.2:核心类元素定义每个应用数据集应该包含的最小元数据集,核心类元素
从ISO19115定义的核心元数据类的元数据元素中提取。例如,核心类元素可以为元数据所
在部门、元数据生成日期、引用、摘要、语言、主题类别、标题、日期、负责人姓名、负责人所在
单位、负责人职位、联系地址、角色等。同时,定义核心类元素的性质为强制性的,表示为元
数据模型强制性的元数据组件。
步骤3.3:扩展类元素定义为描述遥感图像的扩展元数据,扩展类元素从ISO
19115-2和ISO 19130定义的图像元数据类的元数据元素中提取。扩展类元素可以为标识信
息、约束信息、数据质量信息、空间表达信息、参考系统信息、内容信息以及分布信息,分别
定义各项信息的名字、属性、属性类型、描述、关系、关系类型等。
以标识信息为例,该项信息一般需要提供遥感图像数据的内容和格式的概要,在
ISO 19115中定义了适用于任何地理数据的有关标识信息的元数据元素。但还需要表达其
相关影像信息,如描述数据集的图示以及提供遥感图像的关键字、类型和参考源。
步骤3.4:为了更好地满足来自不同国家、地区与组织以及数据集生产商或用户社
区的特殊需要,将特殊类元素定义为一些特殊的元数据信息以用于所选择的用例,将其组
织成专业类元素和组织机构专用元素两个子层次。其中,专业类元素定义为满足各不同专
业需求的元数据,组织机构专用元素定义为满足各不同组织机构需求的元数据。专业类元
素和组织机构专用元素通过步骤5进行标识。专业类元素和组织机构专用元素均为有条件
的或可选的元数据。
例如,全球协调加强观测(Coordinated Enhanced Observing Period,CEOP)机构
联合了遍布全球的36个观测区域,各观测区域同步世界各国大气科学研究机构提供的从高
分辨率到中分辨率的卫星产品。其中,全球建模与同化办公室(Global Modeling and
Assimilation Office,GMAO)机构为CEOP的参考站点提供模型输出时间序列(MOLTS)信息。
因此,CEOP在发布遥感卫星元数据时,需要将GMAO的特殊信息,如标识符、时间信息、网格点
位置以及MOLTS输出变量等,作为附加元数据项在元数据中进行说明,即特殊类元素。
完成步骤1~3即完成了标准元数据的建立。
步骤4:自动构建应用元数据与标准元数据间的映射关系,根据映射关系划分应用
元数据元素的类别。
确定具体元数据元素时,通过定义卫星数据应用元数据元素与ISO 19115、ISO
19115-2、ISO 19130的标准元数据间的映射,建立应用元数据与标准元数据之间的映射关
系,以确保应用元数据与标准元数据规范之间的一致性。
应用元数据与标准元数据间的映射关系通过以下步骤自动生成,具体步骤可参见
图3:
步骤4.1:根据应用元数据和标准元数据的字段名,分别将它们称转换为贝叶斯网
络模型。
步骤4.2:基于WordNet,基于字段名计算应用元数据与标准元数据的元素的语义
相似度,保存语义相似度大于给定阈值θ的两个元数据元素的映射关系。
步骤4.3:重复子步骤4.2,直至应用元数据和标准元数据的字段名均进行了相应
相似度计算,则得到所有应用元数据与标准元数据间的映射关系。
基于生成的映射关系,利用以下规则进一步划分应用元数据元素的类别,参见图
4:
规则1:将在ISO核心类元素(ISO 19115)中反映出来的应用元数据直接作为核心
类元素。ISO核心类元素所在层又可称为“核心元数据层”。
规则2:将在ISO非核心类元素(ISO 19115)中反映出来的应用元数据作为扩展类
元素。ISO非核心类元素所在层又可称为“非核心元数据层”。
规则3:将在ISO扩展元数据类(ISO 19115-2、ISO 19130)中反映出来的应用元数
据作为扩展类元素。ISO扩展元数据类所在层又可称为“扩展元数据层”。
规则4:未在ISO元数据层中反映出来的应用元数据,将其作为附加的特殊类元素,
这些附加的特殊类元素决定了遥感卫星数据集的可扩展性。
步骤5:输出遥感卫星的元数据元素列表及分层结构,用来描述遥感卫星的元数据
元素的基本结构、内容及关联。
以标签输出格式输出元数据元素列表及其分层结构,以展示遥感卫星的元数据元
素的基本结构、内容与关联,并建立遥感卫星的元数据元素字典。所述的元数据元素字典包
括元数据包、元数据类、元数据元素、描述或说明、备注等字段,以及附加元数据元素。
需要说明的是,标签输出格式为一种最原始的卫星元数据记录方式,用户可利用
现有工具将其转化为其它格式(如XML等)。另外,用户可利用现有的数据字典成熟工具来建
立元数据元素字典。