一种清洗天文图像中太阳光球亮点的方法.pdf

上传人:00****42 文档编号:6265280 上传时间:2019-05-27 格式:PDF 页数:11 大小:905.89KB
返回 下载 相关 举报
摘要
申请专利号:

CN201510814236.3

申请日:

2015.11.23

公开号:

CN105404897A

公开日:

2016.03.16

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):G06K 9/62申请日:20151123|||公开

IPC分类号:

G06K9/62

主分类号:

G06K9/62

申请人:

昆明理工大学

发明人:

杨云飞; 张艾丽; 熊建萍; 季凯帆

地址:

650093云南省昆明市五华区学府路253号

优先权:

专利代理机构:

代理人:

PDF下载: PDF下载
内容摘要

本发明涉及一种清洗天文图像中太阳光球亮点的方法,属天文技术、图像处理和数据挖掘领域。本发明包括步骤:首先采用一种拉普拉斯滤波和形态学膨胀相结合的方法识别亮点和采用三维联通的方法跟踪亮点,然后提取亮点的多个相关度较低的特征值,对这些特征值数据标准化后,采用主成分分析法根据贡献率降低维度,最后采用DBSCAN方法对降维后的亮点数据进行清洗,以去除非亮点结构。本发明将DBSCAN方法应用于光球亮点数据的清洗问题上是前所未有的、有效的,该方法在很大程度上解决了传统光球亮点的识别方法存在误识别的问题。同时,为小尺度的磁场研究和进一步日冕加热等问题的研究清洗出更为准确的亮点数据。

权利要求书

1.一种清洗天文图像中太阳光球亮点的方法,其特征在于:首先采用一种拉普拉斯滤波
和形态学膨胀相结合的方法来识别亮点;再通过三维联通的方法跟踪亮点;然后提取亮点的
多个相关度较低的特征值作为清洗的数据;接着,对清洗的数据做z-score标准化处理;再采
用主成分分析法将标准化后的数据根据贡献率降低维度;最后,通过DBSCAN方法对降维后
的数据进行清洗,从而剔除非亮点结构。
2.根据权利要求1所述的清洗天文图像中太阳光球亮点的方法,其特征在于:
所述清洗天文图像中太阳光球亮点的方法的具体步骤如下:
Step1、亮点数据识别;首先对序列图像进行预处理,包括采用最大局部相关的对齐方法
对齐序列图像,归一化序列图像、平滑图像;然后采用拉普拉斯滤波和形态学膨胀相结合的
方法识别序列图像中每幅图的光球亮点;
Step2、亮点数据跟踪;在序列图像的每一幅图上识别出光球亮点后,再由序列图像中识
别出的所有亮点构成的三维时空立方体中采用三维联通方法对光球亮点进行三维跟踪,其中,
三维时空立方体(x,y,t)中x和y是二维平面图像的坐标,t是时间坐标;
Step3、亮点数据特征提取;识别和跟踪亮点后,提取亮点的相关度较低、且能代表亮点
的光学强度、形态和运动等各方面的多个特征值作为清洗的数据;
Step4、亮点数据标准化;得到清洗数据之后,采用z-score方法标准化亮点数据,即将数
据标准化为均值为0,方差为1的正态分布;
Step5、亮点数据降维;采用主成分分析法对标准化后的清洗数据进行降维处理,根据贡
献率选择可降至的维度;
Step6、亮点数据清洗;对降维后的数据采用DBSCAN聚类方法进行清洗,从而剔除非亮
点结构。
3.根据权利要求2所述的清洗天文图像中太阳光球亮点的方法,其特征在于:所述步骤
Step3的清洗的数据属性包括等效直径、强度、偏心率、亮点边缘处于暗径的比例、速度、运
动方式和扩散系数特征值。
4.根据权利要求2所述的清洗天文图像中太阳光球亮点的方法,其特征在于:所述步骤
Step5的贡献率采用90%以上。

说明书

一种清洗天文图像中太阳光球亮点的方法

技术领域

本发明涉及一种清洗天文图像中太阳光球亮点的方法,属天文技术、图像处理和数据挖
掘领域。

背景技术

太阳光球表面布满了米粒状结构,在米粒的暗径中有一些发亮的结构,称为光球亮点。
普遍认为,光球亮点与太阳磁场有密切关系,通过研究光球亮点可以促进太阳磁场的研究,
促进更深层和更热的等离子体和日冕加热等太阳物理现象的研究,从而提前预报太阳磁场活
动,以更好地进行空间天气预报及对地球磁场的预报。

目前在二维图像上识别亮点主要采用了阈值法、区域生长法和形态学等几种方法。阈值
法通过设置一个或几个阈值将图像的灰度级分为几个部分,认为属于同一个部分的像素是同
一个物体;区域生长法是从初始区域开始,将相邻的具有同样性质的像素或其它区域归并到
目前的区域中从而逐步增长区域,直至没有可以归并的点或其它小区域为止;形态学是用具
有一定形态的结构元素去度量和提取图像中的对应形状以达到对图像分析和识别的目的。但
这些方法在识别中都不可避免地将一些发亮的碎米粒误识别为亮点。

数据清洗是随着数据挖掘的发展而出现的一门新兴技术,是指从数据集中发现并纠正“脏
数据”,即从数据文件中检测出错误和不一致的数据,并剔除或修正它们,以提高数据质量。
聚类方法就非常适合用于数据清洗。聚类方法是将研究对象分为相对同质的群组的统计分析
技术。其目的是发现数据间的关系,将相似的归为一类,相异的为一类。其中,基于密度的
DBSCAN方法是一种高效的适合大型数据集的聚类方法。

发明内容

本发明提供了一种清洗天文图像中太阳光球亮点的方法,将数据挖掘中DBSCAN聚类方
法应用到光球亮点的数据清洗,清洗出非亮点结构,用于解决传统识别亮点的方法中存在误
识别的问题。

本发明清洗天文图像中太阳光球亮点的方法是这样实现的:

首先对序列图像进行预处理,然后采用一种拉普拉斯滤波和形态学膨胀相结合的方法来
识别亮点;再通过三维联通的方法跟踪亮点;然后提取亮点的多个相关度较低的特征值作为
清洗的数据;接着,对清洗的数据做z-score标准化处理;再采用主成分分析法根据贡献率将
高维的标准化数据进行降维;最后,通过DBSCAN方法对降维后的数据进行清洗,从而剔除
非亮点结构。

所述清洗天文图像中太阳光球亮点的方法的具体步骤如下:

Step1、亮点数据识别;首先对序列图像进行预处理,包括采用最大局部相关的对齐方法
对齐序列图像,归一化序列图像、平滑图像;然后采用拉普拉斯滤波和形态学膨胀相结合的
方法识别序列图像中每幅图的光球亮点;

Step2、亮点数据跟踪;在序列图像的每一幅图上识别出光球亮点后,再由序列图像中识
别出的所有亮点构成的三维时空立方体中采用三维联通方法对光球亮点进行三维跟踪,其中,
三维时空立方体(x,y,t)中x和y是二维平面图像的坐标,t是时间坐标;

Step3、亮点数据特征提取;识别和跟踪亮点后,提取亮点的相关度较低、且能代表亮点
的光学强度、形态和运动等各方面的多个特征值作为清洗的数据;

Step4、亮点数据标准化;得到清洗数据之后,采用z-score方法标准化亮点数据,即将数
据标准化为均值为0,方差为1的正态分布;

Step5、亮点数据降维;采用主成分分析法对标准化后的清洗数据进行降维处理,根据贡
献率选择可降至的维度;

Step6、亮点数据清洗;对降维后的数据采用DBSCAN聚类方法进行清洗,从而剔除非亮
点结构。

进一步优选的,所述步骤Step3的清洗的数据属性包括等效直径、强度、偏心率、亮点
边缘处于暗径的比例、速度、运动方式和扩散系数特征值。

进一步优选的,所述步骤Step5的贡献率采用90%以上。

本发明的有益效果是:

聚类方法能够发现数据间的关系,将相似的归为一类,相异的归为一类;基于密度的
DBSCAN方法不仅有较强的抗噪声能力强,还能处理任意形状的聚类。将DBSCAN方法应
用于光球亮点数据的清洗问题上是前所未有的、有效的,该方法在很大程度上解决了传统光
球亮点的识别方法存在误识别的问题;同时,为小尺度的磁场研究和进一步日冕加热等问题
的研究清洗出更为准确的数据。

附图说明

图1是本发明清洗太阳光球亮点的方法的总体流程图;

图2是本发明通过日出/太阳光学望远镜在G波段观测到的高分辨图像;

图3是本发明用拉普拉斯滤波和形态学膨胀技术相结合的方法识别的亮点在原图中标记
的结果图;

图4是本发明的亮点数据用主成分分析法分析贡献率与主成分的关系图,其中:横坐标
表示维数,纵坐标表示贡献率;

图5是本发明用DBSCAN方法清洗的结果图,其中,X、Y、Z轴分别表示降维后的三
维数据;图中的实心圆型代表亮点,米字型代表非亮点结构。

具体实施方式

实施例1:如图1-5所示,一种清洗天文图像中太阳光球亮点的方法,首先对序列图像进
行预处理,然后采用一种拉普拉斯滤波和形态学膨胀相结合的方法来识别亮点;再通过三维
联通的方法跟踪亮点;然后提取亮点的多个相关度较低的特征值作为清洗的数据;接着,对
清洗的数据做z-score标准化处理;再采用主成分分析法根据贡献率将高维的标准化数据进行
降维;最后,通过DBSCAN方法对降维后的数据进行清洗,从而剔除非亮点结构。

所述清洗天文图像中太阳光球亮点的方法的具体步骤如下:

Step1、亮点数据识别;首先对序列图像进行预处理,包括采用最大局部相关的对齐方法
对齐序列图像,归一化序列图像、平滑图像;然后采用拉普拉斯滤波和形态学膨胀相结合的
方法识别序列图像中每幅图的光球亮点;

Step2、亮点数据跟踪;在序列图像的每一幅图上识别出光球亮点后,再由序列图像中识
别出的所有亮点构成的三维时空立方体中采用三维联通方法对光球亮点进行三维跟踪,其中,
三维时空立方体(x,y,t)中x和y是二维平面图像的坐标,t是时间坐标;

Step3、亮点数据特征提取;识别和跟踪亮点后,提取亮点的相关度较低、且能代表亮点
的光学强度、形态和运动等各方面的多个特征值作为清洗的数据;

Step4、亮点数据标准化;得到清洗数据之后,采用z-score方法标准化亮点数据,即将数
据标准化为均值为0,方差为1的正态分布;

Step5、亮点数据降维;采用主成分分析法对标准化后的清洗数据进行降维处理,根据贡
献率选择可降至的维度;

Step6、亮点数据清洗;对降维后的数据采用DBSCAN聚类方法进行清洗,从而剔除非亮
点结构。

进一步优选的,所述步骤Step3的清洗的数据属性包括等效直径、强度、偏心率、亮点
边缘处于暗径的比例、速度、运动方式和扩散系数特征值。

实施例2:如图1-5所示,一种清洗天文图像中太阳光球亮点的方法,首先对序列图像进
行预处理,然后采用一种拉普拉斯滤波和形态学膨胀相结合的方法来识别亮点;再通过三维
联通的方法跟踪亮点;然后提取亮点的多个相关度较低的特征值作为清洗的数据;接着,对
清洗的数据做z-score标准化处理;再采用主成分分析法根据贡献率将高维的标准化数据进行
降维;最后,通过DBSCAN方法对降维后的数据进行清洗,从而剔除非亮点结构。

所述清洗天文图像中太阳光球亮点的方法的具体步骤如下:

步骤1、亮点数据识别;首先用最大局部相关的对齐方法对齐序列图像(本例中该序列
图像来源于日出/太阳光学望远镜在G波段观测到的高分辨图像,共有758幅图)、归一化序
列图像、平滑图像;然后对序列图像中的每一幅图分别进行拉普拉斯滤波并通过阈值法预选
亮点;最后采用形态学膨胀方法计算每个预选的亮点的边缘处于暗径的比例,筛选出70%的
边缘位于暗径中的亮点。如图2为日出/太阳光学望远镜在G波段观测到的该序列图像中的第
一幅高分辨图像,图3显示了本步骤识别出的亮点在图2标记的结果,如图中白点所示位置;

步骤2、亮点数据跟踪;将整个序列图像中识别出的亮点构造一个三维时空立方体,用
26领域联通方法对光球亮点进行跟踪。其中,三维时空立方体的三维坐标系(x,y,t)中,x和y
是二维图像的平面坐标,t是序列图像的时间坐标。

26领域联通方法描述如下:假设p和q是三维立方体中的两个点,分别表示为:p=(px;py;
pz),q=(qx;qy;qz),如果p和q同时满足|px-qx|≤1,|py-qy|≤1和|pz-qz|≤1,则称p和q满
足26领域联通。26联通能将目标像素点在三个维度方向上的26个相邻位置上的像素点联通
为一个区域,所以是一种能跟踪亮点在三维时空立方体中的演化的较好方式;

步骤3、提取亮点的特征值。提取的特征值包括亮点的等效直径、强度、偏心率、亮点边
缘处于暗径的比例、速度、运动方式和扩散系数。这些特征值作为清洗亮点的依据是比较合
理的,因为这七个属性相关度低,且能代表亮点的光学强度、形态和运动等多方面的特点。
七个特征值定义如下:

等效直径:将每一个亮点对应的所有像素点作为面积,将其等效为圆来计算其等效直径。

最大强度比:用亮点的最大强度除以整幅图的平均强度来描述亮点的强度。

偏心率:用椭圆两焦点间的距离除以长轴长度描述亮点的形状。偏心率越大,说明越偏
向于长椭圆,反之则说明越偏向于圆形。

亮点边缘处于暗径的比例:亮点的一个重要特性是其位于较暗的米粒暗径,因此提取每
一个亮点边缘位于暗径的比例。

速度:根据亮点在其生命期内每一帧图像上的质心位置计算每两帧之间的位移,以计算
亮点的速度。

运动方式:定义变量m,m=Displacement/TotalLength。其含义为位移(Displacement)除
以运动轨迹长度和(TotalLength)。Displacement为光球亮点首尾质心之间的位移,其公式如下
所示:

D i s p l a c e m e n t = ( X ( n ) - X ( 1 ) ) 2 + ( Y ( n ) - Y ( 1 ) ) 2 , ]]>

其中,X(1)和Y(1)为亮点在起始帧图像的质心坐标,X(n)和Y(n)为亮点在结束帧图像的质
心坐标。

运动轨迹长度和为每两帧图像间位移之和,其公式如下所示:

T o t a l L e n g t h = Σ t = 1 n ( X ( t + 1 ) - X ( t ) ) 2 + ( Y ( t + 1 ) - Y ( t ) ) 2 ]]>

其中,X(t)和Y(t)为亮点在第t帧图像的质心坐标,X(t+1)和Y(t+1)为亮点在第t+1帧图像
的质心坐标。

根据定义,m可以用来定量描述亮点的运动轨迹,其值范围为0到1。如果m等于1,则
意味着亮点的运动轨迹为直线;如果m等于0,则表示亮点从起始点出发又回到原点。m越
接近1则意味着亮点沿着接近直线的轨迹在运动,越接近0,

则意味着亮点的轨迹近似于绕圈的运动。

扩散系数:扩散系数是描述亮点的扩散面积与时间的关系,其定义为(Δl)2=Cτγ,其中
(Δl)2代表亮点在生命期中任意时刻的位置与初始位置的平方位移,γ是扩散系数,τ是亮点的
生命期。扩散系数值越大,意味着在单位时间内扩散的面积越大,反之亦然;

步骤4、亮点数据标准化;得到清洗数据之后,采用z-score方法标准化数据,使其符合标
准正态分布,即均值为0,标准差为1。在七个特征值中,仅需对等效直径、强度、速度和扩
散系数进行标准化处理,因为偏心率、运动方式和边缘位于暗径的比例都已经是无量纲的数
据。分别对等效直径、强度、速度和扩散系数计算均值和标准差,然后用如下所示公式进行
标准化:

x * = x - μ σ ]]>

其中x为待标准化的数据,μ为均值,σ为标准差,x*为标准化后的数据;

步骤5、亮点数据降维;采用主成分分析法对亮点的七个特征值进行降维。主成分分析法
是一种无监督特征抽取降维方法,利用特征数据的内在关联结构,通过线性变换将多维的特
征数据变换为维度较少包含原有特征大部分信息且相互独立的特征数据。由于各项特征数据
不存在人为关联,可使得清洗的结果更为合理。主成分分析法的降维过程描述如下:

在主成分分析法中,将七个特征值称为七维数据。首先用标准化后的亮点的7个特征值
构造一个特征数据矩阵,如下公式所示:

X = X 11 X 12 ... X 1 p X 21 X 22 ... X 2 p . . . . . . . . . X n 1 X n 1 ... X n p ]]>

其中,p表示亮点的个数,n表示特征数据的维数,Xnp表示第p个亮点的n维数据,X为
特征数据矩阵。然后计算特征数据的协方差矩阵,得到各维数据之间的关系;通过协方差矩
阵算出特征向量和特征值,将特征值由大到小排列,给出成分的重要性级别选择降维目标数
k,最后用协方差矩阵的前k列乘以原始数据矩阵,即得到降维后的数据矩阵。其中,k的选
择通过分析贡献率来确定,贡献率表示所定义的主成分在整个数据分析中承担的主要意义占
多大的比重,当取前k个主成分来代替原来全部变量时,累计贡献率的大小反应了这种取代
的可靠性,累计贡献率越大,可靠性越大;反之,则可靠性越小。

亮点的7个标准化后的特征数据通过主成分分析如图4所示,其中坐标横轴代表维数,
纵轴代表贡献率,柱状体代表每一维的贡献率,曲线代表累计贡献率。从图中可以看出,第
一维的贡献率为46%,第二维为25%,第三维为19%。选择降至二维时,其贡献率累计达到
71%,降至三维时达到90%。90%的贡献率意味着这三维的数据已能代表原始数据90%的意
义,因此我们将七维数据选择降至三维;

步骤6、亮点数据清洗;采用DBSCAN聚类方法清洗亮点数据。DBSCAN是一种基于密
度的聚类方法,该方法把具有足够高密度的区域划分为簇,并可以发现任意形状的聚类,它
定义簇为基于密度的点的最大集合。描述该方法之前需做以下定义:

定义1(ε-邻域)--给定对象半径ε内的区域称为该对象的ε-领域。

定义2(核心对象)--如果一个对象的ε-领域至少包含最小数目MinPts个对象,则称该对
象为核心对象。

定义3(直接密度可达)--给定一个对象集合D,如果p是在q的ε-邻域内,而q是一个
核心对象,我们说对象p从对象q出发是直接密度可达的。

定义4(密度可达)--如果有一个数据对象序列p1,p2,...,pn∈D,其中p1=q,pn=p,
并且pi+1是从pi直接密度可达的,则称p是从q关于ε和MinPts密度可达的。

定义5(密度相连)--如果存在一个数据对象O使得p和q都是从O关于ε和MinPts密
度可达的,则称p和q是关于ε和MinPts密度相连的。

DBSCAN方法的流程描述如下:首先通过检查数据库中每个点的ε-邻域来寻找聚类。如
果一个点p的ε-邻域内含多于MinPts个点,则建一个以p作为核心对象的新簇。然后,DBSCAN
反复地寻找从这些核心对象直接密度可达的对象,一些密度可达簇同时进行合并。当没有新
的点可以被添加到任何簇时,该过程结束。

DBSCAN方法清洗的结果如图5所示,其中,X、Y和Z轴分别表示降维后的三个特征数
据的坐标范围,实心圆型代表亮点,米字型代表非亮点结构。从图中可以看出,米字型代表
的非亮点结构在三维图中明显远离于亮点,达到了清洗亮点数据的目的,有效地剔除了非亮
点结构。为小尺度的磁场研究进一步研究日冕加热等问题的研究清洗出更为准确的亮点数据。

上面结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方
式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出
各种变化。

一种清洗天文图像中太阳光球亮点的方法.pdf_第1页
第1页 / 共11页
一种清洗天文图像中太阳光球亮点的方法.pdf_第2页
第2页 / 共11页
一种清洗天文图像中太阳光球亮点的方法.pdf_第3页
第3页 / 共11页
点击查看更多>>
资源描述

《一种清洗天文图像中太阳光球亮点的方法.pdf》由会员分享,可在线阅读,更多相关《一种清洗天文图像中太阳光球亮点的方法.pdf(11页珍藏版)》请在专利查询网上搜索。

本发明涉及一种清洗天文图像中太阳光球亮点的方法,属天文技术、图像处理和数据挖掘领域。本发明包括步骤:首先采用一种拉普拉斯滤波和形态学膨胀相结合的方法识别亮点和采用三维联通的方法跟踪亮点,然后提取亮点的多个相关度较低的特征值,对这些特征值数据标准化后,采用主成分分析法根据贡献率降低维度,最后采用DBSCAN方法对降维后的亮点数据进行清洗,以去除非亮点结构。本发明将DBSCAN方法应用于光球亮点数据的。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1