《一种用于聚类分析优化人工鱼群的方法.pdf》由会员分享,可在线阅读,更多相关《一种用于聚类分析优化人工鱼群的方法.pdf(8页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103336840 A(43)申请公布日 2013.10.02CN103336840A*CN103336840A*(21)申请号 201310299162.5(22)申请日 2013.07.17G06F 17/30(2006.01)G06N 3/00(2006.01)(71)申请人沈阳大学地址 110044 辽宁省沈阳市大东区望花南街21号(72)发明人田力威 田琳(74)专利代理机构沈阳技联专利代理有限公司 21205代理人赵越(54) 发明名称一种用于聚类分析优化人工鱼群的方法(57) 摘要一种用于聚类分析优化人工鱼群的方法,涉及一种优化人工鱼群的方法,包括以下步。
2、骤:步骤1:设置人工鱼参数的初值,利用目标函数计算当前位置的食物浓度;步骤2:通过鱼群模块的执行条件和人工鱼前进准则,每条人工鱼分别执行觅食、追尾、聚群等模块;步骤3:每条人工鱼的状态代表一个决策变量,通过计算目标函数值来评价鱼的寻优程度;步骤4:依据公告板信息和鱼群的位置,选出K-中心点的输入参数,最终得到清晰地聚类划分。根据本申请的方法,通过改进人工鱼群算法,进行了数据聚合的优化。减少所需时间,使决策准确性更高。(51)Int.Cl.权利要求书1页 说明书4页 附图2页(19)中华人民共和国国家知识产权局(12)发明专利申请权利要求书1页 说明书4页 附图2页(10)申请公布号 CN 10。
3、3336840 ACN 103336840 A1/1页21.一种用于聚类分析优化人工鱼群的方法,其特征在于,所述方法包括以下步骤:步骤1:设置人工鱼参数的初值,利用目标函数计算当前位置的食物浓度;步骤2:通过鱼群模块的执行条件和人工鱼前进准则,每条人工鱼分别执行觅食、追尾、聚群等模块,算法中的食物浓度可以参照为数据密度,对比视野范围内食物浓度选择优劣解,将其状态记录到公告板上,人工鱼聚集在数据密度高的区域;步骤3:每条人工鱼的状态代表一个决策变量,通过计算目标函数值来评价鱼的寻优程度,将其状态记录在公告板上,重复上述步骤,更新人工鱼的位置信息,达到最大迭代次数时算法终止,最终选择能表示初始聚类。
4、中心的解;步骤4:依据公告板信息和鱼群的位置,选出K-中心点的输入参数,即初始中心点和聚类个数;用K-中心点算法进行聚类分析,最终得到清晰地聚类划分,在所有数据遍历聚集后,整个步骤结束。权 利 要 求 书CN 103336840 A1/4页3一种用于聚类分析优化人工鱼群的方法技术领域0001 本发明涉及一种优化人工鱼群的方法,特别是涉及一种用于聚类分析优化人工鱼群的方法。背景技术0002 目前聚类的研究多集中在混合聚类上:基于模拟退火的聚类分析虽然聚类结果较好,但是此方法执行时间过长且不适用于海量数据的分析。基于遗传算法的混合聚类虽然并行性较好,但是仍然无法解决初始聚类中心随机,而导致团簇聚集。
5、分散。由于K中心点方法无法自动获得中心点,每次都需要比较相异度之和才能选出下一次迭代的簇心,这样算法的计算代价会很大。发明内容0003 本发明的目的在于提供一种用于聚类分析优化人工鱼群的方法,该方法能够自动获得聚类分析的中心点,并且当数据集发生变化时,可以快速跟踪变化,自适应的调整算法进行方向,根据本申请的算法,进行数据聚合的优化,减少所需时间,使决策准确性更高。0004 本发明的目的是通过以下技术方案实现的:一种用于聚类分析优化人工鱼群的方法,所述方法包括以下步骤:步骤1:设置人工鱼参数的初值,利用目标函数计算当前位置的食物浓度;步骤2:通过鱼群模块的执行条件和人工鱼前进准则,每条人工鱼分别。
6、执行觅食、追尾、聚群等模块,算法中的食物浓度可以参照为数据密度,对比视野范围内食物浓度选择优劣解,将其状态记录到公告板上,人工鱼聚集在数据密度高的区域;步骤3:每条人工鱼的状态代表一个决策变量,通过计算目标函数值来评价鱼的寻优程度,将其状态记录在公告板上,重复上述步骤,更新人工鱼的位置信息,达到最大迭代次数时算法终止,最终选择能表示初始聚类中心的解;步骤4:依据公告板信息和鱼群的位置,选出K-中心点的输入参数,即初始中心点和聚类个数;用K-中心点算法进行聚类分析,最终得到清晰地聚类划分,在所有数据遍历聚集后,整个步骤结束。0005 本发明的优点与效果是:(1)减少计算量和算法执行时间,不仅提高。
7、算法运行效率,且不影响算法收敛性。0006 (2)提高对理噪声数据的处理,跳出局部最优,防止离群点影响而错过全局极值点的问题。0007 (3)解决了初始化聚类中心敏感问题,聚类划分质量精度更高,特性相似的数据聚集明显清晰。0008 (4)此方法还适用于具有复杂属性的数据库,在知识发现、信息预测决策分析有着重大作用。0009 (5)其良好的并行性和稳定性可有效的适应实时的数据的动态变化。说 明 书CN 103336840 A2/4页4附图说明0010 图1为一种用于聚类分析的优化人工鱼群方法;图2示出接收到海量数据的分布图;图3示出了进行数据遍历后生成的效果图。具体实施方式0011 下面结合实施。
8、例对本发明进行详细说明。0012 参照图1描述根据本申请实施方式的用于聚类分析的优化人工鱼群方法步骤1设置人工鱼参数的初值,计算当前位置的食物浓度。0013 初始化所采用人鱼群算法的参数,如果人工鱼个数为N、人工鱼个体的状态定义为:,其中fi为欲寻优的变量、人工鱼移动的最大步长Step、人工鱼的视野Visual、觅食最大试探次数Try_number、拥挤度因子、人工鱼所在位置的食物浓度的计算公式为 。0014 步骤2通过鱼群模块的执行条件和人工鱼前进准则,每条人工鱼分别执行觅食、追尾、聚群等模块,算法中的食物浓度可以参照为数据密度,对比视野范围内食物浓度选择优劣解,将其状态记录到公告板上,最终。
9、人工鱼聚集在了数据密度高的区域。0015 用于聚类分析的方法为人工鱼群方法,该方案分为三部分,包括觅食模块、聚群模块和追尾模块。0016 A觅食模块觅食模块作为人工鱼的基本习性之一,主要原理是鱼群通过视觉与味觉趋向于食物浓度大的区域。设置当前人工鱼状态为Fi,随机选择当前位置视野内一个状态Fj,其中选择视野内随机状态的公式定义为:式中 ,从公式可求出范围内的状态Fj。0017 再求优化解过程中,若食物浓度 ,说明状态更优则向此位置方向前进一个步长,其中人工鱼前进的公式定义为:式中Fik与Fik+1分别表示人工鱼当前位置与移动后的下一个位置,通过此公式得到觅食模块执行后的下一个位置信息。0018。
10、 若不符合前进条件则随机选择状态Fj,重新判断,反复试探Try_number次后,若仍无法找出更优解,人工鱼向公告板记录的相比之下状态较好的值前进一步,其公式定义如下:说 明 书CN 103336840 A3/4页5式中Fi(k+1)与Fi(k)分别表示人工鱼当前位置与移动后的下一个位置,Fbetter为告板记录较好的状态,通过公式得到觅食模块失败时的下一个位置信息。相对于随机模块给出了更好的前进可能性,进而跳出局部最优,防止人工鱼在局部震荡而停滞不前。0019 B聚群模块鱼在游动时为确保群体的生存,会向邻近伙伴的中心聚集。Fi仍对应当前人工鱼状态,感知当前位置附近(视野内)人工鱼数目nf及其。
11、位置的中心Fc。若满足公式 ,则说明该中心位置食物较多、拥挤度较小,则向Fc进一步,向中心位置移动一步的公式为:通过上式,得到即聚群模块执行后的位置信息。0020 若不满足则进一步实施随机游模块,且随机游模块选择自适应步长,这样克服了人工鱼在极值点聚集而错过全局极值点的问题,优化的算法使求解质量精度更高。0021 自适应步长表示人工鱼移动的距离随着迭代次数增加而改变。自适应步长定义为。0022 C追尾模块鱼在游动时当其中一条或几条鱼探索到食物时,其邻域范围内的鱼会尾随鱼群到达食物位置。Fi对应当前人工鱼状态,感知当前位置附近人工鱼中状态最优的Fj,若满足公式则显示Fj位置附近的食物较多、拥挤度。
12、较小,则向Fj前进一步,判断不符合条件则执行觅食模块。0023 然后进行进一步处理,令初期拥挤度因子=0.75,当Try_number=180时,忽略拥挤度因子即 ,算法初期希望限制人工鱼的规模,但在后期人工鱼基本聚集在较优状态附近,缺省减少计算量和算法执行时间,这样改进不仅提高算法运行效率,并且不影响算法收敛性。0024 步骤3每条人工鱼的状态代表一个决策变量,通过计算目标函数值来评价鱼的寻优程度,将其状态记录在公告板上,重复2)3),更新人工鱼的位置信息,达到最大迭代次数时算法终止,最终选择能表示初始聚类中心的解。0025 其中目标函数度量对象与其簇的代表对象的平均相异,表示类间数据分布的。
13、紧密程度,目标函数定义为:其中是步骤4中的初始输入参数,X为数据点。0026 步骤4说 明 书CN 103336840 A4/4页6依据公告板信息和鱼群的位置,选出K-中心点的输入参数,即初始中心点和聚类个数;用K-中心点算法进行聚类分析,使数据类内离散度之和:达到最小。0027 其中K-中心点算法的执行方式为:令为N个样品数据,x是数据的代表点,图2为接收到海量数据的分布图,从图中可看出数据散乱的分别在空间中,用基于聚类分析的优化人工鱼群方法来处理数据。令Ci是任意一个簇,Oi是簇Ci的中心点,(j=1,2,k)。过程描述:通过步骤1、2和3,得到样本集X里Ck个簇的k个初始中心点,将除了代。
14、表中心点的其余数据利用最临近原则分配到各个簇中;在每个簇(Ci)中,随机地选取一个非中心点Oj,计算用非中心点代替原簇中心点的总代价E。如果E0,就用非中心点Oj替换原中心点Oi;其中代价函数构成如下: 式中E代表绝对误差标准的改变量,E2指的是替换中心点后数据集中所有代表点与其同簇中中心点之间的相异度的和,E1代表未替换前数据集中所有代表点与其同簇中中心点之间的相异度的和。0028 在所有数据遍历聚集后,k个团簇清晰地分布在数据集上,图3即进行数据遍历后生成的效果图,可以看出数据聚集效果清晰,团簇均聚集到全局数据密集处,聚类边缘更明显,得到了精确性较高的划分结果,由此整个方法过程结束。0029 在接收到实时的海量的数据,根据本申请的方法,通过改进人工鱼群算法,进行了数据聚合的优化。减少所需时间,使决策准确性更高。0030 本领域技术人员能够根据本发明的上述描述进行改进、变化和修订。这些对于本领域技术人员显而易见的改进、变化或修订由所附的权利要求来限。说 明 书CN 103336840 A1/2页7图1说 明 书 附 图CN 103336840 A2/2页8图2图3说 明 书 附 图CN 103336840 A。