《基于蚁群聚类和遗传算法的新型码本设计方法.pdf》由会员分享,可在线阅读,更多相关《基于蚁群聚类和遗传算法的新型码本设计方法.pdf(14页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103310275 A (43)申请公布日 2013.09.18 CN 103310275 A *CN103310275A* (21)申请号 201310256145.3 (22)申请日 2013.06.25 G06N 3/12(2006.01) (71)申请人 北京航空航天大学 地址 100191 北京市海淀区学院路 37 号 (72)发明人 修春娣 苏兆安 刘建伟 (74)专利代理机构 北京慧泉知识产权代理有限 公司 11232 代理人 王顺荣 唐爱华 (54) 发明名称 基于蚁群聚类和遗传算法的新型码本设计方 法 (57) 摘要 一种基于蚁群聚类和遗传算法的新型。
2、码本设 计方法, 其步骤如下 : 步骤一 : 利用不同数目的蚂 蚁将训练数据随机地分布在不同尺寸的二维空间 上, 采取 LF 算法进行初始聚类的生成 ; 步骤二 : 初始聚类依照码本尺寸进行的聚类簇的修正, 保 证聚类的数目与初始设定的码本尺寸是相同的 ; 步骤三 : 在初始种群成功获得的前提下, 依照遗 传算法的基本流程, 进行个体选择、 交叉和突变操 作, 直到迭代停止得到满足要求的最优个体。 本发 明不仅克服了 LBG 算法中初始选择与最终设计的 结果相关性较强的缺点, 同时避免了类似 LBG 算 法陷入局部最优的劣势。 它适用于大数量处理、 语 音通信、 模式识别、 IP 电话等领域。。
3、 (51)Int.Cl. 权利要求书 2 页 说明书 7 页 附图 4 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书2页 说明书7页 附图4页 (10)申请公布号 CN 103310275 A CN 103310275 A *CN103310275A* 1/2 页 2 1. 一种基于蚁群聚类和遗传算法的新型码本设计方法, 其特征在于 : 该方法的步骤如 下 : 步骤一 : 利用不同数目的蚂蚁将训练数据随机地分布在不同尺寸的二维空间上, 采取 LF 算法进行初始聚类的生成 ; 步骤二 : 初始聚类依照码本尺寸进行的聚类簇的修正, 保证聚类的数目与初始设定的 码本尺寸。
4、是相同的 ; 步骤三 : 在初始种群成功获得的前提下, 依照遗传算法的基本流程, 进行个体选择、 交 叉和突变操作, 直到迭代停止得到满足要求的最优个体。 2. 根据权利要求 1 所述的一种基于蚁群聚类和遗传算法的新型码本设计方法, 其特征 在于 : 在步骤一中用到的采取 LF 算法进行初始聚类的生成, 聚类过程中用到的参数主要包 括蚂蚁数目 m, 二维空间尺寸 Z, 聚类半径 s, 相异度常数 , 及常数值 k1,k2, 搬运概率 Pp放 下概率 Pd; 在步骤一中采取 LF 算法进行初始聚类的生成的基本步骤如下 : (1) 设定初始的蚂蚁数目为 m, 步长为 ma, 二维空间尺寸初始为 Z。
5、, 步长为 za, 在当前蚂 蚁数目和二维空间下将训练序列的数据随机地分配到二维空间上, 所有蚂蚁均设置成空载 状态, 此时对于训练序列中的任一元素 Oi, 其位置 XiYi均是随机地处于 Z*Z 空间内 ; (2) 对于每一只蚂蚁, 在聚类空间上随机地选取一个位置, 如果当前蚂蚁处于空载状态 且当前位置上有数据存在, 计算当前数据元素与以当前位置为中心的聚类半径内所有数据 元素的相似度, 随机生成一个 (0,1) 范围内的数值, 如果随机数大于搬运概率则蚂蚁搬运该 数据, 当前位置上数据清空 ; (3) 如果当前位置上没有数据且蚂蚁处于搬运状态, 运用步骤 (2) 中计算得到的相似度 计算当。
6、前蚂蚁对于当前数据的放下概率, 计算完成后进行判断 : 随机生成一个 (0,1) 范围 内的数值, 如果随机数超过放下概率则蚂蚁放下数据, 蚂蚁设置成空载状态 ; (4) 蚂蚁的位置进行随机地定长移动, 即 X 或者是 Y 坐标加减步长, 重复移动操作直到 当前移动到的位置没有被其他的蚂蚁占据 ; (5) 重复步骤 (2) -(4) 直到对设定数目的蚂蚁均完成操作, 完成操作之后得到对于原 始数据的聚类结果, 此时得到的聚类数目可能与设定达到的码本尺寸是不一样的 ; (6) 依照步骤 (1) 中设定的蚂蚁数目步长 ma 与二维空间步长 za 更改初始参数, 重复步 骤 (2) -(5) 。 3。
7、. 根据权利要求 1 所述的一种基于蚁群聚类和遗传算法的新型码本设计方法, 其特征 在于 : 在步骤二中进行的初始聚类依照码本尺寸进行的聚类簇的修正, 以保证聚类簇的数 目与码本尺寸是一致的 ; 在步骤二中进行的初始聚类依照码本尺寸进行的聚类簇的修正的基本步骤如下 : (1) 初始参数设定 : 码本尺寸 M, 图 2 中得到的聚类数目 K ; (2) 如果 MK, 将得到的聚类数据按照每个聚类簇内训练序列矢量的数目进行降序排 列, 然后将最大聚类簇内的数据依照到这个聚类簇形心距离的大小一分为二, 生成两个新 权 利 要 求 书 CN 103310275 A 2 2/2 页 3 的聚类簇, 重复。
8、拆分操作直到聚类数目与初始设定的码本尺寸相同, 即 M=K ; (4) 对于当前得到的 M 个聚类簇进行形心计算, 将形心当作初始码本中的码矢。 4. 根据权利要求 1 所述的一种基于蚁群聚类和遗传算法的新型码本设计方法, 其特征 在于 : 在步骤三中用到的遗传算法的基本流程, 采用遗传算法将之前得到的初始种群进行 选择、 交叉和基因突变操作的步骤, 其中用到的参数包括种群大小 Npop_size、 突变概率 Pm、 交 叉概率 Pc和迭代停止门限 ; 其中, 步骤三中采用的遗传算法的基本流程, 其具体的步骤如下 : (1) 对于所有的个体计算各自的适应度值, 然后将个体按照适应度进行降序排列。
9、, 判断 最优个体的适应度是否大于迭代停止门限, 如果大于迭代停止门限则迭代工作完成, 进入 步骤 (4) , 反之进入步骤 (2) ; (2) 依照交叉概率 Pc选择已排序的个体序列中前 Pc*Npop_size个个体直接进入下一代, 然 后进行下一代剩余个体的生成工作 : 对已排序的个体序列, 按照从前面开始第一个与倒数 第一个配对、 前面第二个与倒数第二个配对的原则, 将配对的两个个体当作父代, 然后采取 单点交叉操作生成新的两个个体, 放置到下一代中当作子代, 重复交叉操作直到总个体数 目满足种群大小 ; (3) 依照基因突变概率 Pm选取 Pm*Npop_size个个体进行突变操作,。
10、 操作过程为 : 对于每个 个体生成一个 (0,1) 范围内的随机数, 如果随机数大于Pm则当前个体进入突变操作, 对于当 前个体的染色体上的基因采取小范围内的突变, 突变数值是个体的适应度的函数 ; 如果随 机小于 Pm则当前个体保存, 不进入突变操作, 对于所有个体均完成选择和突变操作, 进入步 骤 (1) ; (4) 输出适应度最大的个体作为最终码本设计的结果。 权 利 要 求 书 CN 103310275 A 3 1/7 页 4 基于蚁群聚类和遗传算法的新型码本设计方法 技术领域 0001 本发明提供一种基于蚁群聚类和遗传算法的新型码本设计方法, 它涉及到的是一 种针对信号处理中矢量量。
11、化所用码本的新型码本设计方法, 特别涉及到的是混合激励线性 预测编码方案中针对线谱对频率参数量化的码本设计, 该方法能够有效减弱设计所得码本 与训练序列之间的相关性, 同时有效防止码本设计过程中陷入局部最优, 适用于在数据维 数较大、 分配用来传输的比特数目较少的情况下实现数据的高精度量化。 技术背景 0002 随着当今社会的逐步发展, 移动通信的通信数据量正逐步加大, 传统的通信资源 如频谱已经无法满足日常的通信需求, 针对此种现状研究人员提出了矢量量化的概念, 矢 量量化能够有效的提高数据处理效率, 减少其占用的通信资源, 因而被广泛的应用于卫星 通信、 模式识别、 IP电话和大数据压缩等。
12、领域。 矢量量化的具体方法是将发送端一个多维的 数据进行处理, 通过计算此数据与一定数量的同维数数据之间 (称之为码矢) 的欧氏距离, 进而挑选出两者之间距离最小的矢量, 并将其当作待处理数据的替代, 数据在传递的时候 传递的是最小距离码矢在所有码矢中的顺序标号, 而数据接收端在接收数据之后依照数据 标号进行索引查询, 从而得到发送端所处理数据的最优替代。由此可以看出码本的设计对 于矢量量化的效果至关重要, 有效、 精确的码本能够保证在数据接收端将原始数据尽可能 精确地恢复出来, 所以如何在有限训练序列的情况下得到效果最优的码本就成为了信号处 理领域的一个研究热点。 0003 码本设计的算法出。
13、现最早的是LBG算法, 由Linde、 Buzo和Gray于1980年提出的, 这种方法不需要知道训练序列的概率分布, 通过对训练序列采取一定的迭代算法来逼近最 优码本。LBG 算法的主要步骤是 : 1, 从训练序列中随机地选取符合码本尺寸个数的矢量作 为初始码矢 ; 2, 将训练序列中所有的矢量按照最小欧氏距离的原则分配到第一步中初始码 矢的周围, 称之为聚类处理 ; 3, 对于每个聚类所包含的所有训练序列的矢量计算形心, 作为 新的码矢 ; 4, 计算采用新型码本量化训练序列所有矢量的失真情况, 如果失真达到初始设 定的门限则停止, 完成码本训练, 否则重覆步骤 2 和 3。LBG 算法的。
14、优点是操作步骤简单, 且 码本训练时间较短, 能够满足大部分的码本设计要求, 但是这种算法的局限性同样明显 : 首 先初始化的时候采取的随机选择方法造成最终所得的码本在初始选择不同的时候, 其对于 训练序列的量化效果相差较大, 即最优码本与初始码矢的相关性较强 ; 其次, 设计阶段容易 陷入局部最优, 造成无法得到最终需要的收敛效果。针对 LBG 算法的这两个缺点, 国内外的 许多专家学者进行了长时间的研究, 并提出了多种有效的码本设计方法, 有效地改善了码 本设计的效果。 0004 ZongboXie 和 JiuchaoFeng 在论文 Codebook Design For Vector 。
15、Quantization Based on a Kernel Fuzzy Learning Algorithm 中提出了一种基于莫克尔模糊聚类和 梯度算法的码本设计方法, 方案中将 LBG 中的欧氏距离运算采取核距离的方法, 极大的降 低了计算复杂度, 同时仿真效果显示码本设计的效果与 LBG 相比有所提升。H.B.Kekre 说 明 书 CN 103310275 A 4 2/7 页 5 和 ChetanAgarwal 在 文 章 Codebook optimization using genetic algorithm and simulated annealing 中成功地将遗传算法和模拟。
16、退火算法应用到码本设计中, 在不额外 增加码本尺寸的前提下对码本进行了进一步的优化, 且充分运用了遗传算法良好的全局搜 索能力, 避免了陷入局部最优, 效果显著。陈倩在论文 基于遗传 LBG 的图像矢量量化改进 算法 中通过对遗传算法过程中个体选择前所有的个体进行三次迭代聚类操作, 充分利用 LBG算法局部搜索能力的同时, 改善了码本设计的效果并加快了算法的收敛速度。 大部分现 在提出且已经使用的码本设计方法都无法在提高设计效果和减弱初始选择与最终结果之 间相关性上获得兼顾, 同时有的算法因为很容易陷入局部最优导致最后计算得到的码本虽 然能够满足初始设定的门限, 但是实际使用量化效果较差, 因。
17、此提出一种能够有效的避免 陷入局部最优, 且最终码本与初始选择相关性较小的码本设计方法是目前急需要研究解决 的问题。 发明内容 0005 1、 目的 : 0006 为了提高码本的量化效果, 进而提升矢量量化在实际信号处理中的精确度, 传统 的码本设计方法有的是单一地利用蚁群聚类算法, 充分利用其聚类结果与初始设置相关性 较低的优点, 这样得到的码本在量化效果上无法满足实际应用要求, 且有的时候在有限的 训练时间内无法达到收敛状态, 有的方案是单一地利用遗传算法或者模拟退火算法, 虽然 避免了陷入局部最优, 但是方案在最初的时候仍然需要初始个体的选择, 最优结果与初始 选择之间相关性密切, 还有。
18、的方案是以牺牲量化效果为代价, 降低码本设计中的计算量和 时间复杂度的, 大部分的方法都无法在量化效果与实际时间复杂度、 初始相关性之间获取 兼顾, 本发明的目的是提供一种基于蚁群聚类和遗传算法的新型码本设计方法, 它是提出 一种基于蚁群聚类和遗传算法的码本设计方案, 该方案在初始阶段充分利用蚁群聚类算法 与初始选择相关性很低的优点, 在不同尺寸的二维空间内采取不同数目的蚂蚁进行初始聚 类簇的生成, 计算每个聚类簇的形心将其当作遗传操作中的初始种群中个体的染色体, 然 后依照遗传算法对其采取选择、 交叉和突变操作, 实际操作中针对实际应用数据的特征, 采 用了动态的交叉操作和突变方案, 直到最。
19、优个体的适应度即量化效果达到设定的门限, 在 避免了设计过程陷入局部最优的同时充分利用了遗传算法优秀的全局搜索能力, 有效地提 高了码本设计的效果。 0007 2、 技术方案 0008 本发明的主要特征在于 : 码本设计阶段首先采取蚁群聚类算法中的 LF 算法进行 初始聚类的生成, 该算法的主要原理是仿照自然界中蚁堆对于搬运蚂蚁尸体的工蚁的吸引 力是与蚁堆的尺寸成正比的, 蚁堆越大吸引力越大, 反之越小, 从而形成一种正反馈, 对于 此阶段中采取的二维空间的尺寸和蚂蚁的数目是不断变化的, 继而得到不同的聚类效果 ; 然后, 针对第一步中得到的聚类可能存在的聚类簇的数目与设定的码本尺寸不一样的缺。
20、 点, 进行聚类簇的修正 ; 最后, 针对之前得到的初始个体, 将其当作第一代种群的个体, 采取 遗传算法的基本流程, 执行遗传算法的选择、 交叉和突变操作, 最终在最优个体的适应度超 过初始设定门限的时候停止操作, 将最优个体输出当作码本设计的结果。 0009 图 1 给出的是基于蚁群聚类和遗传算法的新型码本设计方法, 本发明一种基于蚁 说 明 书 CN 103310275 A 5 3/7 页 6 群聚类和遗传算法的新型码本设计方法, 其具体的步骤如下 : 0010 步骤一 : 利用不同数目的蚂蚁将训练数据随机地分布在不同尺寸的二维空间上, 依照图 2 采取 LF 算法进行初始聚类的生成。 。
21、0011 步骤二 : 依照图 3 进行的初始聚类依照码本尺寸进行的聚类簇的修正, , 保证聚类 的数目与初始设定的码本尺寸是相同的。 0012 步骤三 : 在初始种群成功获得的前提下依照图 4 依照遗传算法的基本流程, 进行 个体选择、 交叉和突变操作, 直到迭代停止得到满足要求的最优个体。 0013 其中, 在步骤一中用到的依照图 2 采取 LF 算法进行初始聚类的生成, 聚类过程中 用到的参数主要包括蚂蚁数目 m, 二维空间尺寸 Z, 聚类半径 s, 相异度常数 , 及常数值 k1,k2, 搬运概率 Pp放下概率 Pd。 0014 在步骤一中采取 LF 算法进行初始聚类的生成的基本步骤如下。
22、 : 0015 (1) 设定初始的蚂蚁数目为 m, 步长为 ma, 二维空间尺寸初始为 Z, 步长为 za, 在当 前蚂蚁数目和二维空间下将训练序列的数据随机地分配到二维空间上, 所有蚂蚁均设置成 空载状态。此时对于训练序列中的任一元素 Oi, 其位置 XiYi均是随机地处于 Z*Z 空间内。 0016 (2) 对于每一只蚂蚁, 在聚类空间上随机地选取一个位置, 如果当前蚂蚁处于空载 状态且当前位置上有数据存在, 计算当前数据元素与以当前位置为中心的聚类半径内所有 数据元素的相似度, 随机生成一个 (0,1) 范围内的数值, 如果随机数大于搬运概率则蚂蚁搬 运该数据, 当前位置上数据清空。 0。
23、017 (3) 如果当前位置上没有数据且蚂蚁处于搬运状态, 运用步骤 (2) 中计算得到的相 似度计算当前蚂蚁对于当前数据的放下概率, 计算完成后进行判断 : 随机生成一个 (0,1) 范围内的数值, 如果随机数超过放下概率则蚂蚁放下数据, 蚂蚁设置成空载状态。 0018 (4) 蚂蚁的位置进行随机地定长移动, 即 X 或者是 Y 坐标加减步长, 重复移动操作 直到当前移动到的位置没有被其他的蚂蚁占据。 0019 (5) 重复步骤 (2) -(4) 直到对设定数目的蚂蚁均完成操作, 完成操作之后得到对 于原始数据的聚类结果 (此时得到的聚类数目可能与设定达到的码本尺寸是不一样的) 。 0020。
24、 (6) 依照步骤 (1) 中设定的蚂蚁数目步长 ma 与二维空间步长 za 更改初始参数, 重 复步骤 (2) -(5) 。 0021 其中, 在步骤二中依照图 3 进行的初始聚类依照码本尺寸进行的聚类簇的修正, 以保证聚类簇的数目与码本尺寸是一致的。 0022 在步骤二中进行的初始聚类依照码本尺寸进行的聚类簇的修正的基本步骤如 下 : 0023 (1) 初始参数设定 : 码本尺寸 M, 图 2 中得到的聚类数目 K。 0024 (2) 如果MK,将图2中得到的聚类数据按照每个聚类簇内训练序列矢量的数目进 行降序排列, 然后将最大聚类簇内的数据依照到这个聚类簇形心距离的大小一分为二, 生 成。
25、两个新的聚类簇, 重复拆分操作直到聚类数目与初始设定的码本尺寸相同, 即 M=K。 0026 (4) 对于当前得到的 M 个聚类簇进行形心计算, 将形心当作初始码本中的码矢。 说 明 书 CN 103310275 A 6 4/7 页 7 0027 其中, 在步骤三中用到的遗传算法的基本流程, 采用遗传算法将之前得到的初始 种群进行选择、 交叉和基因突变操作的步骤, 其中用到的参数包括种群大小 Npop_size、 突变概 率 Pm、 交叉概率 Pc和迭代停止门限 。 0028 其中, 步骤三中采用的遗传算法的基本流程, 其具体的步骤如下 : 0029 (1) 对于所有的个体计算各自的适应度值,。
26、 然后将个体按照适应度进行降序排列, 判断最优个体的适应度是否大于迭代停止门限, 如果大于迭代停止门限则迭代工作完成, 进入步骤 (4) , 反之进入步骤 (2) . 0030 (2) 依照交叉概率 Pc选择已排序的个体序列中前 Pc*Npop_size个个体直接进入下一 代, 然后进行下一代剩余个体的生成工作 : 对已排序的个体序列, 按照从前面开始第一个与 倒数第一个配对、 前面第二个与倒数第二个配对的原则, 将配对的两个个体当作父代, 然后 采取单点交叉操作生成新的两个个体, 放置到下一代中当作子代。重复交叉操作直到总个 体数目满足种群大小。 0031 (3) 依照基因突变概率 Pm选取。
27、 Pm*Npop_size个个体进行突变操作, 操作过程为 : 对于 每个个体生成一个 (0,1) 范围内的随机数, 如果随机数大于Pm则当前个体进入突变操作, 对 于当前个体的染色体上的基因采取小范围内的突变, 突变数值是个体的适应度的函数 ; 如 果随机小于 Pm则当前个体保存, 不进入突变操作。对于所有个体均完成选择和突变操作, 进入步骤 (1) 。 0032 (4) 输出适应度最大的个体作为最终码本设计的结果。 0033 3、 优点及功效 : 0034 本发明提供的这种基于蚁群聚类和遗传算法的新型码本设计方法, 不仅克服了 LBG 算法中初始选择与最终设计的结果相关性较强的缺点, 同时。
28、避免了类似 LBG 算法陷入 局部最优的劣势。码本设计过程中, 首先通过运用蚁群聚类算法中的 LF 算法, 使用不同数 目的蚂蚁在不同的二维空间上对训练数据进行聚类, 然后针对聚类所得聚类簇数目可能与 码本尺寸不同的特点, 采用图 2 中介绍的修正方案, 从而保证得到的个体中矢量的个数与 码本的尺寸是相同的, 然后将得到的个体当作遗传算法操作中最初的第一代个体, 进行个 体适应度计算、 个体选择、 交叉和基因突变操作, 最终当最优个体的适应度大于迭代停止门 限的时候停止, 输出此时的最优个体作为码本设计的结果, 保证了全局优化的进行。 0035 本发明适用于大数量处理、 语音通信、 模式识别、。
29、 IP 电话等领域, 本发明主要有以 下几个优点 : 0036 (1) 运用LF算法进行初始聚类的生成, 充分利用了LF算法的优点即最后的聚类效 果与蚂蚁的初始位置选择无关, 这样就充分克服了 LBG 算法中不同初始个体的选择对于最 终码本设计结果的强相关性影响。 0037 (2) 运用遗传算法完成个体的选择、 交叉和突变操作, 通过不断的迭代最终得到符 合条件的个体, 充分利用了遗传算法较强的全局搜索能力, 克服了 LBG 算法容易陷入局部 最优的缺点, 保证了最终的设计码本是基于整体训练序列而得到的。 0038 (3) 遗传算法在操作过程中不存在类似于 LBG 算法产生空包腔的问题, 更没。
30、有针 对空包腔而提出的大包腔拆分法, 在设计过程中提高了聚类效果。 附图说明 说 明 书 CN 103310275 A 7 5/7 页 8 0039 图 1 本发明所述方法总体流程图 0040 图 2 采用 LF 算法进行初始聚类的生成的流程图 0041 图 3 初始聚类依照码本尺寸进行的聚类簇的修正的流程图 0042 图 4 遗传算法的基本流程图 0043 M: 码本尺寸 0044 Oi: 数据元素 0045 Z*Z : 分布的二维空间 0046 s: 聚类半径 0047 : 相异度常数 0048 Pp: 装载数据概率 0049 Pd: 放下数据概率 0050 Npop_size: 种群大小。
31、 0051 Pc: 交叉概率 0052 Pm: 基因突变概率 0053 : 迭代停止门限 具体实施方式 0054 下面结合附图 1、 2、 3、 4, 以混合激励线性预测编码方案中用到的线谱对频率参数 为例具体介绍本发明所给出的新型码本设计方法, 其中线谱对频率参数为 10 维。 0055 本发明一种基于蚁群聚类和遗传算法的新型码本设计方法, 其具体的步骤如下 : 0056 步骤一 : 预设码本尺寸为 64, 即种群大小 Npop_size为 64。依照图 2 给出的方案, 首 先设定蚂蚁的初始数目为 100, 步长为 5, 二维空间的尺寸为 100, 步长为 10, 聚类半径 s 为 5, 。
32、相异度常数 为 2, 常数 k1,k2分别为 0.4、 0.6, 所有蚂蚁均设置成空载状态。数据相似 度的计算依照公式 (1) 进行, 蚂蚁搬运数据概率和放下数据概率的计算依照公式 (2) 、(3) 。 具体公式如下 : 0057 0058 0059 0060 在蚂蚁数目和二维空间尺寸确定的前提下, 聚类过程为 : 0061 (1) 对于第 i 个蚂蚁, 随机的分布到二维空间上, 如果蚂蚁处于空载状态且所在位 置上有数据存在, 依照公式 (1) 、(2) 分别计算相似度和搬运概率。生成一个 (0, 1) 范围内 的随机数, 如果随机数大于搬运概率则蚂蚁搬运数据, 当前点上数据清空, 蚂蚁设置成。
33、搬运 状态。如果蚂蚁处于搬运状态且当前位置上没有数据存在, 则依照公式 (3) 计算放下概率, 生成一个 (0, 1) 范围内的随机数, 如果随机数大于放下概率则蚂蚁放下数据, 当前点上存放 说 明 书 CN 103310275 A 8 6/7 页 9 数据, 蚂蚁成空载状态。 0062 (2) 蚂蚁进行位置移动, 移动规则为 X 轴未到边界则 X1, X 轴到达的边界的话则 Y 坐标 1, 采取加减的哪种形式取决于随机数的生成, 随机生成的一个 -1, 1 范围内的 数, 若随机数为正值则取加, 随机数为负值则为减, 保持移动直到所在位置上不被其他的蚂 蚁占据。 0063 (3) 依照迭代次。
34、数重复 (1)(2) , 得到当前蚂蚁数目和二维空间尺寸下的聚类结果。 0064 (4) 按照设定的步长改变蚂蚁数目和二维空间尺寸, 重复 (1) (2) (3) , 直到得到 足够次数的聚类结果。 0065 步骤二 : 对于步骤一中得到的初始聚类依照码本尺寸进行聚类簇的修正 : 如果聚 类簇数目与码本尺寸相同则直接计算各聚类簇的形心得到码本 ; 如果聚类簇数目大于码本 尺寸将聚类簇按照所属簇内训练序列矢量的数目多少进行降序排列, 然后将最大聚类簇与 最小聚类簇进行合并, 取代原先的最大聚类簇, 重复合并操作直到聚类簇数目与初始设定 的码本尺寸相同 ; 如果聚类簇数目小于码本尺寸则得到的聚类簇。
35、按照每个聚类簇内训练序 列矢量的数目进行降序排列, 然后将最大聚类簇内的数据依照到这个簇形心距离的大小一 分为二, 生成两个新的聚类簇, 重复拆分操作直到聚类数目与初始设定的码本尺寸相同。 对 于所有蚂蚁数目和二维空间尺寸下的聚类结果都采取步骤二的操作。 0066 步骤三 : 完成步骤二之后依照遗传算法的基本流程进行操作, 此时已经得到种群 第一代的个体, 设定遗传算法中用到参数的初值 : Pc为 0.6, Pm为 0.5, 为 0.02。对于每 个个体, 计算训练序列中所有矢量采用此个体进行量化时的失真总和, 即公式 (4) , 个体适 应度为失真总和的函数, 公式 (5) 。 0067 0。
36、068 0069 (1) 对于所有个体按照适应度进行降序排列, 然后进行选择和交叉操作, 依照交叉 概率 Pc选择已排序的个体序列中前 38 个个体直接进入下一代, 然后进行下一代剩余个体 的生成工作 : 对已排序的个体序列, 按照从前面开始第一个与倒数第一个配对、 前面第二个 与倒数第二个配对的原则, 将配对的两个个体当作父代, 然后采取交叉操作生成新的两个 个体, 交叉过程中采取依据适应度的加权交叉操作, 即依照公式 (6) : 0070 0071 0072 其中 a 权值因子的计算依照公式 (7) 进行。 0073 说 明 书 CN 103310275 A 9 7/7 页 10 0074。
37、 将新生成个体放置到下一代中当作子代。 重复交叉操作直到总个体数目满足种群 大小。 0075 (2) 对所有的个体采取基因突变操作, 依照基因突变概率, 选取 32 个个体进行突 变操作, 操作过程为 : 对于每个个体生成一个 (0,1) 范围内的随机数, 如果随机数大于 0.5 则当前个体进入突变操作, 对于当前个体的染色体上的基因采取小范围内的突变, 突变样 点处位 1, 10 的五个不同随机位置, 突变数值为 (-1, 1) 范围内的随机数 ; 如果随机小于 0.5, 则当前个体保存, 不进入突变操作。对于所有个体均完成选择和突变操作。 0076 (3) 依照公式 (4) 、(5) 计算。
38、所有个体的适应度, 如果最优个体的适应度大于迭门 限, 则停止迭代, 反之重复过程 (1) (2) 。 0077 (4) 输出最优个体作为码本设计的最终结果。 0078 综上所述, 本发明提出的一种基于蚁群聚类和遗传算法的新型码本设计方法, 创 新之处在于两点 : 一方面利用了蚁群聚类的LF算法进行了初始聚类的生成, 充分利用LF最 终的聚类效果与初始的蚂蚁位置设定无密切相关性的优点, 这就克服了传统的 LBG 算法初 始选择对最终结果的影响 ; 另一方面利用遗传算法进行最优个体的生成和选择, 充分利用 了遗传算法优秀的全局搜索能力, 同时克服了 LBG 算法极易陷入局部最优的缺点, 能够保 。
39、证设计码本是几近全局最优的, 基因突变环节依照实际操作对线谱对频率参数采用了基于 适应度的交叉操作, 人为地改变种群衍变方向, 加快了收敛速度。因此, 本发明在传统的蚁 群聚类算法和遗传算法的基础上, 充分考虑到了实际操作中 LF 算法在限定时间内可能无 法到达收敛状态的缺点, 并充分利用了遗传算法强大的全局最优能力, 适合应用于矢量量 化前期的码本设计过程, 对于语音编码、 数据压缩、 模式识别等领域的研究都有很大的参考 价值。 说 明 书 CN 103310275 A 10 1/4 页 11 图 1 说 明 书 附 图 CN 103310275 A 11 2/4 页 12 图 2 说 明 书 附 图 CN 103310275 A 12 3/4 页 13 图 3 说 明 书 附 图 CN 103310275 A 13 4/4 页 14 图 4 说 明 书 附 图 CN 103310275 A 14 。