助听器及助听处理方法 【技术领域】
本发明涉及助听器及助听处理方法, 特别涉及用于听觉补偿的助听处理技术。背景技术 随着高龄社会的到来, 高龄的听力衰退者增加。该高龄听力衰退者中大多患的是 老化现象造成的老年性听力衰退。老年性听力衰退的大部分是称作感音性听力衰退的由 内耳或内耳以后的神经系统的障碍引起的听力衰退。换言之, 老年性听力衰退是因为随着 年龄增加, 担负将声音信号变换为向脑传递的信号的作用的内耳的毛细胞弱化、 变形、 消失 等、 或将变换后的信号向脑传递的神经损伤等而难以将声音信号向脑传递而发生的。
以往, 作为补偿听力比正常低的听力衰退者的听觉而使用助听器。在助听器中, 使用例如根据听力衰退者的听力特性的劣化而使声音放大、 从而改善听声的助听技术。此 外, 近年来, 不仅是助听器, 作为面向高龄者使语言的听取变好的助听技术还提出了语速变 换, 也出现了许多具有利用该语速变换将声音缓慢地再现的功能的电视机及收音机、 电话
机等。 但是, 使用这些助听技术的助听设备只不过是改善听力衰退的机理的一部分。因 此, 包括老年性听力衰退者的感音性听力衰退者即使使用助听器, 仅通过对应于听力特性 的声音的增幅, 也不能得到充分的听力改善的效果。这是因为, 感音性听力衰退的特征在 于, 不是单纯在音量上听不见声音, 而是将声音作为语言听出来的能力下降。
这里, 作为感音性听力衰退的能力下降的特征, 可以举出 1) 响度补充现象, 2) 频 率选择性的下降, 3) 时间分辨能力的下降, 在下述中进行说明。
1) 所谓响度补充现象, 是虽然最小可听域值比听力正常者相比上升、 但如果声音 成为可听值以上的强度、 则作为声音的感觉上的大小的响度急剧地增加的现象。 即, 感音性 听力衰退者有虽然难以听见较小的声音、 但如果成为哪怕稍稍为可听值以上的声音则感到 嘈杂的对音量变化变得敏感的倾向。另外, 使用上述以往的助听技术的助听设备着眼于该 现象而实现了听力改善。
2) 在感音性听力衰退中, 因频率选择性的下降, 频带成分间的掩蔽、 特别是低频带 成分对高频带成分的掩蔽 ( 向上掩蔽 ) 的影响增大。即, 感音性听力衰退者具有比低音域 的声音更难听取高音域的声音的倾向。 另外, 对此, 报告了通过对左右的耳朵分别分开提示 低音域和高音域、 从而声音的清晰度变高的情况等 ( 例如参照非专利文献 1)。
3) 在感音性听力衰退中, 因时间分辨能力的下降, 难以对应于声音的快速的变化。 因此, 例如在将两个声音持续地供给的情况下, 一个声音被另一个声音掩蔽的时域掩蔽的 影响增大。 即, 感音性听力衰退者难以感知时间变化快的声音、 以及难以区别在时间上接近 的声音。另外, 在时域掩蔽中, 有先行音将后续音掩蔽的顺向性掩蔽、 和后续音将先行音掩 蔽的逆向性掩蔽的两种。 顺向性掩蔽是指如果对某个音反应, 则即使音消失、 该反应也不立 即平息, 而在该期间中发生的后续音变得难以听见的现象。 此外, 逆向性掩蔽是指越是强的 音则神经的反应发生得越快, 所以如果在较弱的音之后到来较强的音则不能进行两个音的
区别, 较弱的先行音变得难以听到的现象。
在通常的会话中, 元音具有能量大、 时间变化少、 持续时间长的特征, 反之, 辅音具 有能量小、 时间变化剧烈、 持续时间短的特征。因此, 感音性听力衰退者虽然取决于会话中 的讲话速度、 但由于容易发生辅音的前后的元音带来的时域掩蔽, 所以辅音的听取较困难 的情况较多。
进而, 感音性听力衰退者由于因时间分辨能力的下降而难以对应于声音的快速的 变化, 所以即使没有辅音的前后的声音带来的时域掩蔽, 结果听漏辅音的情况也较多。 这是 因为, 对于时间变化剧烈、 持续时间短的辅音, 在感音性听力衰退者的毛细胞反应之前该辅 音已消失而不能反应。结果听漏了辅音。
这样, 感音性听力衰退者因时间分辨能力的下降而难以听取辅音, 不知道在说什 么或听成不同的语言等辅音的识别率变差。
对此, 以往有减轻时域掩蔽的影响的方法。 例如, 公开了如下技术, 即: 通过抑制元 音的共振峰成分较大的低音域的信号以使元音不会将辅音时域掩蔽、 结果强调辅音 ( 例如 参照专利文献 1)。此外, 还公开了如下技术, 即: 将元音的末端部分一部分抑制一定时间, 并在元音与辅音之间放置无音区间, 从而抑制对接着到来的辅音的时域掩蔽的影响 ( 例如 参照专利文献 2、 专利文献 3)。 进而, 还提出了如下技术, 即: 为了降低与元音对辅音的时域 掩蔽相关联的、 在频率成分间发生的掩蔽, 对左右的耳朵提供不同的频率特性的信号 ( 例 如参照专利文献 4)。
通过进行这样的处理, 能够降低从元音向辅音的时域掩蔽, 改善辅音的听取。
专利文献 1 : 日本专利第 3596580 号公报
专利文献 2 : 日本专利第 3303446 号公报
专利文献 3 : 日本特开平 3-245700 号公报
专利文献 4 : 日本特开 2006-87018 号公报
专利文献 5 : 日本特开昭 58-70400 号公报
非 专 利 文 献 1: Barbara Franklin , “The Effect of Combining Low-andHigh-Frequency Passbands on Consonant Recognition in the H e a r i n g I m p a i r e d ”. J o u r n a l o f S p e e c h a n d H e a r i n g R e s e a r c h ,U S A , AmericanSpeech-Language-Hearing Association, December 1975, Vol.18, 719-727
但是, 上述以往的技术不过是能够将时间分辨能力的下降的影响中的、 从元音向 辅音的时域掩蔽减轻。 即, 在上述以往的技术中, 关于使感音性听力衰退者感知时间变化剧 烈且持续时间短的辅音、 改善辅音识别率的问题, 并没有解决。
此外, 以往的语速变换是使用声音的稳定部分 ( 主要是元音部 ) 提取音调周期, 并 以音调单位进行补偿, 从而进行时间拉伸而使语速变慢的技术。 因此, 关于使感音性听力衰 退者感知时间变化剧烈且持续时间短的辅音、 改善辅音识别率的问题, 无法解决。此外, 由 于使语速变慢, 因此会发生嘴唇的动作与声音偏差而视觉信息与听觉信息变得不同步的、 所谓的不能取得唇音同步 (Lip Sync) 的状况, 结果有时难以听见会话的内容。 发明内容
所以, 本发明的目的是解决时间分辨能力下降带来的这些问题, 提供一种能够提高时间变化剧烈且持续时间短的辅音的识别率的助听器及助听处理方法。
为了解决该问题, 本发明的助听器具备 : 声音输入单元, 被输入外部声音信号 ; 声 音分析单元, 检测输入到上述声音输入单元中的声音信号的有音区间和在声响上看作无音 的区间, 并在检测出的有音区间内检测辅音区间和元音区间 ; 以及信号处理单元, 在时间上 对由上述声音分析单元检测出的上述辅音区间进行拉伸, 并在时间上对由上述声音分析单 元检测出的上述元音区间及上述在声响上看作无音的区间中的至少一方进行压缩。
根据本结构, 通过对辅音区间进行时间拉伸, 能够改善时间变化剧烈、 持续时间短 的辅音的识别率, 并且通过将元音区间及 / 或在声响上看作无音的区间进行压缩, 能够使 视觉信息与听觉信息同步、 保持唇音同步的听觉辅助。
此外, 也可以对于上述拉伸的辅音区间的时间的一部分, 通过从上述元音区间以 音调单位删除信号而将上述元音区间在时间上进行压缩, 对于被拉伸的上述辅音区间的时 间的剩余部分, 通过将在声响上看作无音的区间的信号删除而将上述在声响上看作无音的 区间进行压缩。
根据本结构, 不是将辅音区间本身 ( 位置、 场所 ), 而是将通过拉伸处理增加的时 间 ( 量 ) 中的一部分时间量从元音区间删除, 避免不能取得唇音同步的状况。由此, 能够改 善时间变化剧烈、 持续时间短的辅音的识别率, 能够在保持唇音同步的听觉辅助的同时, 防 止声音的高度发生变化等音质的劣化。 此外, 也可以是, 上述助听器还具备调节单元, 该调节单元根据时间分辨能力信 息, 调节将上述辅音区间拉伸的时间, 上述时间分辨能力信息表示利用上述助听器的利用 者的听觉的时间分辨能力 ; 上述信号处理单元将由上述声音分析单元检测出的上述辅音区 间拉伸上述调节单元调节的时间。
根据本结构, 能够实现适合于助听器利用者个人的辅音的听取改善。
此外, 也可以是, 上述助听器还具备调节单元, 该调节单元计算上述声音信号的声 压, 并根据计算出的上述声压, 调节将上述辅音区间拉伸的时间 ; 上述信号处理单元将由上 述声音分析单元检测出的上述辅音区间拉伸上述调节单元调节的时间。
根据本结构, 能够实现对应于输入声音的声压的声音的清晰度改善。
此外, 也可以是, 上述声音分析单元在上述辅音区间内对辅音的种类进行分析 ; 上 述助听器还具备调节单元, 该调节单元根据由上述声音分析单元分析出的辅音的种类, 调 节将上述辅音区间拉伸的时间 ; 上述信号处理单元将由上述声音分析单元检测出的上述辅 音区间拉伸上述调节单元调节的时间。
根据本结构, 能够提供对应于各辅音的种类的最佳的持续时间, 实现对应于辅音 的声音的清晰度改善。
根据本发明, 能够实现提高时间变化剧烈、 持续时间短的辅音的识别率的助听器 及助听处理方法。具体而言, 对于包括老年性听力衰退的时间分辨能力下降的感音性听力 衰退者, 特别能够提高辅音的听清状况, 能够改善声音清晰度。
附图说明
图 1 是表示本发明的实施方式 1 的助听器的结构的模块图。
图 2 是表示本发明的实施方式 1 的声音分析单元和控制单元的动作例 1 的流程图。
图 3 是表示本发明的实施方式 1 的声音分析单元和控制单元的动作例 2 的流程 图 4 是表示本发明的实施方式 1 的声音分析单元和控制单元的动作例 3 的流程 图 5 是表示本发明的实施方式 2 的助听器的结构的模块图。 图 6 是表示本发明的实施方式 3 的助听器的结构的模块图。 图 7 是表示本发明的实施方式 3 的变形例 1 的助听器的结构的模块图。 图 8 是表示本发明的实施方式 3 的变形例 2 的助听器的结构的模块图。 图 9 是表示本发明的实施方式 4 的助听器的结构的模块图。 图 10A 是表示无声爆破音的声响特征的图。 图 10B 是表示无声爆破音的声响特征的图。 图 10C 是表示无声爆破音的声响特征的图。 图 11A 是表示有声爆破音的声响特征的图。 图 11B 是表示有声爆破音的声响特征的图。 图 11C 是表示有声爆破音的声响特征的图。 图 12A 是表示鼻音的声响特征的图。 图 12B 是表示鼻音的声响特征的图。 图 13A 是表示摩擦音的声响特征的图。 图 13B 是表示摩擦音的声响特征的图。 图 13C 是表示摩擦音的声响特征的图。 图 14 是表示拉伸率表的一例的图。 图 15 是表示拉伸率表的一例的图。 图 16 是表示最小时间分辨能力表的一例的图。 图 17 是表示时间拉伸压缩调节单元 503 的结构的一例的图。 图 18 是表示时间拉伸压缩调节单元 503 的结构的一例的图。 图 19 是表示本发明的实施方式 4 的变形例 1 的助听器的结构的模块图。 图 20 是表示拉伸率表的一例的图。 图 21 是表示时间拉伸压缩调节单元 703 的结构的一例的模块图。 图 22 是表示本发明的实施方式 4 的变形例 1 的助听器的动作例的流程图。 图 23 是表示时间拉伸压缩调节单元 703 的结构的另一例的模块图。 图 24 是表示本发明的实施方式 4 的变形例 1 的助听器的另一动作例的流程图。 图 25 是表示本发明的实施方式 4 的变形例 2 的助听器的结构的模块图。 图 26 是表示本发明的实施方式 4 的变形例 3 的助听器的结构的模块图。图。
图。
具体实施方式
以下, 参照附图对本发明的实施方式进行说明。
( 实施方式 1)
图 1 是表示本发明的实施方式 1 的助听器的结构的模块图。图 1 所示的助听器具备声音输入单元 201、 声音分析单元 202、 控制单元 203、 信号 处理部 204、 和声音输出单元 207。
声音输入单元 201 是将例如麦克风、 感应线圈或声音通话装置、 或者声音再现装 置的输出进行输入的外部输入端子, 被输入外部的声音信号, 将输入的声音信号输出给信 号处理部 204。
声音分析单元 202 分析输入到声音输入单元 201 中的声音信号的声音的种类 ( 元 音、 辅音、 其他等 )。 具体而言, 声音分析单元 202 判断输入的声音信号是在声响上看作无音 的区间、 还是有音区间。进而, 声音分析单元 202 在判断为有音区间的有音区间内, 检测辅 音区间和后接于辅音区间的元音区间, 从而判断辅音区间和元音区间。
例如, 声音分析单元 202 如以下这样判断在声响上看作无音的区间和有音区间。 声音分析单元 202 计算单位时间中的声音信号的强度, 在该强度值为规定阈值以上的时间 超过了规定持续时间的情况下判断为有音区间, 在小于规定持续时间的情况下或小于规定 阈值的情况下, 判断为在声响上看作无音的区间。 另外, 在判断有音区间和在声响上看作无 音的区间 ( 无音区间 ) 的方法中, 也可以使用例示以外的周知的判断方法。
此外, 例如声音分析单元 202 如以下这样检测并判断判断为有音区间的有音区间 内的辅音区间和元音区间。 声音分析单元 202 例如使用如下方法等, 即: 在判断为有音区间 的有音区间内提取 ( 检测 ) 共振峰频率或音调周期, 并根据辅音和元音具有的各自的特征 来判断辅音和元音。 这里, 辅音的信号在单体中难以与其他噪声区别, 所以为了判断辅音区 间, 根据后接的元音的存在来推测及判断辅音区间。另外, 声音分析单元 202 既可以基于共 振峰频率及音调周期的任何一个来判断辅音区间和元音区间, 也可以使用上述例示以外周 知的判断方法。 控制单元 203 基于声音分析单元 202 的分析, 进行信号处理部 204 的控制。即, 控 制单元 203 基于由声音分析单元 202 分析的声音的种类 ( 元音、 辅音、 其他等 ), 进行该声音 的处理内容 ( 拉伸、 压缩等 ) 等的判断。并且, 通过对信号处理部 204 发送包括声音的区间 及处理内容等的信息的控制信号, 进行信号处理部 204 的控制。
具体而言, 控制单元 203 当由声音分析单元 202 检测出辅音区间或后接于辅音区 间的元音区间时, 根据检测出的辅音区间或后接于辅音区间的元音区间, 进行信号处理部 204 的控制。 控制单元 203 在声音分析单元 202 中检测出了辅音区间的情况下, 时间拉伸单 元 205 将包含用来进行辅音区间的时间拉伸的信息的控制信号输入到信号处理部 204 中。 进而, 控制单元 203 在存在后接于声音分析单元 202 检测出的辅音区间的元音区间的情况 下, 将控制信号输入到信号处理部 204 中, 该控制信号包含用于时间压缩单元 206 进行元音 区间的时间压缩的信息。
另外, 控制单元 203 和信号处理部 204 怎样分担处理根据安装方法而能够进行各 种安装, 并不限于本实施方式的处理分担。例如, 也可以是控制单元 203 仅将声音的种类和 处理内容发送给信号处理部 204、 信号处理部 204 决定处理时间、 在需要的情况下发送给控 制单元 203 的结构。
此外, 时间拉伸单元 205 用来进行辅音区间的时间拉伸的信息既可以为对检测出 的辅音的种类分别决定的, 也可以为将辅音分类为大致的组并按该组分别决定的。 此外, 也 可以为根据听者的时间分辨能力的劣化而对辅音的每个种类或大致分类的辅音的组分别
决定的。 信号处理部 204 具有时间拉伸单元 205 和时间压缩单元 206, 根据来自控制单元 203 的控制信号, 通过时间拉伸单元 205 和时间压缩单元 206 进行从声音输入单元 201 输出 的声音信号的信号处理。具体而言, 信号处理部 204 被从声音输入单元 201 输入声音信号、 从控制单元 203 输入控制信号。信号处理部 204 基于来自控制单元 203 的控制信号, 通过 时间拉伸单元 205 和时间压缩单元 206 处理从声音输入单元 201 输入的声音信号。即, 信 号处理部 204 将由声音分析单元 202 检测出的辅音区间在时间上拉伸, 将由声音分析单元 202 检测出的元音区间及在声响上看作无音的区间的至少一方在时间上压缩。 另外, 在为了 判断辅音而需要将后接的元音输入到声音分析单元 202 中的情况下, 在从控制单元 203 输 入的控制信号中发生辅音区间的判断延迟。 因此, 一般需要将延迟缓冲设在信号处理部 204 内或信号处理部 204 的前级, 以便能够配合判断延迟而使时间压缩及拉伸单元动作。
时间拉伸单元 205 进行通过来自控制单元 203 的控制信号指定的辅音区间的时间 拉伸。辅音区间的时间拉伸例如可以如专利文献 5 中公开那样通过将辅音区间的声音信号 在时间上切出、 重复该部分的技术等进行。进而, 通过对辅音区间的时间拉伸进行淡入 - 淡 出的交叉衰弱, 能够使连接点变得更平滑。
通过这样使辅音发生的时间 ( 辅音区间 ) 变长, 即使是劣化的内耳的毛细胞也能 够对辅音反应, 此外能够使辅音的前后的元音带来的时域掩蔽的影响减少。由此, 能够改 善不易听取辅音的听力衰退者的辅音的识别率。另外, 拉伸辅音区间的方法并不限定于上 述辅音拉伸方式, 也可以使用其他辅音拉伸方式。 在此情况下, 也具有同样的识别率改善效 果。
时间压缩单元 206 将元音区间及上述在声响上看作无音的区间的至少一个压缩 将辅音区间拉伸的时间量。具体而言, 时间压缩单元 206 基于来自控制单元 203 的控制 信号, 进行后接于上述中指定的辅音区间的元音区间或在声响上看作无音的区间的时间压 缩、 或者后接于辅音区间的元音区间和在声响上看作无音的区间两者的时间压缩。 此外, 时 间压缩单元 206 将拉伸的辅音区间的时间的一部分从元音区间中以音调单位删除信号, 从 而将元音区间在时间上压缩, 对于拉伸的辅音区间的时间的剩余部, 删除在声响上看作无 音的区间的信号, 从而将在声响上看作无音的区间压缩。这样, 时间压缩单元 206 不是在辅 音区间本身 ( 位置、 场所 ) 中, 而是在后续的区间被进行时间压缩通过拉伸处理增加的时间 ( 量 ) 即在辅音区间中时间拉伸的时间量的处理。 由此, 即使在时间拉伸单元 205 将辅音区 间的时间拉伸的情况下, 也能够对应在视觉信息和听觉信息中发生偏差、 不能实现唇音同 步 ( 视觉与听觉的同步 ) 带来的听觉辅助的问题。
更具体地讲, 时间压缩单元 206 基于将辅音区间拉伸后的时间的记录等, 将后接 的元音区间的一部分、 或无音区间的声音信号的一部分或全部删除该时间量或其以上, 从 而进行时间压缩, 以使辅音的发生定时与视觉信息一致。 这是因为, 即使在元音区间中进行 了将声音进行部分删除的处理、 由于持续时间长、 稳定状态继续, 所以也不会难以听取。此 外, 是因为即使将无音区间的一部分或全部删除, 也不会给声音的听取带来不良影响。但 是, 在此情况下, 也为了防止通过元音区间的压缩使音高变化等的音质的劣化, 优选的是提 取压缩的元音区间的元音的音调周期, 并以音调单位删除而缩短时间。 另外, 在这样以音调 单位将元音区间删除的情况下, 可以想到不能删除为使其与辅音的拉伸时间严密地一致。
但是在此情况下, 在删除元音区间的情况下即使因上述理由而与拉伸时间不严密地一致, 也优选的是以音调单位删除。
另外, 关于将辅音区间拉伸的时间, 既可以由控制单元 203 保持, 也可以由信号处 理部 204 保持。此外, 也可以做成另外设置记录部等而记录拉伸时间的结构。
声音输出单元 207 将由信号处理部 204 处理后的声音信号输出。声音输出单元 207 例如不仅是耳机、 扬声器、 头戴式耳机等, 也可以是利用骨骼传导振子那样的振子、 或内 耳用的电极等的结构。
接着, 对以上那样构成的本实施方式的助听器的声音分析单元 202 和控制单元 203 的动作的一例进行说明。图 2 是表示本实施方式 1 的声音分析单元和控制单元的动作 例 1 的流程图。另外, 在以下的动作例 1 中, 对使用辅音检测标志 cons 的情况进行例示。
声音分析单元 202 首先判断输入到声音输入单元 201 中的输入声音是否是有音区 间 (S201)。声音分析单元 202 如果判断为该输入声音是有音区间 (S201 的是的情况 ), 则 前进到判断所判断出的有音区间是否是辅音区间的步骤 (S202)。 声音分析单元 202 如果不 是那样 (S201 的否的情况 ), 则结束处理。
接着, 在步骤 S202 中, 声音分析单元 202 如果判断为该有音区间的声音是辅音区 间的声音 (S202 的是的情况 ), 则前进到进行时间拉伸控制的步骤 (S204)。如果不是那样 (S202 的否的情况 ), 则前进到判断是否需要时间压缩处理的步骤 (S205)。 在步骤 S204 中, 控制单元 203 控制为使信号处理部 204 的时间拉伸单元 205 进行规定时间的时间拉伸, 并 将 1 代入到辅音检测标志 cons 中。 另一方面, 在步骤 S202 中, 声音分析单元 202 如果判断为该有音区间不是辅音区 间 (S202 的否的情况 ), 则前进到判断是否需要时间压缩处理的步骤 (S205)。在步骤 S205 中, 声音分析单元 202 如果判断为辅音检测标志 cons 是 1(S205 的是的情况 ), 则再前进到 判断该有音区间是否是元音区间的步骤 (S206)。 如果不是那样 (S205 的否的情况 ), 则结束 处理。在步骤 S206 中, 声音分析单元 202 如果判断为该有音区间是元音区间 (S206 的是的 情况 ), 则前进到进行音调单位的时间压缩控制的步骤 (S208)。如果不是那样 (S206 的否 的情况 ), 则结束处理。在步骤 S208 中, 控制单元 203 对时间压缩单元 206 进行控制, 以使 其将拉伸了辅音的时间量或其以上的时间量的元音区间以音调单位删除而进行时间压缩, 并将 0 代入到辅音检测标志 cons 中。
以上, 声音分析单元 202 和控制单元 203 进行对连续输入到声音输入单元 201 中 的输入声音的动作。 另外, 在 S205 中, 判断辅音检测标志 cons 是否是 1, 是为了在没有进行 时间拉伸的情况、 或在时间拉伸之后进行了时间压缩的情况下 ( 都为 cons 是 0 的状态 ) 防 止进行不需要的时间压缩。此外, S206 的 “否” 是为了使得在有音区间既不是辅音区间也不 是元音区间的噪声等的情况下也能够应对。
另外, 在以上的动作例 1 中, 在代替辅音检测标志 cons 而使用拉伸时间变量 dur 的情况下, 只要如以下这样动作就可以。即, 在步骤 S204 中, 代替将 1 代入到 cons 中而对 dur 加上拉伸了辅音的时间。此外, 在步骤 S205 中, 代替判断 cons 是否是 1 而判断 dur 是 否比 0 大。此外, 在步骤 S208 中, 进行控制以在不超过 dur 表示的时间的范围内进行时间 压缩, 从变量 dur 减去压缩了元音的时间。以上那样的使用拉伸时间变量 dur 的处理在本 发明的助听器例如如帧处理那样将输入的声音以较短的时间音调划分处理的情况下特别
有效。 进而, 并不限于使用上述辅音检测标志或拉伸时间变量的方法, 也可以使用能够判断 是否应拉伸的其他方法。
接着, 对声音分析单元 202 和控制单元 203 的其他动作例 ( 动作例 2) 进行说明。 图 3 是表示本实施方式 1 的声音分析单元和控制单元的动作例 2 的流程图。另外, 在以下 的动作例 2 中也对使用辅音检测标志 cons 的情况进行例示, 但与上述动作例 1 同样, 也可 以使用拉伸时间变量 dur 或使用能够判断是否应拉伸的其他方法。
声音分析单元 202 首先判断输入到声音输入单元 201 中的输入声音是否是有音区 间 (S301)。声音分析单元 202 如果判断为该输入声音是有音区间 (S301 的是的情况 ), 则 前进到判断所判断出的有音区间是否是辅音区间的步骤 (S302)。 如果不是那样 (S301 的否 的情况 ), 则前进到判断是否需要时间压缩处理的步骤 (S305)。
接着, 在步骤 S302 中, 声音分析单元 202 如果判断为该有音区间的声音是辅音区 间的声音 (S302 的是的情况 ), 则前进到进行时间拉伸控制的步骤 (S304)。如果不是那样 (S302 的否的情况 ), 则结束处理。另外, 步骤 S304 的动作由于与图 2 的步骤 S204 相同, 所 以省略说明。
另一方面, 在步骤 S305 中, 声音分析单元 202 如果判断为辅音检测标志 cons 是 1(S305 的是的情况 ), 则前进到进行时间压缩控制的步骤 (S307)。如果不是那样 (S305 的 否的情况 ), 则结束处理。在步骤 S307 中, 控制单元 203 对时间压缩单元 206 进行控制, 以 使其将拉伸了辅音的时间量或其以上的时间量的在声响上看作无音的区间删除而进行时 间压缩, 并将 0 代入到辅音检测标志 cons 中。 以上, 声音分析单元 202 和控制单元 203 进行对连续输入到声音输入单元 201 中 的输入声音的动作。另外, 动作例 1 与动作例 2 的差异点在于 : 不是将元音区间删除, 而是 将在声响上看作无音的区间删除而进行时间压缩。
进而, 对声音分析单元 202 和控制单元 203 的另一动作例 ( 动作例 3) 进行说明。 图 4 是表示本实施方式 1 的声音分析单元 202 和控制单元 203 的动作例 3 的流程图。 另外, 在以下的动作例 3 中也对使用辅音检测标志 cons 的情况进行例示, 但与上述动作例 1 或动 作例 2 同样, 也可以使用拉伸时间变量 dur 或使用能够判断是否应拉伸的其他方法。
声音分析单元 202 首先判断输入到声音输入单元 201 中的输入声音是否是有音区 间 (S401)。声音分析单元 202 如果判断为该输入声音是有音区间 (S401 的是的情况 ), 则 前进到判断判断出的有音区间是否是辅音区间的步骤 (S402)。 如果不是那样 (S301 的否的 情况 ), 则前进到判断是否需要时间压缩处理的步骤 (S409)。
接着, 在步骤 S402 中, 声音分析单元 202 如果判断为该有音区间的声音是辅音区 间的声音 (S402 的是的情况 ), 则前进到进行时间拉伸控制的步骤 (S404)。如果不是那 样 (S402 的否的情况 ), 则前进到判断是否需要时间压缩处理的步骤 (S405)。另外, 步骤 S404 ~步骤 S406 的动作与图 2 的步骤 S204 ~ S206 分别相同, 所以省略说明。
在步骤 S406 中, 如果声音分析单元 202 判断 ( 检测 ) 为该有音区间是元音区间 (S406 的是的情况 ), 则前进到进行音调单位的时间压缩控制的步骤 (S408)。 如果不是那样 (S406 的否的情况 ), 则结束处理。在步骤 S408 中, 控制单元 203 对时间压缩单元 206 进行 控制, 以使其将拉伸了辅音的时间量或比其短的时间量的元音区间以音调单位删除而进行 时间压缩。并且, 在将元音区间压缩的时间及将在声响上看作无音的区间压缩后的时间的
总和与拉伸了辅音的时间相等的情况下, 将 0 代入到辅音检测标志 cons 中。
另一方面, 在步骤 S409 中, 声音分析单元 202 如果判断为辅音检测标志 cons 是 1(S409 的是的情况 ), 则前进到进行时间压缩控制的步骤 (S411)。如果不是那样 (S409 的 否的情况 ), 则结束处理。在步骤 S411 中, 控制单元 203 对时间压缩单元 206 进行控制, 使 其将拉伸了辅音的时间量或比其短的时间量的、 在声响上看作无音的区间删除而进行时间 压缩。并且, 在将元音区间压缩后的时间及将在声响上看作无音的区间压缩的时间的总和 与拉伸了辅音的时间相等的情况下, 将 0 代入到辅音检测标志 cons 中。
以上, 声音分析单元 202 和控制单元 203 进行对连续输入到声音输入单元 201 中 的输入声音的动作。另外, 与动作例 1 及动作例 2 的差异点在于 : 将元音区间及在声响上看 作无音的区间删除而进行时间压缩。
另外, 在上述动作例 3 中, 动作为 : 进行元音区间或在声响上看作无音的区间中的 更先检测出的一方的时间压缩控制, 但在先检测出元音区间后进行在声响上看作无音的区 间的时间压缩处理的情况下, 只要除了辅音检测标志 cons 以外还使用元音判断标志 vow、 如以下这样进行动作就可以。即, 在步骤 S408 中, 进行控制, 以将比拉伸了辅音的时间短的 时间量的元音区间以音调单位删除而进行时间压缩, 除了将 0 代入到 cons 中以外, 还将 1 代入到 vow 中。在步骤 S409 中, 如果判断为 cons 是 0、 并且 vow 是 1, 则前进到 S411。在 步骤 S411 中, 对于辅音拉伸时间与元音压缩时间的差的时间量 ( 例如辅音的拉伸时间量中 的没有缩减元音而剩余的时间量 ), 进行控制, 以进行在声响上看作无音的区间的压缩, 将 0 代入到 vow 中。 以上, 在本实施方式中, 在后接的元音区间或在声响上看作无音的区间、 或者后接 的元音区间和在声响上看作无音的区间两者中进行时间压缩处理。但是, 也可以不仅在上 述中说明的这些区间进行、 而且在后接的再后面发生的其他元音区间或噪声等的区间进行 时间压缩处理。 不论如何, 都只要选择适合于声音信号的区间而进行时间压缩的处理, 以消 除视觉信息与听觉信息的不一致、 能够进行通过唇音同步的听觉辅助就可以。
以上, 根据本实施方式 1, 能够实现使时间变化剧烈、 持续时间较短的辅音的识别 率提高的助听器及助听处理方法。具体而言, 将输入到声音输入单元 201 中的声音信号在 声音分析单元 202 中分析, 判断是在声响上看作无音的区间还是有音区间, 在判断出的有 音区间中, 再进行辅音区间和元音区间的判断。并且, 根据声音分析单元 202 的判断结果, 控制单元 203 对信号处理部 204 输出使信号处理部 204 的时间拉伸单元 205 及时间压缩单 元 206 动作的控制信号。在时间拉伸单元 205 中, 进行辅音区间的时间拉伸, 在时间压缩单 元 206 中, 通过在后接的元音区间或在声响上看作无音的区间、 或者后接的元音区间和在 声响上看作无音的区间的两者中删除在辅音区间中拉伸的时间量而进行时间压缩。
通过这样将辅音区间时间拉伸到能够感知的长度, 时间分辨能力下降、 难以知觉 通常的会话中的声音的辅音的听力衰退者能够确保辅音的感知时间, 结果能够提高声音整 体的识别程度。 进而, 对于由于辅音的拉伸而不能够进行唇音同步的听觉辅助的问题, 通过 将后接的元音区间、 在声响上看作无音的区间、 其他元音区间、 或者无意义区间等进行时间 压缩, 能够将与视觉信息的不一致也消除。
另外, 也可以不进行到辅音整体的分析, 而采用简单且高速地检测应拉伸的声音 的特征的方法进行辅音区间的时间拉伸。在此情况下, 不仅能够减少上述辅音区间的判断
延迟, 安装也变得简单, 所以也有好的一面。这里, 作为简单且高速地检测应拉伸的声音的 特征的方法, 例如有仅检测爆破、 摩擦等的开头部分 ( 急剧的频率成分的变化 ) 或过渡部分 ( 共振峰成分的变化 : 共振峰迁移 ) 等的辅音的特征的方法等。
( 实施方式 2)
图 5 是表示本发明的实施方式 2 的助听器的结构的模块图。图 5 所示的助听器具 备声音输入单元 201、 声音分析单元 202、 调节部 301、 控制单元 304、 信号处理部 204、 和声音 输出单元 207。另外, 在图 5 中, 对于与图 1 相同的结构要素使用相同的标号而省略说明。
此外, 图 5 所示的助听器相对于有关实施方式 1 的助听器, 调节部 301、 控制单元 304 及信号处理部 204 的结构不同。
调节部 301 由时间分辨能力设定单元 302 和时间拉伸压缩调节单元 303 构成, 根 据本发明的助听器利用者的听觉的时间分辨能力而调节将声音信号的一部分拉伸的时间 和将其另一部分压缩的时间。例如, 调节部 301 在利用者的听觉的时间分辨能力的下降程 度较大的情况下, 与利用者的听觉的时间分辨能力的下降程度较小的情况相比, 将拉伸辅 音区间的时间调节得更长。
时间分辨能力设定单元 302 为了使本发明的助听器适应于利用者, 在助听器使用 前, 使用拟合程序等, 将对于该助听器的时间分辨能力的调节值设定为拟合的参数之一。 使 用这样设定的调节值, 时间分辨能力设定单元 302 中设定助听器利用者的时间分辨能力的 值。这里, 从助听器的外部输入而设定调节值, 但并不限于时间分辨能力设定单元 302 设定 的结构, 也可以做成由也包括时间拉伸压缩调节单元 303 的调节部 301 设定的结构。
例如, 时间分辨能力设定单元 302 作为助听器利用者的听觉的时间分辨能力值, 设定使用时间分辨能力的测量方法测量的数据、 或者对应于测量值的、 时间分辨能力的下 降程度的参数。
另外, 时间分辨能力的测量方法在 《听觉心理学概论》 (B.J.C 摩尔著, 大串健吾监 译 ) 中详细地记述。例如, 在宽频带或窄频带噪声中插入噪声断续的间隙, 通过测量间隙的 检测阈来计算时间分辨能力的下降程度。 这样的时间分辨能力的测量只要在助听器的拟合 时或耳鼻科诊疗时进行就可以, 还可以考虑在助听器中内置测量程序、 一边使用助听器的 受话器发出声音一边测量的方法。此外, 由于时间分辨能力的下降有使时域掩蔽的影响增 大的倾向, 所以也可以通过测量时域掩蔽特性来简单地计算时间分辨能力的下降程度。例 如, 根据上述 《听觉心理学概论》 , 通过使用称作探测信号的较短的信号和掩蔽信号、 测量能 够感知探测信号的延迟时间、 掩蔽量, 简单地计算时间分辨能力的下降程度。此外, 也可以 单纯地用语速不同的文章进行听取试验, 根据正确回答率推测时间分辨能力的下降程度, 从而测量时间分辨能力。
时间拉伸压缩调节单元 303 基于由时间分辨能力设定单元 302 设定的时间分辨能 力值, 设定对信号处理部 204 的时间拉伸单元 305 拉伸的时间 ( 拉伸时间 ) 和时间压缩单 元 306 压缩的时间 ( 压缩时间 ) 进行调节的调节量。
具体而言, 时间拉伸压缩调节单元 303 基于由时间分辨能力设定单元 302 设定的 时间分辨能力值, 例如在时间分辨能力的下降程度较小的情况下, 将拉伸时间和压缩时间 设定得较短, 在下降程度较大的情况下, 将拉伸时间和压缩时间设定得较长。这样, 通过根 据利用者的时间分辨能力的下降程度将辅音拉伸直到该利用者能够感知辅音, 能够容易感知持续时间较短的辅音。
控制单元 304 将由时间拉伸压缩调节单元 303 设定的调节量与对应于声音分析单 元 202 的检测结果的控制信号一起输出给信号处理部 204。即, 控制单元 304 基于由声音 分析单元 202 分析的声音的种类 ( 元音、 辅音、 其他等 ), 进行该声音的处理内容 ( 拉伸、 压 缩等 ) 等的判断。并且, 通过将包括声音的区间及处理内容等的信息的控制信号与在时间 拉伸压缩调节单元 303 中设定的调节量一起发送给对信号处理部 204, 进行信号处理部 204 的控制。
时间拉伸单元 305 基于由控制单元 304 输入到信号处理部 204 中的调节量和控制 信号, 进行辅音区间的时间拉伸。该辅音区间的时间拉伸与图 1 的时间拉伸单元 205 同样 进行, 但使辅音区间拉伸的时间也基于输入的调节量决定。
时间压缩单元 306 基于由控制单元 304 输入到信号处理部 204 中的调节量和控制 信号, 进行元音区间等的时间压缩。该时间压缩与图 1 的时间压缩单元 206 同样进行, 但使 元音区间等压缩的时间也基于输入的调节量决定。
这样, 根据本实施方式 2, 能够通过时间分辨能力设定单元 302 和时间拉伸压缩调 节单元 303 根据利用者的听觉的时间分辨能力调节声音的拉伸时间和压缩时间。由此, 能 够实现能够进行更适合于个人的辅音的听取改善的助听器及助听处理方法。
( 实施方式 3)
已知利用者的时间分辨能力还根据声压 ( 声音的大小 ) 而变化。因此, 在本实施 方式 3 中, 以下说明根据输入的声音信号的声压进行拉伸处理的情况的例子。
图 6 是表示本发明的实施方式 3 的助听器的结构的模块图。图 6 所示的助听器具 备声音输入单元 201、 声音分析单元 202、 调节部 401、 控制单元 404、 信号处理部 204、 和声音 输出单元 207。另外, 对于与图 1 或图 5 相同的结构要素赋予相同的标号而省略说明。
图 6 所示的助听器相对于有关实施方式 1 的助听器, 调节部 401 及控制单元 404 的结构不同。
调节部 401 由声压计算单元 402 和时间拉伸压缩调节单元 403 构成, 根据输入到 声音输入单元 201 中的输入声音的声压, 调节将声音信号的一部分拉伸的时间和将其另一 部分压缩的时间。
具体而言, 声压计算单元 402 计算输入到声音输入单元 201 中的输入声音的每单 位时间的声压。
时间拉伸压缩调节单元 403 基于由声压计算单元 402 计算出的声压 ( 值 ), 在时 间拉伸单元 305 和时间压缩单元 306 中, 设定对拉伸的时间和压缩的时间进行调节的调节 量。例如, 时间拉伸压缩调节单元 403 当由声压计算单元 402 计算出的声压值比规定值大 时, 将拉伸时间和压缩时间设定得较短, 当上述声压值与规定值相同或较小时, 将拉伸时间 和压缩时间设定得较长。这里, 所谓规定值, 是指预先设定的作为拉伸时间和压缩时间的 基准的声压值。此外, 例如时间拉伸压缩调节单元 403 在由声压计算单元 402 计算出的声 压值比规定值大的情况下, 与由声压计算单元 402 计算出的声压值是规定值以下的情况相 比, 将拉伸辅音区间的时间调节得短。
控制单元 404 将由时间拉伸压缩调节单元 403 设定的调节量与对应于声音分析单 元 202 的检测结果的控制信号一起输出给信号处理部 204。 即, 控制单元 404 基于由声音分析单元 202 分析的声音的种类 ( 元音、 辅音、 其他等 ), 进行该声音的处理内容 ( 拉伸、 压缩 等 ) 等的判断。并且, 通过将包括声音的区间及处理内容等的信息的控制信号与由时间拉 伸压缩调节单元 403 设定的调节量一起发送给信号处理部 204, 进行信号处理部 204 的控 制。
这样, 根据输入到声音输入单元 201 中的输入声音的声压, 使拉伸时间压压缩时 间变化, 从而对于例如声压较高而清晰度足够的声音能够使辅音发生的时间变长, 反之, 能 够防止降低清晰度、 出现不自然等的不良影响。此外, 在声压较低的情况下, 能够使辅音发 生的时间变长而辅助辅音的感知。
另外, 利用者的时间分辨能力也根据声压 ( 声音的大小 ) 而变化, 但该变化因每个 利用者而不同的情况较多。因此, 优选的是在助听器使用前实施利用者的各声压的听力检 查, 得到有关各声压的听力的参数。 在此情况下, 也可以将得到的有关各声压的听力的参数 输入到调节部 401 中、 在时间拉伸压缩调节单元 403 中设定调节量、 决定对应于声压的拉伸 时间和压缩时间。 此外, 也可以测量辅音和元音的各声压的声音清晰度, 将有关各声压的清 晰度的参数输入到包括时间拉伸压缩调节单元 403 的调节部 401 中, 设定上述调节量, 决定 对应于声压的拉伸时间和压缩时间。 ( 变形例 1)
图 7 是表示本发明的实施方式 3 的变形例 1 的助听器的结构的模块图。
在图 7 的助听器中, 相对于图 6 的声压计算单元 402 计算由声音输入单元 201 输 入的声音的、 每单位时间的声压, 不同点在于 : 仅对由声音分析单元 202 判断为有音区间的 区间进行声压的计算。通过做成图 7 那样的结构, 能够省去声音的在声响上看作无音的区 间、 及噪声等的无意义区间的声压计算, 能够进行高效率的处理。
以上, 能够由调节部 401 的声压计算单元 402 和时间拉伸压缩调节单元 403 根据 输入到声音输入单元 201 中的输入声音的声压的大小, 调节拉伸压缩时间。由此, 能够实现 能够防止因将足够清晰的声音的一部分拉伸、 压缩带来的声音劣化的助听器及助听处理方 法。 此外, 通过根据利用者的各声压的听力来调节声音的拉伸时间和压缩时间, 能够改善更 适合于个人的、 声音的听取改善。进而, 通过根据辅音、 元音的各声压的清晰度来调节声音 的拉伸时间和压缩时间, 能够实现声音的听取的改善。
( 变形例 2)
图 8 是表示本发明的实施方式 3 的变形例 2 的助听器的结构的模块图。对于与图 1、 图 5 或图 6 相同的结构要素赋予相同的标号而省略说明。
图 8 的助听器是图 6 的调节部 401 的另一结构例, 相对于有关实施方式 3 的图 6 的助听器, 调节部 601 的结构不同。
图 8 所示的调节部 601 由时间分辨能力设定单元 302、 声压计算单元 402 和时间拉 伸压缩调节单元 603 构成。
时间拉伸压缩调节单元 603 基于由声压计算单元 402 计算出的声压值、 和由时间 分辨能力设定单元 302 设定的时间分辨能力值, 设定调节量并输出给控制单元 604。另外, 时间拉伸压缩调节单元 603 如图 7 中说明那样, 也可以仅对由声音分析单元 202 判断为有 音区间的区间进行声压计算单元 402 的计算处理。
控制单元 604 将由时间拉伸压缩调节单元 603 设定的调节量与对应于声音分析单
元 202 的检测结果的控制信号一起输入到信号处理部 204 中。即, 控制单元 604 基于由声 音分析单元 202 分析的声音的种类 ( 元音、 辅音、 其他等 ), 进行该声音的处理内容 ( 拉伸、 压缩等 ) 等的判断。并且, 通过将包括声音的区间及处理内容等的信息的控制信号与由时 间拉伸压缩调节单元 603 设定的调节量一起发送给信号处理部 204, 进行信号处理部 204 的 控制。
这样, 能够根据输入声音的声压和助听器利用者的时间分辨能力两者来调节声音 的拉伸时间和压缩时间。 由此, 能够实现不仅能够改善适合于个人的听取、 还能够防止声音 的不适当的拉伸和压缩带来的声音劣化的助听器及助听处理方法。
( 实施方式 4)
图 9 是表示本发明的实施方式 4 的助听器的结构的模块图。图 9 所示的助听器具 备声音输入单元 201、 调节部 501、 控制单元 504、 信号处理部 204 和声音输出单元 207。另 外, 对于与图 1、 图 5 或图 6 相同的结构要素赋予相同的标号而省略说明。
图 9 所示的助听器相对于有关实施方式 1 的图 1 的助听器, 调节部 501、 控制单元 504 及信号处理部 204 的结构不同。此外, 图 9 所示的助听器相对于有关实施方式 3 的图 5 的助听器, 调节部 501 及控制单元 504 的结构不同。 调节部 501 如图 9 所示, 由声音分析单元 502 和时间拉伸压缩调节单元 503 构成, 根据输入到声音输入单元 201 中的声音的辅音的种类, 设定调节将声音信号的一部分拉伸 的时间和将其另一部分压缩的时间的调节量。
具体而言, 声音分析单元 502 判断输入到声音输入单元 201 中的声音是在声响上 看作无音的区间还是有音区间, 在判断为有音区间的情况下判断有音区间内是辅音区间还 是元音区间。进而, 声音分析单元 502 在判断为辅音区间的情况下, 判断辅音区间内的辅音 的种类。
这里, 所谓辅音的种类, 也取决于分类的方式, 例如根据鹿野等的 《声音 - 音信息 的数字信号处理》 , 如以下这样分类。 即, 鼻音 (m、 n)、 无声摩擦音 (f、 s、 sh)、 有声摩擦音 (z、 zh)、 声门摩擦音 (h)、 无声爆破音 (p、 t、 k)、 有声爆破音 (b、 d、 g)、 无声破擦音 (ts、 ch)、 半 元音 (w) 及拗音 (y)。
此外, 作为更详细的分类方式, 例如如以下这样。有 : 无声口唇爆破音 (p)、 无声齿 龈爆破音 (t)、 无声软腭爆破音 (k)、 有声口唇爆破音 (b)、 有声齿龈爆破音 (d)、 有声软腭爆 破音 (g) 等的爆破音、 无声齿龈摩擦音 (s)、 无声硬腭摩擦音 (sh)、 有声齿龈摩擦音 (z)、 有 声硬腭摩擦音 (zh)、 声门摩擦音 (h) 等的摩擦音、 和无声硬腭破擦音 (ch)、 无声齿龈破擦音 (ts) 等的破擦音。此外, 还有口唇鼻音 (m)、 齿龈鼻音 (n)、 拍音 (1)、 口唇半元音 (w)、 以及 硬腭半元音 ( 拗音 )(y)。
另外, 在声音分析单元 502 中, 辅音的种类可以通过根据输入到声音输入单元 201 中的声音的声音信号检测元音区间、 以时间模式推测夹在元音区间中的声音区间来判断。 具体而言, 基于各辅音的声响上的特征 ( 波谱上的特性 )、 即在开头可看到的急剧或平缓的 强度变化 ( 初始部 )、 接着初始部的部分、 即称作过渡的短时间的共振峰频率变化 ( 共振峰 迁移部分 )、 和为一定的共振峰频率中的初始部和过渡, 能够推测辅音的种类。 以下, 举一些 辅音的种类为例具体地说明。
图 10A ~图 10C 是表示无声爆破音的声响特征的图 ( 光谱图 )。图 10A 是作为无
声爆破音的一例而表示男性的声音发出 “パ (pa)” 的情况下的声响特征的图, 图 10B 是作为 无声爆破音的一例而表示男性的声音发出 “タ (ta)” 的情况下的声响特征的图。图 10C 是 作为无声爆破音的一例而表示男性的声音发出 “カ (ka)” 的情况下的声响特征的图。另外, 在图中, 纵轴表示频率, 横轴表示时间。此外, 在图中, 颜色的浓淡表示声音的强度, 越亮则 表示包含在声音信号中的成分越强。
在此情况下, 如图 10A ~图 10C 所示, 作为辅音的种类之一的无声爆破音 (p、 t、 k) 的声响特征, 除了在接着初期的部分, 称作过渡的共振峰频率变化 ( 共振峰迁移 ) 不同以 外, 还可以观察到初始 ( 开头 ) 的爆破部分 ( 声音的强度变化剧烈的部分 )。另外, 在无声 爆破音 (p、 t、 k) 内, 除了共振峰的迁移的差异以外, 初期 ( 开头 ) 的爆破部分的长度及频率 成分也不同, 从而能够区别。以下说明其例子。
图 11A ~图 11C 是表示有声爆破音的声响特征的图。图 11A 是作为有声爆破音的 一例而表示男性的声音发出 “バ (ba)” 的情况下的声响特征的图, 图 11B 是作为有声爆破音 的一例而表示男性的声音发出 “ダ (da)” 的情况下的声响特征的图。图 11C 是作为有声爆 破音的一例而表示男性的声音发出 “ガ (ga)” 的情况下的声响特征的图。
在此情况下, 如图 11A ~图 11C 所示, 作为辅音的种类之一的有声爆破音 (b、 d、 g) 的声响特征, 在初期 ( 开头 ) 可以观察到蜂音条 (buzz bar)( 开头的低频率成分 )、 和接着 初期的部分中称作过渡的短时间 ( 几十 ms 左右 ) 的共振峰频率变化。另外, 在有声爆破音 (b、 d、 g) 内, 可以考虑通过蜂音条的时间的长度、 共振峰频率变化来区别。
图 12A 及图 12B 是表示鼻音的声响特征的图。图 12A 是作为鼻音的一例而表示男 性的声音发出 “マ (ma)” 的情况下的声响特征的图, 图 12B 是作为鼻音的一例而表示男性的 声音发出 “ナ (na)” 的情况下的声响特征的图。
在此情况下, 如图 12A 及图 12B 所示, 作为辅音的种类之一的鼻音 (m、 n) 的声响特 征, 在初期 ( 开头 ) 可以观察到 200Hz 附近的能量的集中, 还在接着初期的部分可看到共振 峰频率变化。另外, 在鼻音 (m、 n) 内, 可以通过共振峰频率变化的形状来区别。
还可以考虑其他辅音的分类算法, 通过导入这样的辅音分类方法, 声音分析单元 502 能够基于各辅音的声响特征 ( 波谱上的特征 ), 根据初期的强度变化和称作过渡的短时 间的共振峰频率变化的特征来判断 ( 确定 ) 辅音的种类。
然后, 由信号处理部 204 进行拉伸处理。另外, 拉伸处理中, 例如将鼻音 (m、 n)、 有 声爆破音 (b、 d、 g) 的过渡 ( 共振峰迁移部分 ) 进行拉伸等, 仅将时间性变化成为线索的部 分 ( 辅音 ) 进行拉伸处理以便能够感知该变化。此外, 例如将爆破、 破擦部分拉伸等, 将发 出音的持续时间较短的部分 ( 辅音 ) 拉伸处理以便能够感知该成分。
时间拉伸压缩调节单元 503 根据由声音分析单元 502 判断出的辅音的种类, 设定 对信号处理部 204 的时间拉伸单元 305 和时间压缩单元 306 的拉伸时间和压缩时间进行调 节的调节量。
例如, 时间拉伸压缩调节单元 503 根据由声音分析单元 502 判断出的辅音的种类, 如以下这样设定其拉伸时间和压缩时间的调节量。即, 时间拉伸压缩调节单元 503 在基于 辅音的调音位置、 调音方式和声带振动的有无等的分类中, 用表等预先保持表示助听器利 用者容易感知的辅音和难以感知的辅音的听力检查等的数据。并且, 时间拉伸压缩调节单 元 503 关于通过听力检查等的数据推测为难以感知的辅音, 将拉伸时间和压缩时间的调节量设定得较长, 关于推测为容易感知的辅音设定为较短。
这样, 时间拉伸压缩调节单元 503 基于表示助听器利用者容易感知的辅音和不易 感知的辅音的听力检查等的数据进行拉伸及压缩, 从而能够提高辅音的识别率。
例如, 时间拉伸压缩调节单元 503 在由声音分析单元 502 判断出的辅音的种类是 无声爆破音的情况下, 将调节量设定得较短以不会与有声爆破音混同的程度, 在有声爆破 音的情况下, 将调节量设定得较长以使与无声爆破音的差别变得清楚的程度。 由此, 时间分 辨能力下降的听力衰退者能够应对难以识别无声爆破音和有声爆破音的问题。另外, 该问 题对于时间分辨能力下降的听力衰退者来说, 是通过难以正确地感知作为两者的识别的一 个因素的有声开始时间 (Voice onset time(VOT)) 而发生的。关于这样的辅音, 在辅音是 无声爆破音的情况和有声爆破音的情况下使调节量变化, 而使 VOT 的差异、 即无声爆破音 与有声爆破音的差异变得清楚, 从而能够提高辅音的识别率。
另外, 时间拉伸压缩调节单元 503 作为听力检查等的数据而保持有例如将关于各 辅音的容易感知度的助听器利用者的听力信息、 或对每个辅音设定的调节量与辅音建立对 应的表。当然, 这些表并不限于时间拉伸压缩调节单元 503 保持的情况, 也可以是调节部 501 内具备存储部、 通过该存储部保持的结构。
此外, 表示听力检查等的数据的表既可以是表示被标准化成助听器利用者整体的 数据的表, 也可以是表示基于助听器利用者个人的听力的数据的表。
这里, 对表示听力检查等的数据的表、 和使用它进行拉伸处理的时间拉伸压缩调 节单元 503 更具体地说明。
图 14 是表示拉伸率表的 1 例的图。图 14 所示的拉伸率表按照各辅音的每个成分 ( 种类 ) 表示时间分辨能力与拉伸率的关系, 对应于辅音的种类而表示应拉伸的倍率 ( 调节 量 )。这里, 图中的时间分辨能力的值 20(ms) 是表示助听器利用者普遍的辅音的听出能力 的时间, 预先设定。
如图 14 所示, 例如在有音口唇爆破音 b 的情况下, 时间拉伸压缩调节单元 503 将 辅音 b 的时间拉伸到 4.5 倍。此外, 例如在声门摩擦音 h 的情况下, 时间拉伸压缩调节单元 503 将辅音 h 的时间拉伸到 1.8 倍。这里, 关于表示为 1.0 倍的辅音的种类, 表示时间拉伸 压缩调节单元 503 没有拉伸辅音的时间。
另外, 图 14 的拉伸率表表示的值只不过是设定了辅音的种类与使用助听器的利 用者的听觉的时间分辨能力的每个组合的拉伸时间的倍率的一例。当然也可以是其他值, 只要为助听器利用者能够听出来辅音的拉伸率就可以。例如, 过渡的时间性变化较慢的硬 腭半元音 ( 拗音 ) 不怎么需要拉伸, 但过渡的时间性变化较快的、 图 10A ~图 10C 所示的无 声爆破音 (p、 t、 k) 及图 11A ~图 11C 所示的有声爆破音也可以将拉伸时间设定为比例示的 长。 同样, 在拉伸率表中表示的时间分辨能力的值也可以不是 20ms, 也可以是 25ms 或 15ms。 只要是能够作为助听器利用者普遍能够设定的值就可以。
此外, 在拉伸率表中表示的辅音的种类并不限定于图 14 所示的辅音的种类。例 如, 如图 15 所示, 也可以使辅音的种类为将各个辅音按照共通的特征大致分类的组的种 类。 在此情况下, 只要对辅音的各种类、 即将辅音大致分类的各组表示拉伸率就可以。 此外, 将辅音的种类大致分类的组也并不限于如图 16 所示的有声爆破音、 无声爆破音、 无音摩擦 音、 有声摩擦音、 无声破擦音及鼻音, 例如也可以是分类为口唇音、 齿龈音等的组。此外, 这些各组的拉伸率只要使用各组内的代表值 ( 例如平均值、 最大值、 最小值等 ) 设定就可以。 该各组内的代表值既可以在预先准备后设定, 也可以根据各组内的辅音各自的拉伸率的值 来设定。
图 16 是表示最小时间分辨能力表的一例的图。图 16 所示的最小时间分辨能力表 表示为了能够按辅音的每个种类来识别 ( 辨别 ) 所需要的最低限度的时间分辨能力。与助 听器利用者 ( 受听者 ) 的时间分辨能力比较, 在判断为不能感知的情况下进行拉伸处理。 这 里, 助听器利用者 ( 受听者 ) 的时间分辨能力例如是 25(ms), 预先设定。
如图 16 所示, 例如在口唇鼻音 m 的情况下, 时间拉伸压缩调节单元 503 根据 25(ms)/19.3(ms) 的值, 将辅音 m 的时间拉伸到 1.3 倍。此外, 例如在有声齿龈爆破音 d 的 情况下, 时间拉伸压缩调节单元 503 根据 25(ms)/4.1(ms) 的值, 将辅音 d 的时间拉伸到 6.1 倍。其中, 在图 16 中记载为 (33.5) 的、 例如硬腭半元音 ( 拗音 )y 的情况下, 表示是即使不 拉伸也能够识别的音, 因此, 时间拉伸压缩调节单元 503 拉伸到 1.0 倍 ( 不拉伸 )。
这样, 时间拉伸压缩调节单元 503 将助听器利用者 ( 受听者 ) 的听觉的时间分辨 能力拉伸到除以由声音分析单元 202 分析出的辅音的种类的设定在最小时间分辨能力表 中的最小时间分辨能力而得到的值的倍数。
另外, 图 16 的最小时间分辨能力表表示的值不过是一例, 也可以是其他值, 只要 为助听器利用者能够听出辅音的拉伸时间的倍率就可以。例如, 过渡的时间性变化较慢的 硬腭半元音 ( 拗音 ) 不怎么需要拉伸, 但过渡的时间性变化较快的、 图 10A ~图 10C 所示的 无声爆破音 (p、 t、 k) 及图 11 ~图 11C 所示的有声爆破音也可以设定为拉伸时间比例示的 长。 同样, 预先设定的助听器利用者 ( 受听者 ) 的时间分辨能力的值也可以不是 25ms, 也可 以是 20ms 或 15ms, 只要是作为普遍的助听器利用者能够设定的值就可以。
此外, 与上述同样, 在最小时间分辨能力表中表示的辅音的种类并不限于图 16 所 示的辅音的种类。例如, 如图 15 所示, 也可以是将辅音的种类大致分类的每个组。除此以 外, 与上述拉伸率表的情况是同样, 所以省略说明。
此外, 上述拉伸率表及最小时间分辨能力表并不限于如上述那样由时间拉伸压缩 调节单元 503 保持的情况, 也可以是由装备在调节部 501 内的存储部保持的结构。这里, 在 图中表示时间拉伸压缩调节单元 503 保持拉伸率表及最小时间分辨能力表的情况下的时 间拉伸压缩调节单元 503 的结构的一例。
图 17 及图 18 是表示时间拉伸压缩调节单元 503 的结构的一例的图。
图 17 所示的时间拉伸压缩调节单元 503 例如由拉伸率设定单元 5031 和拉伸率表 存储单元 5032 构成。拉伸率表存储单元 5032 保持有上述拉伸率表。拉伸率设定单元 5031 基于助听器利用者 ( 受听者 ) 的时间分辨能力和辅音的种类, 参照拉伸率表存储单元 5032 保持的拉伸率表, 设定拉伸率。拉伸率设定单元 5031 将包含设定的拉伸率的调节量输出到 控制单元 504。
图 18 所示的时间拉伸压缩调节单元 503 例如由拉伸率设定单元 5031 和最小时间 分辨能力表存储单元 5033 构成。最小时间分辨能力表存储单元 5033 保持有上述最小时间 分辨能力表。拉伸率设定单元 5031 参照最小时间分辨能力表存储单元 5033 保持的最小时 间分辨能力表, 与助听器利用者 ( 受听者 ) 的时间分辨能力比较, 在判断为不能感知的情况 下, 设定拉伸率。 拉伸率设定单元 5031 将包括设定的拉伸率的调节量输出到控制单元 504。这样, 时间拉伸压缩调节单元 503 能够基于拉伸率表或最小时间分辨能力表, 根 据辅音的种类设定进行拉伸及压缩的调节量, 所以能够提高辅音识别率。
控制单元 504 将由时间拉伸压缩调节单元 503 设定的调节量与对应于声音分析单 元 502 中的检测结果的控制信号一起输出到信号处理部 204。即, 控制单元 504 基于由声 音分析单元 502 判断出的辅音的种类, 进行该音的处理内容 ( 拉伸、 压缩等 ) 等的判断。并 且, 通过将包括音的区间及处理内容等的信息的控制信号与由时间拉伸压缩调节单元 503 设定的调节量一起对信号处理部 204 发送, 进行信号处理部 204 的控制。
以上, 构成实施方式 4 的助听器。
这样, 在本实施方式的助听器中, 通过调节部 501 的声音分析单元 502 和时间拉伸 压缩调节单元 503 能够根据辅音的种类调节拉伸时间和压缩时间, 所以能够根据辅音的种 类改善辅音的听取状况。
( 变形例 1)
接着, 对上述调节部 501 的其他结构例进行说明。
图 19 是表示本发明的实施方式 4 的变形例 1 的助听器的结构的模块图。图 19 所 示的助听器具备声音输入单元 201、 调节部 701、 控制单元 704、 信号处理部 204、 和声音输出 单元 207。 调节部 701 由声音分析单元 502、 时间拉伸压缩调节单元 703、 和时间分辨能力设 定单元 302 构成。对于与图 1、 图 5 或图 9 相同的结构要素使用相同的标号而省略说明。
图 19 所示的助听器相对于图 9 的助听器不同的是调节部 701、 控制单元 704 的结 构。具体而言, 图 19 所示的助听器的调节部 701 相对于图 9 的助听器的调节部 501 不同的 是时间拉伸压缩调节单元 703 和时间分辨能力设定单元 302 的结构。
声音分析单元 502 如上所述, 判断输入到声音输入单元 201 中的声音是在声响上 看作无音的区间还是有音区间, 在判断为有音区间的情况下判断有音区间内是辅音区间还 是元音区间。进而, 声音分析单元 502 在判断为辅音区间的情况下, 判断辅音区间内的辅音 的种类。具体而言, 声音分析单元 502 基于各辅音的声响特征 ( 波谱上的特征 ), 根据初期 的强度变化和称作过渡的短时间的共振峰频率变化的特征, 判断 ( 确定 ) 辅音的种类。
另外, 声音分析单元 502 也可以在判断出的辅音区间中判断是否出现了应进行拉 伸的声响特征, 在出现了应进行拉伸的声响特征的情况下设定并保持拉伸区间。
时间分辨能力设定单元 302 在助听器使用前设定了用来使助听器适应于利用者 个人的时间分辨能力值。
时间拉伸压缩调节单元 703 参照拉伸率表及最小时间分辨能力表, 基于由声音分 析单元 502 判断出的辅音的种类和由时间分辨能力设定单元 302 设定的助听器利用者 ( 受 听者 ) 的时间分辨能力值, 设定调节量。时间拉伸压缩调节单元 703 将设定后的调节量输 出给控制单元 704。
通过以上那样的结构, 时间拉伸压缩调节单元 703 能够根据输入声音的辅音的种 类和助听器利用者的时间分辨能力两者, 设定对声音的拉伸时间和压缩时间进行调节的调 节量。由此, 能够实现能够达到更适合于个人的听取的改善的助听器及助听处理方法。
以下, 具体说明根据时间拉伸压缩调节单元 703 通过参照预先准备的拉伸率表来 设定的调节量而进行辅音的拉伸处理的情况、 和根据通过参照预先准备的最小时间分辨能 力表来设定的调节量而进行辅音的拉伸处理的情况。首先, 对使用预先准备的拉伸率表的拉伸处理进行说明。
图 20 是表示拉伸率表的一例的图。图 20 所示的拉伸率表按各辅音的每个成分 ( 种类 ) 表示时间分辨能力与拉伸率的关系, 对应于辅音的种类而表示应拉伸的倍率 ( 调节 量 )。
此外, 图 21 是表示时间拉伸压缩调节单元 703 的结构的一例的模块图。
图 21 所示的时间拉伸压缩调节单元 703 例如由拉伸率设定单元 7031 和拉伸率表 存储单元 7032 构成。拉伸率表存储单元 7032 保持有图 20 所示的拉伸率表。拉伸率设定 单元 7031 基于由时间分辨能力设定单元 302 设定的助听器利用者 ( 受听者 ) 的时间分辨 能力和辅音的种类, 参照拉伸率表存储单元 7032 保持的拉伸率表, 设定拉伸率。拉伸率设 定单元 7031 将包含设定的拉伸率的调节量输出到控制单元 704。
例如, 假设由声音分析单元 502 判断出的辅音的种类是有音口唇爆破音 b, 并且由 时间分辨能力设定单元 302 设定的助听器利用者 ( 受听者 ) 的时间分辨能力值是 15ms。在 此情况下, 时间拉伸压缩调节单元 703 参照图 20 所示的拉伸率表, 设定将判断为辅音 b 的 辅音区间拉伸到 3.4 倍的调节量。此外, 例如假设由声音分析单元 502 判断出的辅音的种 类是声门摩擦音 h, 并且由时间分辨能力设定单元 302 设定的助听器利用者 ( 受听者 ) 的时 间分辨能力值是 15ms。 。在此情况下, 时间拉伸压缩调节单元 703 参照图 20 所示的拉伸率 表, 设定将判断为辅音 h 的辅音区间拉伸到 1.4 倍的调节量。其他也是同样的, 所以省略说 明。
另外, 图 20 的拉伸率表表示的值不过是一例, 也可以是其他的值, 只要为助听器 利用者能够听出辅音的拉伸时间的倍率就可以。例如, 过渡的时间性变化较慢的硬腭半元 音 ( 拗音 ) 不怎么需要拉伸, 但过渡的时间性变化较快的、 图 10A ~图 10C 所示的无声爆破 音 (p、 t、 k) 及图 11A ~图 11C 所示的有声爆破音也可以设定为拉伸时间比例示的长。另一 方面, 在通过使初期部的时间较短的辅音、 例如无声爆破音的拉伸时间变长、 而发生与初期 部的时间较长的辅音、 例如有声爆破音的错听的情况下, 也可以进行设定以使无声爆破音 的拉伸时间不超过有声爆破音的拉伸时间、 或者使有声爆破音的拉伸时间更长。
控制单元 704 将由时间拉伸压缩调节单元 703 设定的调节量与对应于声音分析单 元 502 中的检测结果的控制信号一起输出到信号处理部 204。 即, 控制单元 304 通过将控制 信号与调节量一起对信号处理部 204 发送, 进行信号处理部 204 的控制。
接着, 对以上那样构成的助听器的动作例进行说明。
图 22 是表示本实施方式 4 的变形例 1 的助听器的动作例的流程图。另外, 步骤 S401 ~步骤 S411 的动作与图 4 的步骤 S401 ~ S411 分别相同, 所以省略说明。
在步骤 S4040 中, 声音分析单元 502 判断在判断 ( 检测 ) 出的辅音区间是否出现 了应进行拉伸的声响的特征 (S4041)。声音分析单元 502 如果判断为出现了应进行拉伸 的声响特征 (S4041 的是的情况 ), 则前进到设定拉伸区间的步骤 (S4042)。如果不是那样 (S4041 的否的情况 ), 则结束处理。
接着, 如果由声音分析单元 502 判断 ( 检测 ) 出的辅音区间设定为应拉伸处理的 拉伸区间 (S4042), 则时间拉伸压缩调节单元 703 参照如图 20 所示的拉伸率表。 接着, 时间 拉伸压缩调节单元 703 根据由声音分析单元 502 判断 ( 检测 ) 出的输入声音的辅音的种类 和由时间分辨能力设定单元 302 设定的助听器利用者的时间分辨能力两者, 设定对拉伸区间的拉伸率和时间、 以及对应于辅音拉伸时间而将元音、 无音区间压缩的时间进行调节的 调节量 (S4043)。
接着, 控制单元 704 将由时间拉伸压缩调节单元 703 设定的调节量与对应于声音 分析单元 502 的检测结果的控制信号一起输出到信号处理部 204。信号处理部 204 按照从 控制单元 704 输出的调节量和控制信号, 执行拉伸处理 (S4044)。 这里, 所谓拉伸处理, 是指 例如将鼻音 (m、 n)、 有声爆破音 (b、 d、 g) 的过渡 ( 共振峰迁移部分 ) 进行拉伸等、 仅将时间 性变化成为线索的部分 ( 辅音 ) 进行拉伸处理以便能够感知其变化。此外, 例如是将爆破、 破擦部分进行拉伸等、 将发音的持续时间较短的部分 ( 辅音 ) 进行拉伸处理以便能够感知 该成分的处理。即, 对爆破等的初期 ( 开头 ) 和接着初期的过渡部分 ( 共振峰迁移 ) 实施 拉伸处理。
由此, 进行使用了预先准备的拉伸率表的拉伸处理。
接着, 对使用了预先准备的图 16 所示的最小时间分辨能力表的拉伸处理进行说 明。
图 23 是表示时间拉伸压缩调节单元 703 的结构的另一例的模块图。
图 23 所示的时间拉伸压缩调节单元 703 例如由拉伸率设定单元 7031 和最小时间 分辨能力表存储单元 7033 构成。最小时间分辨能力表存储单元 7033 保持有图 16 所示的 最小时间分辨能力表。拉伸率设定单元 7031 基于由时间分辨能力设定单元 302 设定的助 听器利用者 ( 受听者 ) 的时间分辨能力和辅音的种类, 参照最小时间分辨能力表存储单元 7033 保持的最小时间分辨能力表, 设定拉伸率。 拉伸率设定单元 7031 将包含设定的拉伸率 的调节量输出给控制单元 704。 例如, 假设由声音分析单元 502 判断出的辅音的种类是口唇鼻音 m、 并且由时 间分辨能力设定单元 302 设定的助听器利用者 ( 受听者 ) 的时间分辨能力值是 25ms。 在此情况下, 时间拉伸压缩调节单元 703 参照图 16 所示的最小时间分辨能力表, 根据 25(ms)/19.3(ms) 的值, 设定将判断为辅音 m 的辅音区间拉伸到 1.3 倍的调节量。此外, 例 如假设由声音分析单元 502 判断出的辅音的种类是有音齿龈爆破音 d、 并且由时间分辨能 力设定单元 302 设定的助听器利用者 ( 受听者 ) 的时间分辨能力值是 25ms。在此情况下, 时间拉伸压缩调节单元 703 参照图 16 所示的最小时间分辨能力表, 根据 25(ms)/4.1(ms) 的值, 设定将判断为辅音 d 的辅音区间拉伸到 6.1 倍的调节量。其他也是同样的, 所以省略 说明。
另外, 图 16 所示的最小时间分辨能力表表示的值不过是一例, 也可以是其他的 值, 只要为助听器利用者能够听出辅音的拉伸时间的倍率就可以。 例如, 过渡的时间性变化 较慢的硬腭半元音 ( 拗音 ) 不怎么需要拉伸, 但过渡的时间性变化较快的、 图 10A ~图 10C 所示的无声爆破音 (p、 t、 k) 及图 11A ~图 11C 所示的有声爆破音也可以设定为拉伸时间 比例示的长。另一方面, 在通过使初期部的时间较短的辅音例如无声爆破音的拉伸时间变 长、 而发生与初期部的时间较长的辅音例如有声爆破音的错听的情况下, 也可以进行设定 以使无声爆破音的拉伸时间不超过有声爆破音的拉伸时间、 或者使有声爆破音的拉伸时间 更长。
控制单元 704 将由时间拉伸压缩调节单元 703 设定的调节量与对应于声音分析单 元 502 的检测结果的控制信号一起输出到信号处理部 204 中。即, 控制单元 304 通过将控
制信号和调节量一起对信号处理部 204 发送, 进行信号处理部 204 的控制。
接着对以上那样构成的助听器的动作例进行说明。
图 24 是表示本实施方式 4 的变形例 1 的助听器的另一动作例的流程图。另外, 步 骤 S401 ~步骤 S411 的动作与图 4 的步骤 S401 ~ S411 分别相同, 所以省略说明。此外, 步 骤 S4041 和步骤 S4012 的动作与图 22 的步骤 S4041 ~ S4012 分别相同, 所以省略说明。
在步骤 S4047 中, 时间拉伸压缩调节单元 703 参照如图 16 所示的最小时间分辨能 力表。 并且, 时间拉伸压缩调节单元 703 基于由声音分析单元 502 判断 ( 检测 ) 出的输入声 音的辅音的种类和由时间分辨能力设定单元 302 设定的助听器利用者的时间分辨能力两 者, 取得最小时间分辨能力 (S4047)。接着, 时间拉伸压缩调节单元 703 设定对拉伸区间的 拉伸率和时间、 以及对应于辅音拉伸时间将元音、 无音区间压缩的时间进行调节的调节量。
接着, 控制单元 704 将由时间拉伸压缩调节单元 703 设定的调节量与对应于声音 分析单元 502 的检测结果的控制信号一起输出到信号处理部 204 中。信号处理部 204 按照 从控制单元 704 输出的调节量和控制信号执行拉伸处理 (S4047)。这里的拉伸处理与上述 同样, 对爆破等的初期 ( 开头 ) 和接着初期的过渡部分 ( 共振峰迁移 ) 进行。
如以上, 进行使用了预先准备的最小时间分辨能力表的拉伸处理。
以上那样构成的助听器根据助听器利用者 ( 受听者 ) 的时间分辨能力的劣化, 对 每个辅音进行拉伸处理。该拉伸处理是基于时间分辨能力的拉伸处理, 使用预先准备的拉 伸率表或最小时间分辨能力表等来进行。具体而言, 例如将鼻音 (m、 n)、 有声爆破音 (b、 d、 g) 的过渡 ( 共振峰迁移部分 ) 进行拉伸等, 仅将时间性变化成为线索的部分 ( 辅音 ) 进行 拉伸处理以便能够感知其变化。此外, 例如将爆破、 破擦部分进行拉伸等, 将发音的持续时 间较短的部分 ( 辅音 ) 进行拉伸处理以便能够感知该成分。换言之, 对爆破等的初期 ( 开 头 ) 和接着初期的过渡部分 ( 共振峰迁移 ) 进行拉伸处理。
另外, 助听器利用者 ( 受听者 ) 的时间分辨能力的劣化程度如上所述, 不仅因辅音 的种类而不同, 还因语速而不同。
因此, 也可以是, 声音分析单元 502 例如通过测量辅音或元音出现的时间音调等 而分析语速, 保持语速信息, 时间拉伸压缩调节单元 703 还考虑保持在声音分析单元 502 中 的语速信息来设定调节量。具体而言, 时间拉伸压缩调节单元 703 也可以对标准的语速的 声音设定拉伸率表或最小时间分辨能力表, 例如在语速比标准快 1.2 倍的情况下, 将拉伸 率表的值设为 1.2 倍或将最小分辨能力表的值设为 1.2 分之一等, 根据受听的声音的语速 来调节表。
此外, 在上述拉伸处理中, 将助听器利用者 ( 受听者 ) 的时间分辨能力的值预先知 道 ( 预先准备 )、 将该助听器利用者 ( 受听者 ) 的时间分辨能力的值设定到时间分辨能力设 定单元 302 中的情况作为典型例进行了说明, 但并不限于此。例如, 也可以在有关本发明的 助听器的使用开始前, 通过调节装置等推测 ( 测量 ) 助听器利用者 ( 受听者 ) 的时间分辨 能力, 并将由调节装置等推测 ( 测量 ) 的助听器利用者 ( 受听者 ) 的时间分辨能力设定到 时间分辨能力设定单元 302 中。该调节装置既可以装备在时间分辨能力设定单元 302 中, 也可以另外准备在外部。
这里, 例示通过调节装置等推测助听器利用者 ( 受听者 ) 的时间分辨能力的方法。
该调节装置取得测量了助听器利用者 ( 受听者 ) 将辅音怎样听错的错听模式, 根据所取得的错听模式推测助听器利用者 ( 受听者 ) 的时间分辨能力。 例如, 在助听器利用者 ( 受听者 ) 弄错了辅音 k、 正确回答辅音 m 的情况下, 调节装置利用图 16 所示的最小时间分 辨能力表, 根据辅音 k 的最小时间分辨能力 17.6ms 和辅音 m 的最小时间分辨能力 19.3ms, 推测该助听器利用者 ( 受听者 ) 的时间分辨能力为 18 ~ 19ms 左右。这样, 调节装置也可 以根据助听器利用者 ( 受听者 ) 的错听模式来推测助听器利用者 ( 受听者 ) 的时间分辨能 力。另外, 错听模式的测量只要使用一般的语音清楚度检查 (57S、 57S) 的结果、 或使用容易 发生错听 ( 易混淆 ) 的发出的声音以知道辨别的边界线来进行就可以。
此外, 该调节装置不仅可以根据助听器利用者 ( 受听者 ) 的错听模式来推测助听 器利用者 ( 受听者 ) 的时间分辨能力, 还可以指定容易发生错听的辅音或辅音对, 通知给时 间分辨能力设定单元 302。 在此情况下, 时间拉伸压缩调节单元 703 设定对容易发生错听的 辅音或辅音的对的调节量以使容易发生错听的辅音或辅音对的声响特征变得清楚, 并输出 给控制单元。另外, 时间拉伸压缩调节单元 703 也可以通过再调节关于容易发生错听的辅 音或辅音对的拉伸率表或最小时间分辨能力表的值等来应对。并且, 信号处理部 204 对容 易发生错听的辅音或辅音对进行拉伸处理以使声响特征变得清楚。例如, 在鼻音 (m、 n) 间 或有声爆破音 (b、 d、 g) 之间发生错听的情况下, 设定拉伸区间及拉伸率以便能够感知它们 的过渡部分的差异。此外, 在口唇音 (p、 b、 m、 w) 间、 齿龈音 (t、 d、 s、 z、 ts、 n) 间发生错听 的情况下, 设定拉伸区间及拉伸率, 以便能够感知初期 ( 开头 ) 的爆破音、 破擦音等。这样, 助听器也可以对容易发生错听的辅音或辅音对进行拉伸处理以使声响特征变得清楚。
( 变形例 2)
助听器利用者 ( 受听者 ) 的时间分辨能力的劣化程度不仅因辅音的种类而不同, 还因声音的大小 ( 声压 ) 而不同。因此, 在变形例 2 中, 作为考虑到声音的大小的情况的结 构例, 对与上述变形例 1 中的调节部 501 不同的结构例进行说明。
图 25 是表示本发明的实施方式 4 的变形例 2 的助听器的结构的模块图。图 25 所 示的助听器具备声音输入单元 201、 调节部 801、 控制单元 804、 信号处理部 204、 和声音输出 单元 207。调节部 801 由声音分析单元 502、 时间拉伸压缩调节单元 803、 和声压计算单元 402 构成。对于与图 1、 图 5 或图 9 相同的结构要素使用相同的标号而省略说明。
时间拉伸压缩调节单元 803 参照拉伸率表或最小时间分辨能力表, 基于由声音分 析单元 502 判断出的辅音的种类和由声压计算单元 402 计算出的声压 ( 值 ), 设定调节量。 例如, 时间拉伸压缩调节单元 803 在由声压计算单元 402 计算出的声压比规定值大的情况 下, 在由声音分析单元 502 判断出的辅音的种类中设定调节量, 以成为从设定在拉伸率表 中的拉伸率减去规定值量的值。此外, 时间拉伸压缩调节单元 803 在由声压计算单元 402 计算出的声压是规定值以下的情况下, 在由声音分析单元 502 判断出的辅音的种类中设定 调节量, 以成为对设定在拉伸率表中的拉伸率加上规定值量的值。时间拉伸压缩调节单元 803 将设定的调节量输出给控制单元 804。
另外, 声压计算单元 402 也可以与上述图 8 同样, 仅对由声音分析单元 502 判断为 有音区间的区间进行计算处理。
控制单元 804 将由时间拉伸压缩调节单元 803 设定的调节量与对应于声音分析单 元 502 的检测结果的控制信号一起输出到信号处理部 204 中。即, 控制单元 804 基于由声 音分析单元 502 分析的声音的种类 ( 元音、 辅音、 其他等 ), 进行该声音的处理内容 ( 拉伸、压缩等 ) 等的判断。接着, 通过将包括声音的区间及处理内容等的信息的控制信号与由时 间拉伸压缩调节单元 303 设定的调节量一起发送给信号处理部 204, 进行信号处理部 204 的 控制。
这样, 能够参照拉伸率表及最小时间分辨能力表, 根据输入声音的辅音的种类和 输入声音的声压两者, 调节声音的拉伸时间和压缩时间, 能够实现适合于个人的听取的改 善、 和防止声音的不适当的拉伸和压缩带来的声音劣化的助听器及助听处理方法。
( 变形例 3)
进而, 对调节部 501 的另一结构例进行说明。
图 26 是表示本发明的实施方式 4 的变形例 3 的助听器的结构的模块图。图 26 所 示的助听器由声音输入单元 201、 调节部 901、 控制单元 904、 信号处理部 204、 和声音输出单 元 207。调节部 901 由声音分析单元 502、 声压计算单元 402、 时间分辨能力设定单元 302 和 时间拉伸压缩调节单元 903 构成。对于与图 1、 图 5 或图 9 相同的结构要素使用相同的标号 而省略说明。
时间拉伸压缩调节单元 903 参照拉伸率表和最小时间分辨能力表, 基于由声音分 析单元 502 判断出的辅音的种类、 由声压计算单元 402 计算出的声压值、 和由时间分辨能力 设定单元 302 设定的时间分辨能力值, 设定调节量。时间拉伸压缩调节单元 903 将设定的 调节量输出给控制单元 904。另外, 在此情况下, 也可以如上述图 8 那样, 声压计算单元 402 仅对由声音分析单元 202 判断为有音区间的区间进行计算处理。
控制单元 904 将由时间拉伸压缩调节单元 903 设定的调节量与对应于声音分析单 元 202 的检测结果的控制信号一起输出给信号处理部 204。
这样, 能够参照拉伸率表及最小时间分辨能力表, 根据输入声音的辅音的种类、 输 入声音的声压、 利用者的时间分辨能力, 调节声音的拉伸时间和压缩时间, 能够实现更适合 于个人的听取的改善、 和防止声音的不适当的拉伸和压缩带来的声音劣化的助听器及助听 处理方法。
如以上, 根据本发明, 通过分析输入声音并检测辅音区间、 拉伸辅音区间的时间, 能够对因时间分辨能力的下降而难以听取辅音的听力衰退者给予足够感知辅音的时间。 由 此, 能够改善辅音的漏听及误识别、 提高辅音识别度及声音识别度。
另外, 仅通过拉伸辅音区间的时间, 会在视觉信息与听觉信息中发生偏差, 发生不 能进行视觉的听觉辅助的问题。 特别是, 对于难以听取的辅音, 如果在视觉信息与听觉信息 之间发生延迟, 则听取变得更困难。因此, 在有关本发明的助听器及助听处理方法中, 进行 使以后的辅音的发生时间统一的处理, 以使得在视觉信息与听觉信息之间不发生延迟。 即, 在后接于辅音区间的元音区间或在辅音区间之后出现的在声响上看作无音的区间、 或者元 音区间与无音区间的两者中, 删除拉伸了辅音区间的时间量, 从而将后接于辅音区间的区 间的时间进行压缩。由此, 能够使得不发生视觉信息与听觉信息的时间的偏差。另外, 该时 间压缩并不限于后接于拉伸了时间的辅音区间的元音区间, 也可以对其他元音区间进行, 也可以对噪声等的无意义区间进行。
此外, 在有关本发明的助听器及助听处理方法中, 通过由表等保持听力衰退者的 时间分辨能力的下降程度的数据, 根据听力衰退者的时间分辨能力的下降程度来调节辅音 区间的拉伸时间。由此, 能够进行适合于听力衰退者个人的辅音的听取改善。进而, 在有关本发明的助听器及助听处理方法中, 根据输入声音的声压来调节辅 音区间的拉伸时间。由此, 能够进行对应于声压的辅音的听取改善。
进而, 在有关本发明的助听器及助听处理方法中, 基于辅音的声响特征即初始的 音信号的强度变化、 和接着初期的过渡 ( 共振峰迁移部分 ), 判断辅音的种类, 并根据辅音 的种类, 例如使用 PSOLA( 基音同步叠加 ) 法、 或使用反复复制共振峰迁移部分的波形的反 复处理等来调节拉伸处理的辅音区间的拉伸时间。由此, 能够进行对应于辅音的种类的辅 音的听取改善。另外, 所谓对应于辅音的种类, 不仅可以如上述那样对应于各辅音的种类, 也可以对应于将辅音的种类大致分类的组。例如, 也可以将辅音的种类大致分类为有声爆 破音的组、 无声爆破音的组、 无声摩擦音的组、 有声摩擦音的组、 无声破擦音的组以及鼻音 的组。此外, 例如也可以将辅音的种类大致分类为口唇音的组、 齿龈音的组等。并且, 只要 使用各组内的代表值 ( 例如平均值、 最大值、 最小值等 ) 设定拉伸率就可以。该各组内的代 表值既可以在预先准备后设定, 也可以根据各组内的辅音各自的拉伸率的值设定。
另外, 也可以考虑通过对每个辅音单独设定拉伸率、 反而发生错听的情况。 在此情 况下, 只要进行校正 ( 修正 ) 以对发生错听的辅音或辅音对设定共通的拉伸率就可以。
此外, 在通过本发明的拉伸处理反而发生辅音的错听的情况下, 也可以对助听器 的使用初期容许错听。这是因为, 通过本发明的拉伸处理, 如果助听器利用者 ( 受听者 ) 能 够感知 ( 区分 ) 各辅音的声响差异, 则通过进行学习以正确地识别该错听所表示的辅音, 也 能够逐渐消除错听。这样, 也可以依赖于助听器利用者 ( 受听者 ) 的再学习而容许错听。
以上, 根据本发明, 能够实现使时间变化剧烈、 持续时间较短的辅音的识别率提高 的助听器及助听处理方法。
另外, 在上述本发明的助听器及助听处理方法中, 也可以做成不进行到辅音整体 的分析、 而容易且高速地检测应拉伸的声音的特征、 开始辅音区间的时间拉伸的结构。即, 也可以为如下结构 : 如果检测出例如表示爆破、 摩擦的开头部分 ( 急剧的频率成分的变化 ) 或过渡部分 ( 共振峰成分的变化 : 共振峰迁移 ) 等表示辅音的特征性变化、 则不等待辅音整 体的分析而开始辅音区间的时间拉伸。在此情况下, 不仅能够减少上述辅音区间的判断延 迟, 还起到安装变得简单的效果。
此外, 也可以不使用声音的波谱上的特征 ( 共振峰等 )、 而使用将声音在时间轴上 分析的情况下的特征进行辅音或元音的判断。
以上, 基于上述实施方式说明了本发明, 但本发明当然并不限定于上述实施方式。 以下这样的情况也包含在本发明中。
构成上述各装置的结构要素的一部分或全部也可以由 1 个系统 LSI(Large Scale Integration : 大规模集成电路 ) 构成。系统 LSI 是将多个结构部集成在 1 个芯片上制造的 超多功能 LSI, 具体而言, 是包括微处理器、 ROM、 RAM 等构成的计算机系统。在上述 RAM 中存 储有计算机程序。通过上述微处理器按照上述计算机程序动作, 系统 LSI 实现其功能。
此外, 构成上述各装置的结构要素的一部分或全部也可以由相对于各装置可拆装 的 IC 卡或单体的模块构成。上述 IC 卡或上述模块是由微处理器、 ROM、 RAM 等构成的计算 机系统。上述 IC 卡或上述模块也可以包括上述超多功能 LSI。通过微处理器按照计算机程 序动作, 上述 IC 卡或上述模块实现其功能。该 IC 卡或该模块也可以具有防篡改性。
此外, 本发明也可以是上述所示的方法。 此外, 也可以是通过计算机实现这些方法的计算机程序, 也可以是由上述计算机程序构成的数字信号。
此外, 本发明也可以是将上述计算机程序或上述数字信号记录到计算机可读取的 记录介质、 例如软盘、 硬盘、 CD-ROM、 MO、 DVD、 DVD-ROM、 DVD-RAM、 BD(Blu-ray Disc)、 半导体 存储器等中的产品。此外, 也可以是记录在这些记录介质中的上述数字信号。
此外, 本发明也可以是将上述计算机程序或上述数字信号经由电气通信线路、 无 线或有线通信线路、 以因特网为代表的网络、 数据广播等传送的结构。
此外, 本发明也可以是具备微处理器和存储器的计算机系统, 上述存储器存储有 上述计算机程序, 上述微处理器按照上述计算机程序动作。
此外, 也可以通过将上述程序或上述数字信号记录到上述记录介质中并移送、 或 者通过将上述程序或上述数字信号经由上述网络等移送, 由独立的其他计算机系统实施。
此外, 也可以将上述实施方式及上述变形例分别进行组合。
工业实用性
本发明能够在助听器及助听处理方法中使用, 特别是在提高包括老年性听力衰退 的、 时间分辨能力下降的感音性听力衰退者的辅音的听取、 应用到助听器及声音通信设备、 声音再现装置中的情况下, 能够在使用了可提高声音清晰度的声响处理技术的助听器及助 听处理方法中使用。
符号说明 201 声音输入单元 202、 502 声音分析单元 203、 304、 404、 504、 604、 704、 804、 904 控制单元 204 信号处理部 205、 305 时间拉伸单元 206、 306 时间压缩单元 207 声音输出单元 301、 401、 501、 601、 701、 801、 901 调节部 302 时间分辨能力设定单元 303、 403、 503、 603、 703、 803、 903 时间拉伸压缩调节单元 402 声压计算单元 5031、 7031 拉伸率设定单元 5032、 7032 拉伸率表存储单元 5033、 7033 最小时间分辨能力表存储单元