语音通话质量的处理方法及装置 【技术领域】
本发明涉及通信领域,具体而言,涉及一种语音通话质量的处理方法及装置。背景技术 目前,在移动终端 ( 例如,手机等 ) 上,为了提高通话的语音质量,目前采用以 下的处理方式 :
移动终端可以采用双麦克降噪技术,但是这种方法增加了硬件设计成本以及增 加了结构设计的复杂性,这种双麦克降噪技术对于环境非稳态噪声进行完全的滤除使得 被叫端无法真实感受呼叫端所处的真实环境。
移动终端还可以仅仅通过移动终端主板上的麦克 (MIC) 检测环境噪声的大小来 动态调节移动终端的接收增益和发送增益来改善语音通话质量。 由于仅仅通过 MIC 采集 的环境噪声无法判断用户所处的确切的噪声场所,提高发送增益和接收增益并能不能真 正解决语音通话质量问题,反而带来更多的语音失真,影响用户主观感受。
上述两种处理方法均是在移动终端中内置固定软件版本,这样的处理方式,在 出厂后用户无法进行修改,导致语音通话质量不能满足用户的真实需求,在这种情况 下,用户可能选择退机或者去售后更新软件版本,从而影响了用户体验。
发明内容 本发明的主要目的在于提供一种语音通话质量的处理方法及装置,以至少解决 上述问题。
根据本发明的一个方面,提供了一种语音通话质量的处理方法,包括 :在移动 终端中设置多种场景,其中,每一种场景对应一套音频参数 ;使用所述多种场景中的一 种场景所对应的音频参数对所述移动终端进行设置。
优选地,根据以下至少之一确定所述场景所对应的音频参数 :用户的年龄段、 用户的性别、所述移动终端在通话时所处的环境。
优选地,采用以下步骤确定所述场景对应的音频参数 :采集所述场景对应的音 频样本 ;使用所述音频样本在标准的消声室进行测试 ;根据测试的结果确定所述场景对 应的音频参数。
优选地,所述音频参数包括以下至少之一 :用于控制发送和 / 或接收方向上声 音增益大小的参数、调整发送和 / 或接收通道上数字增益的参数、调整发送和 / 或接收通 道上模拟增益的参数、调制发送和 / 或接收语音的频率的参数、抑制背景噪声传输的参 数、增强双讲通话效果的参数。
优选地,使用所述多种场景中的一种场景所对应的音频参数对所述移动终端进 行设置包括 :将所述多种场景中的一种场景所对应的音频参数写入到数字信号处理 DSP 寄存器中,所述终端根据所述 DSP 寄存器中的音频参数对所述移动终端进行设置。
根据本发明的另一方面,提供了一种语音通话质量的处理装置,位于移动终端
中,包括 :第一设置模块,用于设置多种场景,其中,每一种场景对应一套音频参数 ; 第二设置模块,用于使用所述多种场景中的一种场景所对应的音频参数对所述移动终端 进行设置。
优选地,所述装置还包括 :参数预置模块,用于根据以下至少之一确定所述场 景所对应的音频参数 :用户的年龄段、用户的性别、所述移动终端在通话时所处的环 境。
优选地,所述装置还包括 :采集模块,用于采集所述场景对应的音频样本 ;测 试模块,用于使用所述音频样本在标准的消声室进行测试 ;确定模块,用于根据测试的 结果确定所述场景对应的音频参数。
优选地,所述第一设置模块设置的场景对应的音频参数包括以下至少之一 :用 于控制发送和 / 或接收方向上声音增益大小的参数、调整发送和 / 或接收通道上数字增益 的参数、调整发送和 / 或接收通道上模拟增益的参数、调制发送和 / 或接收语音的频率的 参数、抑制背景噪声传输的参数、增强双讲通话效果的参数。
优选地,所述装置还包括 :写入模块,用于将所述多种场景中的一种场景所对 应的音频参数写入到数字信号处理 DSP 寄存器中,所述终端根据所述 DSP 寄存器中的音 频参数对所述移动终端进行设置。 通过本发明,解决了现有技术中导致语音通话质量不能满足用户的真实需求的 问题,提高了用户体验。
附图说明 此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本 发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。 在附图 中:
图 1 是根据本发明实施例的一种语音通话质量的处理方法流程图 ;
图 2 是根据本发明实施例的语音通话质量的处理装置结构框图 ;
图 3 是根据本发明实施例优选的语音通话质量的处理装置结构框图 ;
图 4 是根据本发明实施例的用户体验者主观测试时所使用的环境示意图 ;
图 5 是根据本发明实施例的移动终端的音频模块结构框图 ;
图 6 是根据本发明实施例的基于性别,年龄以及使用场所的场景联系示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。 需要说明的是,在不冲突 的情况下,本申请中的实施例及实施例中的特征可以相互组合。
图 1 是根据本发明实施例的一种语音通话质量的处理方法流程图。 如图 1 所示, 该方法包括如下步骤 :
步骤 S102,在移动终端中设置多种场景,其中,每一种场景对应一套音频参 数;
步骤 S104,使用多种场景中的一种场景所对应的音频参数对移动终端进行设 置。通过上述步骤,移动终端中设置了多种场景,从而为用户提供了多种选择,使 用户可以根据自己需求选择合适的场景,来获得满意的语音通话质量。
现有的移动终端对于用户的性别,年龄层次以及移动终端使用场所无法进行判 断,在本实施例的下面的优选实施例中根据心理声学和生理声学、例如,可以根据不同 性别或年龄层次的用户的听觉和通话语音的频谱范围来确定不同用户的听力能力,进而 设置合适的场景。
例如,根据以下至少之一确定场景所对应的音频参数 :用户的年龄段、用户的 性别、移动终端在通话时所处的环境。 在该优选实施方式下,用户可以根据自己的年 龄,性别以及进行语音通话时所处的不同使用环境来选择一种单独的语音通话配置,这 样可以给予用户更多的语音通话质量选择方案,方便用户在不更换移动终端的前提下显 著提升语音通话质量。
在本实施例中,还提供了一种优选的确定场景对应的音频参数的方法 ( 当然也 可以不采用这种确定音频参数的方法,不过这种确定方法比较容易实现 ),该方法包括如 下步骤 :
步骤 S1,采集场景对应的音频样本 ;
步骤 S2,使用音频样本在标准的消声室进行测试 ;
步骤 S3,根据测试的结果确定场景对应的音频参数。
优选地,音频参数包括以下至少之一 :用于控制发送和 / 或接收方向上声音增 益大小的参数、调整发送和 / 或接收通道上数字增益的参数、调整发送和 / 或接收通道上 模拟增益的参数、调制发送和 / 或接收语音的频率的参数、抑制背景噪声传输的参数、 增强双讲通话效果的参数。
当然,为了更加便于在移动终端中实现,可以将多种场景中的一种场景所对应 的音频参数写入到数字信号处理 (Digital Signal Processing,简称为 DSP) 寄存器中,终端 根据 DSP 寄存器中的音频参数对移动终端进行设置。
通过上述实施例及其优选实施方式,在移动终端中预置了几种移动终端使用场 景模式,使得用户在通话过程中可以根据自己的性别,年龄层次,以及进行语音通话时 所处的位置和环境,对场景进行选择,然后移动终端根据用户所选择场景配置动态地写 入移动终端的 DSP 中基于不同场景定制的调节好的音频参数,这样很好地满足了用户对 语音通话质量提出的较高要求,降低了移动终端厂商售后成本,也使得用户使用移动终 端时,语音通话质量有了显著的提升。
图 2 是根据本发明实施例的语音通话质量的处理装置结构框图,该装置用于实 现上述实施例及其优选实施方式,已经进行过说明的不再赘述,下面对该结构中涉及到 的模块进行说明,如图 2 所示,该装置包括 :第一设置模块 10、第二设置模块 20,下面 对该结构进行说明。
第一设置模块 10,用于在移动终端中设置多种场景,其中,每一种场景对应一 套音频参数 ;第二设置模块 20,用于使用多种场景中的一种场景所对应的音频参数对移 动终端进行设置。
图 3 是根据本发明实施例优选的语音通话质量的处理装置结构框图,如图 3 所 示,该装置还包括 :参数预置模块 302,用于根据以下至少之一确定场景所对应的音频参数 :用户的年龄段、用户的性别、移动终端在通话时所处的环境。
优选地,该装置还包括 :采集模块 304,用于采集场景对应的音频样本 ;测试 模块 306,用于使用音频样本在标准的消声室进行测试 ;确定模块 308,用于根据测试的 结果确定场景对应的音频参数。
优选地,第一设置模块 10 设置的场景对应的音频参数包括以下至少之一 :用于 控制发送和 / 或接收方向上声音增益大小的参数、调整发送和 / 或接收通道上数字增益的 参数、调整发送和 / 或接收通道上模拟增益的参数、调制发送和 / 或接收语音的频率的参 数、抑制背景噪声传输的参数、增强双讲通话效果的参数。
优选地,该装置还包括 :写入模块 310,用于将多种场景中的一种场景所对应 的音频参数写入到 DSP 寄存器中,终端根据 DSP 寄存器中的音频参数对移动终端进行设 置。
下面结合另一个优选实施例进行说明,该优选实施例结合上述实施例及其优选 实施方式。
本优选实施例,在移动终端出厂的内置烧录软件版本中内置几种通话使用场 景,如选择用户的年龄层次、性别,以及用户语音通话时所处的真实环境 :家庭,会议 室,马路,海滩,公交等。 用户可以根据自己的通话需求和实际使用情况进行设置,通 过如上三种模式的选择,用户可以选择适合自己的语音通话质量模式。 在本优选实施例 中,针对每种场景,在移动终端内置软件中提供单独的不同的音频参数,供用户选择好 场景时时实时地写入 DSP 寄存器,达到提升语音通话质量的目的。 在本优选实施例,不同场景的单独的音频参数的获得是通过采取不同的声音 样本,例如,不同年龄层次的声音样本,不同性别的声音样本,不同使用场所的声音 样本,并在标准的消声室通过测试系统,例如可以使用先进通信质量分析 (Advanced Communication Quality Analysis,简称为 ACQUA) 音频测试系统,对终端进行测试,实时 调节音频参数,根据测试结果进行处理,例如,平均主观分数 (Mean Opinion Score,简 称为 MOS) 分值的大小或 ITU 规定的语音测试标准决定采用最佳效果的音频参数。 然后 通过用户体验志愿者主观听觉感受得出的 MOS 分来判断此时的语音通话质量是否是处于 一个较好的状态,最终确定选择的音频参数是否需要继续调整。
图 4 是根据本发明实施例的用户体验者主观测试时所使用的环境示意图,如图 4 所示,可以测试移动终端发送方向的语音通话质量。 如果将两个房间中的移动终端和固 定电话进行互换,则可以测试移动终端接收方向的语音通话质量。 另外针对不同使用环 境的噪声,通过扬声器在房间内发出模拟真实场景的背景噪声,这样来测试不同场景下 移动终端的语音通话质量。
在本实施例中,还可以通过调整的音频参数通过写入 DSP 寄存器生效,使用的 DSP 寄存器以及相应算法包括滤波器,模拟增益,数字增益,回声算法等。
下面结合移动终端中的与音频相关的模块进行说明。 需要说明的是,以下的模 块仅仅是示例性说明,但这些功能的实现并不限于在以下的模块中实现。
图 5 是根据本发明实施例的移动终端的音频模块结构框图。 如图 5 所示,针 对移动终端,一股调节语音通话质量的算法包括自动增益控制 (Auto Gain Control,简称 为 AGC) 模块,数字增益,模拟增益,有限脉冲响应 (Finite Impulse Response,简称为
FIR) 或无限脉冲响应 (Infinite Impulse Response,简称为 IIR) 滤波器和回声消除 (Echo Canceller,简称为 EC) 模块等。 其中 AGC 模块用来控制发送和接收方向上声音增益的大 小,避免声音过大或过小影响用户主观听觉感受,它根据设置的压缩门限、扩展门限、 压缩斜率、扩展斜率和静态增益等寄存器进行增益调整,并且可以滤除低频噪声。 数字 增益和模拟增益都可以提高和减小发送或接收通道上的增益。 FIR 或 IIR 滤波器用来对 接收或发送语音的频率响应进行调制,可以根据不同的场景进行调整,使其达到最佳状 态。 EC 模块负责消除移动终端通话过程中的回声,而且通过此模块的寄存器可以抑制背 景噪声的传输以及增强双讲 (double talk) 的通话效果。
对于不同的语音通话质量模式或场景,上述的 DSP 寄存器需要根据不同的场景 进行调节。
下面根据声音不同的频谱范围进行说明。
60 ~ 100Hz :这段频率影响声音的浑厚感,是低音的基音区。 如果这段频率很 丰满,音色会显得厚实、混厚感强。 如果这段频率不足,音色会变得无力 ;而如果这段 频率过强,音色会出现低频共振声,有轰呜的感觉。
100 ~ 150Hz :这段频率是影响音色的丰满度,如果这段频率成分增强,就会产 生一种房间共呜的空间感、混厚感 ;如果这段频率成分缺少,音色会变得单薄、苍白 ; 如果这段频率成分过强,音色将会显得浑浊,语音的清晰度变差。 150Hz ~ 300Hz :这段频率影响声音的力度,尤其是男声声音的力度。 这段频 率是男声声音的低频度基音频率,同时也是乐音中和弦的根音频率。 如果这段频率成分 缺乏,音色会显得发软、发飘,语音则会变得软绵绵 ;如果这段频率成分过强,声音会 变得生硬而不自然,且没有特色。
200 ~ 500Hz :中低频段决定声音力度,如超过 +5dB ~ 10dB 声音变得模糊,清 晰度下降,下跌 -6 ~ 10dB 声音缺乏力度而显单薄,音色硬而窄。
300 ~ 500Hz :这段频率是语音的主要音区频率。 这段频率的幅度丰满,语音 有力度。 如果这段频率幅度不足,声音会显得空洞、不坚实 ;如果这段频率幅度过强, 音色会变得单调,相对来说低频成分少了,高频成也少了,语音会变成类似于电话中声 音的音色一样,显得很单调。
500H ~ 1KHz :频率是人声的基音频率区域,是一个重要的频率范围。 如果这 段频率丰满,人声轮廓明朗,整体感好 ;如果这段频率幅度不够,语音会产生一种收缩 感 ;如果这段频率过强,语音就会产生一种向前突出的感觉,使语音产生一种提前进入 人的听觉感受。
800Hz :这个频率幅度影响音色的力度。 如果这个频率丰满,音色会显得强劲 有力 ;如果这个频率不足,音色将会显得松驰,也就是 800Hz 以下的成分特性表现突出 了,低频成分就明显 ;而如果这个频率过多,则会产生喉音感。 人人都有一个喉腔,人 人都有一定的喉音,如果音色中的喉音成分过多了,则会失掉音色美感。
1 ~ 2KHz :这段频率范围通透感明显,顺畅感强。 如果这段频率缺乏,音色则 松散且音色脱节 ;如果这段频率过强,音则有跳跃感。
2 ~ 3KHz :这段频率是影响声音明亮度最敏感的频段,如果这段频率成分丰 富,则音色的明亮度会增强,如果这段频率幅度不足,则音色将会变得朦朦胧胧 ;而如
果这段频率成分过强,音色就会显得呆板、发硬、不自然。 1 ~ 3KHz 中高频段对明亮 度、清晰度和临场感有重要作用,此频段超过 +3 ~ 5dB 会使声音变硬,超过 +5 ~ 10dB 会出现金属声,下跌 -3 ~ 5dB 会使声音变硬,超过 +5 ~ 10dB 会出现金属声,下跌 -3 ~ 5dB 会使音色失去明亮感,下跌 -5 ~ 10dB 声音发闷,不清晰。
3 ~ 4KHz :这个频率的穿透力很强。 人耳耳腔的谐振频率是 1 ~ 4KHz,所以 人耳对这个频率也是非常敏感的。 如果这段频率成分过少,听觉能力会变差,语音显得 模糊不清了。 如果这个频率成分过强,则会产生咳声的感觉。
针对移动终端持有者的性别,一股男性声音频谱的低频都比较丰富,导致在移 动终端的另一侧 ( 即被叫端 ),声音听起来会发闷,这种情况下,就可以通过 FIR 或 IIR 滤波器进行低频的调整,抬高低频部分 100-500HZ 之间的频谱增益,改善了通话质量。 而女性声音频谱的高频比较丰富,导致移动终端的另一侧 ( 被叫端 ) 听起来声音发尖和刺 耳,就可以通过 FIR 或 IIR 滤波器在高频处 3000-4000HZ 之间的频谱增益进行一定的压低 来改善通话质量。
针对移动终端持有者年龄,人的年龄层次一股分为老年,中年,青年,儿童, 根据听觉能力的不同,声音频谱的分布也不同,就需要使用不同的 FIR 和 IIR 滤波器参数 进行调节。如老年人听力比较差,则需要提高接收通道的接收强度,如果听筒 (Receiver) 器件本身支持 t 听力辅助 (Hear Assist Carrier,简称为 HAC) 功能,则可以打开听筒的 HAC,但是要保证音量在可以接受的范围之内,不能超过人的生理痛阈,并且不能够超 出听筒或扬声器的功率范围。 针对移动终端持有者的使用环境,比如马路上,车流量比较大,噪声也比较 大,那么就可以在噪声抑制的算法上针对车辆噪声进行更大程度的抑制,并且还可以通 过 AGC 对处于马路噪声的频段进行滤波和特殊处理,以达到最优的通话效果。
图 6 是根据本发明实施例的基于性别,年龄以及使用场所的场景联系示意图。 图 6 示出了基于性别,年龄以及使用场所的场景联系图。 基于图 6,可以提供的使用场 景达到 40 种左右,并且根据实际需求还可以进行添加。 基于上述的移动终端使用者的性 别,年龄层次以及使用场所,需要大约 40 种音频通话场景配置。 每一种场景配置均通过 音频实验室采用不同的音频样本进行严格测试,模拟实际场景进行测试,保证了每个场 景的语音通话质量。 当用户不作任何选择时,移动终端使用一组默认的音频参数进行配 置。 当用户根据自身情况选择了自己的性别,年龄层次,以及通话的使用环境,则移动 终端通过用户的设置进行调用指定场景配置,进而达到改善语音通话质量的目的,大大 地提高了移动终端提升语音通话质量的灵活性,给用户提供了极大的方便性。
通过上述实施例,可以满足用户对语音通话质量提出的要求,降低了移动终端 厂商售后成本,也使得用户使用移动终端时,语音通话质量有了显著的提升。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通 用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所 组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而可以将它 们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或 者将它们中的多个模块或步骤制作成单个集成电路模块来实现。 这样,本发明不限制于 任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的 技术人员来说,本发明可以有各种更改和变化。 凡在本发明的精神和原则之内,所作的 任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。