一种多媒体设备和一种多媒体信号处理方法技术领域
本发明涉及多媒体信号处理技术领域,特别涉及一种多媒体设备和一种
多媒体信号处理方法。
背景技术
目前多种智能音视频设备都添加了语音识别功能。图1是现有的一种多
媒体设备的组成结构的示意图。如图1所示,该多媒体设备包括:麦克风阵
列101、音频编码电路102、摄像头103、视频处理电路104、主控集成电路
105、系统主控微控制单元(系统主控MCU)106、扬声器107及显示屏108。
其中,麦克风阵列101负责语音信号的拾取并转换成模拟音频信号后输
出给音频编码电路102,音频编码电路102将从麦克风阵列101接收的模拟
音频信号进行数字编码,然后输出给主控集成电路105;摄像头103用于捕
获视频信号并输出给视频处理电路104,视频处理电路104用于对摄像头103
输出的信号进行编码处理后输出给主控集成电路105;主控集成电路105汇
集视频信号和音频信号后,合成音视频数据流输出给系统主控微控制单元
106。系统主控微控制单元106为该音视频设备的核心器件,负责音视频数据
链路的管理。从系统主控微控制单元106输出的音频信号通过音频扬声器107
变成声音信号,从系统主控微控制单元106输出的视频信号通过显示屏108
进行显示。此外,图1所示的音视频设备还包括作为外围接口的USB接口和
负责整个系统的稳定供电的电源电路等,这里不再一一赘述。
在现有的如图1所示的具有语音识别功能的音视频设备中,由于设备自
身既有麦克风阵列,又有扬声器,因此扬声器的音频信号会进入到麦克风阵
列中形成回声,造成语音识别的误动作。
现有的一般的回声消除方案是在麦克风阵列处采用自适应滤波方式进行
回声的抑制,但这种方案实现起来成本和复杂度都较高。
发明内容
本发明提供了一种多媒体设备和一种多媒体信号处理方法,以解决扬声
器的音频信号进入麦克风阵列中形成的回声造成的语音识别错误的问题,并
且实现成本和复杂度都比较低。
为达到上述目的,本发明的技术方案是这样实现的:
本发明公开了一种多媒体设备,该多媒体设备包括:麦克风阵列、音频
编码电路、系统主控微控制单元和扬声器,其中:
麦克风阵列,接收语音信号并转换成模拟音频信号后输出给音频编码电
路;
音频编码电路,将所接收的模拟音频信号转换成数字音频信号后,进行
消噪处理以及根据系统主控微控制单元反馈的音频信号进行回声消除处理后
输出;
系统主控微控制单元,接收来自音频编码电路的音频信号,将该音频信
号输出给扬声器的同时反馈给音频编码电路。
该多媒体设备进一步包括:保存有消噪算法程序和回声消除算法程序的
存储器;
所述音频编码电路,采用存储器中的消噪算法程序进行消噪处理,以及
采用存储器中的回声消除算法进行回声消除处理。
该多媒体设备进一步包括:摄像头、视频处理电路、主控集成电路和显
示屏,其中:
摄像头,用于捕获视频信号并输出给视频处理电路;
视频处理电路,用于对摄像头输出的视频信号进行编码处理后输出给主
控集成电路;
所述音频编码电路,将进行消噪处理以及进行回声消除处理后的音频信
号输出给主控集成电路;
主控集成电路,将所接收的音频信号与视频信号合成音视频数据流后输
出给所述系统主控微控制单元;
所述系统主控微控制单元,负责音视频数据链路的管理,将音视频数据
流中的视频信号输出到显示屏,将音视频数据流中的音频信号输出到扬声器
的同时反馈给音频编码电路。
所述主控集成电路采用通用串行总线USB协议将音频信号和视频信号
合成音视频数据流。
本发明还公开了一种多媒体信号处理方法,该方法包括:
采用麦克风阵列接收语音信号并转换成模拟音频信号后输出给音频编码
电路;
音频编码电路将模拟音频信号转换成数字音频信号后,进行消噪处理以
及根据反馈的音频信号进行回声消除处理后输出;
系统主控微控制单元,接收来自音频编码电路的音频信号,将该音频信
号输出给扬声器的同时反馈给音频编码电路。
在上述方法中,所述音频编码电路将模拟音频信号转换成数字音频信号
后,进行消噪处理以及根据反馈的音频信号进行回声消除处理后输出包括:
在存储器中保存消噪算法程序和回声消除算法程序;
音频编码电路将模拟音频信号转换成数字音频信号后,采用存储器中的
消噪算法程序进行消噪处理,以及采用存储器中的回声消除算法进行回声消
除处理。
该方法进一步包括:采用摄像头捕获视频信号并输出给视频处理电路,
视频处理电路对摄像头输出的视频信号进行编码处理后输出给主控集成电
路;
所述音频编码电路将模拟音频信号转换成数字音频信号后,进行消噪处
理以及根据反馈的音频信号进行回声消除处理后输出给主控集成电路;
主控集成电路将所接收的音频信号与视频信号合成音视频数据流后输出
给所述系统主控微控制单元;
系统主控微控制单元负责音视频数据链路的管理,将音视频数据流中的
视频信号输出到显示屏,将音视频数据流中的音频信号输出到扬声器的同时
反馈给音频编码电路。
在上述方法中,所述主控集成电路将所接收的音频信号与视频信号合成
音视频数据流包括:
所述主控集成电路采用通用串行总线USB协议将音频信号和视频信号
合成音视频数据流。
由上述可见,本发明这种,麦克风阵列接收语音信号并转换成模拟音频
信号后输出给音频编码电路,音频编码电路将所接收的模拟音频信号转换成
数字音频信号后,进行消噪处理以及根据系统主控微控制单元反馈的音频信
号进行回声消除处理后输出,系统主控微控制单元接收来自音频编码电路的
音频信号输出给扬声器的同时反馈给音频编码电路的技术方案,由于系统主
控微控制单元将音频信号返回给音频编码电路形成闭环,音频编码电路根据
反馈的音频信号进行回声消除处理,因此可以有效地消除回声,该方案相对
与现有的在多麦克风阵列处采用自适应滤波消除回声的方案来说,实现成本
和复杂度都比较低。
附图说明
图1是现有的一种多媒体设备的组成结构的示意图;
图2为本发明实施例中的多媒体设备的组成结构的示意图;
图3是本发明实施例中的一种多媒体信号处理方法的流程图。
具体实施方式
本发明中,采用麦克风阵列接收语音信号并转换成模拟音频信号后输出
给音频编码电路,音频编码电路将模拟音频信号转换成数字音频信号后,进
行消噪处理以及根据反馈的音频信号进行回声消除处理后输出,系统主控微
控制单元将来自音频编码电路的音频信号输出给扬声器的同时反馈给音频编
码电路。该方案可以有效地消除回声,且该方案相对与现有的在多麦克风阵
列处采用自适应滤波消除回声的方案来说,实现成本和复杂度都比较低。
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发
明实施方式作进一步地详细描述。
图2为本发明实施例中的多媒体设备的组成结构的示意图。如图2所示,
该系统包括:麦克风阵列101、音频编码电路201、摄像头103、视频处理电
路104、主控集成电路105、系统主控微控制单元202、扬声器107和显示屏
108。由于本发明的实施例中对音频编码电路和系统主控微控制单元的功能都
进行了改进,因此采用了与图1中不同的附图标记。
其中,麦克风阵列101,用于接收语音信号并转换成模拟音频信号后输
出给音频编码电路201。音频编码电路201,用于将所接收的模拟音频信号转
换成数字音频信号后,进行消噪处理以及根据系统主控微控制单元反馈的音
频信号进行回声消除处理后输出给主控集成电路105。摄像头103用于捕获
视频信号并输出给视频处理电路104,视频处理电路104用于对摄像头103
输出的视频信号进行编码处理后输出给主控集成电路105;
主控集成电路105,将所接收的音频信号与视频信号合成音视频数据流
后输出给所述系统主控微控制单元202。系统主控微控制单元202负责音视
频数据链路的管理,将音视频数据流中的视频信号输出到显示屏,将音视频
数据流中的音频信号输出到扬声器的同时反馈给音频编码电路201。从系统
主控微控制单元202输出的音频信号通过音频扬声器107变成声音信号,从
系统主控微控制单元202输出的视频信号通过显示屏108进行显示。
在图2所示的实施例中,音频编码电路201可以采用现有的一些成熟算
法根据系统主控微控制单元202反馈的音频信号从来自麦克风阵列101的音
频信号中消去由于扬声器107的声音信号进入麦克风阵列101所产生的回声。
并且本实施例中,音频编码电路201在进行回声消除之前还采用传统的消噪
算法进行噪声的消除。
一种具体的实现方式是,图2所示的多媒体设备还进一步包括:保存有
消噪算法程序和回声消除算法程序的存储器203;音频编码电路201,采用存
储器203中的消噪算法程序进行消噪处理,然后采用存储器203中的回声消
除算法进行回声消除处理。存储器203可以是EEPROM。
视频识别和音频识别是目前的各种智能多媒体产品追逐的目标。在本发
明的多媒体设备中,优化了视频流与音频流的处理结构,主控集成电路105
采用通用串行总线USB协议将音频信号和视频信号合成音视频数据流。具体
可以采用USB2.0协议。这样可以实现可视会议等多媒体功能。
在图2所示的实施例中,视频处理部分采用高分辨率的摄像头,视频数
据流传输采用USB协议,提高了视频数据传输的正确率。
在图2所示的实施例中,主控微控制单元202将音频信号再反馈给音频
编码电路201,从而形成一个闭环控制系统,可以根据输出到扬声器的音频
信号实时进行回音的消除,从而使得语音识别功能更加精准,避免多媒体设
备受到错误的音频信号进行误动作。
基于上述实施例给出本发明中的一种多媒体信号处理方法。图3是本发
明实施例中的一种多媒体信号处理方法的流程图。如图3所示。该方法包括:
301,采用麦克风阵列接收语音信号并转换成模拟音频信号后输出给音频
编码电路。
302,音频编码电路将模拟音频信号转换成数字音频信号后,进行消噪处
理以及根据反馈的音频信号进行回声消除处理后输出。
在本步骤中,具体可以在存储器中保存消噪算法程序和回声消除算法程
序;音频编码电路将模拟音频信号转换成数字音频信号后,采用存储器中的
消噪算法程序进行消噪处理,以及采用存储器中的回声消除算法进行回声消
除处理。
303,系统主控微控制单元接收来自音频编码电路的音频信号,将该音频
信号输出给扬声器的同时反馈给音频编码电路。
图3所示的方法还可以进一步包括:采用摄像头捕获视频信号并输出给
视频处理电路,视频处理电路对摄像头输出的视频信号进行编码处理后输出
给主控集成电路;
所述音频编码电路将模拟音频信号转换成数字音频信号后,进行消噪处
理以及根据反馈的音频信号进行回声消除处理后输出给主控集成电路;
主控集成电路将所接收的音频信号与视频信号合成音视频数据流后输出
给所述系统主控微控制单元;
系统主控微控制单元负责音视频数据链路的管理,将音视频数据流中的
视频信号输出到显示屏,将音视频数据流中的音频信号输出到扬声器的同时
反馈给音频编码电路。
其中,所述主控集成电路采用通用串行总线USB协议将音频信号和视频
信号合成音视频数据流。
综上所述,本发明的技术方案中,由于系统主控微控制单元将音频信号
返回给音频编码电路形成闭环,音频编码电路根据反馈的音频信号进行回声
消除处理,因此可以有效地消除回声,且该方案相对与现有的在多麦克风阵
列处采用自适应滤波消除回声的方案来说,实现成本和复杂度都比较低。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范
围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均
包含在本发明的保护范围内。