一种语音识别频道选择系统、方法及频道转换装置.pdf

摘要
申请专利号：	CN200810065417.0	申请日：	2008.02.23
公开号：	CN101516005A	公开日：	2009.08.26
当前法律状态：	驳回	有效性：	无权
法律详情：	发明专利申请公布后的驳回IPC(主分类):H04N 5/44申请公布日:20090826\|\|\|实质审查的生效IPC(主分类):H04N 5/44申请日:20080223\|\|\|公开
IPC分类号：	H04N5/44; H04N5/445; H04N5/50; G10L15/10; G10L15/28; G08C17/00	主分类号：	H04N5/44
申请人：	华为技术有限公司
发明人：	吴治国; 张勤伟
地址：	518129广东省深圳市龙岗区坂田华为总部办公楼
优先权：
专利代理机构：		代理人：
PDF下载：	PDF下载

内容摘要

本发明提供一种语音识别频道选择系统、方法及频道转换装置，该方法包括：控制器接收用户的语音输入信号；频道转换装置根据输入的语音信号及识别词表识别出待匹配名称；根据待匹配名称与匹配表进行匹配得出需要切换的频道；切换到需要切换的频道。本发明避免了在控制器上进行语音识别操作复杂和成本高的问题，使得用户在操作起来十分方便，并且充分利用频道转换装置的性能，节省了控制的成本。通过频道转换装置识别出待匹配名称，不需要在网络中设置专门的语音识别服务器，防止响应时间过长，避免了由于网络传输数据丢失的问题，并且节约了构建网络的成本。

权利要求书

1.  一种语音识别频道选择方法，其特征在于，该方法包括：
控制器接收用户的语音输入信号；
频道转换装置根据输入的语音信号及识别词表识别出待匹配名称；
根据所述待匹配名称与匹配表进行匹配得出需要切换的频道；
切换到所述需要切换的频道。

2.  如权利要求1所述的语音识别频道选择方法，其特征在于，该方法进一步包括：接收用户输入的激活语音的指令，该指令用于控制所述频道转换装置激活语音，并且将频道转换装置置为静音状态。

3.  如权利要求1所述的语音识别频道选择方法，其特征在于，所述频道转换装置根据输入的语音信号识别出待匹配名称包括：采集和处理用户输入的语音信号，检测实际语音段的起点和终点，根据所述实际语音段的起点和终点识别出所述待匹配名称。

4.  如权利要求1所述的语音识别频道选择方法，其特征在于，所述频道转换装置根据输入的语音信号识别出待匹配名称包括：将语音信号进行语音特征提取；根据声学模型和识别词表计算出所述语音特征数据相对于识别词表中的词条的声学距离；若语音特征数据相对于词条的声学距离小于阈值，根据识别词表和匹配表计算出当前语音对应的频道名称。

5.  如权利要求4所述的语音识别频道选择方法，其特征在于，该方法还包括：若语音特征数据相对于词条的声学距离大于或等于阈值，提示用户重新输入语音。

6.  如权利要求5所述的语音识别频道选择方法，其特征在于，所述提示用户重新输入语音的方式为通过电视屏幕显示用户当前输入的语音无法识别，提示用户重新输入。

7.  如权利要求1所述的语音识别频道选择方法，其特征在于，该方法还进一步包括：频道转换装置向控制器发送停止语音采集控制信号，控制器根据所述停止语音采集控制信号的控制停止采集和处理语音信号。

8.  如权利要求1所述的语音识别频道选择方法，其特征在于，该方法进一步包括：频道转换装置根据电子节目指南EPG服务器更新所述匹配表和/或所述识别词表。

9.  如权利要求1所述的语音识别频道选择方法，其特征在于，该方法进一步包括：根据用户输入的语言选择信号，选择一个与所述语言选择信号对应的声学模型。

10.  如权利要求1所述的语音识别频道选择方法，其特征在于，所述控制器与所述频道转换装置通过无线传输协议进行通信。

11.  如权利要求10所述的语音识别频道选择方法，其特征在于，所述无线传输协议包括：高速红外协议、蓝牙传输协议和紫蜂Zigbee传输协议中的一种或多种。

12.  一种语音识别频道选择系统，其特征在于，该系统包括：控制器，用于与频道转换处理装置进行通信；
所述控制器用于接收用户的语音输入信号；
所述频道转换处理装置用于根据所述输入的语音输入信号及识别词表识别出待匹配名称，根据所述待匹配名称与匹配表进行匹配得出需要切换的频道，并切换到所述需要切换的频道。

13.  如权利要求2所述的语音识别频道选择系统，其特征在于，该系统还包括：电子节目指南EPG服务器，用于提供待更新的匹配表和/或最更新的识别词表，所述频道转换装置根据所述待更新的匹配表更新所述匹配表，和/或根据所述最新的识别词表更新所述识别词表。

14.  一种频道转换装置，其特征在于，该装置包括：
接收模块，用于接收控制器发送的用户的语音输入信号；
识别处理模块，用于根据所述输入的语音输入信号及识别词表识别出待匹配名称；
查询匹配模块，用于根据所述待匹配名称与匹配表进行匹配得出需要切换的频道；
频道转换控制模块，用于切换到所述需要切换的频道。

15.  如权利要求14所述的频道转换装置，其特征在于，该装置还包括：
静音控制模块，用于根据用户输入的激活语音的指令，将频道转换装置置为静音状态。

16.  如权利要求14所述的频道转换装置，其特征在于，所述识别处理模块进一步包括：
语音激活检测单元，用于检测实际语音段的起点和终点。

17.  如权利要求14所述的频道转换装置，其特征在于，所述识别处理模块进一步包括：
语音特征提取单元，用于对语音信号进行语音特征提取；
语音识别单元，用于根据声学模型和识别词表计算出输入的语音特征数据相对于识别词表中词条的声学距离；
语音判断单元，用于判断语音特征数据相对于词条的声学距离是否小于阈值，若语音特征数据相对于词条的声学距离小于阈值，根据识别词表和匹配表计算出当前语音对应的频道名称。

18.  .如权利要求17所述的频道转换装置，其特征在于，该装置还包括：
拒绝识别提示模块，用于在识别结果为非语音时，提示用户重新输入语音。

19.  如权利要求14所述的频道转换装置，其特征在于，该装置还包括：
更新模块，用于根据电子节目指南EPG服务器更新所述匹配表和/或所述识别词表。

20.  如权利要求14所述的频道转换装置，其特征在于，该装置还包括：
语言选择模块，用于根据用户输入的语言选择信号，选择一个与所述语言选择信号对应的声学模型。

说明书

一种语音识别频道选择系统、方法及频道转换装置
技术领域
本发明涉及通信技术领域，尤其涉及一种通过语音识别进行频道选择系统、装置及方法。
背景技术
近年来随着信息技术和广播电视技术的发展，有线数字电视和IPTV等业务发展迅速。在机顶盒(Set-top Box，STB)，如IP机顶盒和数字机顶盒等，逐步市场化的趋势下，机顶盒的完备功能逐渐取代了传统的VCD机和DVD机。另一方面，随着自动语音识别技术的发展，使得机顶盒通过语音来选择频道成为可能，该技术也成为业界研发的重点。
传统的语音识别选择频道有两种方式：一种是通过在遥控器上增加语音识别处理器的方式，在识别时通过用户输入下载语音模板与用户输入的语音数据匹配确定的语音数据来转换频道；一种是通过在网络中设置专门的语音识别服务器。
发明人在实现本发明的过程中发现传统的语音识别选择频道的方式至少存在如下缺点：通过在遥控器上增加语音识别处理器的方式，由于在识别时每次更新语音模板都需要用户手动操作下载到遥控器上，操作起来十分复杂、不便，同时，也增加了遥控器的成本；通过在网络中设置专门的语音识别服务器的方式，由于识别语音时需要将语音信号上传到网络，响应时间较长，并且通过网络上行和下行传输两次数据包丢失的可能性也会增大，另外专门的语音识别服务器也增加了构建网络的成本。
发明内容
有鉴于此，实有必要提供一种操作方便、节省成本的语音识别频道选择方法。
同时，提供一种操作方便、节省成本的语音识别频道转换系统。
同时，提供一种操作方便、节省成本的频道转换装置。
一种语音识别频道选择方法，包括如下步骤：
控制器接收用户的语音输入信号；
频道转换装置根据输入的语音信号及识别词表识别出待匹配名称；
根据所述待匹配名称与匹配表进行匹配得出需要切换的频道；
切换到所述需要切换的频道。
一种语音识别频道选择系统，包括：控制器，用于与频道转换处理装置进行通信；
所述控制器用于接收用户的语音输入信号；
所述频道转换处理装置用于根据所述输入的语音输入信号及识别词表识别出待匹配名称，根据所述待匹配名称与匹配表进行匹配得出需要切换的频道，并切换到所述需要切换的频道。
一种频道转换装置，包括：
接收模块，用于接收控制器发送的用户的语音输入信号；
识别处理模块，用于根据所述输入的语音输入信号及识别词表识别出待匹配名称；
查询匹配模块，用于根据所述待匹配名称与匹配表进行匹配得出需要切换的频道；
频道转换控制模块，用于切换到所述需要切换的频道。
与现有技术相比，本发明实施例通过控制器接收用户的语音输入信号，通过频道转换装置根据所述输入的语音输入信号识别出待匹配名称，根据所述待匹配名称与匹配表进行匹配得出需要切换的频道，并切换到所述需要切换的频道，避免了在控制器上进行语音识别操作复杂和成本高的问题，使得用户在操作起来十分方便，并且充分利用频道转换装置的性能，节省了控制的成本。通过频道转换装置识别出待匹配名称，不需要在网络中设置专门的语音识别服务器，防止响应时间过长，避免了由于网络传输数据丢失的问题，并且节约了构建网络的成本。
附图说明
图1为本发明实施例语音识别频道转换系统结构示意图。
图2为本发明实施例控制器结构示意图。
图3为本发明实施例频道转换处理装置结构示意图。
图4为本发明实施例语音识别频道选择方法流程图。
图5为本发明实施例频道和节目表更新方法流程图。
图6为本发明实施例识别词表和匹配表更新方法流程图。
具体实施方式
请参看图1，本发明实施例语音识别频道转换系统100包括：控制器102、频道转换装置104和电子节目指南(Electronic Program Guide，EPG)服务器106。控制器102，用于接收用户的语音输入信号。频道转换装置104，用于根据输入的语音输入信号及识别词表识别出待匹配名称，根据待匹配名称与匹配表进行匹配得出需要切换的频道，并切换到需要切换的频道。EPG服务器106，用于提供待更新的最新的匹配表和/或最新的更新的识别词表，频道转换装置104可以根据最新的匹配表更新匹配表，和/或根据最新的识别词表更新识别词表。控制器102可以是系统外接控制器、HS(Handset，手机)或遥控器，本实施例中，以遥控器为例。频道转换装置104可以是PC(Personal Computer，个人电脑)、STB(Set-top Box，机顶盒)、NB(NotebookComputer，笔记本电脑)、HS(Handset，手机)、GP(Game Player，游戏机)或ODD(Optical Disc Drive，光碟机)等，本实施例中，以STB为例进行说明。
请结合参看图2，本实施例中，控制器102包括：语音接收模块202、语音信号处理模块204、输入模块210、控制器接收模块212和发送模块216。
语音信号接收模块202，用于接收用户的语音输入信号，本实施例中，语音输入模块可以是一个遥控器上的麦克风。
语音信号处理模块204，用于处理用户的语音输入信号。语音信号处理模块204还包括：语音转换单元206和语音编码单元208。语音转换单元206，用于将语音信号转换成为数字信号，本实施例中，语音转换单元206可以是A/D转换电路。语音编码单元208，用于编码语音转换单元206转换后的数字信号，该编码可以是压缩编码，包括有损压缩编码或无损压缩编码。用户的语音采集和处理可以有不同的方案，本实施例中，以16KHz采样率进行采样，按16或8bit的精度进行量化。语音信号经过采样和处理后的编码格式为PCM(Pulse Code Modulation，脉冲编码调制)格式。
输入模块210，用于接收用户输入的指令，如，语音激活指令，用于控制频道转换装置激活语音，本实施例中，输入模块210可以是键盘或触摸屏。
控制器接收模块212，用于接收频道转换装置104发送的信号，该信号包括返回的指令信号和通知消息等。
发送模块216，用于发送用户输入的语音编码后的信号和操作信号，本实施例中，发送模块216可以是红外、蓝牙等无线通讯装置，如可以通过Bluetooth2.0(蓝牙2.0技术)，紫蜂Zigbee或高速红外协议等能够保证PCM(Pulse Code Modulation，脉冲编码调制)语音数据能够实时传输的高速无线通信技术。发送模块216还包括：操作信号发送单元218，用于发送用户输入的操作信号，例如，键盘输入和触摸屏输入信号。语音信号发送单元214，用于发送用户输入的语音信号，该信号为经过A/D转换的数字信号，也可以是压缩编码后的信号。
请结合参看图3，本实施例中，频道转换装置104(STB)包括：接收模块302、静音控制模块308、语言选择模块310、识别处理模块312、发送模块322、拒绝识别提示模块324、存储模块326、查询匹配模块336、频道转换控制模块338和更新模块340。
接收模块302，用于接收控制器发送的用户的语音输入信号和用户的操作控制指令，本实施例中，用户输入信号包括用户的语音输入信号和用户的操作控制指令，若全部为语音输入，也可以不包含用户控制指令信号。用户的语音输入信号为经过模拟/数字A/D转换后的数字语音信号。接收模块302还包括操作信号接收单元304和语音信号接收单元306。操作信号接收单元304用于接收用户的操作控制指令，例如激活语音控制指令。语音信号接收单元306用于接收用户的语音输入信号。
静音控制模块308，用于根据用户输入的激活语音的指令，将频道转换装置置为静音状态，及在语音采集后将静音状态切换为非静音状态。
语言选择模块310，用于根据用户输入的语言选择信号，选择一个与所述语言选择信号对应的声学模型。
识别处理模块312，用于根据输入的语音信号及识别词表识别出待匹配名称。识别处理模块312包括：语音激活检测单元314、语音特征提取单元316、语音识别单元318和语音判断单元320。
语音激活检测单元314，用于检测实际语音段的起点和终点。本实施例中，语音激活检测单元314采用稳健的端点检测算法检测出实际语音的起点和终点，以区分出输入的语音信号中实际语音段和非语音段。
语音特征提取单元316，用于将语音信号进行语音特征提取。本实施例中，语音特征提取单元316将话音激活检测单元314传送过来的语音信号进行处理，提取出语音特征数据。语音特征类型可以采用MFCC(Mel-FrequencyCeptral Coefficients，美尔频率倒谱系数)特征，PLP(Perceptually LinearPrediction，感知线性预测)特征或LPCC(Linear Predictive Cepstral Coding，线性预测倒谱系数)特征，为了提高抗噪效果，可以在语音特征提取过程中运用倒谱均值减的处理。考虑到MFCC特征利用了人耳的声学感知特性而对噪音具有较好的稳健性，优选MFCC特征作为语音特征。语音信号作为短时平稳信号，语音帧之间具有帧间相关性，为此可以对MFCC特征提取一阶差分或一阶及二阶差分来提高语音识别的准确率。
语音识别单元318，用于根据声学模型和识别词表计算出输入的语音特征数据相对于词条的声学距离。本实施例中，语音识别单元318根据声学模型数据和孤立词表数据得到每个孤立词的最短累积声学距离，然后取最短声学距离最小的孤立词作为该语音首选识别结果。语音识别采用的声学模型包括连续的HMM(Hidden Markov Model隐含马尔可夫模型)模型和离散HMM模型。此外，语音识别单元318还可以给出多个候选的识别结果让用户选择，排序的依据为最短累积声学距离。
语音判断单元320，用于判断语音特征数据相对于词条的声学距离是否小于阈值，若语音特征数据相对于词条的声学距离小于阈值，根据识别词表和匹配表计算出当前语音对应的频道名称。
发送模块322，用于向控制器102发送识别处理信号，在识别处理完毕后，控制器102可以停止采集用户的语音输入信号。本实施例中，发送模块322也可以采用蓝牙、红外等无线方式传送信号。
拒绝识别提示模块324，用于在识别结果为非语音时，提示用户重新输入语音。该提示可以是消息提示、视频显示提示或声音提示，本实施例中，采用在屏幕上显示提示文字的方式提示用户。
存储模块326，用于存储频道和节目表、识别词表、声学模型和匹配表等数据。本实施例中，存储模块326包括：频道和节目表存储单元328、识别词表存储单元330、声学模型存储单元332、匹配表存储单元334。
频道和节目表存储单元328，用于存储频道和节目对应表，本实施例中，表的每一个记录项为直播电视的频道名称以及当前时刻该频道正在播放的节目名称。该频道和节目对应表可以根据EPG服务器106更新，更新周期可以设置为一天或一个星期，具体的时间间隔可以参考IPTV或有线数字电视系统的EPG服务器更新间隔。
识别词表存储单元330，用于存储识别词表，本实施例中，识别词表还包括一张用于孤立词语音识别的孤立词表。
声学模型存储单元332，用于存储待匹配的声学模型。本实施例中，采用包含针对HMM模型的双语种混合建模的声学模型的模型参数。双语种混合声学模型的参数与说话人无关，即为针对非特定人的模型。模型参数需要事先根据标注好的预料数据经过训练器进行训练，训练得到的参数就可以固化到声学模型参数存储部用于孤立词的语音识别，声学模型参数包括隐含马尔可夫模型的状态参数和状态输出观测特征矢量的概率分布函数。
匹配表存储单元334，用于存储匹配表，匹配表存储了用户需要切换的频道与用户的语音输入的频道对应关系。
查询匹配模块336，用于根据待匹配的名称与匹配表进行匹配得出需要切换的频道。本实施例中，以识别出的孤立词作为查询关键字，首先在频道节目表中查询所包含表的频道名列中查询符合关键词的记录项。
频道转换控制模块338，用于切换到需要切换的频道。若存在匹配的记录项，查询结果为单个记录项时，控制机顶盒直播电视切换到记录项中频道名属性标识的频道；查询结果为多个记录时，控制电视屏幕显示多个记录项的频道名的属性值，并提示用户通过遥控器选择其中一个频道观看直播电视节目，待用户完成选择后，控制电视切换到用户选择的频道。
更新模块340，用于根据EPG服务器跟新匹配表和/或识别词表。更新模块340还包括：更新定时单元342和更新控制单元344。更新定时单元342，用于记录更新的时间，并在更新时间到达或超时时，触发更新，本实施例中，频道和节目表更新时间可以设置为每天更新，识别词表和匹配表更新时间可以设置为每分钟更新。更新控制单元344，用于在满足更新时间时，控制更新匹配表和/或识别词表。
本发明实施例通过控制器接收用户的语音输入信号，通过频道转换装置根据所述输入的语音输入信号识别出待匹配名称，根据所述待匹配名称与匹配表进行匹配得出需要切换的频道，并切换到所述需要切换的频道，避免了在控制器上进行语音识别操作复杂和成本高的问题，使得用户在操作起来十分方便，并且充分利用频道转换装置的性能，节省了控制的成本。通过频道转换装置识别出待匹配名称，不需要在网络中设置专门的语音识别服务器，防止响应时间过长，避免了由于网络传输数据丢失的问题，并且节约了构建网络的成本。本发明实施例通过截取实际语音段，语音识别的准确率得到提高。通过静音控制单元控制语音输入时，将机顶盒静音，防止电视播放的声音对用户语音的干扰。通过更新模块从EPG服务器自动更新频道和节目表，识别词表和匹配表避免了用户手工造作带来操作不便的弊端。
请结合参看图4，本发明实施例语音识别频道选择方法，包括如下步骤：
步骤402，控制器接收用户输入的激活语音指令。本实施例中，语音激活指令可以是用户输入的按键信号，用户可以通过键盘或触摸屏等输入设备输入的指令信号。
步骤404，控制器向频道转换装置发送启动语音识别控制指令信号。本实施例中，以蓝牙、高速红外协议、紫蜂Zigbee等无线发送方式为例，通过遥控器向机顶盒发送启动语音识别控制指令信号。
步骤406，频道转换装置置为静音状态。
步骤408，频道转换装置向控制器发送启动语音采集控制指令信号。若不采用静音功能时，也可以不包括以上步骤，不再赘述。
步骤410，控制器接收用户的语音输入信号，采集和处理用户输入的语音信号，本实施例中，通过A/D转换器将模拟语音信号转换成数字语音信号，并通过无线方式传送给频道转换装置。
步骤412，频道转换装置检测实际语音段的起点和终点，根据实际语音段的起点和终点用于识别出待匹配的名称。本实施例中，语音激活检测采用稳健的端点检测算法检测出实际语音的起点和终点，以区分出输入的语音信号中实际语音段和非语音段。
步骤414，频道转换装置向控制器发送停止语音采集控制信号。在识别处理完毕后，控制器可以停止采集用户的语音输入信号。本实施例中，发送方式也可以采用蓝牙、高速红外协议和Zigbee等无线方式传送信号。
步骤416，控制器根据频道转换装置的停止语音采集控制信号的控制停止采集和处理语音信号。
步骤418，将起点和终点之间的实际语音段的信号传送给语音特征提取单元。步骤418和步骤414可以没有先后关系，也可以先执行步骤418后执行步骤416，不再赘述。
步骤420，语音特征提取单元根据输入的语音信号提取语音特征，将语音信号进行特征提取，本实施例中，若之前有获取实际语音段落检测的步骤，就只需提取实际语音段。语音特征类型可以采用MFCC特征，PLP特征或LPCC特征，为了提高抗噪效果，可以在语音特征提取过程中运用倒谱均值减的处理。考虑到MFCC特征利用了人耳的声学感知特性而对噪音具有较好的稳健性，优选MFCC特征作为语音特征。语音信号作为短时平稳信号，语音帧之间具有帧间相关性，为此可以对MFCC特征提取一阶差分或一阶及二阶差分来提高语音识别的准确率。
步骤422，根据声学模型和识别词表计算出输入的语音特征数据相对于词条的声学距离。本实施例中，语音识别根据声学模型数据和孤立词表数据得到每个孤立词的最短累积声学距离，然后取最短声学距离最小的孤立词作为该语音首选识别结果。语音识别采用的声学模型包括连续HMM模型和离散HMM模型。此外，语音识别还可以给出多个候选的识别结果让用户选择，排序的依据为最短累积声学距离。本实施例中，采用包含针对HMM的双语种混合建模的声学模型的模型参数。双语种混合声学模型的参数与说话人无关，即为针对非特定人的模型。模型参数需要事先根据标注好的预料数据经过训练器进行训练，训练得到的参数就可以固化到声学模型参数存储部用于孤立词的语音识别，声学模型参数包括HMM的状态参数和状态输出观测特征矢量的概率分布函数。本步骤之前，还可以包含根据用户输入的语言选择信号，选择一个与该语言选择信号对应的声学模型的步骤。
步骤424，判断语音特征数据相对于每个词条声学距离是否小于阈值，若声学距离不小于阈值，执行步骤426；若声学距离小于阈值，执行步骤428。
步骤426，若语音特征数据相对于词条的声学距离大于或等于阈值，识别结果为非语音，提示用户重新输入。该提示可以是消息提示、视频显示提示或声音提示，本实施例中，采用在屏幕上显示提示文字的方式提示用户。执行完步骤426后，结束本识别过程。
步骤428，若语音特征数据相对于词条的声学距离小于阈值，根据识别词表和匹配表计算出当前语音对应的频道名称。本实施例中，根据声学模型数据和孤立词表数据得到每个孤立词的最短累积声学距离，然后取最短声学距离最小的孤立词作为该语音首选识别结果。语音识别采用的声学模型包括连续HMM模型和离散HMM模型。此外，还可以给出多个候选的识别结果让用户选择，排序的依据为最短累积声学距离。
步骤430，根据识别出来的频道名称切换到需要切换的频道。若存在匹配的记录项，查询结果为单个记录项时，控制机顶盒直播电视切换到记录项中频道名属性标识的频道；查询结果为多个记录时，控制电视屏幕显示多个记录项的频道名的属性值，并提示用户通过遥控器选择其中一个频道观看直播电视节目，待用户完成选择后，控制电视切换到用户选择的频道。
请结合参看图5，本发明实施例频道和节目表更新方法包括如下步骤：
步骤502，检查频道和节目表是否满足更新设置条件，更新设置条件可以根据用户的需求设置，识别词表和匹配表的更新可以设置为一天。若满足更新设置条件执行步骤504，否则返回步骤502。
步骤504，频道转换装置从EPG服务器下载最新的频道和节目表数据，更新频道和节目表。
该更新的目标可以是EPG服务器，也可以是本地的网络或光盘等。
请结合参看图6，本发明实施例识别词表和匹配表更新方法包括如下步骤：
步骤602，检查识别词表和匹配表是否满足更新设置条件，更新设置条件可以根据用户的需求设置，识别词表和匹配表的更新可以设置为一分钟。若满足更新设置条件执行步骤604，否则返回步骤602。
步骤604，根据频道和节目表更新本地的识别词表和匹配表。
本领域普通技术人员可以理解，上述方法中的全部或部分步骤可以通过程序指令相关的硬件完成，该程序可以存储在计算机可读存储介质中，该存储介质如，RAM、ROM或光盘等。
本发明实施例通过控制器接收用户的语音输入信号，通过频道转换装置根据所述输入的语音输入信号识别出待匹配名称，根据所述待匹配名称与匹配表进行匹配得出需要切换的频道，并切换到所述需要切换的频道，避免了在控制器上进行语音识别操作复杂和成本高的问题，使得用户在操作起来十分方便，并且充分利用频道转换装置的性能，节省了控制的成本。通过频道转换装置识别出待匹配名称，不需要在网络中设置专门的语音识别服务器，防止响应时间过长，避免了由于网络传输数据丢失的问题，并且节约了构建网络的成本。本发明实施例通过截取实际语音段，语音识别的准确率得到提高，并且去除了噪音的干扰。通过静音控制单元控制语音输入时，将机顶盒静音，防止电视播放的声音对用户语音的干扰。通过更新模块从EPG服务器自动更新频道和节目表，识别词表和匹配表避免了用户手工造作带来操作不便的弊端。
综上所述，以上仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。