水下仿生动物语音控制系统 【技术领域】
本发明涉及水下仿生动物语音控制系统。
背景技术
语音是人类进行信息交换的一种最自然、最便捷的方式。近年来随着计算机、通讯技术的发展,语音识别技术的重要性进一步得到体现。与此同时,在机器人研究领域,水下仿生机器动物成为研究的热点。例如,仿生机器鱼是以鱼类为模仿对象,利用现代的机械、电子、控制等方法实现从外形、游动方式以及协作控制能力的仿生。水下仿生动物的研究是以仿生学为基础,以机械电子等为手段,采用先进的机器人技术构建一个“智能水下动物”的模型,能让机器动物如机器鱼、机器海豚等能听懂人的语言也是其功能之一。语音识别用声音来控制计算机完成某些特定的动作,可以取代部分按键来执行命令。用语音命令来控制各种人工系统,能够给使用者带来极大的便捷,这一点在人的双手处于非空闲状态时尤其显得重要。语音识别技术具有广泛的应用前景,在工业上可用于智能机器人的听觉系统,飞机的控制口令或数据输入等;在邮电系统中可用语音控制分拣邮包,自动查号;在军事部门用于军事指挥口令系统;语音识别可以帮助残障人士控制轮椅、声控输入等。此外,语音控制在医疗、商业领域也有诱人的前景。
随着电子信息技术的蓬勃发展,语音识别技术及其应用研究越来越受到人们的重视,语音识别已成为智能控制系统的一种发展趋势。以语音识别和语音合成技术为基础,构建机器人的听觉和语音系统,就可以使机器人能听懂人的语言。利用语音识别的结果作为控制信号,从而可以使机器人完成给定的命令、动作或任务。一般来说,语音识别研究如何采用数字信号处理技术自动提取并决定语音信号中最基本的、最有意义的信息。常用的语音识别算法有:基于模板匹配地动态时间规整法(DTW)、基于统计模型的隐马尔柯夫模型法(HMM)以及基于神经网络的识别等。进入20世纪80年代后,语音识别技术研究的重点由小词汇量、特定人非连续的语音识别逐渐转向大词汇量、非特定人的连续语音识别。在研究思路上,也由传统的基于标准模板匹配的技术思路开始转向基于统计模型、特别是隐马尔柯夫模型(HMM)的技术思路。但在识别词汇量不是很大的应用场合中,基于模板匹配的语音识别技术简单方便、实时性好,而且识别率较高。随着对水生动物推进机理研究的深入和机器人技术的发展,出现了各式各样的水下仿生动物,如机器鱼、机器蛇、机器海豚等,但在现有文献中还没有看到基于语音控制的水下仿生动物。
【发明内容】
本发明的主要目的在于提供一种结合机器人技术和语音识别技术的水下仿生动物语音控制系统。
为达到上述目的,本发明提供一种水下仿生动物语音控制系统,它包括语音信号输入模块、语音识别模块、微控制器模块、遥控发射模块、遥控接收模块及外设装置,所述语音信号输入模块与所述语音识别模块连接,所述微控制器模块分别与所述语音识别模块、遥控发射模块及外设装置连接,所述遥控接收模块安装在水下仿生动物体内,与所述水下仿生动物的控制系统连接。
所述语音识别模块、微控制器模块设置在所述水下仿生动物体内。
所述语音识别模块、微控制器模块设置在所述水下仿生动物体外,与所述语音输入模块及外设装置组成一外置式语音遥控器。
所述语音识别模块为16/32位语音控制芯片,所述微控制器模块为低功耗、高性能的单片机,所述微控制器模块为4位、8位、16位或32位的单片机。
所述微控制器模块具有LCD驱动和红外发光管驱动能力及多种常用接口。
所述微控制器模块连接有外部存储模块。
本发明还包括一与所述语音识别模块连接的音频信号输出模块,所述音频信号输出模块为扬声器,所述语音信号输入模块为话筒,所述外设装置包括键盘和显示器。
由于采用了以上技术方案,使本发明具有识别模块体积小、成本低、识别率高的特点,人机对话的词表(剧本)可根据用户需求编辑、扩充。人性化的语音交互方式,大大增强了水下仿生动物和人之间的交互能力,同时也增强了水下仿生动物的趣味性和观赏性。
本发明将为水下仿生动物语音控制系统设计、集成提供参考,可开发具有市场应用前景的语音“宠物”展示系统,实际应用于水族馆、少年宫的科普展览;同时,也为研究水下仿生动物和人之间的交互(human-machine interaction)提供理论和技术基础。
【附图说明】
图1是本发明的组成框图
图2是本发明外置式语音遥控器的操作过程示意图
图3是本发明的工作流程图
【具体实施方式】
下面根据本发明的较佳实施例,并配合附图对本发明的技术方案作进一步说明。
如图1所示,本发明所提供的水下仿生动物语音控制系统采用模块式结构,其包括语音信号输入模块1、语音识别模块2、微控制器模块3、与微控制器模块相连的存储模块4、遥控发射模块5、安装在水下仿生动物体内的遥控接收模块6以及包括键盘和显示器7等在内的外设装置。语音信号输入模块1将接收到的语音信号输入语音识别模块2中进行处理,再由语音识别模块2将处理结果送入微控制器模块3,进行读写语音模板的训练模式或按照已训练完成的语言模板发出控制指令的运算,并通过遥控发射模块5将指令发射出去,同时通过显示器7将其发出的指令显示出来。遥控接收模块6接收微控制器模块3发出的指令,并通过与遥控接收模块6连接的水下仿生动物体内的控制系统来控制水下仿生动物的行动。
语音信号输入模块1通常为各种有线或无线话筒。为了实现人与水下仿生动物之间人性化的语音交互方式,增强水下仿生动物和人之间的交互能力,本发明还可以设置一音频信号输出模块8,实现人与水下仿生动物之间的对话。音频信号输出模块8通常为扬声器,其与语音识别模块2连接。当语音识别模块2识别出提问的问题后,便将预设的回答语言通过音频信号输出模块8予以播放。
语音控制系统中的语音识别模块2、微控制器模块3和存储模块4可采用内置式和外置式两种方式和水下仿生动物连接。采用内置式连接时,语音控制系统中的语音识别模块2、微控制器模块3和存储模块4作为一个语音信号处理模块直接安装在水下仿生动物体内,通过语音切换键,控制水下仿生动物进入或退出语音控制模式。在外置式连接中,语音控制系统中的语音识别模块2、微控制器模块3和存储模块4可以与遥控器结合,组成一个整体的遥控器,该遥控器兼具按键输入和语音输入两种模式。语音切换键可安装在水下仿生动物的壳体上,也可以安装在语音遥控器上。
在本发明中,语音识别模块2是语音控制系统的核心,其主体为一块语音芯片。语音信号通过话筒和语音输入电路输入到语音芯片中,由语音芯片对语音信号进行处理,将语音命令转化为二进制命令代码,再通过控制线和数据线与微控制器模块3进行数据交换,并将相应的回答语言自动通过扬声器8播放。典型的语音芯片有Infineon SDA 80D51 A-U(英飞凌)、Apollo VP2(威盛)等。一般来说,语音芯片有训练和识别两种工作模式。由于掉电后语音芯片中保存的语音命令模板会丢失,为了避免上电后再重新训练,语音控制系统在训练完每个命令后,都会通过微控制器3将生成的语音模板从语音芯片中读出并写入外部的存储模块4中。重新上电后,微控制器3首先判断存储模块4中是否有训练好的语音命令模板,如果有则将命令模板依次读出并写入语音芯片的RAM存储器。这样,就省去了训练模式而直接进入识别模式。但是语音芯片的RAM容量有限,为了更多地存储训练好的模板数,必须外加存储模块4,以利用存储模块4扩展识别的语音命令数。训练时,微控制器3将生成的语音命令模板读出并写入存储模块4。假设语音芯片的RAM可存储M个语音命令模板。识别时,微控制器首先将存储模板中前M个语音命令模板存入语音芯片的RAM,如需要加入后M个语音命令模板,只需一条控制指令,让微控制器3将后M个语音命令模板从存储模块中读出并写入语音芯片RAM。为了减少语音控制系统的体积和降低微控制器的I/O成本,可选用串行工作的E2PROM集成芯片作为存储模块的核心。
语音识别模块2必须选用识别率高、响应快、体积小、功耗低、具有多种输出接口的语音识别芯片,如选用基于16/32位的DSP技术或16位/32位的嵌入式ARM技术的处理芯片。
微控制器模块3选用低功耗、高性能的4位、8位、16位或32位的高性能单片机,具有体积小、集成度高、可靠性好,控制功能强,扩展性好,容易构建各种规模的应用系统,且具有LCD驱动和红外发光管驱动能力及多种常用接口。常见的有W741E260(华邦)、Samsung S3C2410(三星)等。在组成上,一块微控制器芯片相当于一台计算机。
如图2所示,在外置式语音遥控器工作时,系统初始化后即进入键盘扫描程序,键盘扫描程序有三种功能选择:a、语音训练模式;b、手动操作模式;c、语音控制模式。
按下遥控器上的复用键,便可显示命令字,进入语音训练模式。语音训练模式主要实现语音模板的学习、训练过程。在第一次使用语音识别模块时,必须对模板进行训练。训练好的模板存储之后,便可以作为以后语音操作的指令。按下遥控器上的切换键,即进入手动操作模式。
手动操作模式即普通的按键操作模式,通过键盘扫描,按照液晶显示的提示进行操作,把控制信号发射出去。
语音控制模式即系统进入读取状态,利用训练好的模板来识别输入的语音指令,进而转化为针对特定控制对象的控制指令,用遥控信号发射出去控制水下仿生动物的行动。
在内置式语音控制系统工作过程中,只有语音训练模式和语音控制模式,并且通过语音切换键可以控制仿生机器鱼进入语音控制模式或语音训练模式。
为了配合外置式语音遥控器的使用,还必须添加键盘和显示设备7、遥控发射模块等。键盘和显示器7是根据训练模式的需要而设计的。生成一个正确的语音命令模板应先输入语音命令的序号,然后进行2~4次语音信号的输入。键盘用来输入模板的序号和发出输入语音信号的指令,显示器7用来实时地显示训练状态。遥控发射模块则把经微控制器处理后的语音识别模块的识别结果转变成水下仿生动物的运动控制指令,再通过无线控制的方式发送出去。
在外置式语音遥控器工作时,语音控制系统会自动进入按键和语音双重模式,此时任何按键或有效的语音指令都会使水下仿生动物执行相应的动作。若环境噪声太大,可能会影响到语音识别电路的正常工作,导致误操作,此时可通过操作切换键关闭语音输入功能,仅采用按键模式进行控制。当环境噪声降低之后,再按一次切换键,即可重新启动语音输入功能。语音控制系统的工作状态可通过观察其工作状态指示灯来判断。
在语音控制系统工作时,微控制器和语音识别模块要对语音信号进行处理,通常采用10kHz的采样频率对从话筒输出的语音模拟信号进行数字化采集,然后进行识别算法处理,获取语音命令的特征码,再与已有的模板进行匹配计算,最后输出该语音命令的识别结果。
本发明的工作流程如图3所示,系统加电后,微控制器模块首先初始化系统参数,然后判断外部存储模块是否已有训练好的语音命令模板,随即调入外部存储模块的语音模板到语音芯片的RAM,进入语音识别状态,否则转向语音训练状态。在正常语音识别状态,只要按下训练键,系统立即切换到训练模式。在训练模式中,可以一次训练一个语音命令,也可以一次训练多个语音命令。每完成一个语音命令模板训练过程,微控制器将自动把该语音命令模板存入到外部的存储模块。训练完毕后,按微控制器的返回键,系统可立即切换到识别模式。在识别过程中,如果发现某个命令的识别率不够理想,只需按下训练键即可重新对该语音命令进行训练,新生成的语音命令模板将自动覆盖以前的模板。值得注意的是,当语音控制系统内置于水下仿生动物体内时,为了简化系统设计和方便使用,可将训练好的多个语音命令模板直接写入大容量外部的存储模块。这样,语音控制系统可在系统加电时立即进入识别模式,并且在实验室静音环境下训练好的模板具有较高的识别率。但是这样,可供识别的词表不能随机更改,只有将语音识别模块取出来以后用特殊的RAM烧写软件才能更改。此外,在编辑词表时,可将读音相近、易混淆的控制指令如将“快”、“快点”、“再快点”、“加速”、“快一点”、“游快点”、“快点游”作为一组,并把识别的结果均对应水下仿生动物的“加速”指令。这样,可明显提高语音识别的容错能力和“智能”。
实施例
应用本发明的外置式仿生水下仿生动物语音控制系统,其选用具有DSP和单片机双核的Infineon SDA80D51(英飞凌)语音控制芯片,SST 39VF1682(闪存)为外部存储模块为核心芯片,电路板的尺寸为6×10cm2。当实验者用话筒或耳麦与水下仿生动物(机器鱼)对话时,语音控制系统立即进行识别,识别的结果在通过扬声器回放的同时,转化为对水下仿生动物的控制指令。通过语音控制,水下仿生动物能在水中完成一系列游动动作,如加速、减速,左转、右转、急停等,并能进行生动活泼的对话,所进行的对话见下表。 序号 问 题 语音回答 输出代码 日常对话部分: 1 你好! 您好!欢迎到北京大学系统与控制研究中心! 0 2 Hello! Hello!Welcome to PekingUniversity IntelligentControl Laboratory ! 0 3会讲英语吗?Of course!I am robot fish! 0 4你叫什么?我是仿生鱼,Robot fish。 0 5什么名字?我是仿生鱼,Robot fish。 0 6你会什么我会过孔、避障、顶球……好多东东呢! 0 7你会表演什么?我会过孔、避障、顶球……好多东东呢! 0 8你能表演什么?我会过孔、避障、顶球……好多东东呢! 0 9展示一下好的!马上就show! 0 10演示一下吧好的!马上就show! 0 11表演一下好的!马上就show ! 0 12Show一把好的!马上就show ! 0 13你去哪里在水池里玩 0 14你朝哪游呢在水池里玩 0 15你在干什么在水池里玩 0 16自己玩吧呜呜!你不跟我玩了么? 0 17自己玩去吧呜呜!你不跟我玩了么? 0 18你从哪里来智能控制实验室 0 19谁教你游泳的智能控制实验室 0 20你太棒啦谢谢您的夸奖! 0 21你真棒谢谢您的夸奖! 0 22你好棒啊谢谢您的夸奖! 0 23你真好谢谢您的夸奖! 0 24你吃什么我吃电,很刺激的哦! 0 25再见BYE!记得再来看我哦! 0 26Bye-byeBYE!记得再来看我哦! 0 27拜拜BYE!记得再来看我哦! 0 28听到不懂的问题(如你能吃什么?)回答:Sorry,我听不懂! 0 29控制命令部分: 30游速1好的!游速1。 11 31游速2好的!游速2。 12 32游速3好的!游速3。 13 33游速4好的!游速4。 14 34游速5好的!游速5。 15 35游速6好的!游速6。 16 36游速7好的!游速7。 17 37 38左转1好的!左转1。 20 39左转2好的!左转2。 21 40左转3好的!左转3。 22 41左转4好的!左转4。 23 42 43右转1好的!右转1。 25 44右转2好的!右转2。 26 45右转3好的!右转3。 27 46右转4好的!右转4。 28 47 48快没问题!再快点! 30 49再快点没问题!再快点! 30 50加速没问题!再快点! 30 51快点没问题!再快点! 30 52快一点没问题!再快点! 30 53游快点没问题!再快点! 30 54快点游没问题!再快点! 30 55 56慢OK!慢点游! 40 57慢点OK!慢点游! 40 58再慢点OK!慢点游! 40 59慢一点OK!慢点游! 40 60减速OK!慢点游! 40 61慢点游OK!慢点游! 40 62游慢点OK!慢点游! 40 63 64前游明白!Go ! 50 65Forward明白!Go ! 50 66Go forward明白!Go ! 50 67Go ahead明白!Go! 50 68Go straight明白!Go ! 50 69keep going明白!Go ! 50 70游吧明白!Go ! 50 71前进明白!Go ! 50 72向前明白!Go! 50 73往前游明白!Go! 50 74向前游明白!Go! 50 75 76左Yes!往左! 60 77LeftYes!往左! 60 78Turn leftYes!往左! 60 79左转Yes!往左! 60 80左转弯Yes!往左! 60 81向左转Yes!往左! 60 82往左转Yes!往左! 60 83左拐Yes!往左! 60 84向左Yes!往左! 60 85 86右yes!往右! 70 87Rightyes!往右! 70 88右转yes!往右! 70 89右转弯yes!往右! 70 90向右转yes!往右! 70 91往右转yes!往右! 70 92右拐yes!往右! 70 93向右yes!往右! 70 94 95停好的!终于可以歇一会了! ff 96Stop好的!终于可以歇一会了! ff 97停止好的!终于可以歇一会了! ff 98停住好的!终于可以歇一会了! ff 99停下好的!终于可以歇一会了! ff 100别游了好的!终于可以歇一会了! ff 101别动好的!终于可以歇一会了! ff 102歇会好的!终于可以歇一会了! ff 103休息会好的!终于可以歇一会了! ff 104换一条我终于可以歇一会了! ff 105 106要撞上了好险! 81 107原地转圈好的!开始转圈了! 82 108掉头好的!掉头! 83
综上所述,在本发明提供的水下仿生动物语音控制系统中,实验者(非特定人,与性别无关)的语音指令实时地转化为水下仿生动物的运动控制命令,从而可以控制水下仿生动物在水中的行为,进而提供了一种新型的控制方式。本发明所使用的语音识别模块体积小、成本低、识别率高,人机对话的词表(剧本)可根据用户需求编辑、扩充。
本发明所提供的水下仿生动物语音控制系统,可安装在仿生机器鱼、机器海豚等各种水下仿生动物上,可实现人与水下仿生动物之间人性化的语音交互方式,大大增强了水下仿生动物和人之间的交互能力,同时也增强了水下仿生动物的趣味性和观赏性。
应用本发明,可开发具有市场应用前景的语音水下仿生动物展示系统,应用于水族馆、少年宫的科普展览,同时,也为研究智能水下仿生动物和人之间的交互提供理论和技术基础。
本发明并不受以上实施例的限制,本技术领域的普通技术人员不用创造性思考就可以得出的,都在本发明的保护范围内。