发明详述
现在参照图1,图中描述了可以用以描述本发明的方法和系统的
发射机和接收机的高级框图。其中,发射机20包括被输入到速率决
定器24和编码器26的语音抽样22。编码器26为一语音编码器,能
够以多种模式进行操作,例如以多种数据速率对语音抽样进行编码。
速率决定器24检查语音抽样22并为编码器26选择一种模式或编码
速率。
在本发明的一个优选实施例中,编码器26可以实现增强的可变
速率编解码器(EVRC),EVRC在电信工业联合会(TIA)/电子工
业联合会(EIA)出版的临时标准(IS)-127中有详细描述。如IS-127
所述,EVRC对语音抽样的编码可以以每分组171比特的全速率,每
分组80比特的1/2速率,每分组16比特的1/8速率进行。
速率决定器24检查语音抽样22以确定需要那种速率在接收机处
充分地再现语音。速率决定器24可以根据语音活动性来选择编码模
式,这可以通过分析语音抽样22所代表的能量来确定。
紧随编码器26之后,处理器28可以在数据被从编码器26输出
并传递到卷积编码器30之前对它们进行进一步的处理。IS-95CDMA
系统中这种进一步对数据进行处理的例子包括加入帧质量指示符,加
入编码器尾部比特等等。
卷积编码器30对由处理器28输出的数据进行卷积编码。可以如
IS-95通信系统中那样,利用速率为1/2并且具有约束长度为9的卷积
编码器来实现卷积编码器30。
卷积编码器30之后,码元重复器32重复卷积编码器30所输出
的码元若干次,以使由码元重复器32所输出的数据速率保持在最小
的每秒9600比特以上。因此,当编码器26以1/8帧速率模式运行时,
码元重复器32的输出重复了输入码元8次。
码元重复器32之后,在数据达到发射机36之前,发送处理器34
可以对数据进行进一步的处理。这种进一步的处理可以包括块交织和
直接序列扩展,例如IS-95通信系统中执行的交织和扩展功能。
发射机36把来自发送处理器34的数据进行上变频,调制,滤波
和放大以便把它们发送到接收机。在无线通信系统中,发射机36利
用天线38输出一个用于无线传输的射频信号。
接收机50被设计为接收和解调发射机20所发射的信号。如图所
示,接收机50包括天线52,用以接收通过传输介质54的信号。在无
线通信系统中,传输介质54为空中接口,它受到天线52所接收的信
号中出现的位错误的影响。
天线52与接收机56相连,它负责把接收到的信号解调并下变频
以生成数字基带信号。
接收机56的输出与处理器58的输入相连,处理器58可以执行
数字信号处理如码元解扩展,软越区切换组合,解交织和解扰频。
在处理器58之后,接收机需要确定语音是以那种速率在发射机
20中进行编码的。在很多接收机中,这是通过对编码的语音以编码器
26可能使用的几个速率进行解码来实现的。如数据接收机50的例子
所示,1/8速率解码器60,1/2速率解码器62和全速率解码器64都对
处理器58所输出的数据进行解码,并且把解码后的数据提供给速率
决定器66。速率决定器66对每个输出进行评价,然后选择可以传递
给语音解码器68的数据。速率决定器66还把一个控制信号传递给语
音解码器68以便语音解码器68解释数据并以正确的解码模式进行操
作。
语音解码器68把适当的信号发送给扬声器70,扬声器70把信
号转换为声音。
如上所述,如果速率决定器66错误地决定了语音解码器68解码
所接收语音数据的特定分组所应选择的速率,扬声器70所发出的声
音就可能出现问题。例如,如果速率决定器66确定编码器26是以全
速率对语音分组进行编码的,而事实上编码器26是以1/8速率对语音
分组进行编码,那么语音解码器68就会产生令人讨厌的声音信号,
也就是上面所说的声频非自然信号,这对于数据接收机50的用户来
说是特别令人讨厌的。
速率决定器66可能会错误地确定编码数据速率,这是因为1/8
速率帧的特性与全速率帧的特性看起来非常相似,特别是在传输介质
54中引入了一些错误后更是如此。例如,速率决定器66可能会根据
解码器60-64中码元错误率以及循环冗余校验法(CRC)来断定语音
分组的速率。
现场观测显示,在语音抽样22代表无声时的帧的过程中,编码
器26集中于处理十六进制0740H代表的16位码字。利用发送处理器
34中功率控制穿孔的增加以及传输介质54中引入的几个位错误,嵌
入的12位CRC可能通过,速率决定器66中可能测量到很低的码元
错误率(SER)。CRC通过以及很低的SER的组合将会造成1/8速率
的发射帧被断定并解释为全速率帧。当语音解码器68按指令把1/8速
率帧按全速率帧处理时,语音解码器68可能会产生具有不可接受的
巨大音量的40毫秒2千赫的声频信号。
为了减少解码错误的影响,应防止编码器26在特定的编码模式
下操作时输出一组被排斥的码字。
现在转到图2,图2为一高级逻辑流程图,描述了根据本发明的
方法和系统对语音抽样进行编码或声音编码所执行的操作。如图所
示,程序从框200开始执行,然后到框202,此处语音抽样被输入到
声音编码功能中,声音编码功能可以包括一个声码器和一个速率决定
器,就象图1中的编码器26和速率决定器24。在一个优选实施例中,
把以每秒8000个抽样采集的一个20毫秒的语音抽样帧输入到声码器
中。
下一步,如框204所示,程序检测并确定声码器的模式。该步骤
通过检查图1所示的速率决定器24的输出来执行。在不同的声码器
模式中,声码器对语音抽样进行编码的方式是不同的,不同的编码方
式对每个输入的语音抽样帧而言会产生或多或少数量的位。
在检测了声码器的模式后,如框206所示,程序确定使用当前操
作模式的声码器输出的码字是否为被排斥的码字。被排斥的码字是那
些与接收机中解码错误相关的码字。例如,速率判断错误会导致解码
错误,进而在无线通信系统接收机中产生声频非自然信号。在一个优
选实施例中,这些被排斥的码字将产生易于或在统计上可能会以错误
的解码速率进行解码的数据帧,这是因为它具有很低的码元错误率和
一个通过的CRC。换句话说,这些被排斥的码字所形成的语音帧与以
另一种数据速率进行正确编码的语音帧非常接近。其他的码字由于正
确编码的帧与以不同方式解码的帧之间的小的差异生成将导致其他解
码错误的帧而被排斥。被排斥的码字可以凭经验识别,以数学方法预
测,或通过模拟方法发现。被排斥的码字还可以通过某些被设置为一
定值的位,1或0字符串的存在,和1对0的一个特定比率来表征。
如果码字对于当前的操作模式而言不是要排斥的码字,声码器功
能便会如框208所示输出声码器码字。在输出了码字之后,程序会重
复回到框202提取新的语音抽样。
但是,如果以当前操作模式运行的声码器所输出的码字被排斥,
程序会如框210所示使被排斥的码字中所选择的位具有预定的值以产
生一个不被排斥的码字。
在使所选择的位具有预定值这一步中,调整被排斥的码字使其产
生一个不被排斥的码字,而此不被排斥的码字会在接收机中形成相类
似的语音输出。选择不被排斥的码字以使其对解码错误(包括速率错
误决定和其他重要的声频非自然信号的源)具有更强的恢复性。
在产生了不被排斥的码字之后,如框212所示,程序以不被排斥
的码字代替被排斥的码字。这种代替可以是一个码字与另一个码字之
间的简单替换,或者也可以涉及把不被排斥的码字反馈回语音声码器
以便执行适当的滤波器更新。
在用不被排斥的码字代替了被排斥的码字之后,如框208所示,
声码器输出不被排斥码字。在框208之后,程序重复回到框202。
注意框210和212可以作为对防止产生被排斥的码字的声码器算
法的改进来执行。因此,识别被排斥的码字并使得被排斥码字中所选
择的位具有预定值从而生成不被排斥的码字的过程可以在新的声码器
设计或算法中实现。
现在参照图3,图3示意性地描述了使得被排斥的码字中所选择
的位具有预定值从而生成不被排斥码字的系统和操作。如图所示,把
被排斥的码字80中的位和掩码字82中的位输入到布尔OR函数84,
该函数输出一个不被排斥的码字86。注意已使得所选择的位88具有
预定值1。
注意到通过确保所选择的位88,也就是1/8速率帧的第一位等于
1,在解码器错误地把1/8速率帧解码为全速率帧的情况下,很可能IS-95
全速率帧中的混合模式(MM)位将被解码为1。换句话说,通过把
不被排斥的码字中所选择的位88设置为1,以全速率错误地对帧进行
解码的接收机会把混合模式位解释等于1,这就告诉解码器把帧的一
部分作为次速率语音信息处理,把帧的另一个部分作为附加信令或次
要信息处理。这会造成假次速率帧的解码错误,当传输给语音解码器
时,它所产生的声频非自然信号的讨厌程度比如果不用混合模式对帧
进行解释所产生的声频非自然信号的讨厌程度要小得多。另外,这种
混合模式帧很可能会由于16位CRC失败或符合此标准的其他参数的
失败而被舍弃。上述的这些其他参数可以包括消息长度参数,消息类
型参数和消息开始(SOM)指示符位。当帧被舍弃时,它将不会产生
解码错误。
通过迫使以特定模式操作的声码器所产生的被排斥码字中的一个
位等于预定值,可能会在接收机中造成一个不同的解码错误,而这种
不同的解码错误不会产生声频非自然信号,或产生很不容易为人所注
意的声频非自然信号。在其他情况中,这种迫使一个位等于一预定值
的方法可以减少解码错误率。其他的生成不被排斥码字的实施例可以
使用更智能的方法来设置所选择的位。
例如,如图4所示,查找表94可用于识别输入的被排斥码字96
并以输出的不被排斥码字98来代替,码字98有一个或多个位不同于
输入的被排斥码字。对于每个输入的被排斥码字96而言,输出的不
被排斥码字98的选择要使得所输出的码字消除解码错误或减少解码
错误的反面影响。
参照图5,图5描述了另一个使得被排斥的码字中所选择的位具
有预定值从而产生不被排斥码字的方法和装置的实施例。如图所示,
把语音抽样输入到语音编码器112中的语音分析器110中。语音分析
器110生成对描述语音并且对在语音解码器中再现语音有用的参数。
这些语音参数的例子可以包括线频谱对,线频谱对可以提供关于语音
抽样的声频内容的频谱信息。另一个参数,例如帧能量向量,可以提
供激发电平信息。这些类型的参数在IS-127规范中有更详细的描述。
为了减少代表这些未量化语音参数所需要的位的数目,把这些由
语音分析器110输出的语音参数输入到量化器114中。在已知的量化
器中,把输入的语音参数作为向量与量化器中的一组搜索向量进行比
较以找出最接近的匹配。这种匹配过程已知为代码本搜索,它通常使
用最小均方差算法,这一点在本技术领域内是众所周知的。一旦量化
器识别出最接近的搜索向量,便输出一个相对应的位数目更少一些的
代码本值。
根据本发明,量化器114包括搜索向量116和相对应的代码本值
118。另外,搜索字段120可用于保持一个布尔变量,它允许或禁止
搜索所选择的搜索向量,因此也允许或禁止输出所选择的代码本值。
通过控制搜索哪些搜索向量,程序可以控制产生哪些代码本值。这意
味着根据本发明的量化器能够输出在一组不被排斥的码字中的下一个
最好的代码本值。这下一个最好的码字能产生类似的语音,这样便减
少或消除了由于解码错误造成的声频非自然信号。
尽管本发明是在无线通信系统中使用的IS-127EVRC声码器的环
境中描述的,但本发明也可应用于其他用于把数据从一个发射机发射
到一个接收机的编码器中。例如,本发明并不限于具有能够产生全、
半和1/8速率帧模式的声码器。作为另一种选择,IS-96A标准使用1/4
速率声音编码模式。在其他声频应用中,声频编解码器可用于代表更
大范围的除了语音之外的声频源。
因为本发明可以减少解码错误的数量,并不仅仅减少错误的影
响,所以还可以把它应用于非语音/声频方面。例如,本发明可应用于
如IS-95和IS-2000规范中所述的可变速率线路和分组数据服务的传
输。
上述对本发明的一个优选实施例的说明,目的是描述和说明性
的,而并不是想使其非常详尽以把发明限制于所披露的精确形式中。
按照上述讲解,任何修改和变更都是可能的。选择和描述本实施例只
是用于最好地描述本发明的原理及其实际应用,以使本技术领域内的
普通技术人员能够把本发明应用于各种实施例,并作出适合特定用途
的修改。所有这些修改和变更都要在所附权利要求书所确定的本发明
的范围内,这样在根据此范围对其进行解释时,它们才会被公正、合
法和正当地授权。