能够修改在电话呼叫中 传送的语音的通信终端 【技术领域】
本发明涉及一种能够修改在电话呼叫中传送的语音的通信终端,更具体地说适合于移动电话系统。
背景技术
虽然语音传输仍然是移动电话技术的核心,不过事实是制造商试图通过向消费者提供新的诱人并且有趣的服务,区分他们的产品。游戏、和语音识别相关的服务和铃声的多样性是这些新服务的一些例子。
这些新服务通常意味着与附加软件或硬件相关的电话机的附加成本。
本发明的目的是提供一种通信终端,它能够提供修改终端的用户在电话呼叫中传送的语音的诱人且有趣的服务,所述服务的实现方式简单并且经济。
【发明内容】
为此,本发明提出一种通信终端,包括由终端的用户输入模拟语音信号的装置,把模拟语音信号转换成数字信号的装置,对语音信号应用源编码并包括从语音信号抽取重构参数的装置地语音编码器,和修改重构参数从而修改与信号相联系的传送语音的装置。
本发明通过利用电话机中已有的用于语音编码的语音编码器,简单并且经济地实现修改移动电话机传送的语音的服务。重构参数代表要传送的语音,修改重构参数直接影响传送的语音的宏亮度。
修改重构参数的装置最好包括修改代表语音的基本频率的参数的装置。
在一个实施例中,语音信号的源编码是RPE-LTP编码(规则脉冲激励长期预测编码)。
修改重构参数的装置最好包括修改语音编码器的短期滤波器参数的装置。
短期滤波器参数是,例如在RPE-LTP编码内确定的称为对数域比率(LAR)系数的反射系数。
在一种变型中,修改重构参数的装置包括修改语音编码器的长期滤波器参数的装置。
一个长期滤波器参数是,例如与利用RPE-LTP编码的特定音调相关的基本频率。
修改重构参数的装置最好包括修改与编码器激励幅度相关的参数的装置。
与激励幅度相关的参数可以是,例如定义在RPE-LTP编码内确定的脉冲激发信号的参数。
在一个实施例中,修改重构参数的装置包括根据代表由其频率和相应的持续时间定义的一组律音的编码数据修改参数的装置。
终端最好包括选择要传送的声音的修改类型的装置。
终端最好包括手动配置语音信号的重构参数的修改的装置。
在一个实施例中,终端包括以测试模式执行修改的装置。
终端最好是移动电话机。
根据本发明的一个实施例的下述说明,本发明的其它特征和优点将是显而易见的,所述一个实施例是作为说明性和非限制性例子给出的。
【附图说明】
图1表示根据本发明的通信终端。
图2表示在根据本发明的通信终端中使用的,采用符合GSM标准06.10的RPE-LTP编码的语音编码和修改装置。
【具体实施方式】
附图中相同的部件由相同的附图标记表示。
图1表示根据本发明的通信终端8,例如移动电话机。
终端8包括麦克风9,模-数转换器10,语音编码器11,数据格式化器12,修改语音重构参数的装置13,选择要传送语音的修改类型的装置14,手动配置语音信号重构参数的修改的装置15,和以测试模式执行修改的装置16。
下面参考图2说明语音编码器11,数据格式化器12和修改语音重构参数的装置13。
图2表示执行符合GSM标准06.10的RPE-LTP编码的语音编码器11,数据流格式化器12和修改语音重构参数的装置13。用可编程处理器(未示出)执行的软件实现语音编码器11,格式化器12和装置13。
语音编码器11包括确定LAR反射系数的装置2,确定语音的基本频率的装置3,和根据采样信号S确定脉冲激发信号的装置4。
RPE-LTP编码把语音信号模拟为其参数随着时间而变化并且由脉冲信号激发的线性滤波器。于是显然这种编码的目的是确定脉冲激发信号、定义线性滤波器的参数、以及要传送的语音的基本频率。这种语音编码在300Hz-3400Hz的频带中在20ms帧内工作。线性滤波器分成两部分:第一部分考虑语音信号的短期相关性,第二部分考虑语音信号的长期相关性。下面把这两部分称为短期滤波器和长期滤波器。
信号S构成以8kHz采样的20ms语音帧。
装置2确定短期滤波器的LAR反射系数。为此,对滤波信号应用Durbin算法,以便从其获得线性预测。Durbin算法产生称为LAR系数并且以对数域比率(LAR)对数刻度表示的从-1到1的10个反射系数。
确定语音的基本频率的装置3使用5ms帧内与长期滤波器相关的预测方法,并再现与从56Hz到444Hz的音调P和扬声器的特性相关的基本频率,以及和基本频率相关的增益。
装置4确定脉冲激发信号I。
装置2、3和4供给的用于20ms帧的所有数据由产生编码语音信号C的数据流格式化器12格式化。
当确定了上述参数时,通过修改参数LAR、P和I,可对语音产生不同的效果。修改装置13可修改这些参数。
从而,修改装置13可以只修改与基本频率相关的音调的数值,以便把男声变成女声。为此,各帧的音调值P被修改成数值Min(P+Peffect,Max(P)),这里Peffect是预定值,例如90Hz,Max(P)是标准系统接受的最大音调值。男声具有约为120Hz的音调值,而女声具有约为210Hz的音调值。
修改装置13可按照类似的方式把女声变成男声。为此,把各帧的音调值P修改成数值Max(P-Peffect,Min(P)),这里Peffect是90Hz的预定值,Min(P)是标准系统接受的最小音调值。
如果装置13修改音调和增益,还可获得耳语效果。为此,修改装置13增大音调,并降低增益,从而通过降低声音和弦的振动效果,显著改变长期滤波器的输出信号。LAR参数保持不变。
如果装置13修改长期滤波器的参数,还可获得机器人语音效果。为此,音调被设置成相对较高的数值。就低语效果而论,“韵律”(即表征口语的声音元素的组合)完全被修改,并被转变成具有单一基本频率和未发生变化的LAR参数的单调声音。
语音编码器的参数的另一显著特性在于,由于LAR参数代表与语音的产生相关的发声道和鼻道,可借助“全极”共振滤波器模拟这两个管道,每极代表一个共振频率。由于语音的产生涉及发声道和鼻道,因此修改装置13可修改这些参数,从而元音如同鼻子堵塞的人的元音那样共振。
发声道和鼻道都可用一个全极滤波器模拟,但是这两个滤波器的总和并不具有全极特性。为了以一个全极滤波器的形式模拟这两个管道的组合,必须通过把这两极并排放置,构建零点。这零点代表鼻腔对声腔的影响。
通过把这两个并排电极移动到相互靠近,修改装置13降低鼻腔的影响,从而对声音赋予“鼻伤风”效果。
参数也可根据代表由其频率和其相应持续时间限定的一组律音的编码数据而被修改。从而,修改的声音可遵守以限定一组“频率,持续时间”对的编码格式定义的乐谱,从而具有歌唱效果。乐谱被提供给修改重构参数的装置13。乐谱可使用音乐编码格式,例如MIDI格式、YamahaSMAF格式、多音EMR R5格式、来自红外移动通信(IrMC)的IrDA iMelody格式,或者其它任意矢量描述音乐格式。如果需要,在预处理步骤中自动转录乐谱,从而律音的频率在[56Hz,444Hz]的范围中。
用持续时间和频率说明律音,并且每个律音对应于一个开始日期,一个终止日期和一个频率。修改装置13修改5ms语音帧,从而语音的音调等于同时的对应律音的频率。
一般借助数据流格式化器和修改参数的修改装置13之间的交换,修改参数。然而,也可设想在语音编码器11直接修改参数。
图1中,用户可通过选择修改类型的选择装置14,选择要传送的声音效果的所需类型。用户也可通过装置15手动配置语音信号重构参数的修改。例如,他可通过自己设置Peffect的数值,把修改后的音调的数值改变为Min(P+Peffect,Max(P)),以便把男声变成女声。他也可借助装置16,试验获得的效果,装置16使他能够执行利用他已设置的参数选择的修改。
在移动呼叫中,用户的语音首先被采样,并由装置9数字化。随后由语音编码器11编码,语音编码器11实现参考图1说明的步骤7。
随后格式化器12以借助语音编码器11获得的语音重构参数的形式,格式化编码语音。
在装置14、15和16的控制下,修改装置13随后修改格式化后的语音重构参数,以便获得用户所需的效果。修改后的参数随后被转发给装置12,随后通过通信网络被发送给另一方,或者以测试方式由用户执行。
也可设想由修改装置13直接在装置11直接修改重构参数。
当然,本发明并不局限于上面描述的实施例。
特别地,所述实施例涉及RPE-LTP源编码,但是也可设想其它任意形式的源编码,例如ETS 300 726 GSM EFR(增强全速率)编码和3GPP TS 26.071 AM(自适应多速率)编码。