本发明涉及汉语普通话语音通讯。 本发明是一种借助于编码的方法,压缩汉语语音信源信息量的编码通讯方案,简称“音节码通讯”。
它的主要特征是对汉语普通话,包括四个声调在内的1239个单音节集进行编码。从而建立一音一码的对应关系。考虑到现行的通信规则,并利于采用微电脑处理起见,在异步通讯中我们可以借于2个ascii码组成一个音节码,定义为音节交换码。也就是用2*7bit表示一个音节码。
由于具体的编码方法决定,我们也可以在传输过程中去掉ascii码的第七位,即用2*6bit的所谓传输码,传输一个音节码。
作为一个例子,我们提出一个可行的“汉语普通话音节编码草案”。
-汉语普通话音节编码草案-
该草案以汉语拚音方案为基础,利用规则改造汉语拚音音节表,通过以下的变换及规定得到每个音节对应的交换码。
(1)将zh,ch,sh换成v,i,u;
将u换成发v;
将以a,o,e开头的零声母音节双写第一个字母a,o,e;
将er改成ra;
(2)经(1)变换后,取出每个音节的第一个字母做声码;
(3)将余下的韵母部分利用下表的对应关系再次进行变换,并做为韵码。
(a)=>a,(ang)=>b,(ve,uei)=>c,(ua,ia)=>d,(e)=>e,
((eng)=>f,(ian)=>g,(iao)=>h,(i)=>i,(ing)=>j,
(in)=>k,(ou)=>l,(iang,uang)=>m,(iong,uo)=>n,(o,uen)=>o,
(ong)=>p,(ai)=>q,(en)=>r,(an)=>s,(uan)=>t,(v,van)=>v,
(u,un)=>u,(ei)=>w,(ie)=>x,(iong)=>y,(ao)=>z
(4)通过(1)(2)(3)变换后,取声码加韵码,构成一个用二个ascii码表示的音节交换码。
(5)考虑到四个声调的变化,
用大写声码加大写韵码表示阴平调;
用小写声码加大写韵码表示阳平调;
用小写声码加小写韵码表示上声调;
用大写声码加小写韵码表示去声调;
如:BA->(巴);bA->/(拔);ba->v(把);Ba->\(爸)
(6)上述码使用了大小写拉丁字母,共可组成2704个音节交换码。除了表示1239个基本音节外,尚可以自定义若干音节或常用词组。
(7)采用40H 7FH区,除去大小写拉丁字母以外的ascii码,定义为其它功能符,间隔符,轻声符,连读符等 如定义“[”和“]”为转义开绐符和转义结束符……
(8)尽量采用40H 7FH区的ascii码,这样才可能使用6bit的传输码。在机器内部处理时可通过给传输码补加第七位为1的方法再变成交换码。
(9)当实际需要使用00H 3FH区的ascii码时,建议通过使用转义符,设交换码第七位设为0,进而使40H 7FH区的ascii码转义为对应的00H 3FH区的ascii码。
(10)本建议基本上符合编码基本原则。并具有通用性.规则性.可读性.可扩充性及小冗余度。
传输过程中码的抗干扰,及差错控制可利用各种传统方法进行处理。
从技术上看,可以利用电脑技术(包括语言识别技术)实施从语言到音节码地变换。可以采用传统的方法,在有线或无线信道上传输音节码。
汉语语音单音节编码通讯系统包括图1所示的发送子系统1、信道2、接收子系统3。
图1上的发送子系统1由图2所示的键盘1、话筒2、语音识别器3、编码文件4、计算机编码与打包装置5、发送器6组成。
由键盘1、话筒2完成语言的输入。由话筒2输入的语音信号要经过语音识别器3识别出语音单音节。由键盘输入的单音节和由语音识别器识别的单音节送计算机4进行语音音节编码、打包、然后分组、分时送发送器6、发送器6将编码后的信息送到信道7。
发送器6可以是无线电发射台,也可以是有线的调制器。
送往计算机4的信息也可以是磁盘上的编码文件4。
图1所示信道2可以是有线的,也可以是无线的。
图1上的接收子系统如图3所示,包括接收器2、计算机3、语音合成器4、听筒5、电话线路6。
信道1传来的编码信号送往接收器2。
接收器2又可以是无线电接收机,也可以是解调器。
接收器接收的信号送计算机3完成解包,并分时、分组送语音合成器4变成语音信号。语音信号由听筒5或电话线送电话机恢复成标准的话音。
传统的通讯技术,主要着眼于有效的利用信道和拓宽信道信息容量;而本方案着眼于压缩汉语语音信源的信息量。
另外传统的语音信号的编码技术(如:PGM、ADM、LPV等)也是依据信号的物理特征进行波形编码或参数编码;而本方案的编码是一种逻辑编码,从而可以将信源信息量压缩到最低限度。
常用的电话传输模拟信号,终端简单,一般要独占一个标准话音信道(4khz频带宽度);而数字话音通讯,如用PCM波形编码则需64k pbs的信道容量。采用共振峰声码器fv或线性予测声码器LPV进行参数编码,也约需2400pbs的信道容量。这样基本上一个4khz的标准信道只能供一对用户使用。
本发明基于汉语为间断发音的语言体系,一字一音节,音节之间有明显的间断。计音节集为1239个。这很有利于编码和自动语言识别,即通过编码处理后,表示一个音节只要11bit或2x6bit,再考虑到其它因素,一般传输一个音节也只需2x8bit码位。按重构一个音节发声和间断时间和为0.33秒计算,则传一个用户语言对应的音节码只需48PBS的信道容量。
以在普通电话线路上以2400bit/秒传输数字信号计,再考虑其它因素,则相当于在一个电话信道上可同时提供48个以上的用户使用。