预测图像的产生装置并用其对图像 编码、发送和解码的装置 本发明涉及图像编码,特别涉及,应用掩码(mask)产生预测图像的装置,以及应用此装置对二进制图像进行编码,发送及其解码的装置。
近来,文件包括字符或表格及其文本,并且,随着彩色显示更加快速发展,在计算中应用各种彩色照片或图片。由于打印机仅识别二进制图像,应用各种生成二进制图像的方法例如并列调色或误差扩散将要打印的图像转化成二进制图像。
同时,在传真机中,应用上述产生二进制图像方法形成所扫描文件的二进制图像,并且对二进制图像进行编码和发送。国际电信联合电信标准化(ITU-T),确定了经常被传真机传送的文件为文本文件,适合于这些文件的编码方法。并且,由一个文本的文件确定各种编码表。这样,通过对包括图片或照片的文件进行二进制化获得的图像不能满足上述编码方法的要求。
即,在传真机中,处理含有照片或图片的文件比仅含有文本的文件编码效率低,普通的传真图像编码标准应用改进的霍夫曼编码方法。通过霍夫曼编码方法,在表1中由二进制数1表示黑色象素序列或由0表示的白色象素用压缩图像的编码表(表1)符号画出。
例如,假设编码之前二进制图像的位流是图1A,参照表1地霍夫曼表进行二进制图像编码的过程如下。首先,白色象素序列(000000)用0001画出。其次,黑色象素序列(1111)用010画出。再次,白色象素序列(000)用001表示。参照表1图1A的二进制图像被编码成为图1B所示的二进制图像。
表1黑色象素 符号 白色象素 符号 1 1 1 1 2 01 2 01 3 001 3 001 4 010 4 010 5 011 5 011 6 0001 6 0001
参照图1B,图1A未被编码的二进制图像具有24个象素需要24位,而编码的二进制图像需要17位。
通过上述的霍夫曼编码方法,当二进制图像的白色或黑色象素的序列越长,编码变的越好。文本文件的行之间及其页的顶部和底部及两边有很大的空间,这样白色象素序列是长的,满足上述条件。然而,照片或图片的二进制图像没有长的象素序列。
这样,通过霍夫曼编码方法,降低了图片的二进制图像编码效率,结果传送含有图片的文本比仅传送文本花较多时间。
为了解决上述问题,本发明的一个目的是提供一种利用掩码的预测图像产生装置,其中根据窗口的象素值和发送部分的窗口中掩码的元素值,预测图像数据表示出预测中的成功或失败。
本发明的另一个目的是提供一种利用该预测图像产生装置对一个二进制图像进行编码,发送和解码的装置。
照此,为了达到第一个目的,提供了一种利用掩码的预测图像产生装置。该装置包括最大值搜索单元,最小值搜索单元,平均值计算单元,二进制化单元和比较单元。
最大值搜索单元搜索一个掩码元素值的最大值,这个掩码相应于具有一个二进制电平的象素,该象素是在预定大小的窗口中位于具有当前被预测二进制电平的象素之前多个象素之一。最小值搜索单元搜索一个掩码的元素值的最小值,这个掩码相应于具有另一个二进制电平的象素,该象素是在预定大小的窗口中位于具有当前被预测二进制电平的象素之前多个象素之一。平均值计算单元计算分别从最大值搜索单元和最小值搜索单元搜索的最大值和最小值的平均值。二进制化单元对平均计算单元里的平均值进行二进制化。比较单元比较二进制化的平均值与当前象素的二进制电平并且输出表示成功或失败的预测图像数据。
为了达到第二个目的,提供了利用预测图像生成装置对一个二进制图像进行编码,发送和解码的装置。该装置包括第一预测单元,编码单元,解码单元和第二预测单元。根据窗口的象素值和传输图像的窗口中掩码的元素值第一预测单元输出表示成功或失败预测的预测图像数据。编码单元用于按预定编码方法对第一预测单元输出的预测图像进行编码并且传送被编码的数据。解码单元将来自编码单元的发送值解码为编码前的预测图像数据。第二预测单元从窗口的象素值和接收图像的窗口中掩码的元素值中预测当前像素的二进制电平。
参照附图通过详尽地描述一个优选实施例,上述目的和本发明的优点将更明显:
图1A示出了二进制信号编码前的位流;
图1B示出了参照表1示于图1A的位流进行编码之后的位流;
图2示出了利用多个4×4掩码对具有灰度级平均值80的图像进行二进制化的结果;
图3是依据本发明利用掩码的预测图像产生装置的方框图;
图4是利用图3的装置对二进制图像进行编码,发送,解码的装置的方框图;
图5是图4的第二预测单元的详细方框图;
图6示出了利用一维掩码产生预测图像数据过程的方框图;
图7示出了利用二维掩码产生预测图像数据过程的方框图。
下面将要描述利用掩码对具有0至256之间的灰度级值的图像进行二进制化的方法。
在示于表2的一个4×4掩码中,通过利用掩码进行二进制化图像的方法,各个掩码被排列在图像中,彼此没有重叠,如果图像的任意一个象素的灰度级大于相应的掩码基本值,该象素被认为是白色,如果图像的任意象素的灰度级小于相应的掩码元素值,该象素被认为是黑色。
表2 80 176 112 128 240 0 208 32 96 144 64 160 192 48 224 16
表3 80 176 112 128 80 176 112 128 240 0 208 32 240 0 208 32 96 144 64 160 96 144 64 160 192 48 224 16 192 48 224 16 80 176 112 128 80 176 112 228 240 0 208 32 240 0 208 32 96 144 64 160 96 144 64 160 192 48 224 16 192 48 224 16
表3示出了4个4×4掩码的基本值,被排列在8×8的图像中相互之间没有重叠。为方便起见,假设从顶部同时向下增加Y向右增加X,一个x=1和y=1的图像满足掩码中x=1和y=1的元素值,其元素值是80。在此,如果x=1和y=1的象素的灰度级大于掩码的相应的元素值,该象素被认为是白色。一个象素x=2和y=1与x=2和y=1的掩码元素值相对应,其元素值是176。在x=2和y=1中,如果图像的象素的灰度级小于掩码元素值基本176,该图像的象素被认为是黑色。同样的方式,象素x=5和y=1与x=5和y=1的掩码元素值相对应。像素的二进制值(二进制象素数据)被认为黑色和白色的分别是0和1。
图2是利用多个4×4掩码对具有灰度级平均值80的图像进行二进制化。在图2中,区域中重复相应于4×4掩码具有相同二进制图像。然而,在具有类似灰度的图像例如一篇云或海洋,如果利用4×4掩码图像被二进制编码,该图像具有相同的模式。这样,在图像的灰度级变化不大的情况下,利用掩码例如具有大量的蓝噪声掩码进行二进制图像编码是较好的。
示于图3的装置包括最大值搜索单元300,最小值搜索单元310,平均值计算单元320,二进制化计算单元330和比较单元340。
参照图6将要描述图3装置的操作。
窗口的大小是5,属一维的,它表示窗口象素的数量,是用于预测当前象素二进制电平的先前象素的集合,即,在窗口大小是5的情况下,为了预测当前象素的二进制电平,考虑5个先前象素的二进制电平。较好地,在图6中应用了上述蓝噪声掩码。
在图6中,点划线表示图像的灰度级,实线表示掩码的元素值。通过考虑第3,第5,第7象素的二进制象素数据预测图6中第8个像素的灰度级。如果窗口的象素值大于元素值,则二进制象素数据是1,如果窗口的象素值小于元素值,则二进制象素数据是0。第3,5,7像素的灰度级小于相应掩码元素值,这样,第3,5,7象素的二进制象素数据是1。并且,用同样方式获得第4,6象素的二进制象素数据是0。
最大值搜索单元300最好由一个比较器组成,并且,搜索掩码元素值的最大值,该掩码相应于具有二进制象素数据为1的一个象素,该象素是在窗口中位于具有当前被预测二进制电平的象素之前的多个象素之一。相应于含有二进制象素数据1的象素,即,第3,5,7象素掩码的元素值分别是40,20,30,这样,对应于具有二进制象素数据1的掩码元素值最大值是40。
最小值搜索单元310最好由一个比较器组成,并且,搜索掩码元素值的最小值,该掩码相应于具有二进制象素数据为0的一个象素,该象素是在窗口中位于具有当前被预测二进制电平的象素之前的多个象素之一。相应于含有二进制象素数据0的象素,即,第4,6象素掩码的元素值分别是255,220,这样,对应于具有二进制象素数据0的掩码元素值的最小值是220。
平均值计算单元320计算分别从最大值搜索单元300和最小值搜索单元310搜索的最大值和最小值的平均值。这是因为具有二进制象素数据0的象素的灰度级m和相应于掩码元素值的最小值是最接近第8个象素的灰度级,具有二进制象素数据1的象素的灰度级M和相应于掩码元素值的最大值是最接近第8个象素的灰度级。窗口中象素的灰度级是类似的,这样,当前预测的灰度级在M和m之间。运样,M和m之间的平均值被预测为第8个象素的灰度级。
二进制化单元330对从平均值计算单元320取得的M和m的平均值进行二进制化。
比较单元340比较二进制化的平均值与当前象素的二进制电平并且输出预测图像数据,如果比较结果相同输出1表示预测成功,如果比较结果不相同,输出预测图像数据0表示预测失败。
参照图7描述在二维图像中应用掩码预测当前象素的二进制电平的方法。
在二维图像中。应用一个二维窗口,它不同与一维图像。图7中圆点表示的部分是所考虑的预测象素二进制电平的象素范围。即一个窗口。这里,窗口的大小和形式对成功预测的变化有很大影响。如果窗口很大,较多相邻象素的二进制电平被考虑,这样,能够获得接近于预测象素的二进制电平,可是,如果窗口的大小大于预定值的大小,包含边缘的概率增加。因此减少了成功预测的机会。并且,如果窗口是小的,包含边缘的概率减少,较少相邻象素的二进制电平被考虑,因此降低了成功预测的机会。一个5×5窗口是窗口3×3,5×5,7×7中具有最希望成功概率的。
表4示出了当按照本发明的装置预测一个象素的二进制电平时预测成功概率。
表4 图像预测成功概率二进制图像每个 象素的熵由本发明装置获得的每个象 素的熵 f16 93.0077% 0.812398 0.290539 lax 91.9182% 0.836587 0.316724 cjs 94.1292% 0.944738 0.231682 couple 93.5249% 0.951156 0.236787 crowd 93.4307% 0.729155 0.267430 einstem 93.7794% 0.932708 0.231523 baboo 90.7200% 0.964175 0.349898 black 94.0174% 0.717774 0.216667 boats 93.3815% 0.932995 0.257539
在表4中熵表示平均数据量,每个象素的熵表示象素所需的一个平均位和理论上能够被编码的最大数据量。
如果当前象素的二进制电平被成功预测,1被写到当前二进制象素数据,反之写0。如果从先前象素的预测是成功的,二进制象素数据写为1,反之写0。重复上述方法能够实现排列具有成功或不成功预测二进制电平的象素的预测图像。如表4所示,预测成功概率很高,这样预测图像的二进制电平数据为1的概率增加,0的概率减少。通过霍夫曼编码方法,白色(位=1)或黑色(位=0)象素的数量增加,编码变的更好。这样,如果通过图3的装置进行图像编码,编码的效率提高。
表5示出了利用标准传真机霍夫曼编码进行二进制图像编码后的大小。
表5 图像通过普通二进制编码方法对二进制图像编码之后的大小按照本发明装置对预测图像编码后的大小 baboo 78163 25013 lax 74633 22423 black 58686 17963 boats 74815 19415 einstein 81181 18464 f16 58163 14499 cjs 75638 17697 couple 82082 19143 crowd 52953 19159
二进制图像大小初始是32768,即,32K字节。在表4中,利用掩码用传统方法编码形成的大小是初始图像的2或3倍。然而,如果利用本发明的预测装置进行编码,比应用掩码的传统二进制图像编码方法编码效率高5或6倍。
图4的装置包括第一预测单元400,编码单元410,解码单元420,第二预测单元430。第一预测单元400的结构和操作与图3的装置的相同。传送部分的第一预测单元400与接收部分的第二预测单元430以相同的方式执行预测。这样,如果在传送部分预测失败,在接收部分预测也失败。
图5的第二预测单元包括最大值检测器500,最小值检测器510,平均值计算器520,二进制化单元530和预测图像确定单元540。
最大值搜索单元500的操作,最小值检测器510,平均值计算器520,二进制化单元530与相应于第一预测单元部分400的操作相同,并且预测图像确定单元540的操作不同于第一预测单元的部分的操作。第一预测单元400的比较器将二进制化单元330的二进制化平均值与当前象素的二进制电平作比较。然而,第二预测单元430中的预测图像确定单元540输出一个值,如果在解码单元420中被解码的预测图像数据是1,该值是通过将二进制化单元530的二进制化平均值作为当前象素的二进制电平,如果预测图像数据是0,通过取反二进制化的平均值,0被取反为1,1被取反为0,作为当前像素的二进制电平并且反之亦然。
下面将要描述图4装置的操作。
第一预测单元400以与图3装置相同方式预测当前象素的二进制电平,然后产生预测图像数据,该预测图像数据由二进制象素数据1组成表示成功预测或0表示失败预测,任意图像的第一个象素没有先前象素,这样预测失败。这样,传送第一预测图像数据0或1。
编码单元410压缩通过预定的方法由第一预测单元400预测的图像,最好用霍夫曼编码方法。
在接收部分,通过解码单元420,被编码和传送的数据被解码成初始预测图像数据。解码单元420的结构与普通传真机或打印机用的解码单元相同。
第二预测单元430输出利用接收部分图像窗口中象素值和掩码元素值被预测的当前象素的二进制电乎,如果通过编码单元420被编码的预测图像数据是1。同时,如果被解码的预测图像数据是0,图像被成功预测,这样二进制电平被取反输出。
通过在普通二进制图像传送器结构中增加编码前和解码后的预测单元可以实现依照本发明的装置。并且,按照本发明的装置可以应用在打印机或扫描仪及传真机中。
依据本发明,当传送通过对图片文件及文本文件进行二进制化后获得的图像时,对普通图像编码,传送和解码装置做较小的改变可以实现良好的质量和高效率编码。
应该这样理解,本发明不限于示出的实施例及其通过技术人员在本发明的范围内可以做出很多改变和修改。