用于对视频信号中的对象的轮廓进行编码的方法和装置 【发明领域】
本发明涉及一种对表示于视频信号中的对象的轮廓进行编码的方法和装置;并且,更具体地,涉及一种能够对包含于视频信号中的对象的轮廓进行有效编码的方法和装置。
【发明背景】
在诸如可视电话、电话会议和高清晰度电视系统的数字电视系统中,由于在视频信号中的视频信号中的视频信号包含一系列被称为象素值的的数字数据,就需要大量地数字数据来定义每一视频帧信号。然而,由于传统传输信道的可用频带宽度有限,为了经其传送大量数字数据,就不可避免地要通过使用各种数据压缩技术来压缩或减少数据量,尤其是在象可视电话和电话会议系统一样低比特率视频信号编码的情形下。
面向对象的分解-合成编码技术是一种用于为低比特率编码系统对视频信号进行编码的技术。其中输入视频图象被分成多个对象并且用于定义每一对象的运动、轮廓和象素数据的三组数据通过不同的编码信道被处理。
此面向对象的编码方案中的一例就是所谓的MPEG(运动图象专家组)阶段4(MPEG-4),设计它是用于提供一个在诸如低比特率通信、交互式多媒体(如游戏机、交互式电视等)和监视的应用中允许基于内容的对话、改进的编码效率和/或通用可达性的音-像编码标准。(例如,参见MPEG-4 Video Verification Model Version 2.0,国际标准化组织,ISO/IECJTC1/SC29/WG11 N1260,1996年3月)
根据MPEG-4,一个输入的视频图象被分成许多视频对象平面(VOP’S),该视频对象平面对应于在一个用户能够访问和操作(剪切、粘贴等)的位流中的实体,该视频对象平面可被称作一个对象。每个VOP的宽和高可以是包围每个对象的16个象素(一个宏块大小)的最小倍数量,以便编码器对该输入视频图象的处理是在一个VOP接一个VOP的基础上,即在一个对象接一个对象的基础上进行的。该VOP包括由Y、U、V分量组成的彩色信息及由例如一个二进制掩码所表示的形状信息。
在对一个对象的轮廓图象进行处理的过程中,轮廓信息对于分解和合成一个对象形状是至关重要的。表示轮廓信息的传统编码技术是一项链式编码技术。虽然该轮廓信息可以被其没有任何丢失地忠实地编码,但它要求大量的数据表示它。
多边逼近技术是一种被引入的减少表示一个对象的轮廓的数据量的技术,其中首先选择两个起始顶点。若轮廓是一个开环,则两端点被选作起始顶点。另一方面,若轮廓是一个闭环形状,则该轮廓上的两个最远的点被选作起始顶点。然后确定轮廓上离连接这两个起始顶点的直线段最远的点。如果该最远点距该直线段的距离大于一个预定限值,则此最远点成为一个顶点。对每一直线段重复此过程,直到最远点和所述每一直线段的小于或等于该预定限值为止,其中每一直线段连接两个相邻顶点。上述处理的结果是,确定了许多顶点并且通过用多条直线段适配该轮廓来逼近一个对象的轮廓。于是,为其发送而对表示轮廓上顶点位置的顶点信息进行了编码。
即使可能通过用连接的直线段代表该轮廓的方法可以大量减少待发送的数据量,此法仍会导致逼近该轮廓时计算复杂性的增加,因而为了在低比特速率编码解码系统中成功地实现该技术,仍期望进一步减少数据量。
因此,本发明的主要目的是提供一种轮廓编码方法和设备,该方法和设备能够表示一个轮廓的图象,同时减少了计算复杂性并且实现了大量减少所发送的数据量。
根据本发明,提供了一种用于对表示于视频信号中的对象的轮廓进行编码的方法,该方法包含以下步骤:(a)通过平均该轮廓的象素位置而检测该对象的轮廓的形心;(b)根据形心确定该轮廓上的一组主顶点,通过用一条直线连接每一对相邻的主顶点而逼近该轮廓;(c)在该组主顶点的基础上在该轮廓上获取一组次顶点;及(d)对该组主顶点、该组次顶点及该形心进行编码以由此提供一个数字编码轮廓信号。
附图的主要说明
从下面将给出的与附图相联系的优选实施例的描述中可显而易见本发明的以上和其它目的以及特征。
图1示出了用于对轮廓图象编码的本发明的装置的方框图;
图2表示图1中所示的主顶点检测块的详细方框图;
图3说明了一个其中有一个形心并被分成8条分段直线的示例性轮廓;及
图4A至4C描述检测次顶点的过程。
优选实施例的详细说明
参考图1,示出了本发明装置的方框图,该装置用于对表示于一个视频信号中的一个对象的轮廓图象进行编码。
表示一个对象的轮廓的轮廓图象数据被输入一个形心计算块100、并联的一个主顶点检测块110及一个次顶点检测块120。
形心计算块100通过平均该轮廓上的所有象素位置的坐标而找到该对象的轮廓的形心,并且将形心位置数据提供经主顶点检测块110和一个信道编码器150。
根据本发明,主顶点检测块110根据该轮廓图象数据及该形心位置数据来确定轮廓的主顶点。
参考图2,描述了一个主顶点检测块110的详细方框图,该主顶点检测块110包括一个大小检测部分111和一个主顶点确定部分113。大小检测部分111通过例如对轮廓象素,即位于该轮廓上的象素的计数而检测该轮廓的大小,并将分割该轮廓的径向线的数目提供给主顶点确定部分113,在该主顶点部分113根据该轮廓的大小来确定径向线的数目是以如此方法进行的径向线数随轮象素数的增加而增加。
参考图3,说明了根据本发明的优选实施例的一个执行于主顶点检测部分113的主顶点检测过程,在该主顶点检测过程中标记数据50代表了一个闭环形式的轮廓。如图3所示,响应于径向线数目M及形心位置数据,主顶点确定部分113顺时针方向画出了出自形心C的M条径向线,例如M1至M8,始于参考径向线M1,其中每时紧邻的径向线间的夹角为(2π/M)弧度,M是一个大于1的整数,参考径向线的画法是从形心C竖直向上画。随后,主顶点确定部分113检测在轮廓50上的主顶点并确定形心C和每一个主顶点间的距离,其中主顶点被定义为该轮廓和一条径向线的一个交点,即在径向线上的轮廓象素的位置,对主顶点的标号是例如顺时针的,始于参考径向线M1上的第一主顶点A1。如果径向线(例如M3)与该轮廓的交点超过一个(例如A3、A3’和A3”),则与形心的距离最接近于其紧挨的前面一个主顶点(例如A2)和形心C间的距离的点(例如A3)被选作相应的主顶点。如果参考径线与该轮廓的交点超过一个,则可以选与形心的距离最小的点作为第一主顶点。通过在每一对紧邻的主顶点间画一条直线获得了逼近该轮廓50的线段LS1至LS8,由此得到一个封闭多边形。
于是,代表了检测出的主顶点(例如A1至A8)的位置和标号的主顶点信息通过线L10从主顶点确定部分113提供给图1中所示的次顶点确定块120。代表了形心C和主顶点A1至A8间的各距离D1至D8的距离信息,也由此经线L20被提供给主编码器130,对距离标号的方式与对主顶点标号的方式相同。
返回参见图1,在主编码器130,根据第一主顶点A1的距离D1,通过使用传统DPCM(差值脉冲编码调制)技术而对该距离信息编码。此方法是:设D1为初始预测值,计算预测值和D2间的差值,通过将D2作为新的预测值使用而获得D3的差值。此过程一直继续到算出了最后一个主顶点的差值为止。然后将包括该初始预测值的已编码主顶点信息,即DPCM数据,传送至信道编码器150。
同时,响应于被应用至此的轮廓图象数据及来自主顶点检测块110的主顶点信息,次顶点检测块120通过使用传统多边形逼近技术而确定次顶点。次顶点检测块120逐一计算从两相邻主顶点间的轮廓线上的每个轮廓象素至其间多边形上的线段的距离;其上具有至该线段最大距离的一个轮廓象素被选出来,而且若其距离大于一个预定的限值DM,则定义其为一个相应的次顶点。这就是说,如可在图4A中看到的,如果在线段(如A2A3或 A3A4)和最远轮廓象素(如P1或P2)间的距离(如d1或d2)大于预定的限值DM,则点P1或P2成为一个次顶点。一旦通过上述过程为轮廓确定了所有的次顶点,通过用一条直线连接每一对紧邻的顶点就能获得逼近该轮廓的一个封闭多边形的线段,上述顶点包括主顶点和次顶点。如4B所示,对于被封闭多边形逼近的轮廓来说,用与上述同样的方法重复选取在新形成的轮廓段上具有至该线段例如 P2A3最大距离的轮廓象素(例如P3)作为一个相应的次顶点,直到该最大距离等于或小于预定的限值DM,由此,如图4C所示,检测次顶点P1、P2和P3。
在本发明的另一个实施例中,次顶点检测块120在两相邻主顶点间的每一个轮廓段上的每一个轮廓象素处计算该轮廓的曲率,在一个轮廓象素处的轮廓的曲率表示经过该轮廓象素的两条直线间的角度变化,其中的两条直线是从该轮廓象素至轮廓的另外两个象素画出的,另外两个象素位于沿该轮廓的两个不同方向距该象素有预定数目个象素之处。一旦为轮廓段确定了在轮廓象素处的曲率,次顶点检测块120选取轮廓段上所有具有大于预定限值CM的曲率的轮廓象素;并将按其曲率值从大到小选出的最多达预设数P个的轮廓象素确定为次顶点,P为正整数。如果所选的轮廓象素的数目小于或等于预设数,则将所有选出的轮廓象素都确定为次顶点。如果所选的轮廓象素数目大于预设数,则按其曲率值从大到小选出预设数目个轮廓象素并确定为次顶点。这就是说,所有在轮廓段内选出的次顶点的曲率都大于限值CM并且不小于未选中的轮廓象素的曲率,而且轮廓段的次顶点的数目不大于预设数P。在一份共有未决的申请中,描述了一种用于计算轮廓曲率的技术,该专利为中国专利申请号No.95116451.1,申请于1995年9月7日,名称为“用于表示一个对象的轮廓的改进的轮廓逼近方法”(“IMPROVED CONTOURAPPROXIMATION METHOD FOR REPRENTING A CONTOUR OF AN OBJECT”)
表示检测到的次顶点的位置的次顶点信息及主顶点信息被从次顶点检测块120提供至次编码器140。根据本发明的优选实施例,次编码器140为每一个次顶点找到一个最近的主顶点,并计算次顶点与其的位移;而且通过使用如JPEG(连接图象专家组)和算法码来给每一个次顶点的标号和位移编码,由此给信道编码器150提供已编码的次顶点信息。
信道编码器150从形心位置数据、已编码主和次顶点信息中以适于其发送的形式产生一个数字编码轮廓信号,其中数字编码轮廓信号包括用于由主顶点和次顶点形成多边形逼近轮廓图象的顺序信息。
虽对本发明的描述参考了具体实施例,在不背离如下权利要求所定义的本发明的精神和范围的前提下,可以做出各种变化和修改,这一点对本领域中的技术人员是显而易见的。