使用非逐行扫描伪预测图像的特技模式 【相关申请的交叉引用】
基于35 U.S.C.119(e)的规定,本申请要求了于2001年10月23日申请的序号为60/334,914的临时申请的优先权。
【技术领域】
本发明的方案一般涉及一种视频系统,更具体来讲涉及记录或者播放数字编码视频序列的视频系统。
背景技术
在今天的家电市场中,数字电视(DTV)和高清晰度电视(HDTV)正渐渐受欢迎起来。为了观看先前记录的节目或者记录他们中意的节目,这种电视的许多购买者还购买了数字录像机或者播放器,例如数字影碟(DVD)录像机或者播放器。特别是,DTV(或者HDTV)和数字视频数字录像机或者播放器的组合可能是家庭影院娱乐系统的不可分割的部分。
数字录像机或者播放器通常包含运动图像专家组(MPEG)解码器,用来对存储在录像机或者播放器所播放的盘上的数字编码多媒体数据进行解码。如果数字录像机或者播放器与传统的(非DTV或者非HDTV)电视连接,则在被显示在传统电视上之前,由数字录像机或者播放器的MPEG解码器对数字编码信号进行解码。然而,相当多的DTV包含它们自己的MPEG解码器。因此,如果数字录相机或者播放器与DTV相连,那么将利用DTV的解码器远程解码从所述盘读取的视频信号。此结构可以被称之为远程解码器结构。
然而,利用远程DTV解码器来解码数字编码信号存在重大地缺陷。也就是说,按照此类配置很难执行特技模式(trick modes)。所述特技模式可以是没有以正常速度或者没有按正方向进行播放的任何一种视频播放操作。通常,特技模式包括诸如在慢运动或者冻结特技模式期间重复视频信号中的多个图像。由于数字录相机或者播放器与DTV之间的带宽是受限的,因此在正传送给DTV的信号中重复图像可能引起所述信号超过传输通道的最大比特率限制。如果所述图像是帧内(I)图像或者预测(P)图像,那么所述问题将更加尖锐,这是由于这些图像利用了相对大量的比特来进行编码。
除比特率问题外,远程解码视频信号还存在其它缺点:如果重复的图像包含运动对象,那么这种配置下非逐行扫描图像的重复显示可能引起在显示过程中出现摆动效应。为解释此缺点,有理由对隔行扫描作一简短说明。
许多电视机采用隔行扫描技术。在此格式之下,通常将视频信号分为预定数量的水平行。在每个场周期期间内,只扫描这些行的二分之一;通常,在第一场周期期间扫描奇数行,而在下一场周期期间扫描偶数行。每一扫描称为一场,并且当合并时,两个场形成一个完整的图像或者帧。对于NTSC系统来说,每秒显示60场,因而产生了每秒30帧的速率。
当运动对象在隔行扫描电视中移动穿过屏幕时,每个场将只显示该运动对象的一部分。所述局部显示是因为一个场只是每隔整个图像的一个水平行来显示。例如,对于特定的场n来说,只扫描奇数水平行,并且将在场n中显示的运动对象的部分是在扫描场n奇数水平行期间所扫描的部分。在1/60秒以后,创建下一场、即场n+1,并且将显示该图像的偶数水平行。由此,在场n+1中显示的运动对象部分是在扫描场n+1偶数水平行期间被扫描的部分。虽然每个场暂时不同,但是由于场的显示速度,因而人眼感觉场的连续显示像是平滑运动。
如果观看者激活特技模式,那么特技模式视频信号可以包含重复的图像,所述图像是根据隔行扫描格式记录的。例如,如果观看者对特定的图像启动冻结特技模式,那么可以将该图像重复地发送到包含远程解码器的DTV,并且在所述DTV上被解码和显示。然而,重复图像的显示是与非逐行扫描图像的正常显示一致的,即,交替地显示组成非逐行扫描图像的场。
如果运动对象出现在以隔行扫描格式记录的图像中,那么每个场将在一个特定位置中显示运动对象。由此,由于在冻结特技模式期间交替地显示这些场,所以显示器中的运动对象快速地从显示器中的一个位置移动到另一个位置;实际上,所述运动对象看起来像是摆动的。产生此摆动的原因是因为隔行扫描场是暂时不同的,并且运动对象出现在每个场的不同位置中。
此问题也存在于包括去隔行扫描器(deinterlacer)的DTV中。如现有技术中所公知的那样,去隔行扫描器可以从隔行扫描场构造完整的帧,由此,去隔行扫描器可以构造缺少场的包括重复非逐行扫描帧的完整的帧。不过,根据隔行扫描场构造的这些完整的帧也将以交替的方式进行显示,由此产生了摆动假象的可能性。此外,此摆动效应不仅出现在冻结特技模式中,而且还存在于其中重复非逐行扫描图像的任何其它特技模式中。由此,人们需要在没有提高系统开销或增加系统复杂性的情况下,消除比特率问题和摆动假象。
【发明内容】
本发明涉及一种用于对包含多个原始图像的视频信号执行特技模式的方法。本发明包括以下步骤:接收特技模式命令,以及利用基于场的预测和基于帧的预测当中的至少一个预测方案,将至少一个伪预测图像有选择地插入到视频信号中。有选择地插入步骤将视频信号转换为特技模式视频信号。在一种配置中,有选择地插入步骤可以包括以下步骤:利用基于场的预测来有选择地将至少一第一伪预测图像插入到视频信号中,并且利用基于帧的预测有选择地将随后的伪预测图像插入到特技模式视频信号中。
在另一种配置中,所述方法还可以包括根据与参考图像相关的单个场来预测至少一第一伪预测图像的步骤。此参考图像可以是帧内图像或者是预测图像。另外,该参考图像可以是非逐行扫描图像、逐行扫描图像或者场图像。
在本发明的一个方面中,多个原始图像可以被包含在图像组中,并且用于预测至少一个第一伪预测图像的参考图像可以是该组图像的最后一个原始图像,如此使得没有别的原始图像可以根据所插入的伪预测图像被预测。在另一个方面中,多个原始图像可以被包含在一个所述图像组中,并且所述方法还可以包括以下步骤:在有选择地插入步骤之后,跳过最后插入的伪预测图像之后的任一剩余原始图像,从而使该组图像中的最后一个图像是最后插入的伪预测图像。另一方面,在不包含伪预测图像或者重复的原始图像的原始图像组中具有多个原始图像,并且所述方法还可以包括以下步骤:在有选择地插入步骤之后,传输原始的GOP以便解码。
此外,特技模式命令可以是冻结或者慢运动特技模式命令,并且所述方法还可以包括利用远程解码器解码至少一部分特技模式视频信号的步骤。所述伪预测图像还可以是非逐行扫描预测图像。
本发明涉及另一种用于对包含多个原始图像的视频信号执行特技模式的方法。此方法包括以下步骤:接收特技模式命令;响应特技模式命令,有选择地重复至少一个原始图像,其中有选择地重复步骤将视频信号转换为特技模式视频信号,并且使用基于场的预测或者基于帧的预测当中的至少一个预测方案有选择地将至少一个伪预测图像插入到特技模式视频信号中。此方法还可以包括以下步骤:监视特技模式视频信号,其中,如果特技模式视频信号的比特率超过预定阈值,就执行有选择地插入步骤。
在一种配置中,多个原始图像的每一个都包含显示指示符,并且所述方法还可以包括以下步骤:有选择地修改多个原始图像的至少一部分的显示指示符,以便当重复原始图像或者当将伪预测图像插入到特技模式视频信号中时,反映预定的显示顺序。所述显示指示符可以是临时参考字段。每个临时参考字段可以具有整数值,并且有选择地修改多个原始图像的至少一部分的临时参考字段的步骤可以包括以下步骤:每当重复原始图像或者当将伪预测图像插入到特技模式视频信号中时,将临时参考字段的整数值逐渐地加1。以此方法,伪预测图像可以是非逐行扫描伪预测图像。
本发明还涉及一种用于对包含多个原始图像的视频信号执行特技模式的系统。所述系统包括控制器和处理器,所述控制器用于从存储介质中读数据并输出包含多个原始图像的视频信号。所述处理器被编程以用于接收特技模式命令,并且有选择地利用基于场的预测或者基于帧的预测、将至少一个伪预测图像插入到特技模式视频信号中。有选择地插入步骤将视频信号转换为特技模式视频信号。所述系统还包括适当的软件和电路,以实现如上所述的方法。
【附图说明】
图1是依照此处本发明结构的可利用伪预测图像执行特技模式的系统框图。
图2是举例说明了依照本发明结构的用于利用伪预测图像执行特技模式的操作的流程图。
图3A举例说明了依照本发明结构的具有非逐行扫描图像的典型图像组。
图3B举例说明了本发明结构的包括所插入的伪预测图像的图像组的一部分和预测方案的例子。
图3C举例说明了依照本发明结构的包括所插入的伪预测图像的图像组的一部分和另一个预测方案的例子。
图3D举例说明了依照本发明结构的包含非逐行扫描图像的一组图像的一部分,其中已经修改了图像的显示指示符。
图4是举例说明依照本发明结构的用于利用伪预测图像执行特技模式的另一方法的另一流程图。
图5是举例说明依照本发明结构的用于利用伪预测图像执行特技模式的又一个操作的又一个流程图。
图6举例说明了依照本发明结构的包括所插入的伪预测图像的一组图像的一部分和另一个预测方案的例子。
【具体实施方式】
在图1中以框图的形成示出了依照本发明配置用于实现不同改进的操作特征的系统100。然而,本发明不局限于图1举例说明的特定系统,而是可以使用能够接收数字编码信号并将该信号传输给显示设备的任何其它系统来实现本发明。此外,系统100也不局限于从/向特定类型的存储介质读/写数据,能够存储数字编码数据的任何存储介质都可以用于系统100。
系统100可以包括控制器110,用于从/向存储介质112读/写数据。系统100还可以具有搜索引擎114、微处理器116、传输缓冲存储器117和显示装置118。搜索引擎114可以包含适当的软件和电路,以便在从存储介质112读取的视频信号中定位一个或多个特定类型的图像。还可以提供控制和数据接口,以便允许微处理器116控制所述控制器110和搜索引擎114的操作。对于由微处理器116执行的传统操作来说,可以在存储器中提供适当的软件或者固件。此外,依照本发明的结构,可以为微处理器116提供例行程序。
应该理解的是,在本发明的意图内,搜索引擎114和微处理器116的全部或者部分可以是处理器。此外,在本发明的意图内,控制器110、搜索引擎114、微处理器116和传输缓冲存储器117的全部或者部分可以是比特流源122。在一种结构中,显示装置118可以包含其自身的解码器119,用于解码从存储介质112读取的全部或者部分视频信号,并经由比特流源122处理。在此特定的结构中,比特流源122中的解码器(未示出)通常不对从存储介质112读取的视频信号进行解码。可以将此特定的实施例称为远程解码器结构。然而,应当指出,本发明不局限于此结构,本发明能够以其它适当的系统实现。
在操作过程中,控制器110可以从存储介质112中读取包含多个原始图像的视频信号。这些原始图像可以是非逐行扫描图像、逐行扫描图像或者场图像。在一种结构中,如果微处理器116接收诸如慢运动或者冻结命令之类的特技模式命令,那么微处理器116可以有选择地重复至少一个原始图像,以便将视频信号转换为特技模式视频信号。由此,特技模式视频信号可以包含原始图像以及一个或多个原始图像的副本或者重复。
此外,在特技模式命令期间,微处理器116可以通知搜索引擎114在特技模式视频信号中定位一个或多个适当的原始图像。一旦适当的原始图像被定位,搜索引擎114就通知微处理器116,并且微处理器116可以生成相应的伪预测(P)图像。伪P图像是可以根据确定的图像预测的P图像,其中将伪P图像的运动矢量设置为零,并将其剩余信号设置为零或不编码。对本发明来说,伪P图像可以是非逐行扫描伪P图像;然而,本发明不局限于此,所述伪P图像可以是诸如逐行扫描或者场图像的任何其它适当的图像类型。
微处理器116能因此有选择地插入至少一个相应的伪P图像,如此使得除了重复的原始图像之外,将伪P图像发送到传输缓冲存储器117并且发送到显示装置118和解码器119上。由于伪P图像包含相对少量的编码数据,所以在特技模式视频信号中插入伪P图像可以使信号的整体比特率减小。
将以这样的方式来生成伪P图像,即,当微处理器116接收特技模式命令时生成伪P图像,称为“运行时”生成伪P图像。作为选择,微处理器116可以在启动特技模式命令之前生成伪P图像,其中可以将一个或多个伪P图像存储在存储器(未示出)中。一旦微处理器116接收特技模式命令,微处理器116就可以从存储器检索一个或多个伪P图像,并且将它们插入到特技模式视频信号中。在任何一种结构中,所述伪P图像可以代替一个或多个重复的原始图像,从而将伪P图像发送到显示装置118并且对其进行显示,而不是显示重复的原始图像。
在本发明的另一方面中,一旦微处理器116接收了特技模式命令,微处理器116就可以监视特技模式视频信号的比特率。如果特技模式视频信号的比特率超过预定阈值,那么微处理器116、连同搜索引擎114一起可以执行上述的有选择地插入步骤,其中可以将至少一个伪P图像插入到特技模式视频信号中。
在本发明的一个特定实施例中,微处理器116仅仅可以将伪P图像插入到从存储介质112读取的视频信号中,以便形成特技模式视频信号。作为一个例子,如果接收了冻结或者暂停特技模式命令,那么在所述命令的工作期间,微处理器116可以插入视频信号伪P图像,其中可以根据启动冻结特技模式的原始图像来预测第一伪P图像。然而,应该理解的是,此过程不局限于冻结特技模式,此特定的实施例还可以利用慢运动特技模式来实现。
为防止摆动图像问题,当启动诸如冻结特技模式的特技模式命令时,搜索引擎114可以定位特定的原始图像。在一种结构中,此原始图像可以是一组图像(GOP)中的最后一个图像。微处理器116能够将一个或多个非逐行扫描伪P图像插入到视频信号中,其中所述视频信号包含原始图像,在所述原始图像中,可以根据最后一个原始图像的单个场来预测第一伪P图像。如果启动了冻结特技模式的原始图像不是GOP中的最后一个原始图像,那么微处理器116可以延迟特技模式的开始,从而根据GOP中的最后一个原始图像来预测第一伪预测图像。
作为选择,所述搜索引擎114可以定位不是GOP中最后一个图像的原始图像,并且所述微处理器116可以跳过或者删除最后一个伪P图像之后的所有原始图像,以便将其插入到视频信号中(在此替代的实施例中,第一伪P图像可以根据原始图像的单个场来预测,其中所述原始图像也是根据该场预测的)。如下面将解释的,此单个场的预测方案可以帮助消除摆动图像假象。此外,确保GOP中的最后一个图像是最后插入的伪预测图像,以便不会根据所述伪预测图像预测其它图像,由此可以维护视频信号的显示质量。
在另一种结构中,微处理器116可以修改多个原始图像的一个或多个内包含的信息的确定部分,其中所述原始图像包含在特技模式视频信号中,以反映预定的显示顺序。无论是重复原始图像、还是将伪P图像插入到视频信号,都可以执行此修改步骤。下面将更加详细地讨论本发明的整体操作。
利用非逐行扫描伪预测图像的特技模式
参见图2,举例说明了用于示范执行利用伪P图像的特技模式的一种方式的方法200。在一个实施例中,本发明能够以远程解码器结构的方式来实现。对本发明来说,远程解码器结构可以是任何系统,其中视频信号中至少部分图像可以由解码器解码,其中所述解码器在比特流源极外部,并且不受所述比特流源极的控制,其中所述比特流源极向解码器提供图像。
作为一个例子,所述比特流源极可以是光存储介质播放器或者记录器,用于从光存储介质中读取多媒体数据,并且经由传输通道将此数据传输到数字电视,所述数字电视包含其自身的解码器。然而,应该理解的是,本发明不局限于此例子,并且更不局限于远程解码器结构,本发明能够以任何其它适当的系统或者结构来实现。
在步骤210,可以读取包含多个原始图像的视频信号。在一种结构中,这些原始图像可以是非逐行扫描图像、逐行扫描图像或者场图像。在步骤212,可以接收特技模式命令。对本发明来说,所述特技模式命令可以是任何命令,在所述命令中,往往需要重复的一个或多个原始图像包括暂停或者冻结命令或者慢运动命令。
响应所述特技模式命令,在步骤214,可以重复至少一个原始图像,以便将所述视频信号转换为特技模式视频信号。不过没有意思以任何方式来限制本发明的访问,此方法200将示范重复GOP中的原始B图像以形成特技模式视频信号,并且将伪P图像插入到该特技模式视频信号中,其中根据GOP中包含的原始I和P图像来预测伪P图像。
参见图3A,依照显示顺序示出了包含非逐行扫描图像的GOP 300。下标编号表示每个图像相对于GOP中另一个图像、以正常播放速度进行显示的时间。小写字母“t”可以表示顶端场,而小写字母“b”可以表示底部场。此GOP 300可以是视频信号中多个GOP的其中一个。虽然本发明不局限于此特定的GOP结构,但是所述GOP 300将足以说明利用非逐行扫描伪P图像的慢运动特技模式是如何执行的。
返回参见图2,在步骤216,可以利用基于场的或者基于帧的预测来有选择地将一个或多个伪P图像插入到特技模式视频信号中。这些伪P图像可以是非逐行扫描、逐行扫描或者场图像。如先前所述,伪P图像是可以根据确定的图像来预测的P图像,在所述确定的图像中,将伪P图像的运动矢量设置为零,并且将其剩余信号设置为零或非编码的。例如,在MPEG信号中,可以将伪P图像的离散余弦变换(DCT)系数设置为零或非编码的。照此,伪P图像包含极少的信息。伪P图像的主要意图在于复制或者重复图像、或者图像的场,由此其可以利用少数比特来进行预测。由此,伪P图像适合于替换特技模式视频信号中的一个或多个重复的原始图像,并且特技模式视频信号可以包含重复的原始图像和/或伪P图像。
可以将这些伪P图像、而非重复的原始图像发送到远程解码器。因此随着这种信号的比特率趋向于升高,当这些原始图像的大多数、包括具有大量比特的那些编码往往在特技模式命令期间被重复时,此过程可以将特技模式视频信号的比特率维持在可管理的水平上。在下面将描述利用伪P图像的几个预测方案的例子。
例如,返回参见图3A,如果将要执行具有1/3X(1X表示正常播放速度)的播放速度的慢运动特技模式命令,那么GOP 300中的每个B图像都可以被重复两次。因为B图像包含相对少量的比特,因此重复B图像将不会导致特技模式视频信号的比特率太高,至少相对于I和P图像是这样的。在作为参考图像的每个原始图像之后(以显示顺序),可以插入两个伪P图像。对本发明来说,参考图像可以是任何图像,根据所述图像可以预测其它图像,所述图像诸如是I或者P图像。这些参考图像还可以是非逐行扫描图像、逐行扫描图像乃至场图像。
在图3B中举例说明了上述过程的部分例子,其中示出了在图像I2之后插入两个伪预测图像。这里,第一伪P图像Pd1的第一场Pd1t可以根据图像I2的第一场I2t来预测(其中“d”表示图像是虚图像而“d”之后的数字表示伪P图像相对于所有其它伪P图像的显示顺序,在此实例中,所述数字是“1”)。
此外,第一伪P图像Pd1的第二场Pd1b可以根据图像I2的第二场I2b预测。作为选择,第一伪P图像的场可以根据具有反奇偶性的图像I2的场来预测。随后的伪P图像Pd2的场Pd2t和Pd2b可以依照这些例子的任何一个、根据场Pd1t和Pd1b来预测,并且任何一个过程可以被重复以便预测随后的伪P图像。在图3B中示出了相对于第二伪P图像Pd2具有相同奇偶性的基于场的预测。上述的两个结构都表示基于场的预测方案的例子。
参见图3C,示出了基于场的预测的替代方式。作为一个例子,第一伪P图像Pd1的场Pd1t和Pd1b可以利用基于帧的预测、根据图像I2来预测。此外,每个随后的伪P图像可以利用基于帧的预测、根据先前的伪P图像来预测。在另一个结构中,可以利用基于场的预测来预测伪P图像的一部分,并且利用基于帧的预测来预测另一部分。
必须指出,不能将本发明就涉及步骤214和216的评述进行限制,也可以其它的过程来创建特技模式视频信号,并且其它预测方案也是可利用的。例如,由于仅仅执行了插入根据GOP中参考图像预测的伪P图像,所以不必重复所有原始图像来创建特技模式视频信号。在此例子中,可以插入足够的伪P图像以实现所要求的播放速度(这样做可以补偿重复原始图像的缺乏)。
返回参见图2,在另一个实施例中,多个原始图像的每个都可以包含显示指示符。如在判定框218处确定的,如果图像的显示指示符将被有选择地修改,那么多个原始图像的至少一部分的显示指示符在原始图像的重复或者伪P图像的插入之后、被有选择地修改,如步骤220所示。
值得注意的是,当重复原始图像或者将伪P图像插入到特技模式视频信号中时,修改这些显示指示符可以反映多个原始图像的预定的显示顺序。然而,应该理解的是,无论在特技模式期间是否插入伪P图像,都要执行此过程。由此,在仅仅重复图像而不将伪P图像插入到视频信号的传统特技模式期间,可以执行修改显示指示符的步骤。返回参见方法200,如果所述显示指示符是不允许修改的,那么在判定框222可以继续方法200。
在一种结构中,所述显示指示符可以是临时参考字段。所述临时参考字段通常是位于数字编码图像的图像首部的十位字段。当相对于其它视频信号中的图像来显示视频信号中的特定图像时,一些解码器依赖所述临时参考字段来确定。此字段通常具有整数值。
作为一个例子,再一次参考图3A,GOP 300包含十五个图像。GOP 300中的图像的下标编号可以对应于每个相应图像的临时参考字段的整数值。举例来说,图像B0的临时参考字段,即GOP 300中的第一图像可以具有整数值0。作为将要显示的下一个图像的图像B1的临时参考字段可以具有整数值1。由此,要被显示的每个随后图像的临时参考字段的整数值能够以1为单位来递增,一直到图像P14,图像P14的临时参考字段可以具有整数值14。为了方便起见,还可以将短语“临时参考字段的整数值”称为“整数值”。
当重复原始图像或者将伪P图像插入到特技模式视频信号中时,依照原始图像的临时参考字段的显示顺序不再有效。据此,可以修改位于所插入的伪P图像之后的原始图像的临时参考字段的整数值,以便呈现适当的显示顺序。
例如,如果将GOP 300中的图像I2发送到显示装置,并且同时发送三个对应的伪P图像(此操作依照1/4X慢运动播放),那么图像I2的临时参考字段的整数值(假定其是将要显示的GOP中的第三个图像)可以保持为2,可以将第一伪P图像的临时参考字段设置为整数值3,可以将第二伪P图像的临时参考字段设置为整数值4,并且将第三伪P图像的临时参考字段设置为整数值5。此外,待显示的下一个原始图像的临时参考字段、即B3可以从其原始整数值3修改为整数值6(B6)。此例子的最终结果在图3D中示出。
可以继续逐渐地提高原始图像的临时参考字段的整数值的此步骤,直到取消所述特技模式,以及修改最后一个特技模式GOP(受特技模式影响的最后一个GOP)中的最后一个图像的临时参考字段。一旦达到下一个GOP,新的GOP中的第一显示图像的临时参考字段的整数值可以是0。由此,每当将伪P图像插入到特技模式视频信号中时,跟随插入的伪P图像之后的每个原始图像的临时参考字段的整数值、可以经由所述特技模式GOP而被逐渐地增加1,以便反映预定的显示顺序。
临时参考字段的整数值可以具有最大值1,023。如果组成特技模式GOP的图像的临时参考字段的整数值(原始图像加伪P图像)达到此值,那么临时参考字段只可以绕回并且以0从头开始。作为一个例子,如果启动冻结特技模式,那么其中一个伪P图像或者其中一个原始图像的整数值可以最终达到1,023。一旦发生,待显示的下一个直接的伪P或者原始图像的临时参考字段的整数值可以设置为零。
当然,应该注意的是,在上述的任何一个实施例中,本发明不局限于使用临时参考字段,而是可以对所有其它适当的显示指示符进行修改,以反映预定的显示顺序。此外,所述绕回值决不限于1,023,而是可以使用其它适当的值。返回参见图2,在判定框222,无论所述特技模式是否继续,都可以进行确定。如果是这样的话,在步骤214可以继续方法200。不然的话,在步骤224可以恢复正常播放。
转向图4,方法400举例说明了在特技模式期间利用伪P图像的另一种方式。在步骤410,可以读取包含多个原始图像的视频信号。类似于方法200,这些原始图像可以是非逐行扫描图像、逐行扫描图像或者场图像。此方法400可以按照远程解码器结构来实现,但是不局限于此。在步骤412,可以接收诸如冻结特技模式命令或者慢运动特技模式命令的特技模式命令。在步骤414,可以有选择地重复至少一个原始图像,以便将视频信号转换为特技模式视频信号。在步骤416和418,如果要求的话,至少部分原始图像的显示指示符可以依照涉及方法200的步骤218和220的评述来修改。
在特技模式命令期间,可以监视特技模式视频信号的比特率,如步骤420所示。在特技模式期间、监视比特率是必须的,这是由于视频信号中的几个原始图像也许会被重复一次或多次,由此导致比特率提高。在某些情况下,这种提高的比特率可能会超过用于运输特技模式视频信号的传输通道的最大容许的比特率。对本发明来说,可以将传输通道的该最大容许的比特率称为预定阈值。
在判定框422,可以确定特技模式视频信号的比特率是否超过此预定阈值。如果比特率没有达到预定阈值、并且特技模式在判定框426处继续,那么方法400在判定框414继续。返回参见判定框422,如果比特率已经超过预定阈值,那么可以利用基于场的预测或者基于帧的预测、将一个或多个伪P图像插入到特技模式视频信号中,如步骤424所示。此外,这些伪P图像可以是非逐行扫描、逐行扫描或者场图像。
此插入步骤可以依照涉及方法200的步骤216的评述来进行。此外,如果原始图像是B图像,那么不必替换原始图像的副本或者重复。跟随步骤424,方法400可以在判定框416处继续,其中如果需要的话,伪P图像随后的原始图像显示指示符可以被修改。如果当在判定框426处确定时、特技模式将停止,然后可以恢复正常播放,如步骤428所示。然而,应该理解的是,可以在方法400中的任何其它适当的步骤处取消特技模式。
参见图5,示出了用于当将伪P图像插入到视频信号中时帮助消除摆动图像假象的方法500。像方法200和400一样,方法500可以依照远程解码器结构来实现,但是方法500还可以利用其它适当的系统来实现。在步骤510,可以读取包含多个原始图像的视频信号,并且在步骤512,可以接收特技模式命令。作为一个例子,特技模式命令可以是冻结特技模式命令。在步骤514,可以将一个或多个伪P图像插入到视频信号中,其中或者利用基于场的或者利用基于帧的预测来预测伪P图像。这些伪P图像可以是非逐行扫描、逐行扫描或者场图像。插入这些伪P图像可以将视频信号转换为特技模式视频信号。
在一种结构中,插入视频信号中的第一伪P图像可以利用基于场的预测、根据参考图像来预测,并且可以利用基于帧的预测来预测随后的伪P图像。具体来讲,可以根据与参考图像相关联的单个场来预测第一伪P图像。如下面将解释的那样,此特定的预测方案可以帮助控制摆动假象。参见图6,举例说明了诸如过程的例子。
在图6中,按照显示顺序示出了包含几个非逐行扫描图像和伪P图像的冻结特技模式GOP 600的部分。GOP 600中的图像上的下标编号反映图像的预定显示顺序。例如,如果接收了冻结特技模式命令,那么可以对诸如I2的参考图像执行冻结,其中I2可以包括场I2t和I2b。当然,可以对GOP中的所有其它适当的参考图像执行特技模式,所述图像包括任何P图像。所述参考图像可以是非逐行扫描、逐行扫描或者是场图像。
如果伪P图像是框图,即,伪P图像包含至少两个场,那么组成第一伪P框图的场可以根据参考图像的单个场来预测,所述参考图像在此实例中是图像I2。由此,如图6所示,第一伪P框图P3d的场——Pd3t和Pd3b可以根据图像I2的单个场来预测,诸如底部场I2b。在另一个结构中,场Pd3t和Pd3b可以根据顶端场I2t预测。
随后的伪P图像、从图像Pd4到图像Pdn(其中n表示给予最后插入的伪P图像的显示顺序编号),可以利用基于帧的预测进行预测。也就是说,跟随第一伪P框图的每个相继的伪P框图,可以利用基于帧的预测、根据先前的伪P框图来预测。例如,按照第一伪P框图的基于场的预测,第二伪P框图Pd4的场Pd4t和Pd4b可以利用基于帧的预测、根据第一伪P框图来预测。
然而,应该理解的是,随后的伪P图像也可以利用基于场的预测、根据先前的伪P图像来预测。此基于场的预测包括基于单个场的预测——像涉及第一伪P图像所描述的过程那样——以及结合图3B举例说明的基于场的预测方案。尽管如此,因为第一伪P框图利用单个场预测进行预测,所以第二伪P框图的场以及所有随后的伪P图像可以是场的副本,其中第一伪P框图根据所述场进行预测。
不过本发明决不局限于此特定的预测方案。基于单个场的预测可以帮助控制摆动图像假象,并且还有助于将特技模式视频信号的比特率保持在可接受的程度。具体来讲,当在特技模式期间使用伪P框图、根据参考图像的单个场来预测第一伪P框图的场,可以生成一显示,其中运动对象出现在将要显示的伪P框图的每个场的一个特定位置中。
也就是说,如果运动对象出现在用于预测第一伪P框图的参考图像中、并且第一伪P框图的场根据此参考图像的单个场进行预测的话,那么随后的伪P框图的每个场都将在相同的位置中包括运动对象,就像其位于单个参考场中那样。据此,当在特技模式期间显示伪P框图之时,运动对象看起来不会摆动。
返回参见图5的方法500,在判定框516,它可以确定用于预测第一伪P图像的参考图像是否是GOP中的最后一个原始图像。如果是,那么方法500可以在步骤522结束。返回参见图6,图像P14是GOP中最后一个原始图像的例子。再一次回到图5,如果参考图像不是GOP中最后一个原始图像,那么可以跳过最后插入的伪P图像之后的所有剩余原始图像,如步骤518所示。
因为第一伪P图像可以根据参考图像的单个场来预测,所以第一伪P图像和每个随后的伪P图像将根据不完整的原始图像来预测。如果根据最后插入的伪P图像预测到有原始图像的话,那么原始图像可能具有劣质的显示质量。然而,不根据最后插入的伪P图像预测所有原始图像的话,一旦恢复正常播放,视频信号的显示质量不会遭受基于单个场的预测的影响。
作为一个例子,如图6所示,最后插入的伪P图像Pdn之后的所有原始图像都可以跳过。在此例子中,原始图像B3(此刻标记为图像B(n+1))至P14(此刻标记为P(n+12))可以跳过,并且在下一个GOP恢复视频信号的正常播放。如果对GOP 600中的最后一个原始图像启动冻结特技模式,那么往往不需要跳过过程,其通常可能是原始GOP(在图3中被重现的例子)中的图像P14(此刻标记为图像P(n+12))。
作为步骤518的替代,如果将对GOP中不是最后一个原始图像的参考图像启动特技模式,那么可以延迟特技模式的启动,从而对GOP中的最后一个原始图像开始操作。例如,如果最初意欲从图6中GOP 600的参考图像I2开始冻结特技模式,那么可以延迟特技模式的启动,以便它将起始于作为GOP600中的最后一个原始图像的图像P14(或者P(n+12))。
在步骤518的又一个替代方式中(其中对原始GOP中不是最后一个原始图像的参考图像启动特技模式),一旦停止特技模式并且恢复正常播放,原始的GOP就可以被传输以便以正常播放速度解码并且显示。术语“原始的GOP”可以指的是包含原始图像而非伪P图像、重复的原始图像或者跳过的原始图像的GOP。
返回参见图3A,GOP 300可以是原始的GOP。考虑以下例子:假定对GOP300的参考图像P8启动冻结特技模式,并且使用基于单个场的预测来预测第一插入伪P图像。鉴于单个场预测并且如早先解释的那样,最后一个插入的伪P图像之后的原始图像可能遇到预测问题。
依照本发明的结构,一旦停止冻结特技模式,可以向解码器传输GOP 300(原始的GOP)以便解码并且最终显示。也就是说,跟随冻结特技模式的结束,GOP 300中的每个原始图像(而不是插入的伪P图像)可以被传输、解码并且显示。本发明不局限于此特定的例子,而是可以采用其它适当的特技模式,并且可以对GOP 300中的所有其它适当的参考图像启动特技模式。返回参见图5,方法500可以在步骤522结束。
虽然已经结合在此公开的实施例描述了本发明,但是应该理解的是,上述描述是用来举例说明的,而非限制本发明的范围,本发明的范围由权利要求书定义。