减少3D噪声的可见度.pdf

上传人:1** 文档编号:4336731 上传时间:2018-09-14 格式:PDF 页数:23 大小:944.36KB
返回 下载 相关 举报
摘要
申请专利号:

CN201180016944.2

申请日:

2011.03.31

公开号:

CN102823261A

公开日:

2012.12.12

当前法律状态:

终止

有效性:

无权

法律详情:

专利权的视为放弃IPC(主分类):H04N 19/597放弃生效日:20160224|||实质审查的生效IPC(主分类):H04N 13/00申请日:20110331|||公开

IPC分类号:

H04N13/00; H04N7/26

主分类号:

H04N13/00

申请人:

皇家飞利浦电子股份有限公司

发明人:

R.B.M.克莱恩冈內维克; W.H.A.布鲁斯

地址:

荷兰艾恩德霍芬

优先权:

2010.04.06 EP 10159104.8

专利代理机构:

中国专利代理(香港)有限公司 72001

代理人:

刘鹏;汪扬

PDF下载: PDF下载
内容摘要

提供了一种用于处理三维[3D]视频信号以避免在显示在3D显示器(63)上期间的视觉干扰的3D视频装置(40,50)。3D视频信号包括用于产生3D效果的左视图和右视图。本发明涉及认识和解决所谓的脏窗效应,即在两个视图中的噪声之间的相关性导致3D噪声在特定深度处被感知的问题。视频处理器(42,52,53)被布置用于依赖于因所述视图之间的编码噪声的相关性而在3D视频数据的显示期间所预期的至少一个视觉干扰量来处理3D视频数据,以减少编码噪声的所述相关性。该装置具有传送装置(46,55),其用于传送经处理的3D视频数据以显示在3D显示器上。另外,提供了一种3D视频信号(41)和一种记录载体。

权利要求书

1.一种处理三维[3D]视频信号以避免在显示在3D显示器上期间的视觉干扰的方法,所述方法包括:-接收代表3D视频数据的3D视频信号(41,43),所述3D视频数据包括将对观察者的分别的眼睛显示的用于产生3D效果的至少左视图和右视图,-依赖于在将所述3D 视频数据显示在3D显示器(63)上期间所预期的因所述视图之间的编码噪声的相关性而产生的至少一个视觉干扰量来处理所述3D视频数据,以减少编码噪声的相关性,以及-传送经处理的3D视频数据以显示在所述3D显示器上。2.如权利要求1中所述的方法,其中所述方法包括:-根据基于视频数据块和用于所述块的编码参数的变换来对所述3D视频数据进行编码的步骤,以及-针对至少一个分别的块确定所预期的至少一个视觉干扰量的步骤,以及-所述处理步骤包括:依赖于如针对所述分别的块所确定的量来对用于所述分别的块的编码参数进行调节。3.如权利要求1中所述的方法,其中所述方法包括:-对所述3D视频数据进行解码的步骤,以及-所述处理步骤包括:在所述解码之后,将抖动噪声增加至所述视图的至少一个以减少所述相关性。4.如权利要求1中所述的方法,其中所述方法包括:产生指示所述至少一个量的3D噪声元数据,并且传送步骤包括:将所述3D噪声元数据(33)包括在3D视频信号中以传送到3D视频装置以在所述3D视频装置中根据所述3D噪声元数据来启用处理,以减少所述编码噪声的相关性。5.如权利要求4中所述的方法,其中所述方法包括制造记录载体的步骤,所述记录载体(54)设置有代表具有所述3D噪声元数据的3D视频信号的标记的轨道。6.如权利要求1中所述的方法,其中所述方法包括:-从所述3D视频信号检索3D噪声元数据,所述3D噪声元数据指示所述至少一个量,并且所述处理步骤包括:-根据所述3D噪声元数据对所述3D视频数据进行处理以减少所述编码噪声的相关性。7.一种用于处理三维[3D]视频信号以避免在显示在3D显示器上期间的视觉干扰的3D视频装置(40,50),所述装置包括:-输入装置(47,51,58,59),其用于接收代表3D视频数据的3D视频信号,所述3D视频数据包括将针对观察者的分别的眼睛显示的用于产生3D效果的至少左视图和右视图;-视频处理器(42,52,53),其被布置用于依赖于在将所述3D视频数据显示在3D显示器上期间所预期的因所述视图之间的编码噪声的相关性而产生的至少一个视觉干扰量来处理所述3D视频数据,以减少所述编码噪声的相关性;以及-传送装置(46,55),其用于传送经处理的3D视频数据以显示在所述3D显示器上。8.如权利要求7中所述的3D视频装置(40),其中所述装置包括:-编码器(48),其用于根据基于视频数据块和用于所述块的编码参数的变换来对所述3D视频数据进行编码;以及-视频处理器(42),其被布置:用于针对至少一个分别的块确定所预期的所述至少一个视觉干扰量;以及-用于在所述处理中,依赖于如针对所述分别的块所确定的量来对所述分别的块的编码参数进行调节。9.如权利要求7中所示的3D视频装置(50),其中所述装置包括用于对所述3D视频数据进行解码的解码器 (21) ,并且所述视频处理器(52)被布置用于:在所述解码之后,将抖动噪声(24,25)增加至所述视图的至少一个以减少所述相关性。10.如权利要求9中所述的3D视频装置(50),其中所述视频处理器(52)被布置用于:在所述解码之后,仅对用于所述观察者的非主导眼的视图(L)增加抖动噪声 (24) 。11.如权利要求7中所述的3D视频装置(50),其中所述视频处理器(53)被布置:-用于从所述3D视频信号(41)检索3D噪声元数据,所述3D噪声元数据指示所述至少一个量;以及-用于通过依赖于所述3D噪声元数据来处理所述3D视频数据的所述处理以减少所述相关性。12.如权利要求7或11中所述的3D视频装置(50),其中所述输入装置包括用于读取记录载体以检索所述3D视频信号的装置(58)。13.一种3D视频信号,所述3D视频信号包括3D视频数据,所述3D视频数据包括:至少左视图和右视图,所述左视图和右视图将针对观察者的分别的眼睛显示,用于产生3D效果;以及3D噪声元数据(33),其指示在将所述3D视频数据显示在3D显示器上期间所预期的因所述视图之间的编码噪声的相关性而产生的至少一个视觉干扰量,所述信号用于将3D视频数据传送到3D视频装置以在该3D视频装置中根据3D噪声元数据来启用对该3D视频数据的处理以减少所述编码噪声的相关性。14.一种包括如权利要求13中所述的3D视频信号的记录载体(54)。15.一种用于处理三维[3D]视频信号以避免在显示在3D显示器上期间的视觉干扰的计算机程序产品,该程序可运行以使得处理器执行如权利要求1至6中任一项所述的方法的分别的步骤。

说明书

减少3D噪声的可见度

技术领域

本发明涉及一种处理三维[3D]视频信号用于避免在显示在3D显示器上期间的视觉干扰的方法,该方法包括:接收代表3D视频数据的3D视频信号,该3D视频数据包括将对观察者的分别的眼睛显示的用于产生3D效果的至少左视图和右视图。

本发明进一步涉及3D视频装置、3D视频信号、记录载体和计算机程序产品。

本发明涉及处理3D视频数据以通过减少3D噪声的可见度来改进在3D显示装置上的呈现的领域。

背景技术

来自娱乐行业的快速增长的数量的产品针对3D影院。这些产品使用双视图的格式(two-view format)(将对观察者的分别的眼睛显示的用于产生3D效果的左视图和右视图),主要旨在用于眼戴(eye-wear)辅助观察。存在将这些3D产品从行业带回家的兴趣。目前,用于经由诸如蓝光光盘(BD)的光学记录载体来分配立体内容的第一标准处于其最终状态。存在将3D内容从广播行业带回家的兴趣。当然在早期将被使用的格式将是常用的立体格式。

用于产生2D视频数据的装置是已知的,例如视频服务器、广播装置、或创作装置。目前,用于提供3D图像数据的类似的3D视频装置是可用的,并且用于呈现3D视频数据的补充的3D视频装置被提出,像用于光盘的播放器或呈现收到的3D视频信号的机顶盒。3D视频装置可以联接到像电视机的显示装置或用于经由适当的接口(优选地像HDMI的高速数字接口)传送3D视频数据的监视器。3D显示器也可以与3D视频装置集成,例如具有接收部和3D显示器的电视机(TV)。

IEEE0-7803-8834-8/05第6082-6085页,由Li-Fu Ding等人所著的文件“Stereo Video Coding System Coding System with Hybrid Coding based on Joint Prediction Scheme”描述了用于具有左视图和右视图的3D视频数据的编码方案的示例。3D内容的另一个示例是具有多个右眼视图和左眼视图的立体内容。编码被布置用于依赖性地基于独立地对如该文件的图1和图2中所示的另一个视图编码来对一个视图(例如,右视图)进行编码。在所需的比特率因在两个视图中使用冗余(redundancy)而减小的意义上,所描述的编码方案以及类似的编码技术是有效的。

发明内容

为了将以上立体内容带到家,3D视频数据将根据预先定义的格式来压缩。由于在广播信道上以及从更小的范围来讲在BD上的资源是有限的,所以将应用高压缩因子。由于相对高的压缩率,所以各种伪像和其它干扰可能发生,在该文件中进一步被称为编码噪声。

本发明的一个目的是提供视频处理用于减少因在显示在3D显示器上期间的编码噪声而产生的视觉干扰。

为了这个目,根据本发明的第一方面,如在开头段落中所描述的方法包括:

-依赖于在将3D视频数据显示在3D显示器(63)上期间所预期的因所述视图之间的编码噪声的相关性而产生的至少一个视觉干扰量来处理3D视频数据,以减少编码噪声的相关性,以及

-传送经处理的3D视频数据以显示在3D显示器上。

为了这个目的,根据本发明的第二方面,用于处理3D视频信号以避免在显示在3D显示器上期间的视觉干扰的3D视频装置包括:输入装置,其用于接收代表3D视频数据的3D视频信号,该3D视频数据包括将针对观察者的分别的眼睛显示的用于产生3D效果的至少左视图和右视图;视频处理器,其被布置用于依赖于在将3D视频数据显示在3D显示器上期间所预期的因所述视图之间的编码噪声的相关性而产生的至少一个视觉干扰量来处理3D视频数据,以减少编码噪声的相关性;以及传送装置,其用于传送经处理的3D视频数据以显示在3D显示器上。

为了这个目,根据本发明的另外方面,3D视频信号包括3D视频数据,该3D视频数据包括:将针对观察者的分别的眼睛显示的用于产生3D效果的至少左视图和右视图;以及3D噪声元数据,所述3D噪声元数据指示在将3D视频数据显示在3D显示器上期间所预期的因所述视图之间的编码噪声的相关性而产生的至少一个视觉干扰量,所述信号是用于将3D视频数据传送到3D视频装置以在该3D视频装置中根据3D噪声元数据来启用对3D视频数据的处理以减少编码噪声的所述相关性。

当为观察者显示在3D显示器上时,该措施具有减少在左视图和右视图中的编码噪声的相关性的效果。在两个视图中的噪声之间的相关性导致噪声被感知为例如位于特定深度处的污迹或其它干扰。有利地,由于减少了相关性,所以任何这样的干扰对于在3D显示器处的观察者来说将是不太可见并且不太恼人的。

本发明还基于下列认识。现有技术文件描述了非独立地对两个视图编码。对视图的依赖编码(dependent coding)通常被用于3D视频数据。由于在3D数据信道上的资源受到限制,所以相对高的即尽可能高的压缩因子将被应用,而没有根据3D视频数据的源或作者的质量准则的过于可见的编码噪声。因此,实际上,将存在一些编码噪声。本发明人已经观察到,在立体编码中的编码伪像将在特定的深度处被感知,其中它们被称为脏窗(dirty window)效应。该效应因在两个视图中相关的编码噪声而产生。实际上,立体内容似乎是通过脏窗被观察,因为场景中伪像的遮蔽物(veil)在的对象的前面浮动或甚至常常向前缩进(indenting forward)对象,即在单个感知的深度位置处浮动。所述脏窗的深度位置等于在左右视图中具有相同位置的对象的深度位置,即通常在屏幕深处。如果视图已经被沿水平方向移位,例如用于补偿屏幕尺寸效应或观察者距离(被称为基线移位),则脏窗也将在深度方向移位,但是在不同的深度位置处保持可见。

将典型地用于3D视频数据的压缩方法是基于块的。块网格和块对准将针对两个视图被固定。虽然可以对左右视图独立地编码以实现更佳的编码效率,但是,联合编码(joint coding)方法是常用的。联合编码方法试图利用左右视图之间的相关性。为了获得较高的压缩因子,可以对存在于两个图像中的信息仅编码一次,可以使用空间关系和/或时间关系对信息编码,和/或从视频信号移除在单独的图像中不太可能由观察者感知的信息(基于感知的编码)。信息的移除,即,有损编码,引入编码噪声,尤其是当高压缩因子被应用时。该编码噪声可以是可见的,因为伪像的范围从蚊状噪声到成块伪像(blocking artifact)。对于基于块的压缩方案,编码噪声典型地与由压缩方法使用的块结构相关。

本发明人已经看到,虽然诸如蚊状噪声的编码伪像在单独的2D图像中可能几乎是不可见的,但是当立体对(stereo pair)的左右图像以组合的形式被观察时,这样的伪像可以变得可见。在体视学上,对每只眼应用不同的图像,分别的图像中的差别有效地对深度信息进行编码。为了确定深度,当时,人视觉系统将左视图中的对象和在右视图中的对应的对象的水平偏移(即,视差)解释为提供对象的深度的指示。就人视觉系统本身而言,我们将针对左、右视图中的所有对象来解释视差并且基于所述视差来推导场景的深度排序/深度印象。然而,人视觉系统将针对实际图像中的对象以及针对因编码噪声而产生的伪像都这样做。

通常,编码噪声与在编码时使用过的块结构相互关联。一般而言,该块结构针对左视图和右视图图像固定在同一位置处。当编码伪像在块边界处例如在成块的情况下发生时,这些成块伪像在左、右图像中的同一位置处将是可见的。因此,编码噪声在零视差即在屏幕深度处将是可见的。当应用左右之间的基线移位时,脏窗将并排地移动,但是将保持可见。

实际上,这样的伪像对于观察者显得是一个人通过脏窗看到场景。当使用了联合编码方法时,编码噪声将固有地相关联。不幸地知道,脏窗效应会引起看到脏窗效应,并且由其而分心。

如以上所解释的,脏窗问题起因于左右视图之间的相互关联的编码噪声。因此,解决该问题的措施涉及要么避免、要么减少在编码侧的相关性,或对在解码侧的相互关联的编码噪声进行去相关。存在各种方式来减少两个视图中的3D噪声或对其去相关,如在下列实施例中所描述的。

在一实施例中,该方法包括:根据基于视频数据块和所述块的编码参数的变换来对3D视频数据进行编码的步骤;以及针对至少一个分别的块确定所预期的至少一个视觉干扰量的步骤,并且所述处理步骤包括依赖于如针对分别的块所确定的量来对分别的块的编码参数进行调节。

在一实施例中,该装置包括解码器,该解码器根据基于视频数据块和所述块的编码参数的变换来对3D视频数据进行编码;并且视频处理器被布置:用于针对至少一个分别的块确定所预期的至少一个视觉干扰量,以及用于在所述处理中,依赖于如针对分别的块所确定的量来对分别的块的编码参数进行调节。

效果是,依赖于在显示期间所预期的视觉干扰量,编码是受到控制的。该量以及预期的3D噪声的可见度可以基于在块中的3D视频数据的内容,例如复杂图像和/或大量移动或深度差。在这样的块中,任何编码噪声将较不可见。另一方面,在相对安静的场景中,编码噪声可能更恼人。另外,如果在分别的块中的深度很大(即,在脏窗后面的大量空间),则视觉干扰量因具有大量空间在其后面的脏窗的高可见度而很高。随后,如果该量很高,则编码参数可以被调整以例如通过局部地增加可用比特率来减少在这样的块中的编码噪声,从而减少所述相关性。有利地,在减少脏窗效应将最明显的那些块中的脏窗效应的同时,总比特率可以被更有效地使用。

在一实施例中,该方法包括对3D视频数据进行解码的步骤,所述处理步骤包括:在所述解码之后,对视图中的至少一个增加抖动噪声(dithering noise)以减少所述相关性。

在一实施例中,该装置包括用于对3D视频数据进行解码的解码器,并且视频处理器被布置用于:在所述解码之后,对视图中的至少一个增加抖动噪声以减少所述相关性。

抖动噪声基于在显示期间所预期的视觉干扰量而增加。效果是,虽然噪声的总量稍微增加,但是相关性减少。抖动噪声可以增加到左和/或右视图。实验表明,将抖动噪声增加到左或右视图足以对编码噪声去相关,并且提供最佳的图像品质。

在一实施例中,视频处理器被布置用于在所述解码之后,仅对用于观察者的非主导眼的视图增加抖动噪声。本发明者已经注意到,实际上感知的噪声取决于增加了噪声的特定视图。看起来抖动噪声可以最佳地被施加到非主导眼,该非主导眼对于大数人来说是左眼。实际上,该装置可以具有用以确定哪只眼是主导眼的用户设置和/或测试模式。

在该方法的一实施例中,该方法包括:产生指示该至少一个量的3D噪声元数据,并且所述传送步骤包括:将3D噪声元数据包括在3D视频信号中以传送到3D视频装置,以在该3D视频装置中根据3D噪声元数据来启用处理,以减少编码噪声的所述相关性。效果是,附加的3D噪声元数据在要在呈现侧使用的源处产生。例如,噪声元数据是基于编码知识,诸如已经在编码期间被使用的量化步骤。3D噪声元数据被传送至解码侧,其中它被应用用于据根据3D噪声元数据处理3D视频数据以减少编码噪声的所述相关性。例如,当3D噪声元数据指示在图像的块中的噪声级时,在解码期间增加到每个块的抖动噪声基于噪声元数据来确定。有利地,编码噪声的预期发生的数据在3D视频数据的源处产生,即,在丰富的处理资源可用的情况下仅产生一次。因此,在解码器侧例如在消费者场所(consumer premises)的处理,可以相对便宜。

在该方法的一实施例中,该方法包括:从3D视频信号检索3D噪声元数据,该3D噪声元数据指示至少一个量,所述处理步骤包括:根据3D噪声元数据处理3D视频数据以减少编码噪声的所述相关性。

在一实施例中,视频处理器被布置:用于从3D视频信号检索3D噪声元数据,该3D噪声元数据指示至少一个量;以及用于通过依赖于3D噪声元数据来处理3D视频数据的所述处理以减少所述相关性。在进一步的实施例中,该装置包括解码器,该解码器被布置用于根据基于视频数据块和用于所述块的解码参数的变换来对3D视频数据进行解码,并且视频处理器被布置用于依赖于3D噪声元数据来对块中的至少一个增加抖动噪声以减少所述相关性。

效果是,如上所述所产生的3D噪声元数据利用3D视频信号接收,并且随后被检索并且被用来控制对3D视频数据的处理以减少所述相关性。有利地,预期的干扰量在脱机的情况下(即,在源侧)被确定。在该进一步的实施例中,抖动噪声的量依赖于3D噪声元数据而针对分别的块受到控制,从而减少在图像的将是最恼人的部分中的视觉干扰。

在一实施例中,3D视频信号被包括在记录载体中,例如被嵌入在轨道中的光学可读标记的图案中。效果是,可用数据存储空间被更有效地使用。

该方法的进一步优选的实施例,根据本发明的3D装置和信号在所附权利要求中被给出,其公开内容通过引用并入此处。

附图说明

本发明这些和其它方面将从进一步参照在下列描述中通过举例并且参照附图所描述的实施例变得明显并且据此来阐明,在附图中,

图1示出用于处理在显示诸如视频、图形或其它视觉信息的3D图像数据的系统中的3D视频数据的装置,

图2示出用于减少视图之间的相关性的3D视频处理器,

图3示出在私人用户数据SEI消息中的3D噪声元数据,

图4示出用于在3D视频信号中的3D噪声元数据的数据结构,

图5示出3D视频数据,

图6示出具有3D噪声的3D视频数据,

图7A、图7B、图7C和图7D示出具有3D噪声的3D视频数据的分别的细节,以及

图8示出3D噪声的示意示例。

在图中,对应于已经描述的元件的元件具有相同的附图标记。

具体实施方式

注意到,本发明可以被用于基于用于观察者的分别的左眼和右眼的多个图像(视图)的任何类型的3D视频数据。3D视频数据被假定为如电子、数字编码的数据般可用的。本发明涉及这样的图像数据和对在数字领域中的图像数据的处理。

存在3D视频数据可以被格式化并且被传送的许多不同的方式,称为3D视频格式。一些格式是基于使用2D信道以同样携带立体信息。例如,左视图和右视图可以被交错或可以被并排以及上下放置。这些方法牺牲分辨率来携带立体信息。

图1示出用于处理在显示诸如视频、图形或其它视觉信息的3D图像数据的系统中的三维(3D)视频数据的装置。被称为3D源的第一3D视频装置40对被称为3D播放器的另外的3D视频装置50提供和传送3D视频信号41,所述另外的3D视频装置50被联接到用于传送3D 显示信号56的3D显示装置60。

图1进一步示出作为3D视频信号的载体的记录载体54。该记录载体是盘形并且具有轨道和中心孔。轨道由物理可检测的标记的图案组成,其布置成与组成在一个或多个信息层上的基本上平行轨道的圈的螺旋形的或同心的图案相一致。记录载体可以是光学可读的,称为光盘,例如CD、DVD或BD(蓝光光盘)。信息通过沿着轨道例如凹区和凸区的光学地可检测的标记而体现在信息层上。轨道结构还包括位置信息例如数据头和地址,用于指示通常被称为信息块的信息单元的定位。记录载体54携带代表数字编码的3D图像数据像视频的信息,例如根据MPEG2或MPEG4编码系统以像DVD或BD格式的预先定义的记录格式编码的。

3D源具有处理单元42用于处理经由输入单元47收到的3D视频数据。输入3D视频数据43可以从存储系统、录音室、从3D摄影机等获得。视频处理器42生成包括3D视频数据的3D视频信号41。该源可以被布置用于将3D视频信号从视频处理器经由输出单元46并且传送至另外的3D视频装置,或用于例如经由记录载体提供用于分配的3D视频信号。3D视频信号基于例如通过经由解码器48根据预先定义的格式对3D视频数据进行编码和格式化来处理输入3D视频数据43。

用于处理3D视频数据的处理器42被布置用于:确定在将3D视频数据显示在3D显示器的期间预期的因在所述视图之间的编码噪声的相关性而引起的视觉干扰量,并且依赖于如针对减少编码噪声的所述相关性所确定的量来启用对3D视频数据的处理。处理器可以被布置:用于确定指示当3D视频数据被显示时在其中产生的干扰的3D噪声元数据;以及用于将3D噪声元数据包括在3D视频信号中。下面进一步详细地描述处理的实施例。

3D源可以是服务器、广播装置、记录装置、或用于制造像蓝光光盘的光学记录载体的创作系统和/或生产系统。蓝光光盘提供交互式平台用于为内容创作者分配视频。关于蓝光光盘格式的信息可从蓝光光盘协会的网站以视听应用格式的论文中获得,例如http://www.blu-raydisc.com/Assets/Downloadablefile/2b_bdrom_audiovisualapplication_0305-12955-15269.pdf。光学记录载体的生产过程进一步包括:在轨道中提供标记的物理图案,所述图案体现可以包括3D噪声元数据的3D视频信号,并且随后根据图案使记录载体的材料成形以在至少一个存储层上提供标记的轨道。

3D播放器装置具有用于接收3D视频信号41的输入单元51。例如,装置可以包括光盘单元58,该光盘单元58联接到输入单元,用于从像DVD或蓝光光盘的光学记录载体54检索3D视频信息。可替代地(或附加地),3D播放器装置可以包括用于联接到例如因特网或广播网络的网络45的网络接口单元59,这样的装置通常被称为机顶盒。3D视频信号可以从如由3D源40指示的远程网站或媒体服务器被检索到。3D播放器也可以是卫星接收器、或媒体播放器。

3D播放器装置具有处理单元52,该处理单元52联接到输入单元51,用于处理3D信息用于产生将被经由输出接口单元55传送到显示装置的3D显示信号56,例如根据HDMI标准的显示信号,参见“高清晰度多媒体接口;2006年11月10日的规范版本1.3a”,其可在http://hdmi.org/manufacturer/specification.aspx获得。处理单元52被布置用于产生被包括在用于显示在显示装置60上的3D显示信号56中的图像数据。

播放器装置可以具有用于处理3D视频数据的另外的处理单元53,该处理单元53被布置用于:确定指示当3D视频数据被显示时在3D视频数据中产生的干扰的3D噪声元数据。另外的处理单元53可以联接到输入单元51,用于检索来自3D视频信号的3D噪声元数据,并且联接到处理单元52,用于控制如下所述的对3D视频的处理。3D噪声元数据也可以经由独立的信道获取,或可以基于处理3D视频数据而局部地产生。

3D显示装置60用于显示3D图像数据。该装置具有输入接口单元61用于接收从3D播放器50传送的包括3D视频数据的3D显示信号56。传送的3D视频数据在处理单元62中被处理用于在例如双或透镜状LCD的3D显示器63上显示。显示装置60可以是任何类型的立体显示器,也被称为3D显示器,并且具有由箭头64指示的显示深度范围。

在3D视频装置中的视频处理器,即在3D视频装置50中的处理器单元52、53,被布置用于执行下列功能:用于处理3D视频信号以避免在显示在3D显示器上期间的视觉干扰。3D视频信号由输入装置51、58、59接收。3D视频信号包括以数字编码的压缩格式的3D视频数据。3D视频信号代表包括至少将对观察者的分别的眼睛显示用于产生3D效果的左视图和右视图。视频处理器可以被布置用于确定在将3D视频数据显示在3D显示器上期间所预期的因在所述视图之间的编码噪声的相关性而产生的视频干扰量。视频处理器被布置用于依赖于用于减少编码噪声的所述相关性的量来处理3D视频数据。下面讨论用于减少或避免所述相关性的各种技术。所述量也可以由观察者在播放器处或由作者在源处预先设置为预定的(例如针对特定信道或媒体源)、估计的(例如基于介质或数据信道的总比特率)、或固定的(例如在压缩速率将总是很低的低端应用中)。最后,经处理的3D视频数据被联接到诸如输出接口单元55的传送装置,用于传送经处理的3D视频数据以显示在3D显示器上。

在一实施例中,该量基于压缩率、比特率和/或3D视频信号的分辨率来导出。例如,量化水平可以被监测(Q-监测)。在更多基本实施例中,确定该量可以基于预定的阈值比特率或基于用户设置。此外,该量可以基于依赖于视频内容例如依赖于图像的复杂性和/或移动量或深度差来计算3D噪声的可见度而确定。深度可以源自于来自深度图(如果可用)的视差估计(其针对该目的可能是相当粗糙的)。在复杂图像中,任何编码噪声将不太可见。另一方面,在相当安静的场景中,编码噪声可能更加恼人。另外,如果在图像中的深度很大(即,在所谓的脏窗后面的大量空间),则视觉干扰量因具有大量空间在其后面的脏窗的高可见度而很高。实际上,图片中的复杂性或纹理可以源自于视频信号中的高频成分、和图片中的(平均)深度、或其的区域或块,可以基于视差估计或其它深度参数来监测。此外,该量可以针对整个图像、或针对几个区域(例如,用于容纳具有更大深度的上部的上部和下部)、或针对(要么预定的,要么基于根据预期的3D噪声的可见度细分图片而动态地分配的)更大量的块来确定。此外,指示所述量的去相关性(de-correlation)图案可以由解码器或基于已编码的信号的特性来提供,该图案可以在解码期间或在解码之后被使用以控制该方式和/或去相关性的量。

减少两个图像之间的相关性可以在编码、解码期间或在对图像解码之后以各种方式执行。就这点而论,各种用于控制相关性的技术在视频处理领域中是已知的。在编码期间,编码参数可以被调整以减少两个视图之间的伪像和噪声的相关性。例如,量化可以临时地或局部地受到控制,和/或总体比特率可以是多变的。在解码期间,可以应用各种滤波技术,或可以调整参数。例如,去成块(de-blocking)滤波器可以被插入和/或被调整以减少因基于块的压缩方案而发生的伪像。去成块或进一步的滤波可以仅针对非独立编码的视图或有区别地针对非独立编码的视图被调用。

在一实施例中,依赖于如针对减少编码噪声的所述相关性而确定的量来处理3D视频数据通过调节以上提及的用于基于该量控制相关性的技术来执行。例如,该量可以是针对分别的3D视频源或3D视频程序的固定设置。固定的设置可以由用户基于个人喜好输入或调整,诸如针对特定视频源、视频程序、TV频道、记录载体的类型的用于“减少3D噪声”的设置,或针对3D视频处理装置的一般设置。该量也可以例如基于3D视频数据的总比特率、质量和/或分辨率而动态地确定。

在一实施例中,3D视频装置是源装置40并且包括在处理器单元42中的解码器用于根据基于视频数据块和所述块的编码参数的变换来对3D视频数据进行编码。一般而言,压缩可以使用无损技术和有损技术来执行。无损技术典型地依赖于熵编码;然而,利用无损压缩的可行的压缩增益仅取决于源信号的熵。因此,可实现的压缩率对于消费应用是典型地不充分的。因此,有损压缩技术已经被开发,其中输入视频流被分析并且信息被这样编码,使得如由观察者感知的信息丢失被保持到最小;即,使用所谓的基于感知的编码。

大多数常见的视频压缩方案包括无损编码和有损编码的混合。许多的这样的方案分别包括诸如信号分析、量化和可变长度编码的步骤。可以应用范围从离散余弦变换(DCT)、矢量量化(VQ)、分形压缩到离散小波变换(DWT)的各种压缩技术。

基于离散余弦变换的压缩是有损压缩算法,该算法每隔一定间隔对图像采样,分析样品中存在的频率成分,并且丢弃那些当人眼感知它时不影响图像的频率。基于DCT的压缩形成诸如JPEG、MPEG、H.261、和H.263等标准的基础。

视频处理器42被布置用于通过针对至少一个分别的块确定所预期的至少一个视觉干扰量来确定视觉干扰量。3D噪声可以由因所使用的压缩类型而产生的伪像所导致,所述压缩类型诸如针对在3D图片中的块所执行的DCT。随后,在所述处理中,视频处理器依赖于如针对所述分别的块所确定的量来针对所述分别的块或区域调整编码参数。例如,当高的量被确定用于块时,量化被调整。替代地,或附加地,可以将诸如块的编码网格与动态地改变的偏移一起使用以避免在相同的位置发生伪像。此外,可控去成块滤波器可以在编码器中被使用。如在介绍部分中所描述的,对非独立的右视图编码可以基于独立编码的左视图。当针对特定影像或3D图像数据的周期确定高的量时,可以临时地设置不太非独立的编码模式,例如取决于其它视图,在所述联合预测方案中使用I图片代替P图片。

在一实施例中,依赖于两个视图的共同背景,视图中的至少一个在编码之前被相对于在编码中使用的网络而移位。视图中的一个或两个按照移位参数水平地移位,直到网格在两个视图中相对于背景具有基本上相同的位置为止。在解码之后,(一个或多个)视图的按照移位参数的互补的相反移位必须被应用。移位参数可以用3D视频信号传送,所述3D视频信号例如作为如在下文参照图3和图4阐述的3D噪声元数据。有效地,3D噪声将被移到背景的深度位置,并且因此对观察者来说是不太烦扰的。移位可以每个帧地、或针对一组图片、针对在关键帧之间的视频片断、针对场景、或针对更大的部分或视频程序来确定。移位也可以被预设到如下值:该值总是移动3D噪声到屏幕后的大距离,例如无穷大。

该量以及预期的3D噪声的可见度可以进一步基于在块中的3D视频数据的内容,例如复杂图像内容和/或大量移动或深度差。在这样的块中,任何编码噪声将是不太可见的。另一方面,在相当安静的场景中,编码噪声可能更恼人。另外,如果在分别的块中的深度很大(即,在脏窗后面的大量空间),则视觉干扰量因具有大量空间在其后面的脏窗的高可见度而很高。随后,如果该量很高,编码参数可以被调整以例如通过局部地增加可用的比特率来减少在这样的块中的编码噪声,从而减少所述相关性。

在一实施例中, 3D视频装置是播放器装置50,并且视频处理器52包括用于对3D视频数据解码的解码器。处理器52被布置用于在所述解码之后对视图中的至少一个增加抖动噪声以减少所述相关性。

图2示出用于减少视图之间的相关性的3D视频处理器。输入端26对解码器21提供3D视频信号,该解码器21生成左视图L和右视图R。联接到解码器21的检测器22被布置用于:例如基于来自解码器的3D视频信号的解码参数来确定所预期的所述视觉干扰量。检测器联接到抖动噪声发生器23用于可控制地产生一些将被增加到视图的抖动噪声。噪声通过加法器24增加到视图L用于产生经处理的视频数据左视图L’。噪声通过加法器25增加到视图R用于产生经处理的视频数据左视图R’。抖动噪声能够增加到左视图L和/或右视图R。实验表明,对左或右视图增加抖动噪声足以对编码噪声去相关,并且提供最佳的图像品质。

如受到检测器22控制的抖动噪声的量可以基于预设置或在显示期间所预期的预定的视觉干扰量来固定。该量也可以动态地确定,类似于上述在编码器侧的所述确定,要么针对整个图像、要么针对图像的一部分或针对块。抖动噪声可以基于如所确定的量相应地增加到图像的区域的分别的周期。

在3D视频装置的进一步的实施例中,视频处理器被布置用于在所述解码之后,仅对用于观察者的非主导眼的视图增加抖动噪声。看起来抖动噪声可以最佳地被施加到非主导眼,该非主导眼对于大数人来说是左眼。实际上,该装置可以具有用户设置和/或测试模式以确定哪只眼是主导的,用于允许观察者控制抖动噪声将被增加到哪个视图。应注意的是,在一实施例中,一些抖动噪声和/或附加的去成块始终被例如应用到左视图。在这样的实施例中,3D噪声量针对特定系统或应用被确立一次,并且抖动和/或滤波依赖于所述确立的量而被预设。

在一实施例中,3D视频装置是源40,并且视频处理器42设置有产生指示如所确定的至少一个量的3D噪声元数据的功能,用于所述确定在显示期间所预期的视觉干扰量。3D噪声元数据也可以例如在创作系统或后处理设施中被独立地确定和/或被独立地传送到3D播放器。所述视觉干扰量可以如以上所述确定,例如基于编码知识,诸如已经在编码期间被使用的量化步骤。另外,进一步的编码参数,像在编码期间所使用的任何预滤波或加权表,可以被包括在3D噪声元数据中。传送过程可以将3D噪声元数据包括在3D视频信号中,以传送到3D视频装置,用于根据3D噪声元数据在3D视频装置中启用处理,以减少编码噪声的所述相关性。

3D噪声元数据的进一步延伸是在视频帧中限定若干区域以及特别地将3D噪声元数据值分配到该区域。在一实施例中,选择一个区域被执行如下。显示区域在多个区域中被细分。针对每个区域执行检测3D噪声元数据。例如,帧面积被划分成2个或更多个区域(例如,水平条纹)并且针对每个区域,3D噪声比值被增加到流。这牺牲用于处理的解码器的自由度,例如增加抖动噪声,也取决于区域。

根据依赖于区域的空间滤波器功能,3D噪声元数据可以基于对多个区域的3D噪声值的空间地滤波。在一示例中,显示区域根据编码方案被划分成块。在每个块中,所预期的3D噪声被独立地计算。

在一实施例中,3D视频信号包括3D视频数据,该3D视频数据包括将针对观察者的分别的眼睛显示的用于产生3D效果的至少左视图和右视图,该3D视频信号进一步包括3D噪声元数据,该3D噪声元数据指示在将3D视频数据显示在3D显示器期间所预期的因在所述视图之间的编码噪声的相关性而产生的至少一个视觉干扰量。一般而言,信号被提供用于将3D视频数据传送到3D视频装置以在3D视频装置中根据3D噪声元数据启用对3D视频数据的处理以减少编码噪声的所述相关性。实际上,携带3D噪声元数据的3D视频信号被经由例如广播的任何适当的媒体经由TV传输或人造卫星分布给观察者,或分布在像光盘的记录载体上。因此,记录载体54则包括以上包含3D噪声元数据的3D视频信号。

在一实施例中,3D视频装置是3D播放器50,并且视频处理器53被布置用于通过检索来自3D视频信号的3D噪声元数据来确定视觉干扰量。该3D噪声元数据指示所述至少一个视觉干扰量。3D视频处理器52受到控制,用于依赖于3D噪声元数据通过处理3D视频数据来调节所述处理以减少所述相关性。

可替代地,为了减少在3D播放器50中的相关性,所述处理在显示装置60的一个实施例中被执行。3D视频数据,并且可选地,3D噪声元数据例如根据 HDMI标准经由显示信号56被传送。处理单元62现在执行以上功能中的任一项用于对3D显示器上的3D视频数据去相关。因此处理装置62可以被布置用于如针对在播放器装置中的处理装置52、53所描述的对应的功能。在进一步的实施例中,3D播放器装置和3D显示装置集成在单一装置中。

如上所述,3D噪声元数据可以被包括在3D视频信号中。在一实施例中,3D噪声元数据根据预先定义的诸如MPEG4的标准传输格式被包括在用户数据消息中,所述消息例如H.264编码流的发信号基本流信息[SEI]消息。该方法具有如下优点:它与依赖于H.264/AVC编码标准(参见例如ITU-TH.264和ISO/IEC MPEG-4 AVC,即,ISO/IEC 14496-10标准)的所有系统兼容。新的编码器/解码器可以实现新的SEI消息,而现有编码器/解码器将仅仅忽略它们。

图3示出在私有用户数据SEI消息中的3D噪声元数据。3D视频流31被示意性地指示。在流中的一个元素是发信号以对解码器指示流的参数,所谓的发信号基本流信息[SEI]消息32。更具体地,3D噪声元数据33可能被存储在用户数据容器中。3D噪声元数据可以包括噪声值的绝对量、信噪比值或3D噪声信息的任何其它表示。

图4示出用于在3D视频信号中的3D噪声元数据的数据结构。例如,视频信号可以根据预先定义的像蓝光光盘的3D格式被提供在记录载体上。在该图中所示的表限定在视频流中的分别的控制数据包的语法,具体地,限定了3D噪声元数据的GOP_结构_映射(),用于单独地显示在被一起编码的图片组(GOP)中的图片。该数据结构限定了3D噪声元数据35的字段。这些字段可以包含3D噪声量或比例、或其它3D噪声相关的参数,像指示编码网格和/或滤波的解码控制参数。该结构可以进一步被扩展用以例如针对显示图片内的区域或块提供如上所述的更详细的3D噪声元数据、持续一段时间地提供3D噪声元数据等。

图5示出3D视频数据。该图示出具有未经压缩的高质量3D视频信号中的左视图71和右视图72。

图6示出具有3D噪声的3D视频数据。该图示出源自于如图5中所示的视频数据的左视图81和右视图82。在首先对3D视频数据进行编码之后,通过在源侧的相对强的压缩、经由3D视频信号传送、并且通过在播放器侧的解压缩来解码而产生视图。各种伪像现在是可见的,例如左视图和右视图中的白斑83,并且成块效应在两个视图中相同的网格中具有边界84。各种伪像在两个视图中大致相同的位置处发生,并且将因此具有由3D观察者感知到的特定深度位置,通常在屏幕深度处。伪像将在该深度处“飘浮在空中”,实际上形成所谓的脏窗。

图7A示出在图6的左视图的网格84中具有边界的成块效应的特写,并且图7B示出在图6的右视图的网格84中具有边界的成块效应的特写。同样地,图7C示出在图6的左视图中的白斑83的特写,并且图7D示出在图6的右视图中的白斑83的特写。

图8示出3D噪声的示意示例。该图示出具有山、房屋和太阳的场景的左视图91和右视图92。网格被示出为代表DCT块网络结构,如以上提及的。在R视图中的对象相对于L视图移位到相对于背景在左边,意味着对象突出,例如房屋是在山的前面。太阳被移位到右边并且被感知在屏幕后面的无限远处。在L视图和R视图中具有相同的位置的任何事物具有屏幕深度。在左视图和右视图两者中使得两个编码伪像93、94可见。第一伪像93配合在网格中并且在两个视图中具有相同的位置,因此浮在在背景山的前面的屏幕深度处。第二伪像94也浮在屏幕深度处。注意,在该示例中,房屋突出在屏幕的前面。因此,第二伪像似乎在房屋的后面。甚至更恼人的是,如果这样的伪像与房屋的区域相一致,它似乎在房屋的前面可见但是具有在房屋后面的深度,即,好像在房屋中的孔。

应了解,为清楚起见,上文的描述已经参照不同的功能单元和处理器对本发明的实施例进行了描述。然而,将明显的是,在不脱离本发明的情况下,可以使用不同功能单元或处理器之间的功能性的任何适当的分配。例如,所示的将被由独立的单元、处理器或控制器执行的功能可以由相同的处理器或控制器执行。于是,对特定功能单元的提及应仅被看作对用于提供所描述的功能性的适当装置的提及,而不是表示严格的逻辑或物理结构或组织。

本发明能够以任何适当的方式实现,所述形式包括硬件、软件、 固件或其任何组合。尽管在上文中,已经针对装置提供了大多数实施例,但是,相同的功能由对应的方法提供。可选地,这些方法可以至少部分地被实现为在一个或多个数据处理器和/或数字信号处理器上运行的计算机软件。本发明的实施例的元件和组件可以以任何适当的方式物理地、功能地和逻辑地实现。实际上,功能性可以在单个单元中、在多个单元中或作为其它功能单元的一部分而实现。就这点而言,本发明可以在单个单元中实现或可以物理地和功能地分配在不同的单元和处理器之间。

虽然已经结合一些实施例描述了本发明,但是本发明不旨在受到此处所阐述的特定形式的限制。相反,本发明的范围仅受到所附权利要求的限制。另外,虽然某一特征可能看似结合特定实施例被描述,但是,本领域的技术人员将意识到,所描述的实施例的各种特征可以根据本发明合并。在权利要求中,术语包括并不排除其它元件或步骤的存在。

此外,虽然被单独地列出,但是多个装置、元件或方法步骤可通过例如单个单元或处理器实现。另外,虽然单独的特征可以包括在不同的权利要求中,但是这些可能有利地被合并,并且不同权利要求中的包含物并不意味着特征的组合不是可行的和/或有利的。对一个类别的权利要求中的特征的包含也并不意味着对该类别的局限性,然而相反地指示该特征同样地可以视情况应用于其它权利要求类别。此外,权利要求中的特征的顺序并不意味着这些特征必须以任何特定顺序工作,并且特别地,方法权利要求中的单独的步骤的顺序并不意味着必须以该顺序执行这些步骤。相反,这些步骤可以以任何适当的顺序执行。此外,单数提及并不排除复数。因此,对“一”、“一个”、“第一”、“第二”等的提及并不排除复数。权利要求中的附图标记仅被提供作为说明性实例,不应被解释为以任何方式限制权利要求的范围。

减少3D噪声的可见度.pdf_第1页
第1页 / 共23页
减少3D噪声的可见度.pdf_第2页
第2页 / 共23页
减少3D噪声的可见度.pdf_第3页
第3页 / 共23页
点击查看更多>>
资源描述

《减少3D噪声的可见度.pdf》由会员分享,可在线阅读,更多相关《减少3D噪声的可见度.pdf(23页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 102823261 A (43)申请公布日 2012.12.12 C N 1 0 2 8 2 3 2 6 1 A *CN102823261A* (21)申请号 201180016944.2 (22)申请日 2011.03.31 10159104.8 2010.04.06 EP H04N 13/00(2006.01) H04N 7/26(2006.01) (71)申请人皇家飞利浦电子股份有限公司 地址荷兰艾恩德霍芬 (72)发明人 R.B.M.克莱恩冈內维克 W.H.A.布鲁斯 (74)专利代理机构中国专利代理(香港)有限公 司 72001 代理人刘鹏 汪扬 (54) 。

2、发明名称 减少3D噪声的可见度 (57) 摘要 提供了一种用于处理三维3D视频信号以 避免在显示在3D显示器(63)上期间的视觉干扰 的3D视频装置(40,50)。3D视频信号包括用于产 生3D效果的左视图和右视图。本发明涉及认识和 解决所谓的脏窗效应,即在两个视图中的噪声之 间的相关性导致3D噪声在特定深度处被感知的 问题。视频处理器(42,52,53)被布置用于依赖于 因所述视图之间的编码噪声的相关性而在3D视 频数据的显示期间所预期的至少一个视觉干扰量 来处理3D视频数据,以减少编码噪声的所述相关 性。该装置具有传送装置(46,55),其用于传送经 处理的3D视频数据以显示在3D显示器上。

3、。另外, 提供了一种3D视频信号(41)和一种记录载体。 (30)优先权数据 (85)PCT申请进入国家阶段日 2012.09.28 (86)PCT申请的申请数据 PCT/IB2011/051383 2011.03.31 (87)PCT申请的公布数据 WO2011/125005 EN 2011.10.13 (51)Int.Cl. 权利要求书2页 说明书11页 附图9页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 2 页 说明书 11 页 附图 9 页 1/2页 2 1.一种处理三维3D视频信号以避免在显示在3D显示器上期间的视觉干扰的方法, 所述方法包括: -接收代。

4、表3D视频数据的3D视频信号(41,43),所述3D视频数据包括将对观察者的 分别的眼睛显示的用于产生3D效果的至少左视图和右视图, -依赖于在将所述3D 视频数据显示在3D显示器(63)上期间所预期的因所述视图之 间的编码噪声的相关性而产生的至少一个视觉干扰量来处理所述3D视频数据,以减少编 码噪声的相关性,以及 -传送经处理的3D视频数据以显示在所述3D显示器上。 2.如权利要求1中所述的方法,其中所述方法包括: -根据基于视频数据块和用于所述块的编码参数的变换来对所述3D视频数据进行编 码的步骤,以及 -针对至少一个分别的块确定所预期的至少一个视觉干扰量的步骤,以及 -所述处理步骤包括:。

5、依赖于如针对所述分别的块所确定的量来对用于所述分别的块 的编码参数进行调节。 3.如权利要求1中所述的方法,其中所述方法包括: -对所述3D视频数据进行解码的步骤,以及 -所述处理步骤包括:在所述解码之后,将抖动噪声增加至所述视图的至少一个以减 少所述相关性。 4.如权利要求1中所述的方法,其中所述方法包括:产生指示所述至少一个量的3D噪 声元数据,并且传送步骤包括:将所述3D噪声元数据(33)包括在3D视频信号中以传送到 3D视频装置以在所述3D视频装置中根据所述3D噪声元数据来启用处理,以减少所述编码 噪声的相关性。 5.如权利要求4中所述的方法,其中所述方法包括制造记录载体的步骤,所述记。

6、录载 体(54)设置有代表具有所述3D噪声元数据的3D视频信号的标记的轨道。 6.如权利要求1中所述的方法,其中所述方法包括: -从所述3D视频信号检索3D噪声元数据,所述3D噪声元数据指示所述至少一个量, 并且所述处理步骤包括: -根据所述3D噪声元数据对所述3D视频数据进行处理以减少所述编码噪声的相关性。 7.一种用于处理三维3D视频信号以避免在显示在3D显示器上期间的视觉干扰的 3D视频装置(40,50),所述装置包括: -输入装置(47,51,58,59),其用于接收代表3D视频数据的3D视频信号,所述3D视频 数据包括将针对观察者的分别的眼睛显示的用于产生3D效果的至少左视图和右视图。

7、; -视频处理器(42,52,53),其被布置用于依赖于在将所述3D视频数据显示在3D显示 器上期间所预期的因所述视图之间的编码噪声的相关性而产生的至少一个视觉干扰量来 处理所述3D视频数据,以减少所述编码噪声的相关性;以及 -传送装置(46,55),其用于传送经处理的3D视频数据以显示在所述3D显示器上。 8.如权利要求7中所述的3D视频装置(40),其中所述装置包括: -编码器(48),其用于根据基于视频数据块和用于所述块的编码参数的变换来对所述 3D视频数据进行编码;以及 权 利 要 求 书CN 102823261 A 2/2页 3 -视频处理器(42),其被布置:用于针对至少一个分别的。

8、块确定所预期的所述至少一 个视觉干扰量;以及 -用于在所述处理中,依赖于如针对所述分别的块所确定的量来对所述分别的块的编 码参数进行调节。 9.如权利要求7中所示的3D视频装置(50),其中所述装置包括用于对所述3D视频数 据进行解码的解码器 (21) ,并且所述视频处理器(52)被布置用于:在所述解码之后,将抖 动噪声(24,25)增加至所述视图的至少一个以减少所述相关性。 10.如权利要求9中所述的3D视频装置(50),其中所述视频处理器(52)被布置用于: 在所述解码之后,仅对用于所述观察者的非主导眼的视图(L)增加抖动噪声 (24) 。 11.如权利要求7中所述的3D视频装置(50),。

9、其中所述视频处理器(53)被布置: -用于从所述3D视频信号(41)检索3D噪声元数据,所述3D噪声元数据指示所述至少 一个量;以及 -用于通过依赖于所述3D噪声元数据来处理所述3D视频数据的所述处理以减少所述 相关性。 12.如权利要求7或11中所述的3D视频装置(50),其中所述输入装置包括用于读取 记录载体以检索所述3D视频信号的装置(58)。 13.一种3D视频信号,所述3D视频信号包括3D视频数据,所述3D视频数据包括:至 少左视图和右视图,所述左视图和右视图将针对观察者的分别的眼睛显示,用于产生3D效 果;以及3D噪声元数据(33),其指示在将所述3D视频数据显示在3D显示器上期间。

10、所预期 的因所述视图之间的编码噪声的相关性而产生的至少一个视觉干扰量,所述信号用于将3D 视频数据传送到3D视频装置以在该3D视频装置中根据3D噪声元数据来启用对该3D视频 数据的处理以减少所述编码噪声的相关性。 14.一种包括如权利要求13中所述的3D视频信号的记录载体(54)。 15.一种用于处理三维3D视频信号以避免在显示在3D显示器上期间的视觉干扰的 计算机程序产品,该程序可运行以使得处理器执行如权利要求1至6中任一项所述的方法 的分别的步骤。 权 利 要 求 书CN 102823261 A 1/11页 4 减少 3D 噪声的可见度 技术领域 0001 本发明涉及一种处理三维3D视频信。

11、号用于避免在显示在3D显示器上期间的视 觉干扰的方法,该方法包括:接收代表3D视频数据的3D视频信号,该3D视频数据包括将对 观察者的分别的眼睛显示的用于产生3D效果的至少左视图和右视图。 0002 本发明进一步涉及3D视频装置、3D视频信号、记录载体和计算机程序产品。 0003 本发明涉及处理3D视频数据以通过减少3D噪声的可见度来改进在3D显示装置 上的呈现的领域。 背景技术 0004 来自娱乐行业的快速增长的数量的产品针对3D影院。这些产品使用双视图的格 式(two-view format)(将对观察者的分别的眼睛显示的用于产生3D效果的左视图和右视 图),主要旨在用于眼戴(eye-we。

12、ar)辅助观察。存在将这些3D产品从行业带回家的兴趣。 目前,用于经由诸如蓝光光盘(BD)的光学记录载体来分配立体内容的第一标准处于其最终 状态。存在将3D内容从广播行业带回家的兴趣。当然在早期将被使用的格式将是常用的 立体格式。 0005 用于产生2D视频数据的装置是已知的,例如视频服务器、广播装置、或创作装置。 目前,用于提供3D图像数据的类似的3D视频装置是可用的,并且用于呈现3D视频数据的 补充的3D视频装置被提出,像用于光盘的播放器或呈现收到的3D视频信号的机顶盒。3D 视频装置可以联接到像电视机的显示装置或用于经由适当的接口(优选地像HDMI的高速 数字接口)传送3D视频数据的监视。

13、器。3D显示器也可以与3D视频装置集成,例如具有接 收部和3D显示器的电视机(TV)。 0006 IEEE0-7803-8834-8/05第6082-6085页,由Li-Fu Ding等人所著的文件“Stereo Video Coding System Coding System with Hybrid Coding based on Joint Prediction Scheme”描述了用于具有左视图和右视图的3D视频数据的编码方案的示例。3D内容的另 一个示例是具有多个右眼视图和左眼视图的立体内容。编码被布置用于依赖性地基于独立 地对如该文件的图1和图2中所示的另一个视图编码来对一个视图(。

14、例如,右视图)进行编 码。在所需的比特率因在两个视图中使用冗余(redundancy)而减小的意义上,所描述的编 码方案以及类似的编码技术是有效的。 发明内容 0007 为了将以上立体内容带到家,3D视频数据将根据预先定义的格式来压缩。由于在 广播信道上以及从更小的范围来讲在BD上的资源是有限的,所以将应用高压缩因子。由于 相对高的压缩率,所以各种伪像和其它干扰可能发生,在该文件中进一步被称为编码噪声。 0008 本发明的一个目的是提供视频处理用于减少因在显示在3D显示器上期间的编码 噪声而产生的视觉干扰。 0009 为了这个目,根据本发明的第一方面,如在开头段落中所描述的方法包括: 说 明 。

15、书CN 102823261 A 2/11页 5 -依赖于在将3D视频数据显示在3D显示器(63)上期间所预期的因所述视图之间的编 码噪声的相关性而产生的至少一个视觉干扰量来处理3D视频数据,以减少编码噪声的相 关性,以及 -传送经处理的3D视频数据以显示在3D显示器上。 0010 为了这个目的,根据本发明的第二方面,用于处理3D视频信号以避免在显示在3D 显示器上期间的视觉干扰的3D视频装置包括:输入装置,其用于接收代表3D视频数据的 3D视频信号,该3D视频数据包括将针对观察者的分别的眼睛显示的用于产生3D效果的至 少左视图和右视图;视频处理器,其被布置用于依赖于在将3D视频数据显示在3D显。

16、示器上 期间所预期的因所述视图之间的编码噪声的相关性而产生的至少一个视觉干扰量来处理 3D视频数据,以减少编码噪声的相关性;以及传送装置,其用于传送经处理的3D视频数据 以显示在3D显示器上。 0011 为了这个目,根据本发明的另外方面,3D视频信号包括3D视频数据,该3D视频数 据包括:将针对观察者的分别的眼睛显示的用于产生3D效果的至少左视图和右视图;以及 3D噪声元数据,所述3D噪声元数据指示在将3D视频数据显示在3D显示器上期间所预期的 因所述视图之间的编码噪声的相关性而产生的至少一个视觉干扰量,所述信号是用于将3D 视频数据传送到3D视频装置以在该3D视频装置中根据3D噪声元数据来启。

17、用对3D视频数 据的处理以减少编码噪声的所述相关性。 0012 当为观察者显示在3D显示器上时,该措施具有减少在左视图和右视图中的编码 噪声的相关性的效果。在两个视图中的噪声之间的相关性导致噪声被感知为例如位于特定 深度处的污迹或其它干扰。有利地,由于减少了相关性,所以任何这样的干扰对于在3D显 示器处的观察者来说将是不太可见并且不太恼人的。 0013 本发明还基于下列认识。现有技术文件描述了非独立地对两个视图编码。对视图 的依赖编码(dependent co ding)通常被用于3D视频数据。由于在3D数据信道上的资源受 到限制,所以相对高的即尽可能高的压缩因子将被应用,而没有根据3D视频数。

18、据的源或作 者的质量准则的过于可见的编码噪声。因此,实际上,将存在一些编码噪声。本发明人已经 观察到,在立体编码中的编码伪像将在特定的深度处被感知,其中它们被称为脏窗(dirty window)效应。该效应因在两个视图中相关的编码噪声而产生。实际上,立体内容似乎是通 过脏窗被观察,因为场景中伪像的遮蔽物(veil)在的对象的前面浮动或甚至常常向前缩进 (indenting forward)对象,即在单个感知的深度位置处浮动。所述脏窗的深度位置等于在 左右视图中具有相同位置的对象的深度位置,即通常在屏幕深处。如果视图已经被沿水平 方向移位,例如用于补偿屏幕尺寸效应或观察者距离(被称为基线移位),。

19、则脏窗也将在深 度方向移位,但是在不同的深度位置处保持可见。 0014 将典型地用于3D视频数据的压缩方法是基于块的。块网格和块对准将针对两 个视图被固定。虽然可以对左右视图独立地编码以实现更佳的编码效率,但是,联合编码 (joint coding)方法是常用的。联合编码方法试图利用左右视图之间的相关性。为了获 得较高的压缩因子,可以对存在于两个图像中的信息仅编码一次,可以使用空间关系和/ 或时间关系对信息编码,和/或从视频信号移除在单独的图像中不太可能由观察者感知的 信息(基于感知的编码)。信息的移除,即,有损编码,引入编码噪声,尤其是当高压缩因子 被应用时。该编码噪声可以是可见的,因为伪像。

20、的范围从蚊状噪声到成块伪像(blocking 说 明 书CN 102823261 A 3/11页 6 artifact)。对于基于块的压缩方案,编码噪声典型地与由压缩方法使用的块结构相关。 0015 本发明人已经看到,虽然诸如蚊状噪声的编码伪像在单独的2D图像中可能几乎 是不可见的,但是当立体对(stereo pair)的左右图像以组合的形式被观察时,这样的伪像 可以变得可见。在体视学上,对每只眼应用不同的图像,分别的图像中的差别有效地对深度 信息进行编码。为了确定深度,当时,人视觉系统将左视图中的对象和在右视图中的对应的 对象的水平偏移(即,视差)解释为提供对象的深度的指示。就人视觉系统本身。

21、而言,我们将 针对左、右视图中的所有对象来解释视差并且基于所述视差来推导场景的深度排序/深度 印象。然而,人视觉系统将针对实际图像中的对象以及针对因编码噪声而产生的伪像都这 样做。 0016 通常,编码噪声与在编码时使用过的块结构相互关联。一般而言,该块结构针对左 视图和右视图图像固定在同一位置处。当编码伪像在块边界处例如在成块的情况下发生 时,这些成块伪像在左、右图像中的同一位置处将是可见的。因此,编码噪声在零视差即在 屏幕深度处将是可见的。当应用左右之间的基线移位时,脏窗将并排地移动,但是将保持可 见。 0017 实际上,这样的伪像对于观察者显得是一个人通过脏窗看到场景。当使用了联合 编码。

22、方法时,编码噪声将固有地相关联。不幸地知道,脏窗效应会引起看到脏窗效应,并且 由其而分心。 0018 如以上所解释的,脏窗问题起因于左右视图之间的相互关联的编码噪声。因此,解 决该问题的措施涉及要么避免、要么减少在编码侧的相关性,或对在解码侧的相互关联的 编码噪声进行去相关。存在各种方式来减少两个视图中的3D噪声或对其去相关,如在下列 实施例中所描述的。 0019 在一实施例中,该方法包括:根据基于视频数据块和所述块的编码参数的变换来 对3D视频数据进行编码的步骤;以及针对至少一个分别的块确定所预期的至少一个视觉 干扰量的步骤,并且所述处理步骤包括依赖于如针对分别的块所确定的量来对分别的块的 。

23、编码参数进行调节。 0020 在一实施例中,该装置包括解码器,该解码器根据基于视频数据块和所述块的编 码参数的变换来对3D视频数据进行编码;并且视频处理器被布置:用于针对至少一个分别 的块确定所预期的至少一个视觉干扰量,以及用于在所述处理中,依赖于如针对分别的块 所确定的量来对分别的块的编码参数进行调节。 0021 效果是,依赖于在显示期间所预期的视觉干扰量,编码是受到控制的。该量以及预 期的3D噪声的可见度可以基于在块中的3D视频数据的内容,例如复杂图像和/或大量移 动或深度差。在这样的块中,任何编码噪声将较不可见。另一方面,在相对安静的场景中, 编码噪声可能更恼人。另外,如果在分别的块中的。

24、深度很大(即,在脏窗后面的大量空间), 则视觉干扰量因具有大量空间在其后面的脏窗的高可见度而很高。随后,如果该量很高,则 编码参数可以被调整以例如通过局部地增加可用比特率来减少在这样的块中的编码噪声, 从而减少所述相关性。有利地,在减少脏窗效应将最明显的那些块中的脏窗效应的同时,总 比特率可以被更有效地使用。 0022 在一实施例中,该方法包括对3D视频数据进行解码的步骤,所述处理步骤包括: 在所述解码之后,对视图中的至少一个增加抖动噪声(dithering noise)以减少所述相关 说 明 书CN 102823261 A 4/11页 7 性。 0023 在一实施例中,该装置包括用于对3D视。

25、频数据进行解码的解码器,并且视频处理 器被布置用于:在所述解码之后,对视图中的至少一个增加抖动噪声以减少所述相关性。 0024 抖动噪声基于在显示期间所预期的视觉干扰量而增加。效果是,虽然噪声的总量 稍微增加,但是相关性减少。抖动噪声可以增加到左和/或右视图。实验表明,将抖动噪声 增加到左或右视图足以对编码噪声去相关,并且提供最佳的图像品质。 0025 在一实施例中,视频处理器被布置用于在所述解码之后,仅对用于观察者的非主 导眼的视图增加抖动噪声。本发明者已经注意到,实际上感知的噪声取决于增加了噪声的 特定视图。看起来抖动噪声可以最佳地被施加到非主导眼,该非主导眼对于大数人来说是 左眼。实际上。

26、,该装置可以具有用以确定哪只眼是主导眼的用户设置和/或测试模式。 0026 在该方法的一实施例中,该方法包括:产生指示该至少一个量的3D噪声元数据, 并且所述传送步骤包括:将3D噪声元数据包括在3D视频信号中以传送到3D视频装置,以 在该3D视频装置中根据3D噪声元数据来启用处理,以减少编码噪声的所述相关性。效果 是,附加的3D噪声元数据在要在呈现侧使用的源处产生。例如,噪声元数据是基于编码知 识,诸如已经在编码期间被使用的量化步骤。3D噪声元数据被传送至解码侧,其中它被应 用用于据根据3D噪声元数据处理3D视频数据以减少编码噪声的所述相关性。例如,当3D 噪声元数据指示在图像的块中的噪声级时。

27、,在解码期间增加到每个块的抖动噪声基于噪声 元数据来确定。有利地,编码噪声的预期发生的数据在3D视频数据的源处产生,即,在丰 富的处理资源可用的情况下仅产生一次。因此,在解码器侧例如在消费者场所(consumer premises)的处理,可以相对便宜。 0027 在该方法的一实施例中,该方法包括:从3D视频信号检索3D噪声元数据,该3D噪 声元数据指示至少一个量,所述处理步骤包括:根据3D噪声元数据处理3D视频数据以减少 编码噪声的所述相关性。 0028 在一实施例中,视频处理器被布置:用于从3D视频信号检索3D噪声元数据,该3D 噪声元数据指示至少一个量;以及用于通过依赖于3D噪声元数据来。

28、处理3D视频数据的所 述处理以减少所述相关性。在进一步的实施例中,该装置包括解码器,该解码器被布置用于 根据基于视频数据块和用于所述块的解码参数的变换来对3D视频数据进行解码,并且视 频处理器被布置用于依赖于3D噪声元数据来对块中的至少一个增加抖动噪声以减少所述 相关性。 0029 效果是,如上所述所产生的3D噪声元数据利用3D视频信号接收,并且随后被检索 并且被用来控制对3D视频数据的处理以减少所述相关性。有利地,预期的干扰量在脱机的 情况下(即,在源侧)被确定。在该进一步的实施例中,抖动噪声的量依赖于3D噪声元数据 而针对分别的块受到控制,从而减少在图像的将是最恼人的部分中的视觉干扰。 0。

29、030 在一实施例中,3D视频信号被包括在记录载体中,例如被嵌入在轨道中的光学可 读标记的图案中。效果是,可用数据存储空间被更有效地使用。 0031 该方法的进一步优选的实施例,根据本发明的3D装置和信号在所附权利要求中 被给出,其公开内容通过引用并入此处。 附图说明 说 明 书CN 102823261 A 5/11页 8 0032 本发明这些和其它方面将从进一步参照在下列描述中通过举例并且参照附图所 描述的实施例变得明显并且据此来阐明,在附图中, 图1示出用于处理在显示诸如视频、图形或其它视觉信息的3D图像数据的系统中的3D 视频数据的装置, 图2示出用于减少视图之间的相关性的3D视频处理器。

30、, 图3示出在私人用户数据SEI消息中的3D噪声元数据, 图4示出用于在3D视频信号中的3D噪声元数据的数据结构, 图5示出3D视频数据, 图6示出具有3D噪声的3D视频数据, 图7A、图7B、图7C和图7D示出具有3D噪声的3D视频数据的分别的细节,以及 图8示出3D噪声的示意示例。 0033 在图中,对应于已经描述的元件的元件具有相同的附图标记。 具体实施方式 0034 注意到,本发明可以被用于基于用于观察者的分别的左眼和右眼的多个图像(视 图)的任何类型的3D视频数据。3D视频数据被假定为如电子、数字编码的数据般可用的。 本发明涉及这样的图像数据和对在数字领域中的图像数据的处理。 003。

31、5 存在3D视频数据可以被格式化并且被传送的许多不同的方式,称为3D视频格式。 一些格式是基于使用2D信道以同样携带立体信息。例如,左视图和右视图可以被交错或可 以被并排以及上下放置。这些方法牺牲分辨率来携带立体信息。 0036 图1示出用于处理在显示诸如视频、图形或其它视觉信息的3D图像数据的系统中 的三维(3D)视频数据的装置。被称为3D源的第一3D视频装置40对被称为3D播放器的 另外的3D视频装置50提供和传送3D视频信号41,所述另外的3D视频装置50被联接到用 于传送3D 显示信号56的3D显示装置60。 0037 图1进一步示出作为3D视频信号的载体的记录载体54。该记录载体是盘。

32、形并且 具有轨道和中心孔。轨道由物理可检测的标记的图案组成,其布置成与组成在一个或多个 信息层上的基本上平行轨道的圈的螺旋形的或同心的图案相一致。记录载体可以是光学可 读的,称为光盘,例如CD、DVD或BD(蓝光光盘)。信息通过沿着轨道例如凹区和凸区的光学 地可检测的标记而体现在信息层上。轨道结构还包括位置信息例如数据头和地址,用于指 示通常被称为信息块的信息单元的定位。记录载体54携带代表数字编码的3D图像数据像 视频的信息,例如根据MPEG2或MPEG4编码系统以像DVD或BD格式的预先定义的记录格式 编码的。 0038 3D源具有处理单元42用于处理经由输入单元47收到的3D视频数据。输。

33、入3D视 频数据43可以从存储系统、录音室、从3D摄影机等获得。视频处理器42生成包括3D视频 数据的3D视频信号41。该源可以被布置用于将3D视频信号从视频处理器经由输出单元 46并且传送至另外的3D视频装置,或用于例如经由记录载体提供用于分配的3D视频信号。 3D视频信号基于例如通过经由解码器48根据预先定义的格式对3D视频数据进行编码和格 式化来处理输入3D视频数据43。 0039 用于处理3D视频数据的处理器42被布置用于:确定在将3D视频数据显示在3D 说 明 书CN 102823261 A 6/11页 9 显示器的期间预期的因在所述视图之间的编码噪声的相关性而引起的视觉干扰量,并且。

34、依 赖于如针对减少编码噪声的所述相关性所确定的量来启用对3D视频数据的处理。处理器 可以被布置:用于确定指示当3D视频数据被显示时在其中产生的干扰的3D噪声元数据; 以及用于将3D噪声元数据包括在3D视频信号中。下面进一步详细地描述处理的实施例。 0040 3D源可以是服务器、广播装置、记录装置、或用于制造像蓝光光盘的光学记录载 体的创作系统和/或生产系统。蓝光光盘提供交互式平台用于为内容创作者分配视频。 关于蓝光光盘格式的信息可从蓝光光盘协会的网站以视听应用格式的论文中获得,例如 http:/www.blu- ation_0305-12955-15269.pdf。光学记录载体的生产过程进一步。

35、包括:在轨道中提供标记 的物理图案,所述图案体现可以包括3D噪声元数据的3D视频信号,并且随后根据图案使记 录载体的材料成形以在至少一个存储层上提供标记的轨道。 0041 3D播放器装置具有用于接收3D视频信号41的输入单元51。例如,装置可以包括 光盘单元58,该光盘单元58联接到输入单元,用于从像DVD或蓝光光盘的光学记录载体54 检索3D视频信息。可替代地(或附加地),3D播放器装置可以包括用于联接到例如因特网或 广播网络的网络45的网络接口单元59,这样的装置通常被称为机顶盒。3D视频信号可以 从如由3D源40指示的远程网站或媒体服务器被检索到。3D播放器也可以是卫星接收器、 或媒体播。

36、放器。 0042 3D播放器装置具有处理单元52,该处理单元52联接到输入单元51,用于处理3D 信息用于产生将被经由输出接口单元55传送到显示装置的3D显示信号56,例如根据HDMI 标准的显示信号,参见“高清晰度多媒体接口;2006年11月10日的规范版本1.3a”,其可 在http:/hdmi.org/manufacturer/specification.aspx获得。处理单元52被布置用于 产生被包括在用于显示在显示装置60上的3D显示信号56中的图像数据。 0043 播放器装置可以具有用于处理3D视频数据的另外的处理单元53,该处理单元53 被布置用于:确定指示当3D视频数据被显示时。

37、在3D视频数据中产生的干扰的3D噪声元数 据。另外的处理单元53可以联接到输入单元51,用于检索来自3D视频信号的3D噪声元数 据,并且联接到处理单元52,用于控制如下所述的对3D视频的处理。3D噪声元数据也可以 经由独立的信道获取,或可以基于处理3D视频数据而局部地产生。 0044 3D显示装置60用于显示3D图像数据。该装置具有输入接口单元61用于接收从 3D播放器50传送的包括3D视频数据的3D显示信号56。传送的3D视频数据在处理单元 62中被处理用于在例如双或透镜状LCD的3D显示器63上显示。显示装置60可以是任何 类型的立体显示器,也被称为3D显示器,并且具有由箭头64指示的显示。

38、深度范围。 0045 在3D视频装置中的视频处理器,即在3D视频装置50中的处理器单元52、53,被布 置用于执行下列功能:用于处理3D视频信号以避免在显示在3D显示器上期间的视觉干扰。 3D视频信号由输入装置51、58、59接收。3D视频信号包括以数字编码的压缩格式的3D视频 数据。3D视频信号代表包括至少将对观察者的分别的眼睛显示用于产生3D效果的左视图 和右视图。视频处理器可以被布置用于确定在将3D视频数据显示在3D显示器上期间所预 期的因在所述视图之间的编码噪声的相关性而产生的视频干扰量。视频处理器被布置用于 依赖于用于减少编码噪声的所述相关性的量来处理3D视频数据。下面讨论用于减少或。

39、避 免所述相关性的各种技术。所述量也可以由观察者在播放器处或由作者在源处预先设置为 说 明 书CN 102823261 A 7/11页 10 预定的(例如针对特定信道或媒体源)、估计的(例如基于介质或数据信道的总比特率)、或 固定的(例如在压缩速率将总是很低的低端应用中)。最后,经处理的3D视频数据被联接到 诸如输出接口单元55的传送装置,用于传送经处理的3D视频数据以显示在3D显示器上。 0046 在一实施例中,该量基于压缩率、比特率和/或3D视频信号的分辨率来导出。例 如,量化水平可以被监测(Q-监测)。在更多基本实施例中,确定该量可以基于预定的阈值 比特率或基于用户设置。此外,该量可以基。

40、于依赖于视频内容例如依赖于图像的复杂性和 /或移动量或深度差来计算3D噪声的可见度而确定。深度可以源自于来自深度图(如果可 用)的视差估计(其针对该目的可能是相当粗糙的)。在复杂图像中,任何编码噪声将不太可 见。另一方面,在相当安静的场景中,编码噪声可能更加恼人。另外,如果在图像中的深度 很大(即,在所谓的脏窗后面的大量空间),则视觉干扰量因具有大量空间在其后面的脏窗 的高可见度而很高。实际上,图片中的复杂性或纹理可以源自于视频信号中的高频成分、和 图片中的(平均)深度、或其的区域或块,可以基于视差估计或其它深度参数来监测。此外, 该量可以针对整个图像、或针对几个区域(例如,用于容纳具有更大深。

41、度的上部的上部和下 部)、或针对(要么预定的,要么基于根据预期的3D噪声的可见度细分图片而动态地分配的) 更大量的块来确定。此外,指示所述量的去相关性(de-correlation)图案可以由解码器或 基于已编码的信号的特性来提供,该图案可以在解码期间或在解码之后被使用以控制该方 式和/或去相关性的量。 0047 减少两个图像之间的相关性可以在编码、解码期间或在对图像解码之后以各种方 式执行。就这点而论,各种用于控制相关性的技术在视频处理领域中是已知的。在编码期 间,编码参数可以被调整以减少两个视图之间的伪像和噪声的相关性。例如,量化可以临时 地或局部地受到控制,和/或总体比特率可以是多变的。。

42、在解码期间,可以应用各种滤波技 术,或可以调整参数。例如,去成块(de-blocking)滤波器可以被插入和/或被调整以减少 因基于块的压缩方案而发生的伪像。去成块或进一步的滤波可以仅针对非独立编码的视图 或有区别地针对非独立编码的视图被调用。 0048 在一实施例中,依赖于如针对减少编码噪声的所述相关性而确定的量来处理3D 视频数据通过调节以上提及的用于基于该量控制相关性的技术来执行。例如,该量可以是 针对分别的3D视频源或3D视频程序的固定设置。固定的设置可以由用户基于个人喜好输 入或调整,诸如针对特定视频源、视频程序、TV频道、记录载体的类型的用于“减少3D噪声” 的设置,或针对3D视频。

43、处理装置的一般设置。该量也可以例如基于3D视频数据的总比特 率、质量和/或分辨率而动态地确定。 0049 在一实施例中,3D视频装置是源装置40并且包括在处理器单元42中的解码器用 于根据基于视频数据块和所述块的编码参数的变换来对3D视频数据进行编码。一般而言, 压缩可以使用无损技术和有损技术来执行。无损技术典型地依赖于熵编码;然而,利用无 损压缩的可行的压缩增益仅取决于源信号的熵。因此,可实现的压缩率对于消费应用是典 型地不充分的。因此,有损压缩技术已经被开发,其中输入视频流被分析并且信息被这样编 码,使得如由观察者感知的信息丢失被保持到最小;即,使用所谓的基于感知的编码。 0050 大多数。

44、常见的视频压缩方案包括无损编码和有损编码的混合。许多的这样的方 案分别包括诸如信号分析、量化和可变长度编码的步骤。可以应用范围从离散余弦变换 (DCT)、矢量量化(VQ)、分形压缩到离散小波变换(DWT)的各种压缩技术。 说 明 书CN 102823261 A 10 8/11页 11 0051 基于离散余弦变换的压缩是有损压缩算法,该算法每隔一定间隔对图像采样,分 析样品中存在的频率成分,并且丢弃那些当人眼感知它时不影响图像的频率。基于DCT的 压缩形成诸如JPEG、MPEG、H.261、和H.263等标准的基础。 0052 视频处理器42被布置用于通过针对至少一个分别的块确定所预期的至少一个。

45、视 觉干扰量来确定视觉干扰量。3D噪声可以由因所使用的压缩类型而产生的伪像所导致,所 述压缩类型诸如针对在3D图片中的块所执行的DCT。随后,在所述处理中,视频处理器依赖 于如针对所述分别的块所确定的量来针对所述分别的块或区域调整编码参数。例如,当高 的量被确定用于块时,量化被调整。替代地,或附加地,可以将诸如块的编码网格与动态地 改变的偏移一起使用以避免在相同的位置发生伪像。此外,可控去成块滤波器可以在编码 器中被使用。如在介绍部分中所描述的,对非独立的右视图编码可以基于独立编码的左视 图。当针对特定影像或3D图像数据的周期确定高的量时,可以临时地设置不太非独立的编 码模式,例如取决于其它视。

46、图,在所述联合预测方案中使用I图片代替P图片。 0053 在一实施例中,依赖于两个视图的共同背景,视图中的至少一个在编码之前被相 对于在编码中使用的网络而移位。视图中的一个或两个按照移位参数水平地移位,直到网 格在两个视图中相对于背景具有基本上相同的位置为止。在解码之后,(一个或多个)视图 的按照移位参数的互补的相反移位必须被应用。移位参数可以用3D视频信号传送,所述3D 视频信号例如作为如在下文参照图3和图4阐述的3D噪声元数据。有效地,3D噪声将被移 到背景的深度位置,并且因此对观察者来说是不太烦扰的。移位可以每个帧地、或针对一组 图片、针对在关键帧之间的视频片断、针对场景、或针对更大的部。

47、分或视频程序来确定。移 位也可以被预设到如下值:该值总是移动3D噪声到屏幕后的大距离,例如无穷大。 0054 该量以及预期的3D噪声的可见度可以进一步基于在块中的3D视频数据的内容, 例如复杂图像内容和/或大量移动或深度差。在这样的块中,任何编码噪声将是不太可见 的。另一方面,在相当安静的场景中,编码噪声可能更恼人。另外,如果在分别的块中的深 度很大(即,在脏窗后面的大量空间),则视觉干扰量因具有大量空间在其后面的脏窗的高 可见度而很高。随后,如果该量很高,编码参数可以被调整以例如通过局部地增加可用的比 特率来减少在这样的块中的编码噪声,从而减少所述相关性。 0055 在一实施例中, 3D视频。

48、装置是播放器装置50,并且视频处理器52包括用于对3D 视频数据解码的解码器。处理器52被布置用于在所述解码之后对视图中的至少一个增加 抖动噪声以减少所述相关性。 0056 图2示出用于减少视图之间的相关性的3D视频处理器。输入端26对解码器21提 供3D视频信号,该解码器21生成左视图L和右视图R。联接到解码器21的检测器22被布 置用于:例如基于来自解码器的3D视频信号的解码参数来确定所预期的所述视觉干扰量。 检测器联接到抖动噪声发生器23用于可控制地产生一些将被增加到视图的抖动噪声。噪 声通过加法器24增加到视图L用于产生经处理的视频数据左视图L。噪声通过加法器25 增加到视图R用于产生。

49、经处理的视频数据左视图R。抖动噪声能够增加到左视图L和/或 右视图R。实验表明,对左或右视图增加抖动噪声足以对编码噪声去相关,并且提供最佳的 图像品质。 0057 如受到检测器22控制的抖动噪声的量可以基于预设置或在显示期间所预期的预 定的视觉干扰量来固定。该量也可以动态地确定,类似于上述在编码器侧的所述确定,要么 说 明 书CN 102823261 A 11 9/11页 12 针对整个图像、要么针对图像的一部分或针对块。抖动噪声可以基于如所确定的量相应地 增加到图像的区域的分别的周期。 0058 在3D视频装置的进一步的实施例中,视频处理器被布置用于在所述解码之后,仅 对用于观察者的非主导眼的视图增加抖动噪声。看起来抖动噪声可以最佳地被施加到非主 导眼,该非主导眼对于大数人来说是左眼。实际上,该装置可以具有用户设置和/或测试模 式以确定哪只眼是主导的,用于允许观察者控制抖动噪声将被增加到哪个视图。应注意。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 电学 > 电通信技术


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1