《改进的HDR图像编码和解码方法和设备.pdf》由会员分享,可在线阅读,更多相关《改进的HDR图像编码和解码方法和设备.pdf(41页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 (43)申请公布日 (21)申请号 201380037397.5(22)申请日 2013.07.0161/671183 2012.07.13 USH04N 19/46(2014.01)H04N 19/30(2014.01)H04N 19/196(2014.01)H04N 19/17(2014.01)(71)申请人皇家飞利浦有限公司地址荷兰艾恩德霍芬(72)发明人 M. J. W. 梅坦斯(74)专利代理机构中国专利代理(香港)有限公司 72001代理人苏赫峰 景军平(54) 发明名称改进的HDR图像编码和解码方法和设备(57) 摘要为了具有非常有效并且在一些实施例中还与遗留。
2、LDR显示系统后向兼容,教导了涉及将对应于第一辉度动态范围(R_oLDR)的图像编码(LDR_CONT)解码成第二辉度动态范围(R_oHDR)输出图像(HDR_FIN)的装置和方法,其中图像编码(LDR_CONT)是高动态范围场景的原始图像(HDR_ORIG)的编码像素,所述方法包括:利用预定色调映射策略(FL2H)来将所述图像编码(LDR_CONT)中的像素的至少亮度色调映射到对应于所述第二辉度动态范围(R_oHDR)的中间图像(HDR_PRED)中的像素亮度上;以及通过将所述中间图像(HDR_PRED)的像素中的至少一些的亮度乘以预定相乘因子,来修改所述亮度,得到所述输出图像(HDR_FI。
3、N)。(30)优先权数据(85)PCT国际申请进入国家阶段日2015.01.13(86)PCT国际申请的申请数据PCT/IB2013/055384 2013.07.01(87)PCT国际申请的公布数据WO2014/009844 EN 2014.01.16(51)Int.Cl.(19)中华人民共和国国家知识产权局(12)发明专利申请权利要求书3页 说明书25页 附图12页(10)申请公布号 CN 104471939 A(43)申请公布日 2015.03.25CN 104471939 A1/3页21.一种将对应于第一辉度动态范围(R_oLDR)的图像编码(LDR_CONT)解码成第二辉度动态范围(。
4、R_oHDR)输出图像(HDR_FIN)的方法,其中图像编码(LDR_CONT)是高动态范围场景的原始图像(HDR_ORIG)的编码像素,所述方法包括:- 利用预定色调映射策略(FL2H)来将所述图像编码(LDR_CONT)中的像素的至少亮度色调映射到对应于所述第二辉度动态范围(R_oHDR)的中间图像(HDR_PRED)中的像素亮度上 ;以 及- 通过将所述中间图像(HDR_PRED)的像素中的至少一些的亮度乘以预定相乘因子,来修改所述亮度,得到所述输出图像(HDR_FIN)。2.根据权利要求1所述的对图像编码进行解码的方法,其中所述第一辉度动态范围是低动态范围,所述低动态范围通常对应于50。
5、0尼特或更低的范围的峰值明度,并且所述第二辉度动态范围是高动态范围,具有至少750尼特的峰值明度。3.根据权利要求1或2所述的对图像编码进行解码的方法,其中所述预定相乘因子被存储在与所述图像编码(LDR_CONT)相关联的元数据中,所述解码方法包括在所述元数据中读取定义所述图像编码(LDR_CONT)的空间区域的信息,针对所述图像编码(LDR_CONT),至少一个相乘因子被编码在所述元数据中,所述空间区域的几何形状被编码(503、504、505)在所述元数据中。4.根据权利要求3所述的对图像编码进行解码的方法,其中所述预定相乘因子包括在相乘因子阵列(506)中,所述相乘因子阵列包括每个像素或像。
6、素组的相乘因子,其中根据与所述空间区域几何形状的编码对应地定义所述阵列。5.根据权利要求4所述的对图像编码进行解码的方法,其中所述相乘因子阵列(506)中的相乘因子被编码为到定义表(520)中的索引,所述定义表(520)包含针对所述索引的实际相乘因子。6.根据权利要求5所述的对图像编码进行解码的方法,其中所述定义表( 20)与描述符(530)相关联,所述描述符(530)表征所述定义表,并且于是在修改亮度的该情况下,应当例如在图像的特定拍摄上使用它。7.根据权利要求6所述的对图像编码进行解码的方法,其中所述解码还读取窗类型(531),指示与该窗类型(531)相关联的空间区域具有凭借与对应于所述窗。
7、类型(531)的描述符(530)相关联的定义表来编码的相乘因子。8.根据权利要求1或2所述的对图像编码进行解码的方法,其中以约束所述相乘到相乘策略中的方式来执行所述修改所述中间图像(HDR_PRED)的所述像素中的至少一些的亮度,在所述相乘策略中,所述输出图像(HDR_FIN)的局部平均辉度在与所述中间图像(HDR_PRED)的局部平均辉度的预定百分比偏差内。9.根据权利要求8所述的对图像编码进行解码的方法,其中读取类型值508,所述类型值508指示与这样的被约束的相乘相关地定义所述相乘因子。10.根据权利要求1或2所述的对图像编码进行解码的方法,其中从所述元数据读取所述相乘因子作为在运动的1。
8、维或2维位置坐标上的相乘因子的函数定义。11.一种将高动态范围场景的原始图像(HDR_ORIG)编码为对应于第一辉度动态范围(R_oLDR)的图像编码(LDR_CONT)的方法,所述方法包括:- 利用预定色调映射策略(FL2H)来将所述图像编码(LDR_CONT)中的像素的至少亮度权 利 要 求 书CN 104471939 A2/3页3色调映射到对应于第二辉度动态范围(R_oHDR)的中间图像(HDR_PRED、GRAD_1LDR)中的像素亮度上;- 通过分析所述中间图像(HDR_PRED、GRAD_1LDR)中的像素颜色与指定的第二图像(HDR_ORIG 或 GRAD_FINLDR)的那些像。
9、素颜色的区别,来确定用于与所述中间图像(HDR_PRED、GRAD_1LDR)的所述像素中的至少一个的亮度相乘的相乘因子;以及- 在图像信号(S_im)中编码所述图像编码(LDR_CONT)、指定所述色调映射策略(FL2H)的数据和所述相乘因子。12.根据权利要求11所述的对高动态范围场景的原始图像(HDR_ORIG)进行编码的方法,其中所述第一辉度动态范围(R_oLDR)是低动态范围,所述低动态范围通常对应于500尼特或更低的范围的峰值明度,并且所述第二辉度动态范围(R_oHDR)是高动态范围,具有至少750尼特的峰值明度。13.一种HDR图像解码装置(401),包括:- 解码器(402),。
10、其被布置为获得对应于第一辉度动态范围(R_oLDR)的图像编码(LDR_CONT);- 色调映射器(403),其被布置为获得色调映射策略(FL2H)的规范,并且应用所述色调映射策略到所述图像编码(LDR_CONT),得到对应于第二辉度动态范围(R_oHDR)的中间图像(HDR_PRED);以及- 像素颜色修改器(404),其被布置为获得包括至少一个相乘因子的相乘因子数据(A_MUL),并且被布置为将至少一个相乘因子乘以所述中间图像(HDR_PRED)中的至少一个像素的亮度,得到输出图像(HDR_FIN)作为输出。14.一种HDR图像编码装置(701),包括:- 用于获得高动态范围场景的原始编码。
11、(HDR_ORIG)的输入,- 分级管理器(702),其被布置为将该原始编码(HDR_ORIG)转换为对应于第一辉度动态范围(R_oLDR)的图像编码(LDR_CONT),并且被布置为通过利用被编码在色调映射数据(FL2H)中的色调映射策略来色调映射所述图像编码(LDR_CONT)来确定对应于第二辉度动态范围(R_oHDR)的中间图像(HDR_PRED);- 分级差别比较器(704),其被布置为将所述中间图像(HDR_PRED)与指定的第二图像(HDR_ORIG,或GRAD_FINLDR)进行比较,并且基于在这些图像之间的差别得到相乘因子数据(A_MUL),所述相乘因子数据包括至少一个相乘因子。
12、,所述相乘因子当与所述中间图像(HDR_PRED)的至少一个像素的亮度相乘时得到输出图像(HDR_FIN)的最终像素颜色,所述最终像素颜色比起所述中间图像(HDR_PRED)中的像素的颜色更接近在所述第二图像中的对应像素的颜色;以及- 编码单元(710),其被布置为将所述图像编码(LDR_CONT)、所述色调映射数据(FL2H)和所述相乘因子数据(A_MUL)编码在输出图像信号(S_im)中。15.根据权利要求14所述的HDR图像编码装置(701),包括用户接口单元(703),所述用户接口单元(703)被布置为允许人颜色分级员确定至少所述图像编码(LDR_CONT)和所述色调映射策略。16.一。
13、种HDR图像信号,包括:- 对应于第一辉度动态范围(R_oLDR)的图像编码(LDR_CONT);权 利 要 求 书CN 104471939 A3/3页4- 被用于将所述图像编码(LDR_CONT)色调映射成对应于第二辉度动态范围(R_oHDR)的中间图像(HDR_PRED)的色调映射数据(FL2H);以及- 相乘因子数据(A_MUL),包括至少一个相乘因子用于与所述中间图像(HDR_PRED)的至少一个像素的亮度相乘。17.一种被布置为能够存储包括如权利要求16所述的HDR图像信号的数据的便携数据设备,例如蓝光盘。权 利 要 求 书CN 104471939 A1/25页5改进的 HDR 图像。
14、编码和解码方法和设备技术领域0001 本发明涉及与被称为低动态范围(LDR)图像的遗留图像相比具有增大的动态辉度(luminance)范围的至少一个图像或视频的改进的编码的装置和方法和得到的产品(例如数据储存产品或例如存储在存储器中的编码后的信号)。背景技术0002 近来,图像采集、显示和特别是编码已从所谓的低动态范围(LDR)成像(例如类似PAL或MPEG2的经典系统)改进到所谓的高动态范围成像(HDR)。传感器现今具有较高的原生(native)信号电压范围(在饱和或至少给出最大允许像素电压的场景辉度与最小值或替代的典型噪声水平之间),或它们具有用于通过多个图像(例如从具有不同敏感度的空间系。
15、统,或具有不同曝光设置的连续图片)组成得到的图像来延展该传感器范围的技术。利用LDR摄像机采集(capturing)的区别是这样的LDR摄像机通常修剪和/或软修剪一些区域,如在外部的明亮辉度变成白(那些存储的编码的LDR图像像素的亮度(luma)Y为255),而HDR采集系统可合理地如实地采集在场景中的所有辉度。尽管这样,但是怎么处理它们仍然是个问题,即,如何针对例如在电视网络系统上的传输来对它们进行编码,并且如何在例如HDR显示器上(如实地,或以优选的方式,或至少可接受地)渲染它们,HDR显示器具有比LDR显示器的典型峰值明度更高的峰值明度(例如3000尼特,而不是100 或500尼特)。0。
16、003 因为对图片的渲染的外观取决于很多变量,例如图片中的内容,所渲染于的显示器的种类(例如其峰值明度)和观看环境,通常所采集的原始传感器图片(其可以紧密相关于原始场景,但是绝对不与最终渲染环境有关,从而没有关于人将如何看这两个场景的信息)经历其像素颜色的转换(其被称为分级)。通常这可以是人分级员。例如,在电影制作中,可能难以精确地照亮房屋内部(还给定了定时和定价约束),更不必说建立特殊灰度模式的雷云。场景照明组可以然后争取近似正确的照明,其至少在所有地方建立“足够”或“正确量”的光,并且可以定位实践(例如如在桌上的蜡烛之类的氛围照明(或模拟其的一些事物),霓虹灯等)。但是分级员然后在图像处理。
17、软件中对其进行改进,例如他可以画出阳光,如同在实际场景中穿过窗户落下那样。0004 LDR编码具有表征其的另一属性。天真地,可能认为LDR仅仅是其中亮度具有每像素8位代码字(或当然类似的实施例)的编码,并且反之亦然,8位表示LDR。但是在理论上,可以对8位代码的那些图像阵列中的任意进行编码,从而可以至少在理论上对非常复杂的图案进行编码,从而为什么HDR图像不可以。0005 问题是(并且其部分是长历史传统的遗留)根据特定代码映射函数将传感器电压(即场景辉度的线性表示)编码为8位代码字。这是简单的、不太非线性单调和连续的函数,即伽马2.2。理念是,经由这样的直接连接系统对采集、编码和渲染的这一紧密。
18、链接将相当于几乎自动地正确做出分级。信号被直接施加到CRT显示器的阴极,并且这是由于该CRT物理结构才选择伽马2.2(其附带地还给出合理的均匀精神性视觉明度范围来利用)。如果仅存在单个类型的显示器,其将正确地将驱动值渲染成输出辉度,只要其被为LDR信号说 明 书CN 104471939 A2/25页6的驱动信号驱动。并且利用直接来自摄像机的补偿伽马(即大约1/2.2)对其进行自动预分级。而且,如果在创建侧的任何分级艺术家希望微调或改进像素颜色,则他将在创建侧的正好同一CRT上观看信号时这么做,从而消费者家庭电视机将大约精确地给出相同渲染(除在观看者上的环绕效果之外),因为其由同一校正的图像驱动。
19、。0006 在任何情况下,该LDR编码链用作闭合的规范,其中渲染和编码(或分级)相当于同一事情。现今,具有非常不同的显示器(例如在家庭的LCD,用于在火车上观看图像内容的Ipad、家庭投影仪和最近非常高明度的HDR显示器)使得渲染或色域映射应当是完全与图像编码分离的阶段成为必要,因为给定同一输入图像,这些显示器将显示出在它们的输出外观中的非常大的变化,这可能比期望的更加严重。0007 但是在任何情况下,在内容创建侧,例如在摄像机和编码之间,在LDR系统中仍然遵循该紧密链接。尽管现代消费者摄像机(尤其是因为最近它们开始并入HDR功能)可使用比伽马2.2更精密的代码映射函数,它们仍然具有相对类似的。
20、功能,其不是高度非线性的,即不是如此不同使得我们不能利用线性分析逼近它们的数学行为的很多方面。0008 特别是其在必须采集较高辉度范围的场景(例如坐在汽车中的人的场景)时被看到。例如人的脸的曝光以及代码映射函数(例如S曲线)之类的因素的组合通常导致以下事实:如果针对汽车内部良好地曝光,则可仅利用接近代码色域的上边界的淡颜色(pastellish color),即利用接近255的亮度来表示外部。这是因为摄像机或摄影师例如选择使脸部颜色代码映射为接近平均辉度,比如说简单值128。如果我们粗略估计在该值周围的映射函数是平方函数,则值255可仅表示高4x的外部亮度。当然实际值将取决于摄像机系统(包括人。
21、操作员选择)将如何智能地处理这样的亮区域,并且在代码映射中的大致肩部可仍然至少分配不同的代码值给比脸部的4x辉度更高的场景辉度(但是也必须说,在实际上,当在不具有很多准备的情况下拍摄地点快速产生的内容中的非常多部分将图像的显著部分修剪到255,并且其是否是如此令人满意是成问题的)。0009 无论如何,作为粗略措施,可以说500:1(或至少1000:1)的上述辉度比率,LDR编码变得成问题,并且至少如果我们希望对场景正确地编码,则我们进入HDR编码技术领域。因此这以建立大约5-10到1、高亮到阴影的照明不均匀的几何形状因子发生,因为物体的反射通常在1%和100%的范围之间。这样的照明降低可已经发。
22、生在距离窗户几米远的房间中。0010 高动态范围场景的示例(其也清楚地向人观看者显示独特的色彩方案)是黄昏城市风景。白色已变成对于人类视觉来说的浅灰色,并且白色看起来在场景中丢失,因为光已经跳到在该(“光”)之上的明度水平。即,人将愿意能够在HDR显示器上显示这些作为光对象,并且还以能够将它们清楚地辨别为光(尤其通过不直接应用输入信号作为驱动信号,但是做一些色域映射优化的渲染器)的方式对它们进行编码。注意,因为摄像机采集、编码和显示的去耦合,关于指定哪些动态范围(并且它们应当不总是辉度对比),应当做出仔细的辨别,因为当进行渲染时特别的例如100000:1的动态范围场景可能不一定需要相同的对比度。
23、(例如在显示器上的太阳不需要实际能够伤害你的眼睛),实际相关因子是精神性视觉合理的类似表现。更不用说在一般的高度非线性编码中,这应当表示关于编码解码器的动态范围的任何事情,因为例如特定的映射或编码/渲染精度之类的这样的因素可能都对其具有影响。关于显示渲染,已知具有HDR显示系统,如果其可渲染特别是在LDR显示器上不说 明 书CN 104471939 A3/25页7能如实渲染的光效果,例如实际闪耀的灯,或室外场景的真实太阳照射。并且特别地,将其它场景对象(例如室内家具)的明亮与其协调,即,给出明亮和正常/较暗对象的良好外观结果的这样的亮度(人视觉是相对的)。0011 被首先设想用于HDR图像编码。
24、的(原生)解决方案是由工作在计算机图形学领域中的人构想的,因为在计算机中,可做出任何类型的信号(不具有采集透镜限制,在计算机中,在超新星旁边的宇宙可实际具有零辉度,而且不具有任何采集的光子噪声)。因为框架能够全部遗弃任何之前电视技术约束,合逻辑的解决方案将仅对场景辉度进行线性编码。这将意味着对于像素亮度,需要较高量的代码位,例如16或32。除了如上文所述较高量的数据(其对于视频可能有时候是个问题)之外,这样的原生编码绝对与成像链的剩余部分(即渲染系统)没有链接(或嵌入的技术知识,例如附加的值、测量或包括在等式中的知识,其可以与被编码的像素图像一起被协同编码为元数据或与被编码的像素图像分离但是可。
25、链接到被编码的像素图像)。0012 编码的替代的第二方式是通过双显示系统启示的,或至少与双显示系统概念上相关,双显示系统例如双LCD面板显示器、或具有2D可调制背光的单面板LCD。在这些系统中,最终输出是有背层显示器产生的光图案与前LCD的透射的乘数。问题然后是如何驱动两个信号,给定例如我们具有如上文的原生16位(至少亮度)HDR编码,以及标准驱动器电子器件和例如8位的LCD的物理调制能力(这意味着LCD的线性透射可实现其完全透射的1/255的黑色,以及对于非线性行为的潜在稍微不同的值 ;并且例如背光也是通过8线性位可调制的)。简单的解决方案则将是取像素亮度的平方根,并且发送2x该平方根给两个。
26、驱动器。原理上,任何乘法分解将(理论上)适合。例如,如果LCD仅可以4个梯级(step)(2位线性)改变透射,可仍然做出精确的HDR系统,只要利用给出除法的余数的信号来驱动背光:Y_背光 = Y_HDR/Y_LCD,其中Y_LCD将在该示例中更亮或暗地以4个不同方式调制在背后的是什么光(例如最大阻挡,其可以是例如投射背后的光的第1/80,相比透射100%和在2等距透射之间)。0013 Y_HDR 将是16位信号,其中最大值将表示通过将显示器的背光(局部地)切换到其最大值(考虑加热、老化等)大致可渲染的一些非常亮的场景辉度。从而,再次使用线性编码(因为其是渲染如何物理上工作),背光将需要做出16。
27、位的第1/4的范围(将做出65536个线性阶梯),其(再次如果我们假设我们需要线性编码和等距驱动)意味着背光将由14位信号驱动(如果需要这样的精度的话)。背光可因此通过任何所需的因子将局部值变为LCD值以渲染HDR图像。实际上,因为这些显示器包含比像素远更少的数量的LED背光元件,所以通过根据一些平均照度驱动背光来渲染图像的一定逼近。从而,例如类似于英国哥伦比亚大学的US7172297的权利要求2中那样,首先计算局部图像像素的平均亮度,并且这得到逼近所需要的渲染的背光值,并且然后设定LCD像素为Y_HDR与该逼近的除数。从而,该相乘的令人感兴趣的属性是其对应于线性位中的降低以对图像之一执行编码。
28、,这可在数学上被看作一定种类的范围压缩或色域映射。0014 从而进一步对此进行精细设计,即以基于这样的乘方案对任何HDR图片进行编码(不一定用于实际两层显示器)。即,可以通过做出一些一般色调的映射来形成第一图片,并且从该映射的得到的8位图像建立标准的JPEG图片(Y_JPEG)。并且然后存储第二图片,第说 明 书CN 104471939 A4/25页8二图片是比例图像Y_HDR/Y_JPEG。从而在解码器侧,可然后使用正常的LDR JPEG图片,或通过将两个LDR图片相乘来再创建HDR图片(假定初始是16位得到两个8位图片,这一般对于大多数(如果不是所有的话)HDR场景或情形是足够的)。该方法。
29、的第一劣势是,尽管可如此编码任何HDR图像(通过在比率图片中校正在JPEG图片中的任意,或至少得到合理的逼近,如果JPEG被恶劣编码以致得到的校正越过可能的范围的话,例如如果两个相邻像素被选择为JPEG中的1的话这可能发生,但是在HDR中应当是230或350,再次假定线性),但是代价是需要编码2个图片。通过任何数学校正没有节约,除了需要周围的语义来对那两个图片格式化之外,乍看起来将需要与当存储单个16位图像时相同量的位(至少如果不空间上做二次采样等的话)。第二,该“盲”分解与实际渲染器的物理结构或呈现在所渲染的场景中的物理或精神性视觉语义法(例如哪个对象是仅仅亮的灯)无关,相反其仅仅起因于对被。
30、选择以变成基于JPEG的图像的东西的相乘校正。但是它是好的对图像进行编码的向后兼容的策略。0015 可以从预测-校正可伸缩编码追溯编码的第三方式,其中通过附加的校正图像来校正预测。最初,这在尤其SNR可伸缩性中发生,并且第一图像是逼近,其可包含像素亮度的凑整或量化的版本。在其之上添加图片,该图片添加了另外的精度(注意其它变型可包含例如空间逼近,其也可通过加入校正信号来校正,这将然后也恢复高频率,例如在边界处)。从而如果例如待编码的原始(LDR)信号具有空间上相邻的像素127、144,可以例如利用4的精度阶梯对6位的逼近进行编码,给出像素值128和144。可然后利用包含值-1和0的更高精度的图像。
31、来对其校正。因为逼近已经足够好,校正信号的范围应当更低,这可实现位节省。0016 因为范围和在范围内的精度可原理上互换,也可构想使用这样的技术用于编码HDR图像。实际上,可以定义任何编码范围(以及8位编码)的最大值来与任何场景辉度对应。但是给定HDR场景中的明度阶梯的量,这可被看成是大概仅对于大于8位编码来说是合理的。同时,仅仅可伸缩性不暗示色调映射中的任何改变,即显然仅处理亮度的精度问题,但是并不陈述有关特定LDR编码将如何与任何HDR编码相关,或任何编码后图像将需要如何被最优地渲染在任何显示器上(而不会例如一般在较低峰值明度的显示器上被渲染地过暗)的任何内容。0017 在该概念上进一步构建。
32、,如在WO2007/082562(参见图1)中开发了两层HDR编码方法。在这样的编码器中,认识到存在在HDR和LDR之间的关系,因为其可被采集、编码(例如凭借色域映射)或一般被分级(一般通过为内容制作人工作的艺术家分级员),。例如,因为LDR色域(如由例如400尼特的典型LDR显示器将渲染的东西来定义)可能不能够如实包含亮区域,例如阳光充足的室外,可以通过降低其亮度(并且可能还降低颜色饱和度)来将这样的区域映射到LDR空间。从这样的原始场景的LDR编码做出HDR图像将包含将图像的那些亮室外区域的像素亮度/颜色映射到较高的明度(或换言之,预测HDR分级图像将像什么),例如通过添加固定的或取决于L。
33、DR亮度的明度来偏置那些LDR亮度,或一般施加映射函数到至少亮度:Y_HDR=f(Y_LDR)。将至少得到更像HDR似的外表,但是该预测将如何靠近原始HDR分级将强烈取决于映射/预测函数的正确性(和复杂性)。因为图像的高复杂性(使人通常选择更简单的预测(例如是全局色调映射,其将每个像素亮度唯一地映射在亮度值上并且不映射例如图像中的像素的空间位置之类的其它因素),而不是选择(无论如何说 明 书CN 104471939 A5/25页9不完全精确地预测原始HDR图像的)更复杂预测),将存在差别,并且这将是不同的图像。从而,这些两层方法也将该对图像进行编码。因为在LDR分级(其原则上甚至不必须靠近或类。
34、似于HDR分级,而可以是任何形式)与HDR分级之间的区别与X位精度和信号的X+Y位精确表示之间的区别完全不同。它们可以原则上是任何东西,甚至高到16位图像(例如原始HDR),而不是8位区别图像,例如如果预测是如此差以致预测像素亮度的连续零,而HDR像素亮度将例如是65000、65004等(虽然这样的最差情况情形是如此不太可能,也能够限制编解码器仅在该情况下犯错误)。在任何情况下,利用校正图片测试那些预测编解码器中的一些,我们发现它们可能需要大量的编码后的数据,并且特别是该数据可编码实际上不与HDR体验如此相关的图像信息,例如在错误方向映射HDR亮度的预测模型误差的校正,或噪声或精神性视觉上不如。
35、此相关的图像结构,或至少不是对HDR影响有贡献的最重要图像结构(在HDR相关性的层级上,例如火焰可以是重要的,并且该外观可已经通过很少的良好选择的数据字来编码)。0018 从而下文提出的技术的目标是提供HDR编码技术(即,与经典LDR相比,沿着亮度范围的图像区域的更高质量的任何编码技术),其给出对场景中的至少一些(如果不是所有的话)HDR方面(即,光,对象的照明(例如某些图像区域的太阳照射),某些方面(例如局部对比度)的改进渲染,等)的编码的更好控制,得到这样的可能的优势,例如较低的比特率,或在编码的位的层级中至少更显著的信息。发明内容0019 该目标的问题中的一些通过将对应于第一辉度动态范围。
36、(R_oLDR)的图像编码(LDR_CONT)解码成第二辉度动态范围(R_oHDR)输出图像(HDR_FIN)的方法来处理,其中图像编码(LDR_CONT)是高动态范围场景的原始图像(HDR_ORIG)的编码像素,该方法包括:利用预定色调映射策略(FL2H)来将图像编码(LDR_CONT)中的像素的至少亮度色调映射到对应于第二辉度动态范围(R_oHDR)的中间图像(HDR_PRED)中的像素的亮度上;以及通过将中间图像(HDR_PRED)的像素中的至少一些的亮度乘以预定相乘因子,来修改该亮度,得到输出图像(HDR_FIN)。0020 通过对像素进行编码,我们当然意指那些像素的信息(因为像素是对。
37、特定采样位置的纹理颜色采样,如在所选择的比色系统中定义的),即它们呈现的图像对象纹理,即那些像素的颜色表示(例如YCrCb或RGB)。但是LDR_CONT并不包含在原始HDR图像的颜色编码中的实际表示(即使其将被编码为3x8位图像),但是相反包含存储在LDR_CONT中的新颜色中的那些颜色的转换,该新颜色然而仍旧包含渲染原始图像所需要的空间统计颜色信息。从而,像素仍然表示相同的几何图像对象结构,但是如果被渲染在与原始HDR图像被输入的不同的特定显示器上时具有不同的比色外观(但是信息理论上,不管什么比色转换,与在原始图像中相同的信息,即对HDR场景中的信息的良好采集,几乎仍然存在于图像编码LDR。
38、_CONT中,并且是至少利用附加元数据,并且特别是利用根据本创新实施例的元数据,而可再获得的)。通过与图像对应或与图像相关联的动态范围,我们意指旨在主要在特定动态范围的显示器,或类似范围的显示器上渲染(在下文解释在定义以这样的方式的编码的含义的渲染的动态范围与人们所通常认为的例如8位亮度编码的动态范围(其仅对于线性编码是有意义的)之间的精确区别)。通过色调映射策略,我们意指例如简单的全局色调映射说 明 书CN 104471939 A6/25页10函数,或例如将图像编码的像素颜色最终改变为输出图像的像素颜色的任意算法。0021 实现具有向后兼容直接可用LDR信号的这样的系统的非常令人感兴趣的方式。
39、是将高动态范围(输入或主)图像或视频信号的编码解码成高动态范围输出图像或视频信号的方法,该方法包括:- 利用预定色调映射函数将编码中的像素的至少亮度色调映射在高动态范围中间图像中的HDR像素的亮度上;以及- 通过将该中间图像的HDR像素中的至少一些的亮度乘以预定相乘因子来修改该亮度。0022 对于编码,我们意指场景的图像的任意表示,不一定被压缩,但是特别智能地在其表示中使用HDR场景的属性(例如分配亮度子范围以平均灰度对象以及另一子范围用于光效果)。为了简化,我们将聚焦于亮度,因为规定对象的明亮值是对于视觉质量来说更重要的因子,在其周围的颜色具有一定更小的影响(例如因为我们不知道新闻播报员的衬。
40、衫的颜色)。从而如果我们需要做出变形误差,例如因为色域形状问题,我们能够在色度方向更好地做出它们。技术人员知道,我们还能够指定在该亮度轴周围的颜色的色度方面,其通过指定在规定的亮度周围的色域映射的色度(例如一些色相和饱和度函数),或通过工作在三个R、G、B轴上,而不是在亮度、色度颜色表示上等。因为这不是本发明的核心,我们将不对此详述。技术人员理解,可在亮度通道上完成的操作(映射和修改)可当然也能够在另一颜色通道(例如红色通道)上完成。对于信号,可以理解如何根据一定标准对图像数据进行格式化,尤其是当添加另外的元数据时,而在我们的描述中的图像可以被理解为像素颜色的原始阵列(但是在这两种构想中都可容。
41、易理解本发明)。0023 我们将描述用于有用的应用的基本方法,其中我们主要将HDR场景(存在至少协同编码的转换函数,但是可以例如以辅助方式来编码一些HDR高明度区域,例如利用局部替换图片,以给出在解码器侧的空间局部像素的集合)编码为8位遗留图像(即例如凭借MPEG-AVC 编码来编码的),我们将其称为“HDR_encoded_as_LDR”(或还可称其为“LDR_ 容器”编码,因为HDR被封装在LDR框架中)。在该示例中的编码将是例如LDR MPEG或JPEG,包含主要的高动态范围输入视频信号(例如16位线性)的信息。能够理解为什么这样的编码可在很多情形中工作。尽管对于最高质量,避免在精细梯度。
42、上的条带,或对象的非常精细的纹理,但是对于目前的显示明度和尺寸,甚至多于8位可能是令人满意的。然而,对于在图像中快速移动的复杂对象纹理,6位逼近可能已经是合理的。从而将重要的亮度子范围压缩到不小于6位的任何映射可能不错。对于整个范围,通过在LDR和HDR 8位分级之间的映射从8到6位的降低将允许已经线性的伸展或伽马,其通过因子4或2段(stop)来减光。尤其对于其中带宽/存储器或比特率是有点关键的应用,可能希望使编码允许已经大多数HDR特征处于非常合理的质量,如果不是需要更多的位的最大可能质量(并且可能甚至对于很多所谓高质量应用,通过例如不适当或临界地调谐DCT系数的量化器等来无论如何做出更大的伪影)。0024 应当仔细衡量以理解在被编码用于特殊辉度范围(例如 LDR 范围)的信号(例如可用于通过直接应用该信号作为驱动信号)与其实际包含的 信息之间的对于本教导的重要区别(该区别不是通俗易懂的见解)。因为我们已将编码和渲染完全去耦,所以这可被完成。仅必须处理将亮度子范围中的信息沿着0.1或最小_亮度, 最大_亮度范围偏移到说 明 书CN 104471939 A。