首页>论文>正文
日期
06/07
2006
咨询
  • QQ扫一扫

  • Vision小助手
    (CMVU)

全面解析 视频压缩技术和MPEG降噪技术
收藏
2006-06-07 19:19:53来源: 金辉安防同盟

   理论上,数字电视(DTV)画面品质优于传统的模拟电视,没有鬼影、雪花、颤动和色彩失真等等问题。而且,模拟电视信号正如可以论证的那样,最大的缺陷就是画面斑点甚多,且因为对高频信号响应不足而导致画面不够细腻,简单地说,就是带宽不够。图像越细致,分辨率就越高,所需要的带宽就越大。

   很久以前,美国官方就把可用频谱中的每6MHz带宽分配给美国广播公司的每一个频道以提供模拟电视信号,这种对视频带宽的限制及其对应的显示标准(NTSC色彩空间),就决定了传统电视机的特征,并在几十年时间里决定了电视画面的质量。

   随着数字电视的出现,广播公司看到了能更充分地利用其分配的带宽的机会。的确,从他们的角度来看,数字电视最突出的优点莫过于容许在同样的带宽内传输更多的频道,并且同样能支持后续的高清晰度电视节目(HDTV)。

   冗长的数据


   带宽的限制

   HDTV对技术的要求非常高。传统传播模拟信号的NTSC信号在一个频道6MHz带宽内最低要使用4.2MHz的带宽,并以29.97Hz的场频扫描525线。经过数字量化和编码压缩之后,该信号可以被记录在DVD上,其位传输bit率从2Mbits/s到10Mbits/s(支持自适应),平均为4Mbits/s。比较而言,典型的HDTV具有5倍于模拟TV的分辨率。因此在同样条件下,传输数据率应该是模拟信号的5倍才能达到同样的性能。

   无论是传统的空中广播(OTA)、有线电视公司的机顶盒,还是卫星电视,他们都在传输信号时受到带宽的制约,在受限的带宽上他们还要附加占用带宽的服务,包括互动广播、收费频道和电视节目表等等。

   那么,怎样才能解决问题呢?采用压缩技术是一种办法。

   数字视频压缩引起失真

   目前最常用的数字视频压缩算法是MPEG-2。从现有的卫星电视传输、有线数字电视传输到空中数字广播,MPEG-2在各种应用中已经被国际上广为采用。

   MPEG-2首先通过运动补偿去除时间冗余,然后将一帧图像分割成一个个8x8的相素点阵,在每个点阵内使用DCT(离散余弦变换)去除空间冗余。DCT完成后通过量化和重组后压缩就完成了,然后进行可变长编码,最后进行霍夫曼编码。整个压缩过程极大的减少了比特率(>10:1压缩比)。

   然而,比特率的减少也带来了问题,因为编码损失了一些原始的视频信息,有可能引起严重的负作用,所以,MPEG-2被称为有损编码。它丢弃了被认为视觉上较为次要的图像信息。压缩得越大,编码后的图像与原始图像的差异就越大。图像质量和逼真度现在取决于所选择的(或通常是施加的)压缩级别。因为它直接与可用带宽相关,我们必须问问自己,什么时候才不出现过度的视频压缩呢?

   看得见的失真

   在数字信号传输中的带宽限制以及过分的图像压缩,使压缩后的图象完全不同于模拟世界看到的图像。

   通常,模拟图像变差(或噪声)经常是以高斯噪声的形式出现,该噪声的优点是它会保留基本的内容并且因为人眼视觉缺陷而不易被发觉。我们常常会看到那些有些模糊而让人不那么舒服的模拟图像,但是,这并不会让人觉得明显的反感。

   数字噪声遵循的是一种不同的分布模式,更重要的是,其特殊的形态让人的视觉感到很不自然。当将MPEG-2编码(或任何基于DCT模块的编解码)用到极限,失真就主要有两种方式:蚊式噪声(Mosquito noise)和方块效应(Blocking artifacts)。

   蚊式噪声

   在清晰的彩色背景上,围绕突出物体、电脑仿真物体或滚动的字符周围的蚊式噪声最为明显。它看起来像某种围绕物体与背景之间高频分界(在前景物体与背景之间形成的尖锐跳变)的朦胧的东西或闪光体,甚至有时它被误认为是环绕物。不幸的是,这种细小的效应在人身体之类更接近自然的形状上也能看到。VIRIS项目组(视频参考损伤系统)将蚊式噪声定义为“伴随着运动物体边缘的失真,表现为围绕着物体四周有一层象飞行物体和/或模糊的气泡的物质(就像蚊子围绕着人头部和肩膀飞)”。

   当重建图像并因为使用用反余弦变换丢弃一些数据时,就会出现蚊式噪声。

   “蚊子”在一张图像的其它部分也可以找到,例如,在特定的纹理分界处或颗粒状物体处也会出现蚊式噪声。结果就有点类似随机噪声了,噪声看起来似乎与纹理或颗粒物混合在了一起,看起来就像画面的原始特征。

   方块效应,名副其实,在图像中表现出令人讨厌和不自然的方块。有时侯表现为一大块,它是一种图像的失真,且是由分块编码结构造成的。

   当编码达到最大化的时候,每个像素点阵就会被相当粗糙地取平均,使之看上去像一个大像素。每一个像素点阵的计算都不一样,这样就造成了各个点阵之间象是有明显的边界一样。

   当物体或摄像机快速运动的时候该效应更为明显。最佳的例子是在NFL(美国国家足球联盟)广播过程中,抱球飞奔的运动员看起来就像老式任天堂游戏机里的马利奥兄弟似的。

   预平滑

   尽管预平滑不是图像压缩处理算法中的一种,但它已经被用于消除这种数字失真。

   广播公司和内容提供商已经越来越意识到其传播系统的缺陷,他们中的一些针对已有的带宽限制采用了相当有争议的解决方案:预平滑。

   通过在信号输入信道之前消除其图像中的高频部分,编码器有更多的时间处理其任务,所产生的图像受到方块效应和蚊式噪声的影响就更小。另一方面,这种一定程度上的过度滤波也损失了原始图像中的所有微细变化和纹理。

   例如,一个蓄须达一周的足球运动员现在看来象是胡须剃得很干净(即使他处于静止状态),而体育场则看起来像一片绿色的大地毯。

   可以证明,尽管有人会觉得预平滑也不错,但这完全是一个不可逆的算法。一旦处理掉了细节,人们就不能再重建它们了。

   然而,方块效应和蚊式噪声确实消失了。

   MNR: Algolith公司的解决方案

   从学术的观点看,人们已经对图像的压缩和校正进行了广泛的研究,但是,至今为止,尚没有多少针对最终用户的切实可行的解决方案。


   Algolith公司是最先提供实时解决蚊式噪声和方块效应的解决方案的公司之一,Algolith的产品是MNR(MPEG Noise Reducer-MPEG消噪器)。

   MNR实现了4种独特的图象处理技术:

   1 - 每个像素实时回归进行降噪

   2 - 采用巧妙的分组技术降低蚊式噪声

   3 - 通过检测、混合及逐步缩小基于DCT压缩的点阵来减弱方块效应

   4 - 采用非线性滤波实现图像体调整

   MNR的本质在于其空间图像分析模块。每个像素被定义在不同的区域,比如边缘,纹理,平面或者交叉区域。MNR同样关注运动图像的瞬时状态。考虑了所有这些因素后MNR会在多种滤镜中选择一种加以应用。

   MNR独特的适用性使其成为一种先进的图像处理系统。MNR能在出问题的特殊区域运行而不会影响到画面的剩下部分。要知道何时何地使用滤镜同何时何地不使用滤镜是同等重要的。正是基于这种理念MNR被设计了出来。因此,MNR仅用来增强观看体验而且特别适用于大屏幕显示器和投影显示器。

   其高度自适应特性还容许在不改造已经建立的广播基础设施的条件下改善图像质量。MNR的设计一直考虑了实时实现和硬件可行性,因而可以被无缝地植入到终端用户现有的家庭影院设备之中。


   显示技术的发展

   曾经,NTSC标准代表了显示领域的标准。模拟电视多年来一直都保持不变的分辨率,视觉质量的改善并无实质进展。目前,由于政府主管部门没有强制执行新的数字电视标准,无论好坏怎么样,都使普通电视的标准得到了不断的进步。

   分辨率标准的提高是没有尽头的。随着新兴显示技术的快速发展(LCOS,DLP等等),一些新型显示器现在可以超过信号能表现的最大分辨率。更重要的是,新的显示具有更高的对比度,还达到了几年前难以想象的大尺寸屏幕。

   所有这一切都给提高图像质量提出了更高的要求,因为对于那些干扰和失真它们表现出了放大镜的作用。

   随着显示技术的不断进步,象Algolith公司专有的MNR技术那样的对原始图像信号的修正方案,将更具有吸引力。

   最大限度地沿用SD DVD直到HD尘埃落定

   向数字世界的转移不仅仅表现在广播电视工业,老式的家用录像带系统在全数字的DVD视频(数字通用碟)面前也将加速走向灭亡(如果还算没有全部灭亡的话)。但是,即使这种技术在压缩的要求下也显得不安全。

   的确,增加新的内容,加长的影片时间,多声道的音轨会使本已经包含有大量内容的碟片播放起来不那么清楚了。因为更多内容的加入,会使碟片空间显得不够而导致不得不提高压缩率。这样的结果是,消费者开始抱怨效果不清楚,这促使了“超级内容”DVD的出现,这种DVD关注于如何使碟片能装下的电影内容最大化。

   这种发自DVD出版行业的行动不仅证实了压缩可能带来的缺点,而且还表明了公众对其的认识。因此,正常的DVD媒介可能会从进一步的视频处理中获益,如Algolith公司的MNR解决方案,NHR容许现有这一代媒介沿用下去,直到我们等来蓝光、HD DVD和HVD之战的胜者。

   未来展望

   新格式之战的胜者关注的是提供具有最高视觉品质的高清晰内容,这当然是采用现有的DVD技术不可能做到的事情。此外,这些新格式除了包含现有编解码技术外还将包括下一代编解码技术:

   MPEG-2, 常用的高清方案

   VC-1, MPTE标准421M的非正式草案,基于微软的Windows媒体播放器(WMV)技术。

   MPEG-4/AVC a.k.a. H.264, 是最有发展前景的编解码方案。

   然而,这些牵涉到版权问题的不同标准有可能导致象DTV启动时那样的混乱状态。最终图像质量会受到何种影响,尚需拭目以待。

   编解码器越优秀,用户的需求就越高

   数字电视和高清电视为图像质量最初带来的仿佛是“圣杯”,尽管如此,现实却是我们的图像质量要做到脱胎换骨还为时过早。对压缩的需求本身已经带来了若干问题,随着更好的显示技术的出现,这些问题对一般电视观众会变得更为明显。

   整个行业都认识到有限视频带宽的严峻现实,作为下一代解决方案的编解码效率的提高展示出改善图像质量的潜力。然而,由于未来似乎被对带宽日益增长的需求所主导(IPTV增加了互动性和内容定制),人们可能要问,如果仅仅在压缩技术上创新还能满足消费者的期望吗?

   随着现实与需求之间差距的扩大,开发更好的视频处理算法将成为未来追求高清显示的另一个战场。