登陆注册
9654400000040

第40章 数字图像传播(2)

(3)视频压缩的基本概念

以压缩/解压后的数据与压缩前原始数据是否完全一致作为衡量标准,可将数据压缩划分为无损压缩、有损压缩和混合压缩三种。

无损压缩:无损压缩是对文件的数据存储方式进行优化,采用某种算法表示重复的数据信息,文件可以完全还原,不会影响文件内容,对于数字图像来说,也就不会使图像细节有任何损失。由于无损压缩只是对数据本身进行优化,所以压缩比(压缩前的数据量与压缩后的数据量之比)有限。

常用的无损压缩编码算法有哈夫曼编码、算术编码、行程编码等。

有损压缩:有损压缩是对图像本身的改变。如图像色彩用HSB色系表示时有三个要素:亮度(B)、色相(H)和饱和度(S),而人眼对亮度的敏感程度远远高于其他二者,也就是说,只要亮度不变,稍微改变色相和饱和度,人们难以察觉。

因为有损压缩不能完全还原原始信息,所以打开压缩过的图片再次存储,损失会累积,图像质量会进一步下降。

常用的有损压缩编码算法有预测编码:差分编码、运动补偿;频率域方法:正交变换编码(如DCT)、子带编码;空间域方法:统计分块编码;模型方法:分形编码、模型基编码等。

混合编码:即同时采用两种或两种以上的编码方法混合进行的编码。混合编码可以根据实际需要充分发挥不同编码方法的优点,不但可以获得更大的压缩比和更优的图像质量,而且可以降低计算复杂度和提高抗干扰力。目前的图像编码标准方案(如JPEG和MPEG等),几乎都采用多种不同的编码方法进行混合编码。

2.压缩编码算法的研究进展

(1)第一代视频压缩编码技术

视频压缩编码技术的发展历程是以香农信息论为出发点,不断改进、不断完善的过程。第一代视频编码技术仅考虑图像及图像序列中的空间冗余、时间冗余和信息熵冗余,其编码方法主要以像素或像素块作为编码实体,没有或较少考虑信息接收者的主观特性和人类视觉系统,因而只能去除数据冗余,属于低层压缩编码的范畴。第一代视频压缩编码技术主要有信息熵编码、预测编码、变换编码、矢量量化编码、子带——小波编码、神经网络编码等方法。

(2)第二代视频压缩编码技术

20世纪80年代后期,图像分析和合成、计算机图形学、计算机视觉等相关学科的迅速发展及新兴学科的不断出现,为视频压缩编码的发展注入了活力,同时关于人类视觉生理/心理特性的研究也大大拓宽了人们的视野,第二代视频编码技术随之诞生,并且不断成熟。其编码思想由基于像素和像素块转变为基于内容(Content—based)。

它突破了香农信息论框架的束缚,充分考虑了人眼视觉特性及信源特性,通过去除内容冗余来实现数据压缩。具体编码技术又可分为基于对象(object-based)和基于语义(Semantics—based)两种,前者属于中层压缩编码的范畴,后者属于高层压缩编码的范畴。

第二代视频压缩编码技术属于模型编码方式,是由轮廓——纹理的思路发展而来,主要有基于方向滤波的图像编码法、基于图像轮廓——纹理编码方法、分形编码方法、基于模型的编码方法等等,许多编码技术还有待于进一步的研究和探索,是目前比较活跃的研究领域。

3.常用压缩编码算法简介

在数据压缩编码过程中涉及较深的数学理论基础问题,本节仅介绍几种常用的压缩编码方法,主要是从物理意义上作一定的解释。

(1)熵编码

在信息论中,信源X中目标xi(i=1,2,…,n)的信息量I(xi)被定义为I(xi)=-log2p(xi),式中p(xi)为xi(i=1,2,…,n)出现的概率。信息的熵H(X)就是信源X中所有目标的平均信息量,即H(X)=-Σn[j=]1p(xi)log2p(xi)。

熵编码以信息熵原理为基础,把数据中出现概率大的码元用短的码元表示,即占用较少的比特数(二进制位数);把数据中出现概率小的码元用长的码元表示,即占用较大的比特数(二进制位数)。这样能大大地压缩数据量。

熵编码是一种无损编码,常用的有哈夫曼编码、LZW编码、行程编码和算术编码等。

A.哈夫曼(Huffman)编码

哈夫曼编码是一种常用的压缩编码方法,是Huffman于1952年为压缩文本文件建立的。基本原理是频繁使用的数据用较短的代码代替,较少使用的数据用较长的代码代替,每个数据的代码各不相同,这些代码都是二进制码,且码的长度是可变的。例如,一个文件中出现了8种符号A0、A1、A2、A3、A4、A5、A6、A7,那么要编码至少需要3比特。假设分别编码成000、001、010、011、100、101、110、111(称作码字)。那么符号序列A0A1A7A0A1A6A2A2A3A4A5A0A0A1编码后变成000001111000001110010010011100101000000001,共用了42比特。实际上,在符号序列中A0、A1、A2这三个符号出现的频率比较大,其他符号出现的频率比较小,如果我们采用一种编码方案使得A0、A1、A2的码字短,其他符号的码字长,这样就能够减少总比特数。例如我们采用这样的编码方案:A0到A7的码字分别表示为:01、11、101、0000、0001、0010、0011、100(这个编码不能随意乱写,编码必须保证不能出现一个码字和另一个的前几位相同的情况,比如说,如果A0的码字为01,A2的码字为011,那么当序列中出现011时,就不知道是A0的码字后面跟了个1,还是完整的一个A2的码字),那么上述符号序列变成011110001110011101101000000010010010111,共用了39比特,尽管有些码字如A3、A4、A5、A6变长了,但使用频繁的几个码字变短了,最终实现了压缩。

具体的Huffman编码算法是:先按出现的概率大小排队,把两个最小的概率相加,作为新的概率和剩余的概率重新排队,再把最小的两个概率相加,再重新排队,直到最后变成1。每次相加时都将“0”和“1”赋予相加的两个概率,读出时由该符号开始一直走到最后的“1”,将路线上所遇到的“0”和“1”按最低位到最高位的顺序排好,就是该符号的霍夫曼编码。产生Huffman编码需要对原始数据扫描两遍。第一遍扫描要精确地统计出原始数据中每个值出现的频率,第二遍是建立Huffman树并进行编码。由于需要建立二叉树并遍历二叉树生成编码,因此数据压缩和还原速度都较慢,但简单有效,因而得到广泛应用。

B.行程编码

行程编码又称“运行长度编码”或“游程长度编码”,属于无损压缩编码。行程编码的原理是:将一行中颜色值相同的相邻像素用一个计数值和该颜色值来代替。例如aaabccccccddeee可以表示为3a1b6c2d3e。

视频图像中经常出现一连串连续的像素点具有相同值的情况,例如彩条、彩场信号,就不必把所有像素存储,只需传送起始像素点的值及随后取相同值的像素点的个数,这种情况下压缩比是惊人的。

该算法也有一个致命弱点,如果图像中每两个相邻点的颜色都不同,用这种算法不但不能压缩,反而数据量增加一倍。所以单纯采用行程编码的压缩算法用得并不多,主要用于对量化后的DCT系数进行编码。

C.LZW算法

LZW是一种比较复杂的压缩算法,其压缩效率也比较高。它的基本原理是:LZW把每一个第一次出现的字符串用一个数值来编码,在还原程序中再将这个数值还成原来的字符串。例如:用数值0100代替字符串“abccddeee”,每当出现该字符串时,都用0100代替,这样就起到了压缩的作用。至于0100与字符串的对应关系则是在压缩过程中动态生成的。LZW是无损的,GIF文件采用了这种压缩算法。LZW算法由Unisys公司在美国申请了专利,要使用它首先要获得该公司的许可。

(2)差分编码和预测编码

差分编码和预测编码是用于消除统计冗余而设计的压缩编码方法。差分编码是指不传送像素本身的值而是传送该像素值与前一像素值(或前一帧对应像素值)的差值,去除相邻像素之间的相关性和冗余性,只对新的信息进行编码,从而有效压缩数据。例如,因为像素的灰度是连续的,所以在一片区域中,相邻像素之间灰度值的差别可能很小。如果我们只记录第一个像素的灰度,其他像素的灰度都用它与前一个像素灰度之差来表示,就能起到压缩的目的。

由差分编码进一步发展起来的预测编码,是根据一定规则先预测出下一个像素或图像子块的值,然后将此预测值与实际值的差值传送给接收端。由于差值的数据量低于原图像的数据量,因而能实现图像数据压缩。常用的预测编码有Δ调制(Delta Modulation,简称DM)、线性预测编码(Differential Pulse Code Modulation,DPCM)等。

预测编码的基本思想是:

模型利用以往的样本数据对下一个新的样本值进行预测

将预测所得的值与实际值的差值进行编码由于差值很小,可以减少编码的位数。

帧内预测编码对噪声和误码很敏感,并且压缩比较低。目前预测编码主要应用帧间预测编码,一般有5种编码方式:帧重复法、帧内插法、阈值法、运动补偿法、自适应法。

(3)变换编码与离散余弦变换(在JPEG部分重点介绍)

变换编码的基本思路是:将在空间域里描述的图像,经过某种数学变换后(通常采用正交变换,如傅立叶变换,沃尔什变换等),产生一组变换系数,再对这些系数进行量化、编码以实现压缩。一般来说,在变换域里描述要比空间域里简单,而且图像相关性明显下降,这样变换本身就能实现编码率的压缩。若再对变换域图像进行某种处理(如频域中的二维滤波)以及熵编码,则可进一步压缩图像的编码比特率。对变换处理后的图像信号施以上述对应的逆变换,即可获得空间域图像。

离散余弦变换(Discrete cosine Transform,DCT)就是一种变换编码,其变换原理涉及到数学知识。从频域观点分析,意味着图像信号的能量主要集中在低频附近,高频信号的能量随频率的增加而迅速衰减。DCT通过频域变换,可以将原图像信号用直流分量及少数低频交流分量的系数来表示,而将部分高频分量滤除,由于大多数图像的高频分量较小,加上人眼对高频成分和色度成分的失真不太敏感,所以可以对高频数据和色彩数据作更粗的量化,因此表示变换系数所用的数据量要大大小于表示图像像素所用的数据量。解压缩时再通过反离散余弦变换回到样值,虽然有一定失真,但人眼是可以接受的。

DCT变换编码的计算复杂度适中,又具有可分离特性,还有快速算法等特点,所以在图像数据压缩中,采用离散余弦变换编码的方案很多,特别是90年代迅速崛起的计算机多媒体技术中,JPEG、MPEG、H.261国际等压缩标准,都用到离散余弦变换编码方法。

4.衡量压缩编码方法优劣的重要指标

衡量一个压缩编码方法优劣主要有三个指标:

首先,压缩比要高,有几倍、几十倍的,也有几百乃至几千倍压缩比的编码算法;其次,压缩与解压缩要快,算法要简单,硬件实现容易;最后,解压缩的图像质量要好。

常用的压缩工具有ZIP、RAR、ARJ以及LHA等很多种,但在JPEG压缩标准出现前,传统的压缩算法在处理图像和视频方面都没有取得根本性突破。

同类推荐
  • 语言理论与实践

    语言理论与实践

    这个集子收录的是个人零散的思维碎片,如果其中存在一种教学思想的话,这种思想可以说属于“工具论”。这种“工具论”是叶圣陶先生语文教学思想的继承与发展,与现在绝大多数国家认识高度统一后推行的语文教学思想与方式(形式训练)高度一致。
  • 大学生GE阅读(第4辑)

    大学生GE阅读(第4辑)

    《大学生GE阅读(第4辑)》以“人文情怀、学术精神”为宗旨,以通识教育为主板,以文、史、哲、艺、政、经、法、社等学科为重点,陆续开设“大学讲堂”“博士开谭”“专题专论”“评书评人评事”“海外文摘”“网上撷英”以及“反馈与批评”等栏目。文章以栏目为单元,以文学、历史、哲学、艺术、政治、经济、法学、社会学为序次,举凡论文、散文、书评、随笔、讲演稿、谈话录等,文体不拘,文风不限。编者诚心虔志,企盼有创见、有发现、有风骨、有格调之文章,希望与同仁同道共同开拓一片中国大学生喜闻乐见的通识天地与文化乐园。
  • 媒介与民生:电视民生新闻的理论与实践

    媒介与民生:电视民生新闻的理论与实践

    我国当代民生新闻经过多年的发展,已经形成一定的社会影响力,广受社会大众喜爱,也是目前学界与业界共同关注与讨论的热点话题。电视民生新闻的兴起,既是政治民主化、媒介市场化与传播平民化的产物,又是中国新闻媒介“新闻本位”、“受众本位”观念的革新与强化。在构建和谐社会的时代背景下,“民生新闻”成为新闻媒介与社会环境形成良性互动的一种传播范式。平民化的传播理念与传播方式使民生新闻与普通老百姓的日常生活、喜怒哀乐紧密联系在一起,体现了“以人为本”、“三贴近”的社会政治话语与新闻媒介人文关怀、社会责任的价值认同。
  • 胡适说:社会与文明

    胡适说:社会与文明

    《社会与文明》精选胡适先生的著作或者演讲整理稿,分为上下两篇,上篇说社会,下篇说文明。全书选编的篇目既能够很好地体现胡适思想,又照顾到了大范围受众的阅读习惯。同时,加入大量图片,对于《社会与文明》内容上的无形扩展,以及趣味性和知识性的增加,具有很大的作用。
  • 袁宝华文集第八卷:袁宝华访谈文选

    袁宝华文集第八卷:袁宝华访谈文选

    文集为十卷本,汇集了作者在解放初期恢复东北工业,制定和实施“一五”计划,赴苏谈判156项工程,三年“大跃进”大炼钢铁,国民经济调整,建立新中国物资管理体制,“文化大革命”期间国民经济运行,改革开放期间国民经济管理,企业整顿和改革,制定《企业法》,开创职工教育和MBA教育工作,开拓企业思想政治工作,创建民间经济类社团,建设中国企业家队伍,以及担任中国人民大学校长工作中的理论著作和文章。
热门推荐
  • 冷酷堡主刁蛮妻(完)

    冷酷堡主刁蛮妻(完)

    她太调皮了,仗着父皇的宠爱,三不五时便出宫,她今年才刚及笄就要她嫁人……还是个好好王爷,拜托,那她不把人家里吵翻了,像这种家世,肯定又会不准这,不准那的,不管了,先逃再说……于是,包袱款款,带着一个宫女便出宫是也……冷家有云,二十五岁之前一定要成亲,冷家长子,俊美、冷酷、残暴,却对双亲的话不能不予理睬,但是要他成亲……刚满24,娘就张罗着天天要相亲,看着那一群想嫁进冷家的女人……不禁寒心……先走再说,要儿媳妇,他自己去找……他的样子能找到儿媳妇?早将人吓跑了……去寻找师父时,正好遇到有人被抢劫,好心帮忙,却被人死死缠住,硬是拖了两个“拖油瓶”……
  • 遇见你,我今生的缘

    遇见你,我今生的缘

    自从他见到她的第一面起就深深地爱上了她,可他却把这份爱深深地隐藏在了心里,为了能和心爱的人在一起,他放弃了更好的C大,毅然决然的选择了D大,从此开始了他默默守护之路,为了让子静开心,浩辰隐藏了自己的爱,一直在她的身后默默地守护她,同时也把自己弄得遍体鳞伤。对于多数女生的爱慕,他置之不理,不屑于顾,却在自己的心被伤的千疮百孔的时候,他选择了放下,去接受另一个一直同他一样爱着自己的女孩,开始了自己的生活。可是当子静知道这一切时,还来得及吗?他最终会如何选择?
  • 危城之全城戒备

    危城之全城戒备

    杀人只是为了取乐,杀人只是为了把等级练上去,杀人只为了让这个城市颤抖。
  • 准仙人的幸福生活

    准仙人的幸福生活

    悲催男遭遇车祸,灵魂进入“仙界”。跟随师父苦修多年后,冒险重新返回人间。却没想到竟然回到十六岁时。于是他决定重新追求自己未来的校花未婚妻,然后享受这美好的人生。但人生无常,他真的能如愿吗?
  • 惊世战妃

    惊世战妃

    幕元战国时期的魂族始祖,因为修炼走火而重生于两千后的崇元时代,一代风云人物变身为东晋国将军府中的废物四小姐。胆小懦弱,半痴半傻,从小到大,受尽欺凌辱骂,被链锁后院八年,受尽折磨。魂族始祖重生附体,天地变色。始祖非善人,岂能容他人在她的世界肆意妄为?欺凌?辱骂?暗杀?试试看!姑奶奶一巴掌把你拍墙上,抠都抠不下来。金麟岂是池中物,一遇风云便化龙。驭万兽,练灵丹,制神器,空间随身,风凌异世,谁能与她争锋?魂族秘境,暗藏风云,世人纷涌,抢夺宝物,挖其血肉。雪山苍茫,一人当关。她傲视苍穹,剑指天下,天下若要亡她,她便杀尽天下。
  • 大陆行者

    大陆行者

    一场宿醉,无意穿越,附身在了一具八岁小孩子体内,从此,便造就了一条逆天之路。众美环身,他当如何去留;天道无常,他且如何抉择。一把刀,一把剑,仗剑江湖,行侠仗义。江湖,是否如传说中一样的江湖……这人,又是否是江湖中的人儿呢……
  • 太极图说

    太极图说

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。
  • 青春,彼岸花开

    青春,彼岸花开

    青春是一场美好的梦境,我们在青春中成长,长大。在青春中,我们一起坚持,一起笑,一起哭,一起感受着我们的青春。
  • 极品兵王召唤系统

    极品兵王召唤系统

    菜鸟雇佣兵在将死之际,突然获得兵王召唤系统。任你再厉害,我有系统在手,不论是真实世界,还是电影游戏,只要是兵王都可以被我召唤。
  • 重生之婢女谋

    重生之婢女谋

    将军府四姨娘婉碧被陷害,罚终生待在后院不得出门。两月后其产下一死婴,郁郁而终。再次睁眼,她回到了十五岁那年,她依然是大夫人身边的小丫鬟。这一世,她誓要把大夫人的真面目昭告天下。第一步就是解决姨娘的问题,她慢慢的凑近丫鬟玉鸢的耳边轻声说道:“玉鸢,能救你的只有我。偷偷告诉你,老爷的腰间,有颗黑痣……”