Scientific Journal of Information Engineering August 2014, Volume 4, Issue 4, PP.111-115
Application of Tensor Voting in Image Compression Xiaofang Shao#, Xin Zhang, Dong Xia QingDao Branch of NAEI, Qingdao 266041, China #
Email: pugongying_0532@163.com
Abstract Image compression is widely applied in image processing with the development of internet technology and the increasing demand on images & videos. This paper presents a summary of related works and introduces how to apply the tensor voting method in image compression. The algorithm’s flowchart and typical experimental result are demonstrated. At last, we analyze the characteristics of the algorithm and suggest some future directions. Keywords: Image Compression; Image Encoding; Compression Ratio
张量投票方法在图像压缩中的应用 邵晓芳,张欣,夏栋 海军航空工程学院青岛校区,山东 青岛 266041 摘
要:随着网络技术的发展和图像、视频需求量的增大,图像压缩的应用和研究日益广泛。在总结相关工作的基础上,
介绍了张量投票方法在图像压缩中的应用,给出了算法流程及典型实验结果,并进行了分析和展望。 关键词:图像压缩;图像编码;压缩比
1 引言 一幅实用的数字图像的数据量是非常巨大的,这给图像的传输和存储带来相当大的困难,鉴于此,人们 自然会考虑下面的问题,在满足一定图像质量条件下,是否能减少图像的比特数,最少能少到多少,用什么 方法减少等。于是,图像压缩技术应运而生。图像数据压缩在较多的情况下是为了有效存储和传输(如图像 通信)而减小图像中的冗余信息的编码技术。随着网络技术的发展和图像、视频需求量的增大,图像压缩的 应用和研究日益广泛。 本文旨在总结图像压缩相关工作的基础上,具体描述张量投票方法在图像压缩中的应用。本文主要内容 安排如下:第二节介绍相关工作;第三节描述张量投票应用于图像压缩的算法思路、流程和典型实验结果; 最后是总结和展望。
2 相关工作 图像数据压缩过程或系统无论采用什么具体结构和技术,从原理上讲有三个基本环节:变换、量化、编 码,如图 1 所示。首先对原始图像进行某种形式的变换或对数据形式进行简单的整理,这里的变换是广义的, 变换的作用是根据数据的统计特征将原始图像用另一种形式在一个新的域中表示,改变图像数据的特性,使 在变换域中图像能用较少的像点或较少的比特数表示;然后对变换结果进行量化,量化的目的是以降低准确 率为代价进一步增加压缩比,现有的量化方法主要可分为标量量化和矢量量化,对量化器的要求是:在一定 的允许客观误差或主观察觉图像损伤条件下,总的量化等级数要尽量的少,并便于实现;最后是编码,编码 - 111 http://www.sjie.org
器的编码方式应和信号的概率特性相适应以求得较大的压缩比且抗扰性强。为了便于图像能高质、高速或小 容量地传输或存储,图像压缩的基本技术要求是,在无失真或允许一定失真条件下,尽量用最少或较少的比 特数,并且具有较强的抗扰能力;这三个技术指标往往是相互制约的,例如,一味追求比特数少可能要产生 失真和抗扰性差;所以在实际问题中,要综合考虑这三个指标,以达到总体最优[2]。 原始图像
变换后数据
变换
量化级
量化
码字输出
编码
图 1 图像数据压缩的一般过程
根据信息损失程度,现有的图像压缩方法可分为客观无损压缩、主观无损压缩和主观有损压缩。客观无 损压缩主要用于像医学图像处理、技术图纸、剪贴画或连环画等;其余两种有损压缩主要应用于摄像等对少 量信息损失不敏感的领域。 现有客观无损压缩的方法有:行程编码(Run-length encoding) ,主要用于 PCX 类图像,有望推广到 BMP、 TGA、TIFF;预测差值编码(DPCM)等预测编码技术,例如,李进等[11]针对高光谱图像采用中值预测器和 两步双向预测算法,并与参考预测值比较得出一种改进的预测编码算法;David A. Huffman 于 1951 年提出的 Huffman 编码,根据图像的灰度直方图特征,用最小比特数的编码表征最经常出现的灰度级,更大比特数的 编码表征次常出现的灰度级,……以此类推,以达到总比特数最小化的目的;利用图像相关信息的 Markov 模 型,该模型将某一位置像素及其灰度定义为一个由邻域像素决定的函数,最简单的情况由一阶 Markov 模型 定义,此方法还可扩展到高阶;矢量编码(“Vector” Coding) ,这种方法与 Huffman 编码类似,只是将像素成 对地处理,形成矢量,不同的图像需要不同的矢量编码才有效率;改进的 Huffman 编码,将出现概率很低的 码字一律用“ELSE”代替,以提高编码效率;自适应 Huffman 编码,根据变化的统计规律自适应调整编码规律; 算术编码(Arithmetic Coding) ,与 Huffman 编码类似的一种变长编码,不同的是,灰度级不局限于整数,也 不 局 限 于 对 单 个 像 素 编 码 , 而 且 使 用 树 型 数 据 结 构 编 码 ; 基 于 字 典 的 压 缩 方 法 ( Dictionary-Based Compression) ,将常用的字符、字符串或灰度级用符号表示,建立数据字典作为压缩编码/解码的依据,LZW 编码(Lempel-Ziv-Welch Coding)就是在无先验统计知识的情况下较为有效的一种熵编码(Entropy encoding) 方式。 有损压缩(包括主观无损压缩和主观有损压缩)的方法有:变换编码(Transform Coding),即进行正交 变换、子带编码、小波变换[3][4]、分形变换等在变换域中完成数据压缩,图像压缩领域的 JPEG 标准就先是采 用了分块 DCT(Discrete Cosine Transform)变换[5],后又改进为小波变换进行图像压缩的;颜色空间转换, 如用 HIS 空间替代 RGB 空间表示颜色;EBCOT(Embedded Block Coding with Optimized Truncation)方法, 即在比特流的基础上执行嵌入式分块优化编码[6];基于偏微分方程(partial differential equations)的编码方法, 该方法采用自适应三角化和 B-树编码对图像进行预处理以删除部分冗余像素,然后通过基于偏微分方程的边 缘增强式扩散过程(edge-enhancing diffusion)对编码结果进行进一步的编解码处理[7];形状自适应图像压缩 (Shape Adaptive Image Compression) ,该方法将图像分割成若干部分(边界和内部纹理区域等) ,然后对各 部分根据其局部特征和颜色分布分别变换编码,最后再合并,由于利用了图像分割结果,各区域内部相似度 较高,所以压缩比较大[8];线性样条曲线法,通过在图像的 Delaunay 三角化结果中用样条函数拟合图像中的 较为重要的目标像素点,然后用样条曲线信息来表征图像压缩结果达到去除冗余的目的[9];何艳敏对基于稀 疏表示的图像压缩方法进行了研究[10],讨论了传统和新型图像编码方法以及适应新媒体环境的可伸缩编码技 术以及基于冗余稀疏表示的编码基本框架;文献[12]和[13] 针对高光谱图像压缩分别提出了基于快速层次交 替最小二乘非负张量 Tucker 分解和基于端元提取技术的方法。 下面我们将较重要的变换方法,量化方法,编码方法列写如图 2 所示,有关具体内容,感兴趣的读者可 查阅参考文献[2];此外,图像压缩技术已有标准的测试数据及评估网站,感兴趣的读者可参考网址[14]。对 - 112 http://www.sjie.org
于图像压缩效果的评价指标,一类是度量压缩程度的压缩比;另一类是压缩质量比较指标,主要包括均方误 差(Mean Square Error (MSE))和峰值信噪比(Peak Signal to Noise Ratio (PSNR))等。 等值线编码(轮廓编码) 行程编码(一维/二维)
线性预测
预测差值编码 非线性自适应预测 KLT SVT
正交变换
DFT DCT WHT DST HRT
变换方法
DWT
线性相位滤波器(DCT)
Huffman编码
子带变换 Sannon-Fano编码
共轭正交滤波器(DWT)
算术编码
编码方法
混合编码
B码
神经网络方法 分形方法
LZW码
均匀量化 Max量化器
量化方法
客观准则 最优量化
其他各种最/次佳比特分配方法
主观准则量化
图 2 图像压缩的一些主要技术
3 方法描述 Yu-Wing Tai 等 0 提出了一种应用多尺度张量投票同时完成图像去噪和压缩的方法。该方法针对彩色图像 首先定义一系列的投票尺度,然后通过投票和组织过程一方面滤出那些在任何尺度下都不符合颜色分布规律 的高斯模型的噪声点,另一方面选择最佳尺度进行特征提取,最后选择一组有代表性的特征表示原图像,并 用张量投票的投票域作为图像重建时应用的“滤波器”,从而实现图像去噪和压缩。该方法的计算流程如下 图 3 所示。 图 3 中,多尺度颜色分析是用 EM 算法计算多个预定义的离散尺度下各像素点分布的高斯模型,设其均 值矩阵为 ,方差矩阵为 ;是否符合高斯模型是在一定尺度上进行判别,在任何尺度上都不符合估算模型 的点被判为噪声点而被舍弃;对剩余的目标点,则根据其模型方差的大小分别判为边界点或区域点,若方差 ,反之在区域内部(颜色比较平滑) ;接下来分别对边界点和区 较大,则判别点在边界上(颜色变化较大) 域内部点进行张量投票:对于边界点集,令 C 表示各数据点的曲率估计结果,一般情况下将满足曲率 max( C ) min( C )
1 2 的临界曲线点划为一组,定义边长大小为 2 max( C ) 的二维网格对图像进行规则划分,每个网格中最
接近中心点的边界点会被选为具代表性的曲线点;与边界点的处理方法类似,设 D 为图像局域灰度/色度,N 为邻域大小,根据奈奎斯特定律,对区域点的采样率为
max( D ) N
- 113 http://www.sjie.org
,即用边长大小为
max( D ) N
的二维网格对图像规
则划分,取每个网格中最接近中心的区域点作为代表点。 输入数据的 张量表示 多尺度颜色分析 需计算各预定义尺度下 是否符合估计模型
判为 噪声点
是否符合 高斯模型?
否
是
其高斯模型方差是 大是小?
大
小
判为边界点
判为区域内部点
张量投票
张量投票
提取代表曲线
提取区域代表点
利用具代表性的点和曲线表示 图像,实现压缩;并可根据这些 点、线恢复原图像
图 3 张量投票方法进行图像压缩的计算流程
实验表明,对于曲线检测,最佳投票域大小为 max( D ) N
1 max( C )
;而对于区域代表点而言, 最佳尺度或投票域是
。
实验结果如图 4~50 所示。图 4 是对一自然场景处理的结果,其中图 4(a)为输入图像,大小为 351KB;图 4(b)为重建图像;图 4(c)为代表数据集,大小为 65.6KB0;图 4(d)为图像中各区域的最佳尺度表示,注意树干 和沙漠是在不同尺度下的图像。 图 5 是针对自然景象处理的另一实例。其中,图 5(a)为输入图像,大小为 441KB;图 5(b)为重建图像; 图 5(c)为代表数据集,大小为 64.1KB0,压缩比近于七分之一;图 5(d)为对该图像各区域最佳尺度的颜色编 码表示。
(a)输入图像
(b)重建图像
(c) 代表数据集
(d)不同区域最佳尺度的颜色编码
图 4 图像压缩示例二 - 114 http://www.sjie.org
(a)输入图像
(b)重建图像
(c)代表数据集
(d)最佳尺度下对图像颜色编码的结果
图 5 图像压缩示例三
4 结束语 张量投票方法用于图像压缩是基于特征提取基础上的信息提炼和图像重建,这种压缩思路较之传统意义 上的图像编码具有更多认知层面的处理过程,可有效减少图像中的冗余信息,为图像压缩的研究注入了新的 活力。我们下一步计划将张量投票的处理结果与图像编码结合起来,对这一算法进行优化。
REFERENCES [1]
Yu-Wing Tai, Wai-Shun Tong, Chi-Keung Tang. Simultaneous Image Denoising and Compression by Multiscale 2D Tensor Voting. //Proceedings of the 18th International Conference on Pattern Recognition, IEEE computer society, 2006, 3: 818-821
[2]
孙即祥. 图像压缩与投影重建. 北京: 科学出版社, 2006
[3]
Ronald A. DeVore, Bjorn Jawerth, Bradley J.Lucier. Image Compression Though Wavelet Transform Codeing. IEEE Trans. On information theory. 1992, 38(2): 719-746
[4]
Sonja Grgic, Mislav Grgic, Branka Zovko-Cihlar. Performance Analysis of Image Compression Using Wavelets. IEEE TRANSACTIONS ON INDUSTRIAL ELECTRONICS, 2001, 48(3): 682-695
[5]
Ahmed N., Natarajan T., Rao K.R.. Discrete Cosine Transform. IEEE Trans. Computers, 1974, 1: 90-93
[6]
David Taubman. High Performance Scalable Image Compression with EBCOT. IEEE TRANSACTIONS ON IMAGE PROCESSING. 2000, 9(7): 1158-1170
[7]
Irena Galic, JoachimWeickert, MartinWelk, etal. Towards PDE-Based Image Compression. //Lecture Notes in Computer Science: Variational, geometric, and level set methods in computer vision-Third International Workshop, VLSM 2005. Beijing, China: Springer. 2005, 3752: 37-48
[8]
Jian-Jiun Ding, Jiun-De Huang. Image Compression by Segmentation and Boundary Description. Master’s Thesis, National Taiwan University, Taipei, 2007
[9]
Laurent Demaret, Nira Dyn, Armin Iske. Image Compression by Linear Splines over Adaptive Triangulations. IEEE Signal Processing Letters, 2006, 13(5): 281-284
[10] 何艳敏. 稀疏表示在图像压缩和去噪中的应用研究. 中国科技大学博士学位论文, 2011 [11] 李进, 金龙旭, 李国宁. 适于星上应用的高光谱图像无损压缩算法. 光谱学与光谱分析, 2012, 32(8): 2264-2270 [12] 杜丽敏, 李进, 金光, 等. 基于快速层次交替最小二乘非负张量 Tucker 分解的干涉高光谱图像光谱信息压缩方法. 光谱学 与光谱分析. 2012, 32(11): 3155-3161 [13] 张立燕, 谌德荣, 陶鹏. 端元提取技术在高光谱图像压缩中的应用. 光谱学与光谱分析, 2008, 28(7): 1445-1448 [14] http://www.imagecompression.info/
- 115 http://www.sjie.org