基于AVS标准的熵解码器设计

时间：2014-05-02 来源：123485.com 作者：9stone

AVS标准是《信息技术先进音视频编码》系列标准的简称，是我国具备自主知识产权的第二代信源编码标准。AVS标准包括系统、视频、音频、数字版权管理等四个主要技术标准和一致性测试等支撑标准。
目前音视频产业可以选择的信源编码标准有四个：MPEG-2、MPEG-4、AVC(也称JVT、H.264)和AVS。从制订者分，前三个标准是由MPEG专家组完成的，第四个是我国自主制定的。从发展阶段分，MPEG-2是第一代信源标准，其余三个为第二代标准。从主要技术指标——编码效率比较，MPEG-4是MPEG-2的1.4倍，AVS和AVC相当，都是MPEG-2的两倍以上。

AVC标准中，对预测残差有两种熵编码的方式：基于上下文的自适应变长码（CAVLC）和基于上下文的自适应二进制算数编码(CABAC)；对于非预测残差，采用指数哥伦布码或CABAC编码，视编码器的设置而定[1]。
AVS标准所用的熵编码技术相比于以前有了很多改进，它的语法元素和残差系数是由定长码和指数哥伦布码构成的，其中指数哥伦布码和语法元素之间存在多种映射关系。

1 AVS标准熵解码算法描述

在整个AVS视频的解码过程中，熵解码模块位于系统的最前端，负责从压缩后的码流中解析出宏块头信息以及量化系数，供后续的帧内预测模块和帧间预测模块使用。而熵解码模块又可以大体分为两个部分：解析K阶指数哥伦布码部分和解析语法元素部分。

解析K阶指数哥伦布码时，首先从比特流的当前位置开始寻找第一个非零比特，并将找到的零比特个数记为leadingZeroBits，然后根据leadingZeroBits计算CodeNum。用伪代码描述如下：

由于AVS视频中所有的语法元素以及经过变换和量化的残差系数都是以指数哥伦布码的形式映射成二进制码流的，因此在解析出K阶指数哥伦布码的CodeNum后，下一步就是要还原出各种语法元素和残差系数。

在AVS标准中规定了四种映射方式：ue(v)、se(v)、me(v)和ce(v)。其中ue(v)、se(v)和me(v)所描述的语法元素采用0阶的指数哥伦布码，ce(v)用来描述残差系数，可以采用0阶、1阶、2阶或者3阶指数哥伦布码。它们的解析过程如下：

ue(v)：无符号直接映射，语法元素的值等于CodeNum；
se(v)：有符号映射，映射关系为：当CodeNum=k时，语法元素值为(-1)k+1×Ceil(k÷2)
me(v)：分为MbCBP和MbCBP422两种模式，分别根据CodeNum的值,查找相对应的表来得到语法元素的值。
ce(v)：ce(v)描述的语法元素可以采用0阶、1阶、2阶或3阶指数哥伦布码进行解析，还有19个相关的码表，对于阶数的确定规则以及码表的切换规则，在AVS标准中都有详细的说明。解析时,首先语法元素trans_coefficient等于CodeNum,如果trans_coefficient小于59,可以根据trans_coefficient的值查找相关的码表得到残差系数；如果trans_coefficient大于等于59，解析下一个ce(v)语法元素，得到一个新的CodeNum，escape_level_diff等于CodeNum,然后根据trans_coefficient和escape_level_diff求得残差系数[3]。

2 熵解码器的硬件设计

由于熵解码器位于整个解码结构的最前端，所有后续模块中需要用到的数据都是熵解码模块从原始码流中解析出来的，因此熵解码器性能的优劣直接影响到整个AVS视频解码器的性能。

从前面的介绍中可以了解到，经过指数哥伦布编码后形成的码流中，每个码的码长不固定，而且前后具有很大的相关性，这样在解码时就必须逐位读取数据，解析完一个码字后才能解析下一个码字。这种串行解码的方式严重限制了熵解码器的性能，所以需要找到一种能够并行解码的方式。这里的并行解码并不是指同时对好几个码进行解码，而是针对一个变长码的多个位来说的。具体来说就是一次读入N位数据，通过比较操作，得到码长，使得解码可以在确定的时间长度内进行，而不是随着码长的不同而变化。显然，这将提高硬件的复杂度，但是换来了解码速度的提高[4]。

整个熵解码器可以分为四个模块：数据准备模块、解指数哥伦布码模块、语法元素解析模块和解码控制模块。硬件结构如图1所示。