1、 帧内预测
亮度分量只使用8×8块尺寸,共有五种模式。
色度预测跟H.264很相似。
优点:宏块的第一个8×8块使用了左下角的点进行预测。
DC模式下各象素点预测值并不相等,保证了图像的平滑性。
缺点:尺寸限制为8×8,不灵活
预测方向较少,预测效果欠理想。
2、 帧间预测
I场编码:上场帧内预测,并为下场作预测。
P场编码:从最近编码的4个场中进行预测。
P帧最多两个参考帧。
B帧前后各一个参考帧,而且必须一前一后,预测只有一个运动矢量,对称编码。限制为IBBP编码顺序。
预测模式最小块尺寸为8×8。
亮度1/4插值,半象素和1/4插值都是四抽头滤波器,分别为:[-1,5,5,-1]、[1,7,7,1]。
色度插值和H.264一样。
滤波:帧内 bs=2;p、b参考帧都为最近,且位移都不大bs=0,否则为1;
运动矢量的中值预测比较特殊^_^。
Cbp中对亮度是一个对cb、一个对cr,与H.264的DC、AC不同。
对场编码,系数重排的时候,更倾向与垂直方向,亦即认为垂直方向的系数值较水平方向大。
优点:限制了参考帧个数,最小块尺寸为8×8,降低了内存占用量,减少了计算复杂度。
由于B帧是紧靠在编码帧的前后,使用对称矢量是很有效的。
缺点:参考帧方面远不及H.264的灵活和高效。
不支持比8×8块更小的分割方式,对于分辨率较小的(如qicf、cif、sif)和运动复杂的(如mobile、footbool)序列压缩效果明显不如H.264;而对于高清,区别不大。
滤波效果应该不及H.264,因为完全没考虑块的块与块之间模式、残差之间的差异。
Cbp编码时,由于cb、cr分量的变化较Y分量都不大,亦即分别用一个位来表示系数量化后是否全是为0是有冗余的,效果不及H.264好。
对于插值公式,总的来说效果都差不多,H.264稍稍计算复杂些。但我认为,二者都有很大的改进余地。
3、 变换量化
过程跟H.264相似,只是基于8×8块而已。有62个量化等级。
优点:8×8块变换较4×4更能使图像的能量集中,亦即压缩效果更好些。
缺点:变换涉及到乘法运算,计算比H.264复杂
会引起较大的振铃效应
4、 熵编码
对所有的数据都使用Gxp-Golomb编码,
优点:run-level综合编码,可一定提高压缩效率,但预设数据比较大。
降低了计算复杂度。
缺点:压缩效果不好,不及CAVLC,更不及CABAC。
AVS-P7
AVS-P7面向手持设备等计算能力有限的设备。
增加了4×4、8×4等更小的块模式。
帧内预测4×4块大小,9个模式,邻近9个象素值。色度3个模式,也是基于4×4。
仍然2个参考帧,插值1/2象素水平方向8抽头,垂直方向4抽头(认为水平信息比垂直方向重要);1/4象素2抽头。
只有p帧
变换量化都是基于4×4,没用哈达曼变换。
滤波器粗糙,考虑QP不充分。没考虑运动矢量、编码模式、残差。
优点:
缺点:我原先初次看到扩展到了4×4等小块,还以为面向高压缩存储领域的,却越看越疑惑。感觉像是为了不沦落于MPEG2的压缩效果,又不愿向实时通讯领域低头,临时拼凑的结果,完全是H.264基本级的精简版,而又精简的不成样子。AVS-P7和AVS-P2基本不兼容。
发表评论