H.265 视频编码技术:开启高清视频新时代

在视频技术飞速发展的今天,高清、超高清视频已成为主流。这背后,H.265 视频编码技术功不可没。它作为新一代的视频编解码标准,在诸多方面对传统编码技术实现了突破。

一、H.265 编码技术的演进与优势

视频编解码标准主要源于国际电联 ITU-T 和国际标准化组织 ISO。ITU 的 H.26× 系列从 H.261 逐步发展到 H.263、H.263+;ISO 的 MPEG 系列也历经多代更迭。后来二者合作推出 H.264/AVC,而 H.265(HEVC)则是在此基础上的进一步升级。

与 H.264 相比,H.265 在压缩效率上有显著提升。H.264 的宏块大小固定为 16×16 像素,在高分辨率视频中,这种固定大小的宏块会导致低频系数冗余增加,压缩效率降低。同时,宏块数量增多会使宏块级参数占用更多码流资源。而 H.265 的编码单位更为灵活,可在 8×8 至 64×64 之间选择。对于信息量少的区域,使用大编码单位,减少码字数量;细节丰富的区域则采用小编码单位,精准编码。这一特性让 H.265 在同等视频质量下,码率仅为 H.264 的一半,能以 1 – 2Mbps 的速度实现 720P 高清视频传送,而 H.264 在标清传送时都需低于 1Mbps 的速度 。

二、H.265 的关键技术原理

(一)编码单元与数据结构

  1. CTU、CU、PU 和 TU:H.265 编码中的核心单元包括编码树单元 CTU、编码单元 CU、预测单元 PU 和变换单元 TU。CTU 是编码的基本单位,其大小通常为 64×64 像素。CU 可看作是 CTU 递归分割后的结果,大小范围从 8×8 到 64×64。CU 采用四叉树分割方式,通过分割深度和分割标记符确定分割情况。PU 从 CU 中分割出来,是预测的基本单元,在帧内预测和帧间预测中有着不同的划分模式。TU 同样采用四叉树划分,以 CU 为根,其大小不能超过 CU。在帧内编码时,TU 尺寸小于 PU;帧间编码时,TU 尺寸小于对应 CU 。
  2. Slice 和 Tile:Slice 是一个条带,Tile 是一个矩形块。它们之间需满足特定条件:要么任一 Slice 中的所有 CTU 属于同一个 Tile,要么任一 Tile 中的所有 CTU 属于同一个 Slice。Slice 可以包含一个独立的 Slice Segment(SS)和多个非独立的 SS,Slice 内的 SS 可相互依赖,但不能依赖其他 Slice 。

(二)帧内预测模式

H.265 的帧内预测模式更为丰富,共有 35 种,相比 H.264 的 9 种有了大幅增加。除了常见的 Planar、DC 模式外,还有 33 种方向模式。其中,Intra_DC 模式利用参考像素的均值进行预测;Intra_Planar 模式则通过四个角的参考像素得到两个线性预测的均值。在划分模式上,帧内主要使用 PART_2Nx2N、PART_NxN 两种 。

(三)帧间预测模式

  1. 预测参考与模式:H.265 在帧间预测方面有两个参考表 L0 和 L1,每个表有 16 个参照项,但最大唯一图片数量为 8。运动估计比 H.264 更复杂,采用列表索引和两种主要预测模式 —— 合并(Merge)和高级运动向量预测(AMVP)。这两种模式都运用了空域和时域 MV 预测思想,通过构建候选 MV 列表选取最优预测 MV 。
  2. 运动估计准则与搜索算法:运动估计准则包括最小均方误差(MSE)、最小平均绝对误差(MAD)、最大匹配像素数(MPC)、绝对误差和(SAD)、最小变换域绝对误差和(SATD)等,实际应用中常用 SAD 或 SATD,SAD 因不含乘除法、便于硬件实现而应用广泛。搜索算法有菱形(dia)、六边形(hex,默认)、可变半径六边形搜索(umh)、星型(star)、全搜索(full)等 。
  3. Skip 和 Merge 模式:Skip 模式是一种特殊的 Merge 模式,Skip = merge + (CBF = 0)。在 H.265 中,Merge 模式整合了 H.264 中的 direct 模式和 skip 模式。Skip 模式只传输 skip_flag 和 merge_index,不传输残差,能节省码率;Merge 模式则传输残差和 merge_index,且无需复杂运动估计,当前 PU 块的运动信息可由相邻 PU 推导得出 。

(四)量化变换与熵编码

  1. 量化变换:H.265 通过量化变换对数据进行处理,将变换系数进行量化,使其更适应传输和存储需求。量化过程会根据不同的编码场景和需求进行调整,以平衡视频质量和码率 。
  2. 熵编码:H.265 规定仅使用 CABAC 算术编码。CABAC 通过对数据进行概率建模,能够更高效地压缩数据,进一步降低码率,提升编码效率 。

(五)后处理技术

  1. 去块效应滤波器:由于基于块的预测和变换会在块边缘产生像素值跳变,即块效应。去块效应滤波器的作用就是消除这种块效应,它通过对块边缘像素进行处理,使图像看起来更加平滑自然 。
  2. 自适应样点补偿:该技术通过对重建图像进行分类,针对不同类型的图像像素值进行加减 1 操作,从而减少失真,提高压缩率,降低码流。自适应样点补偿分为带状补偿和边缘补偿,带状补偿根据像素值强度划分 32 个等级,对中间 16 个等级进行补偿;边缘补偿则通过选择不同模板确定像素类型进行补偿 。
  3. Wavefront Parallel Processing(WPP):WPP 是一种并行技术,以一行 LCU 块为单位进行处理,虽然不完全截断 LCU 行之间的关系,但行与行之间存在较大依赖关系。该技术在编码和解码过程中能提高处理效率,且通常其压缩性高于 tiles 。

三、H.265 的应用领域与前景

H.265 编码技术在众多领域得到广泛应用。在视频播放设备方面,4K 超清电视、索尼的媒体播放器新品 FMP-X10 以及部分蓝光光盘都采用 H.265 编码格式,不仅节省内存空间,还能提供更高质量的视频播放体验。在摄像设备领域,索尼、海康威视、中兴等厂商的产品将 H.265 用于日常拍摄和区域监控安防,提高了监控画面质量,减少了设备安装数量。此外,索尼 PS4 也支持 H.265 编解码技术,随着 4G 网络的普及,H.265 在移动客户端的应用也逐渐增多 。

尽管 H.265 具有诸多优势,但也面临一些挑战。其解码难度高于 H.264,运算量飙升到 400 – 500GOPS,目前硬件支持度尚显欠缺,且标准确立时间较晚。同时,谷歌 VP9 采用自由的 BSD 版权协议,对 H.265 形成了一定竞争。不过,随着技术的不断发展和硬件性能的提升,H.265 有望克服这些障碍,在未来视频编码领域发挥更大的作用。

en_USEnglish
Scroll to Top