
在数字化时代,视频数据的规模呈爆炸式增长,其对存储空间与传输带宽的需求极为庞大。一秒钟未压缩的 4:2:2 NTSC 视频就需占据 27MB 存储空间,一分钟更是高达 1.6GB。未经处理的原始视频占用的专用带宽极高,这极大地限制了视频的存储、传输与应用。因此,为应对这一挑战,业界投入大量精力研发压缩算法与视频编码标准,尽可能规避传输未经压缩的数据。
MotionJPEG(M-JPEG)虽未被 JPEG 标准专门涵盖,但它为视频帧压缩提供了便捷方式,且早于 MPEG-1 出现。本质上,M-JPEG 对每一视频帧单独进行 JPEG 编码,随后将压缩后的视频帧按顺序存储(后续解码)。还有 MotionJPEG2000 编解码器,它采用 J2K 替代 JPEG 来编码各个视频帧,如同 J2K 取代 JPEG 一样,该编解码器未来可能会逐步取代 M-JPEG。
H.261 于 1990 年开发完成,是首个被广泛运用的视频编解码器。它引入将一帧图像分割为 16X16 “宏块” 的概念,通过跟踪宏块在不同帧间的运动来计算运动补偿矢量。该标准主要针对 ISDN 线路(px64kbps,p 取值 1 – 30)上的视频电话应用。其输入帧一般为 30fps 的 CIF 图像,输出压缩帧分辨率约为 10fps,传输速度在 64 – 128kbps。尽管如今仍在使用,但已近乎被 H.263、H.264 等后续标准取代。
MPEG-1 诞生于 20 世纪 90 年代初,它提供了数字化存储音频和视频数据的方法,并能恢复出大致相当于家用录像系统(VIDEO HOME SYSTEM,NHS)质量的内容。此编解码器旨在让视频数据能存储于 CD-ROM 中,具体而言,基本目标是在容量 650 – 750MB 的 CD-ROM 上存储并回放 VHS 质量视频,从而创建视频 CD(VCD)。其组合的视频 / 音频比特流可适应 1.5Mbps 带宽,这与当时从 CD-ROM 和数字音频磁带系统读取的数据速率相符。相较于 H.261,MPEG-1 在更高比特率(对于 CIF 输入帧,允许 1Mbps 以上速率)下质量更优。虽然 CIF 用于部分源数据流,但 SIF 格式或许更为流行,它每帧有 352X240 像素,约为 720X480 NTSC 帧的一半。MPEG-1 专为以每秒 30 帧速度压缩 SIF 格式逐行扫描视频而开发,相比 H.261 增加了双向运动预测和半像素运动估计。如今,尽管仍有人用 MPEG-1 创建 VCD,但相较于 MPEG-2,已不常见。
MPEG-2 受多种终端市场需求推动,迅速超越 MPEG-1,其编码比特率可从 1Mbps 扩展至 30Mbps,为 DVD 视频、标清电视和高清电视等高性能应用打开了大门。即便在较低比特率下,MPEG-2 最终码流质量也优于 MPEG-1。这一复杂标准由 10 个部分组成,其 “视觉” 部分也被称为 H.262。MPEG-1 主要针对 CD 和 VHS 质量视频,而 MPEG-2 实现了 DVD 质量视频,输入符合 BT.601(NTSC 720X480,30fps)要求,输出码流速率范围是 4 – 30Mbps,具体因所选 “性能配置” 而异,且 MPEG-2 既支持隔行扫描,也支持逐行扫描。
H.263 在视频会议系统中应用广泛,在所有比特率下表现均优于 H.261。其输入源通常为 30fps 的 QCIF 或 CIF,在 10fps 下,输出比特率甚至可低于 28.8kbps,性能与 H.261 相当。不过,H.261 需在 ISDN 线路传输,H.263 用普通电话线即可,其应用终端市场包括视频通话和网络监控(含基于互联网的应用)。
MPEG-4 基于 H.263 基线并有所改进,主要面向网络流式多媒体传输。鉴于网络常存在带宽限制,MPEG-4 编解码输入源一般是 CIF 及以下分辨率。它允许对不同类型对象采用不同编码方式,例如区别对待静态背景纹理和移动前景形状,以实现整体压缩率最大化。MPEG-4 有多种性能配置,其中 “Simple” 和 “Advanced Simple” 最为流行。“Simple Profile” 适用于较低视频分辨率和比特率,如手机视频流;“Advanced Simple Profile” 主要用于较高分辨率和比特率场景。
DV 专为消费类(随后也涵盖专业类)视频设备开发,其压缩策略与 Motion JPEG 类似,可接收亮度和色度信息的 BT.601 采样格式。在摄像机领域应用普遍,根据不同比特率和色度下采样策略,有多种 “播放” 模式。DV 通常通过 IEEE1934 接口传输,比特率可从标清消费级设备常用的 25Mbps 扩展至高清视频设备常用的 100Mbps 以上。
QuickTime 由苹果公司开发,包含一组多媒体编解码器以及处理数字视频、音频、动画、图像和文本的算法。QuickTime 7.0 遵循 MPEG-4 和 H.264 标准。实际上,QuickTime 文件格式是 ISO 的 MPEG-4 标准的基础之一,部分原因在于它提供了从视频捕获、编辑、存储到内容回放和分发的完整点对点解决方案。
RealVideo 是 RealNetworks 公司开发的专利视频编解码器。最初作为 PC 上的低比特率流媒体格式,如今已拓展至便携式设备市场,也用于宽带流媒体和手机基础设施。它可用于实时流,也可在下载文件前进行视频点播预览。RealNetworks 将 RealVideo 与自家专有音频编解码器 RealAudio 捆绑,生成 RealMedia 集成文件,可在 PC 上通过 RealPlayer 应用程序播放。
Windows Media Video(WMV)是微软开发的 MPEG-4 变体,具备数字版权管理能力,可对视频内容的浏览、复制、修改或重放进行控制。
Theora 是Xiph.org基金会开发的开源、免专利使用费的视频编解码器,该基金会此前已开发多个开源音频编解码器。Theora 基于 On2Technologies 向公共领域发布的 VP3 编解码器开发,主要与一些低比特率编解码器竞争。
H.264 也被称为 MPEG-4 第 10 部分、H.26L 或 MPEG-4 AVC profile。它是 ITU-T 和 ISO/IEC 委员会合作的成果,目标是在保证合理视频质量前提下,比特率相比之前标准降低 50% 以上。该标准能在广泛的比特率和视频分辨率范围内工作。不过,H.264 比特率大幅降低的代价是实现复杂度显著增加,这使得 D-1 格式的 H.264 编码仅在高端媒体处理器中应用,且通常需两个分立器件分担处理任务 。