下一代音频 (NGA) 的两个领先实现是杜比 AC-4 和 MPEG-H。尽管它们都基于 ITU 的一套核心建议,但它们有不同的起源、优势和局限性。

杜比 AC-4 与 MPEG-H:背景

自 1881 年以来,多声道音频广播一直存在,当时 Clément Alder 连接了几对电话线,将立体声音频从巴黎歌剧院发送到巴黎电气展览会的房间。从1890 年到 1932 年,使用这种技术的音频节目在法国和英国都有商业化的应用。从那时起,广播已经从一个扬声器变成了多达 22 个扬声器。

Dolby Atmos: 用于沉浸式音频体验的编解码器选项

2020年,国际电联以下一代音频(NGA)的名义推出了对先进声音系统的建议。NGA是一套先进的音频技术,它的开发是为了提供增强的音频体验,旨在提供高质量的音频,并提高灵活性、互动性和沉浸感。

它包含各种音频技术,包括基于对象的音频、3D 音频和个性化音频。基于对象的音频允许声音设计师将音频视为可以在三维空间中放置和移动的单独对象,从而提供更加身临其境和逼真的体验。

3D 音频超越了传统的立体声和环绕声,提供更加身临其境和定向的音频体验,通常需要使用耳机或专用扬声器设置。个性化音频允许听众根据他们的个人喜好定制他们的音频体验,例如调整不同音频元素的音量或选择特定的音轨或语言。

NGA 由各种组织和行业团体开发,包括国际电信联盟 (ITU)、欧洲广播联盟 (EBU) 和美国高级电视系统委员会 (ATSC)。这些团体致力于开发和推广 NGA 标准和指南,确保 NGA 可跨不同平台和设备进行互操作。

杜比 AC-4 和 MPEG-H 可以说是实施最广泛的 NGA 标准,并且具有截然不同的优缺点,我们现在将深入探讨:

杜比全景声和杜比 AC-4

杜比实验室 (Dolby Labs) 于 1975 年凭借其用于影院的杜比立体声系统进入多声道声音世界,并在一年后发布了真正的四声道环绕声系统。

杜比全景声 (Dolby Atmos) 是杜比 NGA 技术中最著名的组件,于 2012 年首次推出,以响应电影院对更逼真的音频日益增长的需求。传统的环绕声系统使用固定数量的声道来产生音频,并根据扬声器在屏幕上的位置将声音分配给特定的扬声器。这种方法可以很好地创造一种定向声音,但它缺乏创造真正身临其境的声音体验的能力。

杜比全景声 (Dolby Atmos) 已被整合到该公司的杜比 AC-4 编解码器中。新编解码器的开发始于 2011 年,旨在创建一种用于广播和流媒体服务的高质量音频格式。它于 2014 年发布用于商业用途。

MPEG-H

NGA 领域的另一项领先技术是 MPEG-H,也称为 ISO/IEC 23008-3。它是由运动图像专家组 (MPEG) 和 Fraunhofer IIS 制定的音频编码标准。MPEG-H 的开发始于 2010 年,2013 年定型,此后不断进行更新和改进。

与杜比 AC-4 一样,开发 MPEG-H 是为了满足对高质量和身临其境的音频体验日益增长的需求,但是,MPG-H 不是专注于电影院,而是为广播、流媒体和虚拟领域设计的现实。它是一种先进的音频编码格式,可以高效传输和存储高质量音频,同时还提供身临其境的声音和交互性等附加功能。

MPEG-H 的关键特性之一是它能够同时支持基于通道和基于对象的音频。这意味着音频可以以传统的基于声道的格式进行编码和解码,其中声音被分配给特定的扬声器,或者以基于对象的格式进行编码和解码,其中声音被视为可以在三个空间中放置和移动的单独对象维空间。这可以提供更加身临其境和动态的音频体验,尤其是在虚拟现实和游戏应用中。

MPEG-H 的另一个关键特性是它能够适应不同的播放环境。这意味着音频可以针对特定的播放系统进行优化,例如耳机、立体声扬声器或环绕声系统。它还允许通过具有不同带宽的网络高效传输音频,确保即使在不利的网络条件下音频质量也保持一致。

杜比 AC-4 与 MPEG-H:主要特点

MPEG-H 和杜比 AC-4 都是旨在增强听众音频体验的技术。虽然它们在支持基于对象的音频格式和提供与遗留系统的兼容性方面有相似之处,但两者之间也存在差异。

杜比 AC-4 功能

杜比 AC-4 是一种专有系统,可提供高达 24 位/192kHz 的无损音频质量。它的沉浸式组件杜比全景声 (Dolby Atmos) 使用元数据来描述每个声音对象的位置和移动,从而允许在 3D 空间中准确放置和移动声音。

杜比AC-4,提供身临其境和个性化的音频体验

杜比 AC-4 的一些主要特性包括:

1. 基于对象的音频:与将特定声音分配给特定音频通道的传统基于通道的音频格式不同,杜比全景声 (Dolby Atmos) 使用基于对象的音频,其中声音表示为单个对象,可以在三个位置上定位和移动次元空间。这允许对声场进行更精确和动态的控制。

2. 基于声道的音频:杜比 AC-4 支持传送 7.2.1 流(7.1 加 2 个纵向声道)的床形式的基于声道的音频。

3.自适应音频:杜比AC-4包含自适应音频技术,可以根据特定的播放系统和环境实时调整音频组合。这可确保针对特定设置优化音频,无论是家庭影院系统还是电影院。

4. 个性化:杜比 AC-4 的 NGA 功能为观众提供了多种选择,例如体育广播中的语言选择或主场/客场播音员。

MPEG-H 特性

MPEG-H 使用高效的压缩算法,可以在保持高音频质量的同时减小音频数据的大小,这在广播中的使用具有显着优势。与杜比全景声 (Dolby Atmos) 一样,MPEG-H 使用元数据来描述每个声音对象的位置和移动,从而允许在 3D 空间中准确放置和移动声音。

1. 基于对象的音频:MPEG-H 使用基于对象的音频编码,其中音频对象被编码为单独的音频元素,可以实时组合和操作。这允许对音频内容进行更精确和动态的控制,从而提供更加身临其境和交互式的音频体验。

2. 基于通道的音频:MPEG-H 还支持基于通道的音频编码,其中音频作为单独的通道进行编码和传输。这允许与现有音频系统和设备兼容,并确保音频可以在任何标准音频系统上播放。

3. 自适应音频:MPEG-H 允许音频混合适应特定的播放系统和环境。这可确保针对特定设置优化音频,无论是家庭影院系统还是移动设备。

4. 个性化:MPEG-H 还包括对交互性的支持,允许听众实时与音频内容进行交互,例如更改混音、调整音量或选择不同的音频对象,

杜比 AC-4 与 MPEG-H:比较

乍一看,这两个系统的功能似乎几乎相同,然而它们各自显示出其根源。

杜比全景声 (Dolby Atmos) 显然来自电影世界,并且非常重视提供预先制作的多声道体验。虽然它确实包含了 NGA 推荐中指定的交互和定制功能,但它确实是为故事片和电视剧所要求的靠背和观看沉浸式环境而设计的。然而,这种情况正在发生变化,杜比已经投入大量开发精力来增强其交互功能,并使用 AC-4 编解码器。

在用户采用方面,杜比 AC-4 得到广泛支持并兼容从家庭影院到移动设备的大量播放设备。它还得到了 Apple TV、BT TV、Sky Q、Netflix 和亚马逊等多种流媒体服务以及游戏机和虚拟现实平台的支持。这使其成为适用于沉浸式音频的通用且广泛可用的解决方案。

MPEG-H对NGA建议的实施非常注重定制和互动性,这暴露了它在广播方面的起源。此外,与杜比全景声使用专有编解码器不同,MPEG-H支持行业标准的AAC和HE-AAC格式,这使得它更容易被纳入现有的创作和播放系统中。MPEG-H包含在ATSC 3.0和DVB广播标准中,也是索尼360现实音频平台背后的技术。

虽然它是一项较新的技术,目前不像杜比全景声 (Dolby Atmos) 那样得到广泛支持,但它正在越来越受欢迎。目前,韩国的 TTA 和巴西的 SBTVD 等一些广播电视服务以及亚马逊音乐和 Deezer 等音乐流媒体服务以及游戏机和虚拟现实平台都支持 MPEG-H。

根据环绕声技术的历史,在可预见的未来,这两种系统极有可能共存。大多数具有环绕声功能的消费类设备都支持杜比环绕声、杜比定向逻辑、dbx 环绕声和 DTS 环绕声作为标准功能。随着杜比 AC-4 和 MPEG-H 的加入,这种方法可能会继续下去。

本文转载自实时互动网,文章出处《杜比 Ac-4 与 MPEG-H:下一代音频编解码器》

Logo

致力于链接即构和开发者,提供实时互动和元宇宙领域的前沿洞察、技术分享和丰富的开发者活动,共建实时互动世界。

更多推荐