菁彩三维声(Audio Vivid)是全球首个基于AI技术的音频编解码标准,由世界超高清视频产业联盟(UWA联盟)与数字音视频编解码技术标准工作组(AVS)联合制定,共同发布,具有以下
特点:
一、技术参数
1.支持单通道,立体声,环绕声,三维声(多声道声床,音频对象,Ambisonic 声场)
2.支持有损和无损编解码
3.支持编解码和渲染(扬声器渲染和双耳渲染)
4.支持 Three degree of freedom(3DoF)呈现
5.支持 HOA 空间编码工具,大幅提升 HOA 信号的编码效率
6.解码器复杂度与业界标杆相当
7.支持 16 个通道的编解码(HOA 最大支持到 3 阶,可扩展至更高阶)
8.采样率支持 32kHz~192kHz
9.位宽支持 16 比特和 24 比特
10.速率支持 32kbps~1.6Mbps
11.编解码算法时延小于 80ms(典型场景)
12.最大支持 7 阶 HOA 双耳渲染,支持 128 轨音频实时渲染
13.双耳渲染时延小于 40ms(典型场景)
二、技术优势
a.高度沉浸式体验:能够打破声道的限制,将声场还原为更接近真实世界的三维声场,使声音在高度上 “站了起来”,更有层次感、空间感和方位感,让听众仿佛身临其境,极大地提升了用户的听觉体验。无论是观看体育赛事、演唱会,还是欣赏电影等,都能为用户带来 “声” 临其境的感受。
b.高效的编解码效率:基于神经网络等先进技术的编解码方式,在保证听音质量的前提下,可实现更高的压缩效率,使音频文件占用更小的存储空间,同时也更利于网络传输,能够在有限的带宽条件下,快速传输高质量的音频数据,满足用户对于高清音频的实时播放需求。
c.个性化音频体验:支持对音频中的不同声音对象进行独立编码和处理,用户可以根据自己的喜好和设备条件,对声音对象的位置、移动轨迹、大小、远近等要素进行个性化调整,实现定制化的音频体验,满足不同用户在不同场景下的多样化需求。
d.良好的兼容性和适应性:作为一项开放的音频技术标准,Audio Vivid 具有较好的兼容性,能够与多种音频设备和播放平台进行集成和适配。无论是专业的音频播放设备,还是普通的消费电子产品,如手机、平板、电视、耳机等,都可以支持 Audio Vivid 格式的音频播放,为用户提供一致的高质量音频体验。
e.自主知识产权与技术创新:Audio Vivid 是我国具有自主知识产权的音频编解码技术,摆脱了超高清音视频关键技术 “卡脖子” 的难题,推动了我国音频技术的自主创新和发展,提升了我国在全球超高清视频产业中的核心竞争力,为国内音频产业的发展提供了有力的技术支撑。
f.应用场景广泛:可应用于家庭环境、影院环境、演唱会、体育赛事、个人、AR/VR 以及车载等多元场景,满足不同场景下用户对于高质量音频的需求,为各种音频相关产业提供了更具沉浸感和创新性的音频解决方案
