基于Dante低延时网络化公共广播系统
摘 要:
提出基于Dante网络音频传输协议的公共广播系统,在实现一般网络化公共广播系统应备功能的基础上,具备专业扩声工程的低延时、同步性特性,可满足高标准公共广播项目的需求。
1 传统网络化公共广播系统
基于计算机网络搭建的公共广播系统一般称为网络化公共广播系统(IP公共广播系统),公共广播系统中最基本的海量音频节目库、远距离的传输和控制、大范围的矩阵交互等方面通过计算机和网络技术而化解。网络化公共广播系统将音频信号数字化后封装到IP数据包传输,相比采用模拟线路的公共广播系统的音频信号传输,性能显著提升,传输距离即是网络所覆盖的范围,音频质量可达到CD级别。
早期IP公共广播系统的硬件是基于x86架构的计算机平台,典型系统如图1所示,音频信号传输链路如图2所示。由x86架构服务器构建的公共广播系统,以x86架构服务器的主机作为系统核心,实现系统逻辑处理、节目存储管理、定时管理、系统控制界面交互等功能。终端也是x86架构的计算机,分为信号输入类终端和信号输出类终端,输入类终端包括模拟音频信号输入、告警信号输入、控制信号输入等;输出类终端包括模拟音频信号输出、告警信号输出、控制信号输出等,音频信号输出的终端就是广播分区设备;此外,还有混合类终端同时具有输入输出功能。
图1 早期网络化公共广播系统原理

早期的网络化系统由于主机和终端都采用x86架构硬件,本质上就是由通用计算机网络组成的系统,只是主机性能相对于终端更好一些,而终端因为功能单一配置相对低很多,但即便如此,终端成本还是比较高昂,而且体积较大。主机对所有的终端在任何时候都能进行独立的音频选择播放、音量控制、开关等功能,也可以批量对若干数量的分区进行控制,即所谓的分组功能,也可以进行双向的互动操作,如终端点播服务器的音频内容,与主机或其他终端进行音频对讲等。系统的分区数量规模取决于服务器主机的性能和网络的带宽,一般可以很容易实现过千分区的功能。
得益于ARM架构处理器的快速发展,新一代网络化公共广播系统的终端硬件核心也逐渐改由ARM嵌入式系统,产品体积和成本均大幅减小,一个典型的基于ARM架构处理器的网络化公共广播系统如图3所示。主机采用x86架构的硬件+Windows/Linux操作系统的服务器,也有采用ARM架构服务器+Linux操作系统的服务器,各终端设备通常采用ARM嵌入式SoC或者其他类型的MCU作为核心。

该类公共广播系统涉及的设备类型较多,本文中不讨论完整系统,仅讨论与音频相关部分的功能。从信号源类型来看,通常系统的音频信号源主要有两类。
1)从服务器硬盘播放的音频文件,格式有MP3、MP4、AAC、WAV、WMA、APE等,通常采用流媒体技术,用UDP协议由主机发送到广播分区终端,一个文件可以被同时播放到所有分区终端或者若干个分区终端,终端接收数据后实时解码成模拟音频信号,并送往下级信号处理设备(功率放大器、扬声器)。
2)由音频输入类终端(传声器、播放机、线路输入)实时采集的模拟音频信号,需要经过A/D转换为数字信号,为保证实时性和音频质量,一般不经过压缩处理,直接封装成IP数据包,并通过UDP协议发送到广播终端,终端处理过程与处理服务器传送文件音频流类似。
网络化公共广播系统具有服务器向每个分区终端同时播放不同音频文件的能力,而采集类信号源则以一对多或多对多的方式完成分区实时广播,总体来看类似于网络化的音频交叉矩阵。
公共广播系统工程本身属于扩声工程,除常规的频响、失真度、声压级等衡量电声性能指标外,音频信号的延时和同步指标也非常重要。这里的延时是指信号源进入到系统输入设备,再经过系统传输与处理,最终由输出设备输出,全链路整个过程的时间差,如图4,这个值越小越好。同步是指当两个以上设备输出同一个信号时,彼此之间存在的时间差,如图5,这个值也是越小越好。
图4 网络化公共广播的延时

当前广泛使用的IP公共广播系统一般基于OSI 7层架构及完整的来自操作系统的协议栈,设计编程以顶层应用为主,具有开发技术难度较低,可以广泛兼容常规局域网、广域网的特点,但是由于缺乏网络及媒体时钟同步机制,以及针对时间敏感数据传输的底层优化措施,对于实时传输音频信号而言,延时和同步的问题比较明显。目前各公共广播产品都有自己的一套协议组合,采用不同的技术路线,如A/D的采样率、IP数据包的载荷长度、缓存的大小等,对于延时和同步的指标会带来较大差异;除产品本身的硬件与软件算法、协议有关外,还与设备使用的网络环境有关。目前,网络、系统理想状态下,延时普遍能达到的实测值是100~400 ms,在实际项目的应用中,很多时候各种网络信息设备混用在一个局域网中,通常延时要大于这个数值,使公共广播系统的电声指标会大打折扣。以网络化公共广播系统中音频信号源的播放为例,对于直接播放存于播放服务器的音频文件,无需信号处理,延时小;对于实时采集的信号源,尤其是传声器输入延时最敏感,其他类型的相对不太敏感,因为听众可以同时听到讲话者的直达声和由传声器拾取经网络广播还原的电声信号,如果延时过大将明显影响听音质量,甚至听到两个声音。而在声音同步方面,同步性能对所有的信号类型都有影响,同步不好时会劣化声场分布,降低语音清晰度,不同程度地影响到听音效果。
2 基于Dante的网络化公共广播系统计
2.1 系统原理



2.2 系统构成

2.3 延时及同步的测试




3 基于Dante网络化公共广播系统的应用
某音乐学院因为专业特点对公共广播系统的音质有寻呼讲话低延时、分区声音同步、语言清晰度方面的高标准要求,校方对目前的传统网络化公共广播系统不满意,经综合对比后选用基于Dante网络化公共广播系统,系统拓扑如图14,设备安装调试后校方非常认可本系统的音频低延时和声音质量。

4 结语
选自 《演艺科技》2022年第三期 郭远林《基于Dante低延时网络化公共广播系统》。转载请标注:演艺科技传媒。更多详细内容请参阅《演艺科技》。
(除原创作品外,本平台所使用的文章、图片、视频及音乐属于原权利人所有,仅用于行业学习交流,并不用于商业用途。文中观点为作者独立观点,因客观原因,或会存在不当使用的情况,如,部分文章或文章部分引用内容未能及时与原作者取得联系,或作者名称及原始出处标注错误等情况,非恶意侵犯原权利人相关权益,敬请相关权利人谅解并与我们联络第一时间处理,共同维护良好的网络创作环境。)