WAA无线多通道音频广播传输规范

版本: V0.6 状态: 正式实施

目录

1. 总则

本规范由世界无线局域网应用发展联盟(WAA)制定,为面向专业音视频(AudioVideo)系统的强制性无线音频传输标准,适用于家庭影院、专业影音、多声道分布式音响系统,可作为行业级或国家级无线音视频传输标准申报、落地与实施依据。

规范旨在替代AES3等传统有线音频传输方式,在无线传输环境下实现接近有线传输的音质、时序与同步性能,正常工况不主动插补、不篡改音频波形;短时链路波动依靠冗余帧平滑接续,避免爆音与时序偏移(超低音采用专属8帧冗余机制)。

系统核心特性:采用单晶振时钟架构(通过PLL锁相环衍生全系列音频主时钟,硬件设计精简);音频传输采用冗余帧机制(主声道、天空声道为当前帧+1帧历史帧,超低音为专属8帧冗余机制),降低音频丢包对播放的影响;具备三维空间定位能力,可自动识别地面音箱与天空声道高度参数,实现全自动声场校准,满足高精度声学需求。

采样率规则:系统支持192kHz采样率处理,其传输需满足总数据量不超过96kHz 24bit单通道的最大数据量限制(含对应历史帧);若超出该限制或采用7.2.4满通道(13路)传输时,自动将192kHz强制降为96kHz传输。

定位差异:本规范不与蓝牙比拼功耗指标,核心差异化聚焦三大硬指标——超低传输延时、超大多声道传输容量、多设备高精度时钟同步,走专业高清多声道高端影音赛道。

全局时基:系统全局统一时基为1μs,由处理器内部Tick时钟硬件生成。

2. 核心设计原则与定位
  • 架构原则:发射端实现全功能、全运算、全管理;接收端采用极简、低成本设计,无独立配置界面。
  • 时钟原则:全网采用单晶振+PLL锁相环同源时钟体系,时序性能接近有线直连。
  • 传输原则:分包长度适配网络MTU,支持UDP封装、直接裸包双传输模式;音频数据采用WiFi 802.11e QoS MAC层No Ack单播模式。
  • 时隙原则:系统以10+ms为基础完整时间片周期,整周期均等分为四份时序切片;音频传输占用前三份(截止7+ms),剩余最后一份专供广播ACK、时钟同步、定位管控。
  • 定位原则:支持三维空间定位,可测量音箱水平位置与天空声道高度。
  • 抗丢包原则:采用差异化冗余传输机制,主声道、天空声道为当前帧+1帧历史帧,超低音为1帧当前主帧+7帧历史冗余帧。
3. 系统架构

系统采用一发多收、音频单播No Ack、控制/定位广播、确定性时隙调度架构,保障传输实时性与同步性,适配7.2.4共13路声道并发传输需求。

  • 发射端:承担全局时钟源、音频处理、高精度重采样、协议调度、设备配置与定位解算全部核心功能;以物理层通用晶振(如25MHz)为基准,通过PLL锁相环生成全系列音频主时钟。
  • 接收端:实现时钟同步跟踪、单播数据接收、音频解码播放、应答反馈、参与音箱间协同定位;极简硬件设计,无独立配置界面。
  • 物理层:基于5.8GHz WiFi 6技术,支持轻量级信道跳频(规避2.4GHz干扰)。
  • 核心支撑体系:时钟体系(全网同源,1μs全局时基)、定位体系(复用1μs时间戳)、冗余传输(差异化配置)、传输调度(10+ms时间片四分法)。
4. 发射端与接收端功能定义

4.1 发射端(主机)

  • 音源与时钟管理:支持AES3、SPDIF光纤/同轴等多音源接口,通过PLL从基准晶振衍生音频主时钟。
  • 数据处理与传输:完成各声道冗余帧封装、分包(适配MTU),支持UDP封装或裸包传输;超低音按单包聚合8帧数据封装。
  • 设备与定位管理:实时监测接收端状态,生成1~9档音质分级;完成音箱三维坐标建模与全自动声场校准。
  • 信道与同步管理:实时监测5.8GHz合规信道质量,自适应切换;同步全网1μs时基与时间戳。

4.2 接收端(音箱)

  • 数据接收与解析:支持UDP封装、裸包格式单播数据接收,解析各声道冗余帧。
  • 时钟与同步:搭载硬件时钟同步模块,PLL跟踪发射端主时钟;接收1μs全局时基。
  • 定位与播放:参与音箱间协同定位,仅响应自身分配通道数据;超低音接收端需缓存满80ms数据后启动解码播放。
  • 安全支持:支持链路层基础加密、私有配对密钥、WPA2/WPA3兼容。
5. 基础技术参数

5.1 全局时基

系统统一时基:1μs,由处理器内部Tick时钟硬件原生生成。

5.2 基准晶振与音频主时钟频率

  • 基准晶振:物理层通用典型25MHz
  • 48K体系:基准主时钟12.288MHz,衍生24.576MHz、49.152MHz,对应采样率48kHz、96kHz、192kHz
  • 44.1K体系:基准主时钟11.2896MHz,衍生22.5792MHz、45.1584MHz,对应采样率44.1kHz、88.2kHz、176.4kHz
  • 超低音6kHz采样率:以48K体系512采样点为参照,由PLL衍生生成

5.3 时序基准

  • 基础完整时间片周期:10+ms(可变动)
  • 时间片均分:四分,每等份2.5ms
  • 音频传输窗口:前三份合计约7.5ms,标称7+ms
  • 同步定位管控窗口:最后1份约2.5ms
  • 缓冲区判定节点:5+ms
  • 强同步窗口:20+ms(两段10+ms基础周期拼接)

5.4 链路与协议参数

  • 音频包固定16字节包头;单包最大有效音频净荷1456字节
  • 最大标准音频通道13路(7.2.4配置,通道0~12),通道14为配对专用通道
  • PLL调节范围±128PPM
  • 射频参数:5.8GHz频段、20MHz带宽,国内合规信道149、153、157、161、165
6. 时隙调度架构

系统以10+ms(可变动)为完整基础时间片,采用均等四分时序切片调度机制,音频传输与同步定位管控时隙物理完全隔离。

  1. 基础调度周期:固定10+ms完整时间片,均等分为四份,每份2.5ms。
  2. 音频发送阶段:0ms~7+ms(前三份时序切片),集中突发发送各声道冗余帧全量音频数据包。
  3. 缓冲区管控节点:5+ms时序节点检测UDP链路剩余待发送缓存;若剩余分包无法在7+ms前完整发送,直接清空UDP缓冲区。
  4. 同步定位管控阶段:7+ms~10+ms(最后1/4时序切片),接收端有序发送ACK应答、完成时钟同步、音箱间交互测距与定位解算。
  5. 强同步窗口:每20+ms为一个强同步窗口,窗口内丢包不补、不重试。
  6. 时隙隔离规则:音频业务严格限定在前3/4时序,同步管控业务限定在后1/4时序,互不干扰。
7. 数据包格式与封装机制

7.1 封装方式(二选一)

  • UDP封装模式:音频数据包作为UDP载荷,标准IPv4头部20Byte、UDP头部8Byte,单包最大UDP载荷1472Byte,扣除16Byte自定义WAA协议头后,单包最大有效音频净荷1456Byte。
  • 裸包模式:16字节标准包头+音频净荷直接送入WiFi物理层,传输时延更低、协议开销更小。

7.2 数据包结构

  • 音频数据包包头(16字节):字节偏移0~3(4字节,32bit全局微秒时间戳)、4~7(4字节,帧序号+通道内包序号+通道类型+帧类型)、8~11(4字节,音频格式配置)、12~15(4字节,CRC16校验+信道状态+保留位)。
  • 应答包(16字节):仅占用16bit微秒时间戳位域,其余字段暂预留。

7.3 信道与协议合规性

  • 中国区5.8GHz合规信道:固定为149、153、157、161、165
  • WiFi协议合规:遵循WiFi IFS帧间间隔机制,通过WMM最高语音优先级配置。
8. 音频数据量与分包规则

8.1 声道配置与单通道纯音频载荷

  • 7路主声道:主轨96K/24bit + 历史辅助帧48K/16bit,单通道单帧纯音频总数据4096Byte;冗余机制为1帧当前帧+1帧历史帧。
  • 4路天空声道:主轨48K/24bit + 历史辅助帧48K/16bit,单通道单帧纯音频总数据2560Byte;冗余机制为1帧当前帧+1帧历史帧。
  • 2路超低音声道:6kHz采样率,单包聚合8帧数据(1帧当前主帧+7帧历史冗余帧),单包总音频载荷1280Byte;8包内收到任意1包即可完整插值还原低频波形。

8.2 分包规则(基于MTU约束)

  • 超低音声道:单通道单包聚合8帧数据,整帧1个UDP包发送
  • 天空声道:单通道整帧拆分2个UDP包
  • 主声道:单通道整帧拆分3个UDP包
9. 时序基准与音频主时钟体系统一定义

系统全局统一时基为1μs,由处理器Tick时钟硬件生成,无需分频拟合折算,全网时序基准唯一;发射端支持高采样率向下整数分频,分频过程时钟同源、无相位断裂与失真,48k与44.1k体系分频独立;超低音6kHz采样率以48K体系512采样点为参照,由PLL衍生生成,时钟同源无偏差;1μs时间戳仅用于定位、测距、同步交互,不用于音频采样、播放时序计数。

10. 通道管理与配对机制
  • 通道划分:通道0~12为标准音频通道(13路,7.2.4配置),通道14为配对专用通道。
  • 初始与配对:接收端出厂无默认通道号、无自主配置权限;由发射端发起配对流程(设备扫描→通道分配→角色绑定→参数保存)。
  • 运行管控:配对完成后,接收端仅响应自身分配通道数据,无法修改配置;具备断电记忆功能,开机自动接入组网。
11. 三维空间定位与音箱间协同定位

11.1 定位能力与可行性

系统在不增加硬件成本、不占用音频带宽、不改动传输架构的前提下,实现适配13通道自动识别各类音箱位置,基于WiFi RTT/FTM的米级/亚米级距离估计。

11.2 定位实现

  • 时隙支撑:7+ms音频发送完成后,剩余1/4时隙作为同步定位窗口。
  • 架构优势:无需额外专用定位帧,所有音箱可接收广播/组播的应答、定位数据。
  • 定位与校准:通过多点测距解算,获取音箱水平距离、间距、垂直高度差及室内声学参数,自动识别天空声道并完成高度补偿。
12. 接收端播放同步策略
  • 启播机制:主声道、天空声道采用双帧同步启播,以20+ms为双帧时序窗口,需连续接收两帧完整有效音频包后启动播放;超低音接收端需缓存满80+ms数据后才启动解码播放。
  • 同步与播放:启播后,所有接收端基于统一32bit微秒时间戳同步播放;正常接收当前帧时保持对应音质,当前帧残缺时依靠历史帧降级接续。
  • 异常应对:20+ms强同步窗口内丢包不补;严重连续丢包、时序失步时,进入静音保护,重新等待两帧有效包后按20+ms同步流程开播。
13. 系统工作模式
  • 正常播放模式:传输对应通道音频数据,遵循10+ms时隙调度与20+ms强同步窗口规则。
  • 配对配置模式:发射端启用通道14,接收端触发配网模式,暂停音频业务,完成接收端扫描、通道分配、绑定与参数保存。
  • 定位校准模式:在同步定位窗口自动运行,不影响正常音频播放,持续完成音箱三维测距、坐标解算与声场校准。
  • 信道切换模式:发射端实时监测5.8GHz信道质量,信号不达标时自动切换至合规信道。
14. 抗干扰与异常处理
  • 频段与信道优化:采用5.8GHz频段(规避2.4GHz干扰),固定20MHz带宽,支持轻量级软件跳频。
  • 架构与冗余抗扰:单向单播无重传、控制/定位广播避免上行拥塞;依托差异化冗余机制降低丢包影响。
  • 工程预案:保留双天线分集、MCS自适应、降采样降通道数、低码率保护模式。
15. 标准符合性要求
  • 射频符合性:遵循我国5.8GHz频段管理规定,仅使用合规信道。
  • 协议符合性:遵循WiFi 6协议,适配UDP/裸包传输,符合IFS帧间间隔、WMM最高语音优先级要求。
  • 时序符合性:严格遵循10+ms基准时隙、7+ms音频窗口、5+ms缓冲区判定、20+ms强同步窗口规则。
  • 音频符合性:正常工况不主动插补、不篡改音频波形,采样率、位深、分包规则符合规范。
  • 定位符合性:支持亚米级距离估计识别,定位逻辑采用WiFi粗定位+设备拓扑识别+信号质量辅助校准。
16. 音质分级与终端硬件指示规范

16.1 音质1~9档量化定义

档位RSSI丢包率音质描述
1档<-75dBm≥30%极端干扰,音频持续爆音、断连、卡顿
2档-70~-74dBm20%~29%严重干扰,频繁卡顿、偶发爆音
3档-65~-69dBm15%~19%偏重干扰,偶发卡顿、轻微失真
4档-60~-64dBm10%~14%一般干扰,无卡顿爆音,细节轻微丢失
5档-55~-59dBm5%~9%轻度干扰,无失真卡顿,极细微细节损失
6档-50~-54dBm2%~4%信道基本干净,音频完整,无可感知失真
7档-45~-49dBm≤1%信道干净,接近无损,细节完整
8档-40~-44dBm0%信道优质,全细节无损,时序零偏差
9档≥-39dBm0%信道极致优质,100%无损,毫秒级同步

16.2 终端硬件指示强制要求

  • 高配要求:具备屏显、多色LED阵列、串口上报功能的产品,需完整支持1~9档实时显示。
  • 最低标配:一颗双色LED灯,三级状态指示——绿色常亮(7/8/9档)、橙色闪烁(4/5/6档)、红色快闪(1/2/3档)。
  • 响应要求:灯光状态切换延迟≤200ms。
17. 附则

本规范由世界无线局域网应用发展联盟(WAA)负责解释、修订与更新。

本规范自V0.6发布之日起正式实施,所有相关设备研发、生产、部署需严格遵循本规范要求。