WAA无线多通道音频广播传输规范V0.6 - 深圳市酷唱科技有限公司

1. 总则

本规范由世界无线局域网应用发展联盟（WAA）制定，为面向专业音视频（AudioVideo）系统的强制性无线音频传输标准，适用于家庭影院、专业影音、多声道分布式音响系统，可作为行业级或国家级无线音视频传输标准申报、落地与实施依据。

规范旨在替代AES3等传统有线音频传输方式，在无线传输环境下实现接近有线传输的音质、时序与同步性能，正常工况不主动插补、不篡改音频波形；短时链路波动依靠冗余帧平滑接续，避免爆音与时序偏移（超低音采用专属8帧冗余机制）。

系统核心特性：采用单晶振时钟架构（通过PLL锁相环衍生全系列音频主时钟，硬件设计精简）；音频传输采用冗余帧机制（主声道、天空声道为当前帧+1帧历史帧，超低音为专属8帧冗余机制），降低音频丢包对播放的影响；具备三维空间定位能力，可自动识别地面音箱与天空声道高度参数，实现全自动声场校准，满足高精度声学需求。

采样率规则：系统支持192kHz采样率处理，其传输需满足总数据量不超过96kHz 24bit单通道的最大数据量限制（含对应历史帧）；若超出该限制或采用7.2.4满通道（13路）传输时，自动将192kHz强制降为96kHz传输。

定位差异：本规范不与蓝牙比拼功耗指标，核心差异化聚焦三大硬指标——超低传输延时、超大多声道传输容量、多设备高精度时钟同步，走专业高清多声道高端影音赛道。

全局时基：系统全局统一时基为1μs，由处理器内部Tick时钟硬件生成。

2. 核心设计原则与定位

架构原则：发射端实现全功能、全运算、全管理；接收端采用极简、低成本设计，无独立配置界面。
时钟原则：全网采用单晶振+PLL锁相环同源时钟体系，时序性能接近有线直连。
传输原则：分包长度适配网络MTU，支持UDP封装、直接裸包双传输模式；音频数据采用WiFi 802.11e QoS MAC层No Ack单播模式。
时隙原则：系统以10+ms为基础完整时间片周期，整周期均等分为四份时序切片；音频传输占用前三份（截止7+ms），剩余最后一份专供广播ACK、时钟同步、定位管控。
定位原则：支持三维空间定位，可测量音箱水平位置与天空声道高度。
抗丢包原则：采用差异化冗余传输机制，主声道、天空声道为当前帧+1帧历史帧，超低音为1帧当前主帧+7帧历史冗余帧。

3. 系统架构

系统采用一发多收、音频单播No Ack、控制/定位广播、确定性时隙调度架构，保障传输实时性与同步性，适配7.2.4共13路声道并发传输需求。

发射端：承担全局时钟源、音频处理、高精度重采样、协议调度、设备配置与定位解算全部核心功能；以物理层通用晶振（如25MHz）为基准，通过PLL锁相环生成全系列音频主时钟。
接收端：实现时钟同步跟踪、单播数据接收、音频解码播放、应答反馈、参与音箱间协同定位；极简硬件设计，无独立配置界面。
物理层：基于5.8GHz WiFi 6技术，支持轻量级信道跳频（规避2.4GHz干扰）。
核心支撑体系：时钟体系（全网同源，1μs全局时基）、定位体系（复用1μs时间戳）、冗余传输（差异化配置）、传输调度（10+ms时间片四分法）。

4. 发射端与接收端功能定义

4.1 发射端（主机）

音源与时钟管理：支持AES3、SPDIF光纤/同轴等多音源接口，通过PLL从基准晶振衍生音频主时钟。
数据处理与传输：完成各声道冗余帧封装、分包（适配MTU），支持UDP封装或裸包传输；超低音按单包聚合8帧数据封装。
设备与定位管理：实时监测接收端状态，生成1~9档音质分级；完成音箱三维坐标建模与全自动声场校准。
信道与同步管理：实时监测5.8GHz合规信道质量，自适应切换；同步全网1μs时基与时间戳。

4.2 接收端（音箱）

数据接收与解析：支持UDP封装、裸包格式单播数据接收，解析各声道冗余帧。
时钟与同步：搭载硬件时钟同步模块，PLL跟踪发射端主时钟；接收1μs全局时基。
定位与播放：参与音箱间协同定位，仅响应自身分配通道数据；超低音接收端需缓存满80ms数据后启动解码播放。
安全支持：支持链路层基础加密、私有配对密钥、WPA2/WPA3兼容。

5. 基础技术参数

5.1 全局时基

系统统一时基：1μs，由处理器内部Tick时钟硬件原生生成。

5.2 基准晶振与音频主时钟频率

基准晶振：物理层通用典型25MHz
48K体系：基准主时钟12.288MHz，衍生24.576MHz、49.152MHz，对应采样率48kHz、96kHz、192kHz
44.1K体系：基准主时钟11.2896MHz，衍生22.5792MHz、45.1584MHz，对应采样率44.1kHz、88.2kHz、176.4kHz
超低音6kHz采样率：以48K体系512采样点为参照，由PLL衍生生成

5.3 时序基准

基础完整时间片周期：10+ms（可变动）
时间片均分：四分，每等份2.5ms
音频传输窗口：前三份合计约7.5ms，标称7+ms
同步定位管控窗口：最后1份约2.5ms
缓冲区判定节点：5+ms
强同步窗口：20+ms（两段10+ms基础周期拼接）

5.4 链路与协议参数

音频包固定16字节包头；单包最大有效音频净荷1456字节
最大标准音频通道13路（7.2.4配置，通道0~12），通道14为配对专用通道
PLL调节范围±128PPM
射频参数：5.8GHz频段、20MHz带宽，国内合规信道149、153、157、161、165

6. 时隙调度架构

系统以10+ms（可变动）为完整基础时间片，采用均等四分时序切片调度机制，音频传输与同步定位管控时隙物理完全隔离。

基础调度周期：固定10+ms完整时间片，均等分为四份，每份2.5ms。
音频发送阶段：0ms～7+ms（前三份时序切片），集中突发发送各声道冗余帧全量音频数据包。
缓冲区管控节点：5+ms时序节点检测UDP链路剩余待发送缓存；若剩余分包无法在7+ms前完整发送，直接清空UDP缓冲区。
同步定位管控阶段：7+ms～10+ms（最后1/4时序切片），接收端有序发送ACK应答、完成时钟同步、音箱间交互测距与定位解算。
强同步窗口：每20+ms为一个强同步窗口，窗口内丢包不补、不重试。
时隙隔离规则：音频业务严格限定在前3/4时序，同步管控业务限定在后1/4时序，互不干扰。

7. 数据包格式与封装机制

7.1 封装方式（二选一）

UDP封装模式：音频数据包作为UDP载荷，标准IPv4头部20Byte、UDP头部8Byte，单包最大UDP载荷1472Byte，扣除16Byte自定义WAA协议头后，单包最大有效音频净荷1456Byte。
裸包模式：16字节标准包头+音频净荷直接送入WiFi物理层，传输时延更低、协议开销更小。

7.2 数据包结构

音频数据包包头（16字节）：字节偏移0~3（4字节，32bit全局微秒时间戳）、4~7（4字节，帧序号+通道内包序号+通道类型+帧类型）、8~11（4字节，音频格式配置）、12~15（4字节，CRC16校验+信道状态+保留位）。
应答包（16字节）：仅占用16bit微秒时间戳位域，其余字段暂预留。

7.3 信道与协议合规性

中国区5.8GHz合规信道：固定为149、153、157、161、165
WiFi协议合规：遵循WiFi IFS帧间间隔机制，通过WMM最高语音优先级配置。

8. 音频数据量与分包规则

8.1 声道配置与单通道纯音频载荷

7路主声道：主轨96K/24bit + 历史辅助帧48K/16bit，单通道单帧纯音频总数据4096Byte；冗余机制为1帧当前帧+1帧历史帧。
4路天空声道：主轨48K/24bit + 历史辅助帧48K/16bit，单通道单帧纯音频总数据2560Byte；冗余机制为1帧当前帧+1帧历史帧。
2路超低音声道：6kHz采样率，单包聚合8帧数据（1帧当前主帧+7帧历史冗余帧），单包总音频载荷1280Byte；8包内收到任意1包即可完整插值还原低频波形。

8.2 分包规则（基于MTU约束）

超低音声道：单通道单包聚合8帧数据，整帧1个UDP包发送
天空声道：单通道整帧拆分2个UDP包
主声道：单通道整帧拆分3个UDP包

9. 时序基准与音频主时钟体系统一定义

系统全局统一时基为1μs，由处理器Tick时钟硬件生成，无需分频拟合折算，全网时序基准唯一；发射端支持高采样率向下整数分频，分频过程时钟同源、无相位断裂与失真，48k与44.1k体系分频独立；超低音6kHz采样率以48K体系512采样点为参照，由PLL衍生生成，时钟同源无偏差；1μs时间戳仅用于定位、测距、同步交互，不用于音频采样、播放时序计数。

10. 通道管理与配对机制

通道划分：通道0~12为标准音频通道（13路，7.2.4配置），通道14为配对专用通道。
初始与配对：接收端出厂无默认通道号、无自主配置权限；由发射端发起配对流程（设备扫描→通道分配→角色绑定→参数保存）。
运行管控：配对完成后，接收端仅响应自身分配通道数据，无法修改配置；具备断电记忆功能，开机自动接入组网。

11. 三维空间定位与音箱间协同定位

11.1 定位能力与可行性

系统在不增加硬件成本、不占用音频带宽、不改动传输架构的前提下，实现适配13通道自动识别各类音箱位置，基于WiFi RTT/FTM的米级/亚米级距离估计。

11.2 定位实现

时隙支撑：7+ms音频发送完成后，剩余1/4时隙作为同步定位窗口。
架构优势：无需额外专用定位帧，所有音箱可接收广播/组播的应答、定位数据。
定位与校准：通过多点测距解算，获取音箱水平距离、间距、垂直高度差及室内声学参数，自动识别天空声道并完成高度补偿。

12. 接收端播放同步策略

启播机制：主声道、天空声道采用双帧同步启播，以20+ms为双帧时序窗口，需连续接收两帧完整有效音频包后启动播放；超低音接收端需缓存满80+ms数据后才启动解码播放。
同步与播放：启播后，所有接收端基于统一32bit微秒时间戳同步播放；正常接收当前帧时保持对应音质，当前帧残缺时依靠历史帧降级接续。
异常应对：20+ms强同步窗口内丢包不补；严重连续丢包、时序失步时，进入静音保护，重新等待两帧有效包后按20+ms同步流程开播。

13. 系统工作模式

正常播放模式：传输对应通道音频数据，遵循10+ms时隙调度与20+ms强同步窗口规则。
配对配置模式：发射端启用通道14，接收端触发配网模式，暂停音频业务，完成接收端扫描、通道分配、绑定与参数保存。
定位校准模式：在同步定位窗口自动运行，不影响正常音频播放，持续完成音箱三维测距、坐标解算与声场校准。
信道切换模式：发射端实时监测5.8GHz信道质量，信号不达标时自动切换至合规信道。

14. 抗干扰与异常处理

频段与信道优化：采用5.8GHz频段（规避2.4GHz干扰），固定20MHz带宽，支持轻量级软件跳频。
架构与冗余抗扰：单向单播无重传、控制/定位广播避免上行拥塞；依托差异化冗余机制降低丢包影响。
工程预案：保留双天线分集、MCS自适应、降采样降通道数、低码率保护模式。

15. 标准符合性要求

射频符合性：遵循我国5.8GHz频段管理规定，仅使用合规信道。
协议符合性：遵循WiFi 6协议，适配UDP/裸包传输，符合IFS帧间间隔、WMM最高语音优先级要求。
时序符合性：严格遵循10+ms基准时隙、7+ms音频窗口、5+ms缓冲区判定、20+ms强同步窗口规则。
音频符合性：正常工况不主动插补、不篡改音频波形，采样率、位深、分包规则符合规范。
定位符合性：支持亚米级距离估计识别，定位逻辑采用WiFi粗定位+设备拓扑识别+信号质量辅助校准。

16. 音质分级与终端硬件指示规范

16.1 音质1~9档量化定义

档位	RSSI	丢包率	音质描述
1档	<-75dBm	≥30%	极端干扰，音频持续爆音、断连、卡顿
2档	-70~-74dBm	20%~29%	严重干扰，频繁卡顿、偶发爆音
3档	-65~-69dBm	15%~19%	偏重干扰，偶发卡顿、轻微失真
4档	-60~-64dBm	10%~14%	一般干扰，无卡顿爆音，细节轻微丢失
5档	-55~-59dBm	5%~9%	轻度干扰，无失真卡顿，极细微细节损失
6档	-50~-54dBm	2%~4%	信道基本干净，音频完整，无可感知失真
7档	-45~-49dBm	≤1%	信道干净，接近无损，细节完整
8档	-40~-44dBm	0%	信道优质，全细节无损，时序零偏差
9档	≥-39dBm	0%	信道极致优质，100%无损，毫秒级同步

16.2 终端硬件指示强制要求

高配要求：具备屏显、多色LED阵列、串口上报功能的产品，需完整支持1~9档实时显示。
最低标配：一颗双色LED灯，三级状态指示——绿色常亮（7/8/9档）、橙色闪烁（4/5/6档）、红色快闪（1/2/3档）。
响应要求：灯光状态切换延迟≤200ms。

17. 附则

本规范由世界无线局域网应用发展联盟（WAA）负责解释、修订与更新。

本规范自V0.6发布之日起正式实施，所有相关设备研发、生产、部署需严格遵循本规范要求。

WAA无线多通道音频广播传输规范

目录