硬件产品经理实战指南 · 补遗卷(四)关于声学

硬件产品经理实战指南 · 补遗卷(四)关于声学

听懂声音:从TWS耳机到麦克风阵列——硬件PM的声学必修课

大家好,我是兔尔摩斯。

前面几篇补遗,我们聊了学习方法、专业英语、AI硬件周期。这一篇,我想回归一个更“硬核”但容易被产品经理忽略的领域:声学

为什么硬件PM需要懂一点声学?因为从TWS耳机到智能音箱,从麦克风阵列到语音交互,声学设计直接决定了用户的第一感知——而这个领域,恰恰是很多产品经理的盲区。选错一颗麦克风,可能导致整个VUI系统唤醒率崩盘;搞不懂ANC拓扑,你的降噪耳机可能永远停留在“实验室神器、产线噩梦”的阶段。

本文内容主要来自我早年的项目笔记和行业观察,部分数据以2019-2020年为背景,但底层逻辑至今依然有效。希望能帮你建立从“耳机”到“麦克风阵列”的知识树主干。当然,有些问题不用担心,笔者在之前的正片内容中也有撰写过:项目进行过程中会有专业的声学工程师参与工作,并简单介绍了要如何与对应的岗位配合。作为硬件产品经理,更加重要的应该是做一些基础知识的梳理,了解整体声学架构所服务的完整优秀产品体验方案。而且笔者有一个发现:其实在传统消费类电子领域,特别是10年前,声学主要服务的产品是蓝牙音箱、Wi-Fi音箱或者Hi-Fi声学系统,本质是对喇叭驱动和各个部件调整参数,以达成优质的声音享受体验。但是随着消费类市场产品形态的发展,声学的技术边界也出现了延展。笔者自己的感觉是,传统调声学曲线、了解飞利浦“金耳朵”曲线(耳机产品在声学方面用来做电声工程师能力评估的一些参考项目)等经验丰富的声学工程师,在踏入新的声学交互体验时,能力是不足的。这里举几个例子:

  • 智能音箱最重要的功能之一是远场语音唤醒,这需要搭建麦克风阵列矩阵。特别是当智能音箱正在播放音乐时,用户需要发出命令改变控制,那么扬声器在工作的时候,麦克风阵列能否协同保持与安静状态下同等的语音唤醒能力,显得尤为重要。
  • 更复杂一些的情况:传统会议设备一般会使用电话八爪鱼系统,而为了追求便利,我们会设计类似于便携蓝牙音箱的小型化设备。当设备长期通过蓝牙连接会议通讯软件,支持麦克风阵列并捕捉来自多方向声源时,扬声器需要保持清晰地放出线上其他人的声音,同时要避免“双通”情况的发生,这需要软硬件结合的方案处理。
  • 更进一步,TWS耳机产品需要小型化,在优化通话降噪的同时,从物理和软件层面增强降噪系统方案(主动降噪与被动降噪结合)。其实我们知道,ANC最早的技术路径来自军用耳机设备和汽车整车声学降噪系统。
  • 而近年来火热的智能眼镜,则必须避免把消费产品设计得不像耳机本身。因此需要在眼镜腿部增加小型化扬声器,并且做成开放式耳机产品,兼顾开放式音源和声源定向方案。

综合以上场景,笔者的总体想法是:大家不需要紧张,觉得声学是非常独立的一块知识。我更希望告诉大家,以当前ODM行业产品发展的多样性,对电声工程师的系统性挑战也是必然的。硬件产品经理和电声工程师是一个共同学习进步的过程,大家都一样。

一、TWS耳机的ANC拓扑:前馈、反馈与混合怎么选?

1.1 对于硬件产品经理关键的信息是——麦克风的数量和位置,决定了ANC的拓扑架构

2019年TWS市场火爆,国内厂商纷纷上车。但一个现象很有意思:很多知名品牌在19年下半年就发布了TWS ANC耳机的预告,却迟迟没有推向市场;甚至有些手机品牌用了带ANC功能的SoC,上市产品却没有开启ANC功能。实际上,各大品牌的ANC主动降噪耳机的量产时间都推迟了。

笔者认为,推迟的根本原因在于:ANC不是“有了芯片就行”,声学腔体设计和产线一致性是两个大坑。很多品牌商忽略了ANC声学腔体设计,以及生产时一致性很难做到。根据当时的经验,很多项目是跑到DVT(Device Verification Test)阶段,才出现明显的适配不佳问题,进而产生了诸多问题。笔者当时给有意向做TWS ANC的品牌厂商一个建议:选好有声学功底的合作方,尤其是做过ANC产线测试的——这句话到今天依然适用。

1.2 ANC的基本原理

主动噪声消除(ANC)是一种将不需要的声源识别为噪声的方法,通过产生“抗噪声”信号来消除原始噪声,从而实时地消除噪声。现代降噪耳机在被动降噪无法产生理想结果时,通常采用这种技术来消除外部噪声源,特别是在较低的频率(<1kHz)。这在一些情境下非常实用,比如工人需要保护自己不受工厂持续噪音影响,或航空公司旅客需要过滤掉发动机的噪音。

一个典型的ANC耳机系统包含:

  • 麦克风:捕捉环境噪声
  • ANC芯片/算法:生成反向信号
  • 扬声器:播放音乐 + 抗噪声信号

噪音消除耳机-概念图

无论拓扑架构如何,在噪声干扰检测中实现ANC有两个明显的挑战:

  1. 可靠地捕获外部环境噪声:使用麦克风监听周围噪音源,在音频波段(20Hz-20kHz)捕捉信号。麦克风的几项参数指标对此至关重要。
  2. 实现从原始声音信号捕获到噪声的消除:需要自适应算法及时有效地实现降噪,因为声源的频率、幅值、相位等特性是时变的。

1.3 三种拓扑架构详细对比

(1)前馈(Feed Forward,FF)

架构示意:如图所示,每侧耳机只使用一个麦克风,放置在耳机外侧。

工作原理:对这个麦克风的测量数据形成了ANC算法实现的噪声参考信号。能在主要噪声信号到达人耳前就很好地检测到它们,这是这种设计最大的优点。戴着耳机的人们甚至没有意识到噪声的存在,就通过算法消除了它。

优点

  • 能较好处理中频噪声信号(1-2kHz之间)
  • 设计相对简单

缺点

  • 由于系统中缺少反馈回路,算法无法保证噪声消除工作是实时的——这是前馈拓扑架构的主要缺点
  • 麦克风放置在外部,因此可能会因为风噪影响性能(此场景中,具有更高AOP和更低截止频率的麦克风将非常有用)

适用场景:需要更宽的ANC带宽、但愿意牺牲适度降噪性能的蓝牙耳机。

FF Feed Forward示意


(2)反馈(Feed Back,FB)

架构示意:如图所示,只使用一个麦克风,但放置在离使用者耳朵较近的地方。

工作原理:麦克风能准确地听到将要进入用户耳朵的声音信号,并且有一个反馈回路用于迭代地从系统中去除噪声。

优点

  • 低频性能很好
  • 能有效去除初级噪声信号中可预测的窄带分量
  • 这是在耳机中实现ANC时最常用的拓扑

缺点

  • 频率在1-2kHz之间不能像前馈配置那样有效地衰减
  • 无法有效删除中高频噪声信号,这种限制是由于次级路径(信号路径从ANC模块的输出一直返回到它的输入)引入了相移
  • 在这种配置中使用的麦克风需要具有频率上的平坦群延迟,且多个麦克风之间的差异应尽可能低
FB Feed Back示意

(3)混合(Hybrid)

架构示意:如图所示,前馈+反馈的组合,每侧耳机使用两个麦克风(一个面向外的参考麦克风感知主信号,一个误差麦克风收集进入用户耳中的信号)。

工作原理:面向外的参考麦克风感知主信号,作为前向ANC滤波器的参考信号;误差麦克风收集进入用户耳中的信号,作为反馈ANC滤波器的参考信号。误差麦克风的输出也有助于确定前馈和反馈滤波器的参数。如果设计正确,这种配置可以平衡前馈和反馈拓扑的潜能。

优点

  • 三种拓扑中ANC性能最佳、降噪带宽最宽
  • 平衡了前馈和反馈的优势

缺点

  • 伴随着复杂性、成本和尺寸的增加
  • 2kHz以上性能仍不理想(因此耳机设计者通常使用被动降噪技术来提高高频噪声消除性能)

适用场景:高性能ANC耳机设计,低成本不是主要考虑因素。

Hybrid 示意


一句话总结

  • 预算有限、想做基础降噪 → 反馈
  • 想要宽频带、能接受风噪风险 → 前馈
  • 追求极致降噪、可以接受成本上升 → 混合

1.4 综合评定方案

那么讲到这里,结合了具体的结构设计,以及当前SoC厂商一般具有完善的内置算法,并且有大量第三方IDH提供专业的降噪完整解决方案,当我们搭建了一套设计之后,下一步就是用相对系统的方式进行验证。笔者这里直接给出一套优化后的评定标准。当然各个厂商在近年来的方案中应该已经积累了不少经验,如下仅供参考:

二、通话降噪

2.1 通话降噪的前期发展

其实在2019年左右,国内设计环境并没有一个严格评估通话降噪的方法,大家可以做的是参考之前通讯领域的通话降噪测试方式,以此基准针对耳机做出一些调整。如下展示的是笔者当时自行整理的一些评判标准。而在当时,针对通话降噪的设计方案也是百花齐放。

首先是Qualcomm推出的CVC回声和噪音消除技术。其特色是总体软件算法集成在SoC内部,方案设计上需要搭配双麦克风来实现。增强通话的方式是通过双麦克风信号分离(DMSS)DSP处理技术,保证动态下抑制背景噪音。据官网技术分享,最高可以实现30分贝噪音抑制。同时,算法搭配了一部分Automatic Gain Control(AGC),也就是自动增益控制。不过这个主要是针对使用耳机的说话人:如果音量太大,可以将音频信号调整后再传输。这与其他算法方案中提及的AGC概念不完全相同。总体来讲,这是在当时较为通用的一种选择,毕竟算法与SoC适配度较高。但是总体而言,通话优化是有限的。

于是,在当时,我们开始尝试引入第三方算法,一般会单独搭配一颗DSP芯片。比如如下方式:硬件层面需要搭配指向性麦克风(Adaptive Directional Microphone,ADM),搭配算法公司提供的Beamforming算法,可以实现AEC(Acoustic Echo Canceller)回声消除、Noise Suppressor(NS)噪音抑制(这里指直接删除算法捕捉并判定的噪音信号,比如来自交通、机器或路过汽车的声音),以及AGC自动增益控制,还有一些辅助搭配的EQ调节等。部分更加完整的算法可能还会做一些自动音量和均衡的调节,以及为传输中丢包现象做补偿。

以上方法,特别是多麦克风阵列搭配降噪算法,效果的确不错。但是同时,因为耳机形态变小了太多,对功耗的需求以及结构设计中的挑战则不小。以上算法,不论是单独集成于DSP中,还是用更多的麦克风阵列搭配纯算法植入SoC,这两种降噪方案都是早期基于军用头戴式耳机的降噪技术以及移动电话降噪技术演变出来的。部分耳机是单独搭配一个可以伸长的麦克风靠近嘴边;或者移动电话本身的长条形状,也能够满足麦克风在电话底部靠近使用者嘴巴、喇叭在电话上部靠近使用者耳朵。总体产品结构足够大,这也是麦克风阵列可以刚好生效的关键。但是在当时,TWS耳机体积太小,设计者更希望能精简结构。同时,过于小的耳机体积导致麦克风之间的距离很短,结构上能设计成麦克风阵列的挑战大大增加。因此在初期,排除结构之外的干扰,耳机设计方面极度依赖阵列降噪算法,但实际算法的表现也不好。甚至,降噪的本质并不是捕捉充分的声音信号并进行噪声信号分离,而是还要依赖一些环路数据包补偿,尝试把丢失的数据给抓回来,比如Packet Loss Concealment,特别的数据信号补偿,或者可以对正常接收到的声音信号通过Automatic Volume & Equalization(AVQ)进行信号补偿。因此,虽然通话降噪是当时产品的噱头,但消费类领域产品能做到的与专业设备之间相距甚远。

在麦克风阵列与算法的组合不尽如人意的表现下,设计者开始尝试通过额外的方式解决。于是从产品形态上,开始尝试新的信号采集方式——利用声音在固体中传输速度快于在空气中传输的特性,使用骨传导芯片采集信号。这样做的好处是可以清晰地采集到人在通话时的声音,坏处是同时把噪音也充分采集到了,得到的信号是混杂在一起的。于是基于这个现实,一些基于DNN的算法就需要同步配置在SoC中,帮助信号采集的同时,有效地做出人声与噪音分离,进而保证通话效果。这样,即使在地铁、KTV等极端低信噪比场景下,只要算法的效率较高,其实声音信号中的人声与背景噪音的信号特性差异还是较大的,效果会比较有效。

综合以上,随着近年来通话降噪的发展,整体的业态呈现出稳定的方案:芯片SoC在兼顾低功耗的同时,比较理想地做到了平衡一套适配的通话降噪方案,并优化蓝牙传输。以上就是对整体技术发展的简介。当然,在下一步穿戴类(智能眼镜)以及产品进一步小型化的驱动下,通话降噪的方案还在进一步优化中。

三、高信噪比麦克风的核心价值

3.1 VUI的基本概念

VUI(语音用户接口)支持使用语音作为通信手段的人与设备之间的交互。它更多是以命令和问题的形式将信息传输到具有或不具有云连接的电子系统。VUI在许多消费电子领域得到应用,如智能手机、智能电视和智能家居设备(如Amazon Echo或Google Home)。

VUI的概念基于使用单个麦克风或麦克风阵列捕获音频信号。录制的语音指令由应用处理器进行处理,通过波束形成、噪声消除等语音增强算法提高信号质量。改进后的信号被发送到云端进行关键字和命令识别,相应的输出最终由VUI或辅助集成设备组件播放或执行。

大多数VUI接口使用MEMS麦克风阵列进行盲源信号分离和扬声器定位,并在存在背景噪声的情况下检测命令。

3.2 麦克风的核心性能参数

麦克风阵列的性能,由单颗麦克风的性能决定。麦克风性能的特点通常是自噪声动态范围

  • 动态范围的上限:由声学过载点(AOP,Acoustic Overload Point)定义
  • 动态范围的下限:由信噪比(SNR,Signal-to-Noise Ratio)定义

信噪比描述了麦克风的自噪声。麦克风只能在其自噪声层以上的声压级(SPL)下接收信号。因此,高信噪比的麦克风可以在比低信噪比的麦克风更低的声压下工作

3.3 为什么高SNR在VUI中如此重要?

目前的VUI设备重点是为在1-3米范围内涉及正常语音(60 dBSPL)的用例提供最佳性能。在实验室里,这些理想条件很容易实现。然而,实际情况提供了许多性能级别低于60 dBSPL限制的用例:

  • 轻柔或耳语:用户可能不希望吵醒同房间睡觉的人,或避免打扰别人读书。如果捕捉到的声音电平接近VUI麦克风的自噪声电平,低SPL的语音会导致错误的命令识别。低自噪声麦克风留有足够空间,确保即使是低声压级的语音信号也能被放大、处理和识别。
  • 远场场景:用户和VUI设备可能不在同一个房间(7-10米距离),声音会被距离和墙壁等物理屏障减弱。麦克风的自噪声越低,用户和语音识别设备之间的可能距离就越大。

3.4 测试标准与ABC-MRT

目前还没有为VUI设备定义特定的测试标准。在研究了PESQ/POLQA、语音传输指数(STI)等不同标准后,基于传统修正音韵测试的Audio Precision的“发音-频带相关修正音韵测试”(ABC-MRT)被认为是最接近评估要求的工具。该测试提供从0到1的可理解度评分,1表示100%匹配。

测试环境基于ETSI指南(ETSI EG 202 396-1)及一些定制规范:

  • 半消声室,尺寸约4.4m × 3m
  • 混响时间极低,吸声系数约95%
  • 房间噪声声级低于10dB(A)

基于保密原则,实际测试数据此处隐去。

一个来自经验的忠告:目前算法供应商倾向于制造与硬件无关的算法,试图在每种硬件上都提供良好性能,而非针对某款硬件深度优化。如果你的VUI设备使用了高SNR麦克风,一定要推动算法团队针对这颗麦克风的规格做调优,充分利用高级硬件组件的优势,否则等于徒增成本。

四、高端TWS声音表现追求

笔者当时结合全球市场2019年TWS销售数据,做了一个“销量+功能”的交叉分析。虽然数据有点年头了,但结论很有意思——TWS的核心卖点已经从“音频性能”转向了“便利性与通信”

4.1 功能得分对比

我们设置了16个功能等级。得分如下(笔者注:详情可参考此篇文章,对部分耳机产品做了详细说明:2019高端价位TWS Features对比 - 兔尔摩斯的文章 - 知乎):

结论:从产品规格对比可以看出,TWS更多的是关于便利性和通信,而不是传统的音频性能。得分高的产品往往在连接便利性、通话质量、跨设备协同上表现突出。

4.2 市场格局变化

从2018年到2019年Q1-Q3的市场变化可以看出:

  • 除了Sony、Bose、JBL、Sennheiser等传统音频品牌,华为、小米、三星、Jabra等新品牌也冲入零售额前十
  • 结合产品得分分析,TWS产品对市场增长的贡献最大
  • 尤其值得关注的是:
    • Jabra:2019年销售额几乎是2018年的两倍,抓住了TWS的机会
    • Sony:稳步增长,到2019年底增长约1.5倍,主要原因是推出了第二代ANC TWS(口碑好、得分高)

笔者的观察:在TWS高端市场,通信类需求正在成为行业转变的驱动力,迫使音频行业引入大量通话领域的技术积累。这给硬件PM的启示是——定义产品时,不要把“音质”作为唯一尺子,要综合考虑使用场景(通勤、运动、办公)的通信需求。

而笔者认为,一款耳机的声音表现对于综合评分一定是重要的。某些时候,在综合设计考量的过程中,因为普通的入耳式耳机(非定制)不完全贴合,且体积小,对喇叭的选型和结构腔体设计具有较大的限制。但是进化到ANC之后,一是消费者愿意为了更好的音质体验为相对更大的体积买单;二是结构方面的设计发力可以优化整体的使用体验。

举个例子:Sony X1000系列TWS耳机,声音表现就相当不错。从声学和结构的角度,可以看到产品的喇叭表现部分较为出色

同步地,在行业需求中,我们也有一些标准的测试方案,比如下图:

重点通过音频曲线和参数能体现的,比如FR(Frequency Response)。以下曲线是完整的A2DP模式下的频率响应和总谐波失真。
输入信号:-10dBFS @ headset,20Hz-20kHz正弦扫频。
音量设置:最大。
如下就是我们设计的产品与AirPods 2的对比:作为一款注重通话降噪和体积轻巧的TWS(非ANC)耳机,我们追求的是极致轻巧、方案够简化,同时能达到市场中高端机型的声音表现。

以及展示的THD对比:

如下综合展示我们针对一款普通TWS耳机声学测试验证的一个测试条件列举:

五、超高信噪比MEMS麦克风的深度解析

编辑于 2026-05-19 · 著作权归作者所有
相关文章
让索尼RAW用上富士滤镜|使用Jiangtherapee PSMode进行LUT套用|如何进行色域转换?超详细 w-okada 变声器使用教程|免费实现高质量AI实时变声2026电视好画质二选一:RGB 和 SQD 到底谁更值得买?场景化全面实测对比来了小米塑造影像实力的王牌——光影猎人全系列传感器汇总蓝牙 LE 音频实测:700 米超远传输与稳定音质的实力展现拨开数字迷雾:顶级音响解码(DAC)架构技术路线全解析百元价位封神!Akko破晓S9 Ultra体验:听声辨位拉满,戴一天都不难受跟AI聊音响系列(三、监听和hifi的争议)双通道录音+4G同步,AI工作流的最后一块拼图——TicNote Pods AI耳机的效率实验给耳机HRTF用的全景声/Atmos检测视频回味经典,NAD C 3030 HiFi立体声功放试听评测监听音箱选5寸还是6寸,一次聊明白一键拯救Z8 iso64【虚高】噪声|iso64/100之争当空调有了第六感!“星闪”人感技术的加入,到底改变了什么?经常外出、在咖啡厅谈工作,手机录下来全是背景噪音,有什么办法应对?三年客户执行的工作开挂神器:讯飞AI录音卡,嘈杂环境也不错过任何关键信息技术路线之战:TCL Q9M Pro与海信E7S Pro,谁才是同价位画质最优解?618电视选购【Mini LED电视新品速览】为什么东芝新品东芝电视小芝士R600要搭载独立音质芯片?音画双芯是炒概念还是真提升?参数配置超细分析,购前必看实测破晓S9 Ultra耳机:四模连接、53mm单元,真能听声如见影?为什么HIFI产品让年轻人敬而远之?为什么音频行业诈骗泛滥?618领夹麦克风专属推荐 | 盘点2026上半年热门畅销款麦克风,纠结领夹麦选哪个品牌看这篇,百元平价与千元旗舰机型齐聚测评分享,全方位对比产品实力,帮你打消选购疑虑,618大促期间省心入手不踩坑