
麦克风工作原理全解析
你每天打电话、开会、录音、喊“小爱同学”,都离不开一个东西——麦克风。但你可能从来没想过:声音明明是空气振动,它怎么就变成电信号了?模拟麦和数字麦到底差在哪?MEMS麦克风为什么能做到芯片那么小?这篇文章,我们就把麦克风这个东西,从里到外、从古到今,给你拆个明明白白。
一、声音是怎么变成电的?——麦克风的本质
麦克风的本质就是一个声-电换能器。声音是空气压力的波动,麦克风的工作就是把这种压力变化转换成电信号。不同类型的麦克风,区别就在于“怎么转换”。
所有麦克风都有一个核心结构:振膌(Diaphragm)。振膌是一层极薄的膌,声波打到它上面会引起振动。不同的麦克风,是用不同的物理原理把这个振动变成电。
我们可以把它比作一面鼓:你敌一下鼓面,鼓面振动,产生声音。麦克风反过来——声音打到“鼓面”(振膌)上,振膌振动,然后用不同方法把振动转成电信号。
二、麦克风的四大家族
按照换能原理,主流麦克风分为四大类:
2.1 动圈麦克风(Dynamic / Moving Coil)
原理:电磁感应。振膌背面粘着一个线圈,线圈套在永磁体的磁场里。声波让振膌振动,带动线圈在磁场中运动,根据法拉第电磁感应定律,切割磁力线产生感应电动力(电压)。
简单说:声音→振膌振动→线圈切割磁力线→产生电压。跟发电机是一个原理,只不过发电机是转圈转,麦克风是线圈来回振。
特点:结构结实、不需要供电、抗过载能力强。频率响应不如电容麦平坦,灵敏度较低。
应用:现场演出、KTV、广播电台。经典型号:Shure SM58。
2.2 电容麦克风(Condenser)

▲ 电容麦克风内部结构示意图
原理:电容变化。振膌和背极板构成一个平板电容器。振膌振动时,两极板距离发生变化,电容值随之变化。在恒定电荷条件下,电容变化导致电压变化,从而输出电信号。
关键公式:C = εA/d,其中C是电容,A是极板面积,d是极板间距。声波让d变化,C就变化,再由 Q = CV 可知,电荷Q不变时,C变小则V变大。
特点:灵敏度极高、频率响应平坦、音质细腻。但需要外部供电(48V幻象电源),且对潮湿、磁场比较敏感。
应用:录音棚、专业音频制作、ASMR录音。
2.3 驻极体麦克风(ECM,Electret Condenser)
原理:永久极化的电容麦。核心思路和电容麦完全一样,但它巧妙地用一层驻极体材料(永久带电的高分子膌)替代了外部偏置电压。背极板被驻极体材料覆盖,永久带有电荷,这样就不需要外部的高电压偏置了。
内部还集成了一个JFET(场效应管)做阻抗变换,因为电容输出阻抗极高,直接接线会被干扰得一塔糊涂。JFET把高阻抗转为低阻抗输出,方便后级电路采集。
特点:体积小、成本低、只需几伏特偏置电压。性能随温度/湿度波动较大,一致性一般。
应用:曾经的手机麦克风霸主,电话、对讲机、便宜耳机。现已被 MEMS 大量替代。
2.4 MEMS麦克风(微机电系统)

▲ MEMS麦克风芯片与传统ECM的尺寸对比
原理:硅基微电容。MEMS麦克风的核心仍然是电容原理,但振膌和背极板都是用半导体工艺(蚀刻、沉积)在硅晋圆上制造的。振膌是一层极薄的多晶硅或氮化硅薄膌,只有1微米左右厚。
关键突破:用芯片制造工艺做麦克风。这意味着:尺寸可以做到极小(3mm×3mm)、产品一致性极高、可以和其他芯片集成在一起、能耐受回流焊接的高温(260°C)。
特点:体积极小、一致性好、耐高温、可 SMT贴片、抗振动。信噪比近年已达66~70dB,接近ECM水平。
应用:智能手机、TWS耳机、智能音箱、笔记本电脑、车载系统、医疗设备。已经全面替代ECM。
四种麦克风对比一览
| 类型 | 换能原理 | 是否需供电 | 核心优势 | 典型场景 |
| 动圈 | 电磁感应 | 不需要 | 结实耐用、抗过载 | 现场演出/KTV |
| 电容 | 电容变化 | 48V幻象电源 | 灵敏度高、音质细腻 | 录音棚 |
| ECM驻极体 | 永久极化电容 | 1~10V偏置 | 体积小、便宜 | 老式手机/对讲机 |
| MEMS | 硅基微电容 | 1.6~3.6V | 极小、一致性好、耐高温 | 手机/TWS/智能音箱 |
三、模拟麦克风 vs 数字麦克风——差在哪?

▲ 模拟麦 vs 数字麦的信号链路对比
无论哪种麦克风,振膌感受到声波后最初产生的都是模拟电信号。所谓“数字麦克风”,只是在麦克风内部多集成了一个ADC(模数转换器),直接输出数字信号。
3.1 模拟麦克风的信号链路
MEMS传感器 → 放大器 → 模拟电压输出 → 外部ADC → MCU
模拟麦输出的是一个连续变化的电压信号,通常以一个直流偏置点为中心上下摆动。比如偏置点是0.8V,声音就让它在±0.1V范围内波动。后级需要一个ADC把这个模拟电压采样量化成数字值。
优点:电路简单,成本低,设计自由度高(可以自己选ADC精度)。
缺点:模拟信号传输过程中极易受干扰。PCB走线越长,噪声越大。在手机、平板等射频干扰严重的环境下,音质可能明显下降。
3.2 数字麦克风的信号链路
MEMS传感器 → 放大器 → 内置ADC → 数字输出(PDM/I2S) → MCU
数字麦把模数转换在芯片内部就完成了,输出的是纯数字信号。数字信号戗0和1组成,要么是高电平要么是低电平,抗干扰能力天生就强。
优点:抗干扰强、不需要外部ADC、PCB布局简单、多麦克风可共享总线。
缺点:成本略高、需要MCU支持对应的数字接口。
四、PDM vs I2S——数字麦的两大接口
数字麦克风输出的数字信号有两种主流格式:PDM和I2S。这两个缩写可能是嵌入式音频领域出现频率最高的术语。
4.1 PDM(Pulse Density Modulation,脉冲密度调制)
最直观的理解:PDM就是用“1的密度”来表示音量大小。声音越大,单位时间内输出的“1”越多;声音越小,“1”越少。它其实是一个1bit的超高速采样(通常3.072MHz),只有0和1两个值。
•接线简单:只需要两根线——CLK(时钟)和 DATA(数据)
•可以两个麦克风共用一对线(左右声道分别在CLK上升沿和下降沿采样)
•后级需要抽取滤波器(Decimation Filter)把1bit流转成多位PCM数据
典型芯片:INMP441、SPH0645LM4H
4.2 I2S(Inter-IC Sound,芯片间音频接口)
I2S输出的是已经处理好的多位PCM数据(通常16bit或24bit),相当于麦克风内部自己做了抽取滤波。
•需要三根线:SCK(位时钟)、WS(字选择/左右声道)、SD(数据)
•MCU可以直接读取PCM数据,不需要额外的抽取滤波
•对MCU的外设要求更高(需要I2S接口)
典型芯片:ICS-43434、MSM261S4030H0R
PDM vs I2S 对比表
| 对比项 | PDM | I2S |
| 信号类型 | 1bit超采样流 | 多位PCM(16/24bit) |
| 接线数 | 2根(CLK+DATA) | 3根(SCK+WS+SD) |
| 后级处理 | 需抽取滤波 | 可直接使用 |
| 双麦共线 | 支持(L/R分时采样) | 支持(WS区分) |
| 对MCU要求 | 较低,可用SPI模拟 | 需I2S外设 |
| 成本 | 较低 | 略高 |
| 适用场景 | 资源受限的嵌入式 | 音质要求高的场景 |
五、麦克风的指向性——它“听”哪个方向?

▲ 四种常见麦克风指向性模式
指向性决定了麦克风对不同方向声音的拾取灵敏度。简单说,就是它“听”哪个方向更清楚。
全向(Omnidirectional)
各方向灵敏度相同,360°均匀拾取。适合会议录音、环境监测。大多数MEMS麦克风都是全向的。
心形(Cardioid)
正前方最灵敏,背面抑制最强,极坐标图形似心形。适合人声录制、直播、主播。经典场景:主播对着麦克风说话,背后的空调声被抑制。
超心形(Supercardioid)
比心形更窄的前方拾取角度,背面有一个小的拾取瓣。适合嘈杂环境下的定向录音,如新闻采访、影视录音。
双向/8字形(Figure-8)
前后两个方向灵敏,左右两侧抑制。常用于对谈录音(两个人面对面)、Blumlein立体声录音。
六、嵌入式开发者怎么选麦克风?
如果你是做嵌入式产品的,选麦克风主要看这几个维度:
6.1 关键参数解读
•灵敏度(Sensitivity):通常以dBV表示,如-26dBV,数值越大(越接近0)越灵敏。远距离拾音需要更高灵敏度
•信噪比(SNR):越高越好,一般>60dB可用,>65dB优良。直接决定录音音质
•声学过载点(AOP):麦克风能承受的最大声压级,超过就失真。车载、工业环境需要高AOP
•功耗:通常几百微安,低功耗模式可降到5µA以下,对电池供电的TWS耳机至关重要
•封装尺寸:常见3.5×2.65mm、更小的2.75×1.85mm等
6.2 选型决策树
•手机/TWS耳机/智能音箱 → 数字MEMS(PDM),抗干扰好,线路简单
•音频处理板/高音质录音 → 数字MEMS(I2S),直接获取PCM数据
•低成本物联网设备 → 模拟MEMS + MCU自带ADC
•语音识别/远场拾音 → 麦克风阵列(多个PDM麦)+ 波束成形算法
七、麦克风阵列与波束成形——让机器“听”懂方向
当你对智能音箱说“小爱同学”的时候,它是怎么知道你在哪个方向的?答案是:麦克风阵列 + 波束成形算法。
麦克风阵列就是把多个麦克风按特定几何排列(线形、圆形、十字形)。由于声音到达每个麦克风的时间有微小差异(因为距离不同),通过分析这些时间差,就能计算出声源方向。
波束成形(Beamforming)则是利用多路信号的相位差,对特定方向的声音进行增强,对其他方向的噪声进行抑制。相当于用软件实现了一个“可转向”的心形指向。
常见配置:
•智能音箱:6~7麦圆形阵列(如Amazon Echo)
•手机:2~4麦,用于通话降噪
•远场会议系统:8~16麦线形阵列
八、麦克风技术发展简史

▲ 麦克风技术演进时间线
1876年:电话发明人贝尔和爱迪生几乎同时发明了碳粒麦克风,利用碳粒压缩时电阻变化来转换声音。这是人类最早的“声-电转换”。
1931年:西门子和Beyerdynamic分别推出动圈麦克风,线圈在磁场中振动产生电流。动圈麦结实耐用,至今仍是现场演出的主力。
1947年:纽曼实验室发明实用电容麦克风,开启了专业录音的新纪元。
1962年:日本人西尾岗发明驻极体麦克风(ECM),不需要外部高压偏置,体积小、成本低,迅速普及到所有消费电子产品。统治了将40多年。
2003年前后:楼氏(Knowles)推出商用MEMS麦克风,苹果在iPhone中采用后引爆市场。体积比ECM再小一个数量级,且耐回流焊接。
2010年代至今:数字MEMS麦克风全面普及,PDM/I2S接口成为主流。麦克风阵列技术成熟,智能音箱、智能车机成为新的大规模应用场景。
九、嵌入式实战:读取MEMS麦克风数据
给一个简单的示例,演示如何在嵌入式平台上读取不同类型麦克风的数据:
模拟麦克风(ADC采样):
十、写在最后
从1876年贝尔的碳粒麦克风,到今天手机里3mm见方的MEMS芯片,麦克风的核心使命从未改变——把空气的振动变成电的振动。
变化的是方法:从碳粒电阻到电磁感应,从电容变化到硅基微加工;变化的是体积:从拳头大到米粒大;变化的是接口:从两根铜线到PDM/I2S数字总线。
但有一件事始终不变:声音是人类最自然的交互方式。只要这一点不变,麦克风就不会消失。它只会越来越小、越来越智能、越来越无处不在。