
致敬汽车百人
大家好,欢迎关注“肖工讲AI”,先关注不迷路。
汽车交互从实体按键演进至好用的智能语音,用了十余年。这持续探索的十余年里,行业先后涌现出飞鱼 OS、小 P、NOMI、理想同学等优秀的语音产品。它们的背后,是一代代汽车语音人的不懈耕耘。
语音交互是一个复杂的系统,涉及软件、硬件与结构设计的紧密配合;其技术链路也环环相扣:从降噪、唤醒、识别、语义理解、语音合成,再到大模型,每个模块都是一门深厚的学问,而将它们有机的集成,打造出完整的交互体验,更是巨大的挑战。在汽车工程中,语音还与座舱系统、整车电器、交互设计、生态服务等深度交织,离不开跨领域、跨团队的协同共创。
细数整个汽车语音领域,真正的产品与技术从业者不过寥寥数百人。头部车企或拥有几十人规模的建制化团队,而多数公司往往只配置几人规模的产品、项目与研发混编小组。在人员分散、资源有限的情况下,加之语音技术技术革新快、知识系统庞杂,打造极致的语音体验挑战巨大。即便如此,汽车语音人仍坚守在各自的战场上,用行动诠释各自对智能语音的理解,不断推动语音体验向上突破。汽车行业拥有成千上万的零部件产品,每个产品方向上都有这样一支“百人团队”,在日拱一卒地推动中国汽车向前、向好。
我是 2011 年毕业就进入汽车行业,2014 年开始参与语音产品设计,至今在这个领域已实践十二年。这一路上磕磕绊绊,从最开始的单麦克语音方案到而今的大模型,自己一路踩坑无数。也曾看见许多充满活力的新人加入语音行业,因系统的繁杂而出现困惑与忧虑。再后来,当我走进一家家车企,见到大家探讨极致语音交互而热情洋溢,也因用户吐槽“语音不够智能”而低落。种种这些,便觉得自己作为行业老兵,应当为这个行业做一些贡献。从 24 年 6 月开始到 25 年 12 月结束,花了一年半的时间整理了语音关键技术、产品代际、产品设计方法、行业案例及测评方法,编成此书。希望能为同行带来一丝启发,也为行业的前行添一份微薄之力,更希望有助于大家打造极致的语音交互体验。语音交互系统的知识体系太庞大,同时个人思虑也不一定成熟,其间几经修改,仍觉不够完善,疏误之处恳请指正。
静水深流,光而不耀,致敬每一个在汽车语音路上前行的人。