如何看待小米「龙虾」Xiaomi miclaw 首批通过中国信通院手机端智能助手(Claw)评估?
「首批通过」这四个字,比有些人想象的含金量高多了。
我在大厂做了六年AI开发,看到这个消息第一反应不是「小米又营销了」,而是「终于有了一个能客观评估端侧AI的标准」。
为什么这么说?
因为端侧AI(就是在手机、电脑这些设备上直接跑大模型,不依赖云端)这两年火得一塌糊涂,但有一个问题一直没解决:没有统一的标准来告诉用户,谁好谁差。
每个厂商都说自己强,但强在哪里?强多少?有没有一个客观的、第三方机构出具的评估结果?之前基本靠各家的软文和发布会。
中国信通院这次推出的手机端智能助手(Claw)评估,本质上就是在做这件事——用一套统一的标准,给市面上的端侧AI打分。
小米能进首批名单,说明两件事。
第一,它的端侧大模型调度能力确实到了第一梯队。
端侧AI的核心难点在于:你的手机算力有限、内存有限、功耗有限,但大模型对这三样的需求几乎是无限的。怎么在这种限制下跑出可用的体验,需要在模型压缩、推理优化、芯片适配等多个层面都有积累。这不是买别人开源的模型套个壳就能做到的。
我之前在公司做过端侧模型相关的项目,光是让一个7B参数量的模型在手机上跑起来「能用」,就需要在量化、剪枝、知识蒸馏等多个环节做大量优化。每一项都需要深入底层硬件和模型架构,不是说砸钱就能解决的。
第二,它参与了这个评估标准的制定过程。
信通院的标准不是随便谁都能过的。厂商要提前跟标准制定方对接,把自己的技术方案跟评估体系对齐,这个过程本身就是一道门槛。能进首批,说明你在行业标准形成的时候就深度参与了,这不是花钱能买来的。
当然,新闻里提到的另一个点也很有意思——某些厂商拿的是「安全认证」,而不是「能力评估」。
我不是说安全认证没用。安全当然重要。但这两者的区别有点像:能力评估是在问「你能不能跑100米」,安全认证是在问「你跑步的时候会不会撞到人」。前者考的是上线,后者的上线门槛低得多。
如果一个AI助手的全部亮点只是「安全可靠」,那它本质上还是个功能机,跟塞班时代的语音助手没有本质区别。真正的智能助手,需要在保证安全的前提下,把「能」这件事做到极致。
所以我的判断是:首批通过能力评估的,含金量更高。这不是贬低安全认证,而是说,两者根本就不是同一个维度的比较。
最后说说我对行业的影响。
标准一旦确立,游戏规则就变了。以前厂商可以说「我的AI很强」,因为没有客观标准,谁都可以吹。现在有了统一评估,能过就是能过,过不了就是过不了。这对那些只会堆营销名词、没有实际技术投入的厂商,是一记重锤。
对用户来说,这是好事。至少以后买手机,可以看看它有没有通过这个评估,而不是听发布会吹牛。
另外我还挺关注的一个点是:这次评估里特别提到了「端侧大模型调度能力」。
这个词有点技术,我解释一下。端侧大模型调度,核心就是一件事:怎么在有限的设备资源上,把大模型的推理效率提到最高。这涉及到模型和芯片的协同优化,需要芯片厂商和模型厂商深度合作。
小米能做好这件事,跟它长期和高通深度合作有关。芯片是上游,谁的芯片上能跑出更好的端侧AI体验,谁就占优势。高通最新的旗舰芯片在AI算力上有很大提升,小米能在上面首批通过评估,说明它的软件优化能力也跟上了。
这其实也解释了另一个问题:为什么某些「自研芯片」的厂商在端侧AI上反而声音不大。自研芯片在特定场景有优势,但在AI模型生态上,想要跟高通、联发科这些通用芯片平台比适配效率,难度不在一个量级。
技术这东西,最终还是要靠硬实力说话。