如何看待小米「龙虾」Xiaomi miclaw 首批通过中国信通院手机端智能助手（Claw）评估？

「首批通过」这四个字，比有些人想象的含金量高多了。

我在大厂做了六年AI开发，看到这个消息第一反应不是「小米又营销了」，而是「终于有了一个能客观评估端侧AI的标准」。

为什么这么说？

因为端侧AI（就是在手机、电脑这些设备上直接跑大模型，不依赖云端）这两年火得一塌糊涂，但有一个问题一直没解决：没有统一的标准来告诉用户，谁好谁差。

每个厂商都说自己强，但强在哪里？强多少？有没有一个客观的、第三方机构出具的评估结果？之前基本靠各家的软文和发布会。

中国信通院这次推出的手机端智能助手（Claw）评估，本质上就是在做这件事——用一套统一的标准，给市面上的端侧AI打分。

小米能进首批名单，说明两件事。

第一，它的端侧大模型调度能力确实到了第一梯队。

端侧AI的核心难点在于：你的手机算力有限、内存有限、功耗有限，但大模型对这三样的需求几乎是无限的。怎么在这种限制下跑出可用的体验，需要在模型压缩、推理优化、芯片适配等多个层面都有积累。这不是买别人开源的模型套个壳就能做到的。

我之前在公司做过端侧模型相关的项目，光是让一个7B参数量的模型在手机上跑起来「能用」，就需要在量化、剪枝、知识蒸馏等多个环节做大量优化。每一项都需要深入底层硬件和模型架构，不是说砸钱就能解决的。

第二，它参与了这个评估标准的制定过程。

信通院的标准不是随便谁都能过的。厂商要提前跟标准制定方对接，把自己的技术方案跟评估体系对齐，这个过程本身就是一道门槛。能进首批，说明你在行业标准形成的时候就深度参与了，这不是花钱能买来的。

当然，新闻里提到的另一个点也很有意思——某些厂商拿的是「安全认证」，而不是「能力评估」。

我不是说安全认证没用。安全当然重要。但这两者的区别有点像：能力评估是在问「你能不能跑100米」，安全认证是在问「你跑步的时候会不会撞到人」。前者考的是上线，后者的上线门槛低得多。

如果一个AI助手的全部亮点只是「安全可靠」，那它本质上还是个功能机，跟塞班时代的语音助手没有本质区别。真正的智能助手，需要在保证安全的前提下，把「能」这件事做到极致。

所以我的判断是：首批通过能力评估的，含金量更高。这不是贬低安全认证，而是说，两者根本就不是同一个维度的比较。

最后说说我对行业的影响。

标准一旦确立，游戏规则就变了。以前厂商可以说「我的AI很强」，因为没有客观标准，谁都可以吹。现在有了统一评估，能过就是能过，过不了就是过不了。这对那些只会堆营销名词、没有实际技术投入的厂商，是一记重锤。

对用户来说，这是好事。至少以后买手机，可以看看它有没有通过这个评估，而不是听发布会吹牛。

另外我还挺关注的一个点是：这次评估里特别提到了「端侧大模型调度能力」。

这个词有点技术，我解释一下。端侧大模型调度，核心就是一件事：怎么在有限的设备资源上，把大模型的推理效率提到最高。这涉及到模型和芯片的协同优化，需要芯片厂商和模型厂商深度合作。

小米能做好这件事，跟它长期和高通深度合作有关。芯片是上游，谁的芯片上能跑出更好的端侧AI体验，谁就占优势。高通最新的旗舰芯片在AI算力上有很大提升，小米能在上面首批通过评估，说明它的软件优化能力也跟上了。

这其实也解释了另一个问题：为什么某些「自研芯片」的厂商在端侧AI上反而声音不大。自研芯片在特定场景有优势，但在AI模型生态上，想要跟高通、联发科这些通用芯片平台比适配效率，难度不在一个量级。

技术这东西，最终还是要靠硬实力说话。

编辑于 2026-04-30 · 著作权归作者所有