如何看待三星谷歌合作首款AI手机上线，但未像豆包手机一样触及安卓权限，主要依靠Gemin大模型能力？

去年年底豆包手机上线的时候，我自己拿来用了几天。说真的，GUI Agent的体验确实惊艳——跟它说”帮我在美团上点一份黄焖鸡米饭加个鸡蛋”，它真的就一步步点进去，识别界面元素，模拟人手操作，把订单给你凑出来。这个完成度在当时国内是独一档的。

但后来发生了什么大家都知道了：主流App陆续开始对豆包的读屏和自动操作做限制。 火得快，凉得也快。

豆包手机的核心实现路径是：拿到系统级权限 → 读屏理解界面 → 模拟人类点击操作。整个过程不需要App开发者配合，甚至不需要开发者知情。字节作为一个”第三方”，绕过了应用开发者，直接在系统层面把别人家的App给”接管”了。

技术上完全可行。商业上完全不可行。站在别的app的角度：你凭什么替别人家App做决定的问题。 美团、饿了么、滴滴这些平台，每个用户的每一次交互都是它们精心设计的转化漏斗。你一个AI直接跳过所有的推荐位、广告位、会员引导，直奔下单——这等于把人家的商业模式给短路了。

这谁能忍？

谷歌这次在S26上做的事情。表面上功能范围要比豆包手机窄很多——目前主要就是Uber打车、DoorDash和Grubhub点外卖，还有一些杂货采购。三星+Gemini”只实现了局部能力”。

三星方面透露的信息是，应用商城排名前200的应用都能支持Gemini的操作。所以谷歌在发布之前，至少跟这些开发者有过某种程度的沟通和授权。Gemini能在Uber里帮你叫车，应该是Uber也同意让Gemini这么干。

谷歌去年就发布了一个叫AppFunctions的框架，允许开发者主动把应用内的特定功能入口暴露给AI助手调用。这个框架的存在意味着：开发者可以自己决定哪些功能可以被AI调用，哪些不行。

这才是最关键的设计。你想想，如果你是DoorDash的产品负责人，你面对的是两种设计思路：豆包模式：某个第三方AI未经你同意，直接读你的界面、模拟点击，绕过你所有的运营策略。你完全不知道AI在你App里干了什么，也没有任何控制权。

谷歌模式——Android官方提供一套标准框架，你可以选择性地开放某些功能入口给AI助手，保留对核心交互流程的控制权，同时你的App在AI时代不会被边缘化。

你选哪个？答案不言自明。

当前移动互联网的核心商业逻辑是什么？是App作为用户交互的唯一入口。 所有的流量分发、广告变现、用户画像、留存策略，都建立在”用户必须打开我的App，在我的界面里完成操作”这个前提上。

AI智能体的出现，正在动摇这个前提。

如果用户以后说一句”帮我订今晚七点两个人的位置，要那家上次去过的日料店”，AI就能自动帮你搞定——那用户还需要打开大众点评吗？还需要看大众点评精心排列的推荐列表吗？还会被首页Banner广告触达吗？

这就是为什么应用厂商对AI智能体如此警惕。 这不是隐私问题，不是安全问题。核心是：AI智能体在重构用户与应用之间的关系，而这直接威胁到App们赖以生存的流量和数据。

豆包手机用一种激进的方式揭开了这个矛盾。谷歌用一种温和的方式试图化解这个矛盾。

但矛盾本身并没有消失。

谷歌的AppFunctions框架，本质上是在说：AI时代的App不会消失，但App需要重新定义自己的边界——哪些功能可以被AI代劳，哪些功能必须由用户亲自完成。

这套框架如果能推广开来，意味着整个Android生态的交互范式要重写一遍。App不再只是一个给人看的界面，还得提供一套给AI看的接口。这对开发者来说是巨大的工作量，但也是不得不面对的现实。

字节跳动做豆包手机，在身份上是一个”第三方应用厂商”跨界搞硬件。无论技术多强，在生态话语权上天然处于弱势。美团封你、支付宝封你、微信封你，你没有任何反制手段。

谷歌是Android操作系统的拥有者。 全球超过70%的智能手机运行在Android上。谷歌说”我要在系统层面支持AI智能体”，这不是一个功能更新，这是一个生态级别的战略调整。

Gemini智能体首发在三星S26和Pixel 10上，后续会随Android 17推送到更多设备。这意味着几十亿台设备未来都可能获得这个能力。苹果那边也在跟谷歌合作，借助Gemini推动Siri的升级。

当Android和iOS两大操作系统都开始在系统层面原生支持AI智能体，App的形态变革就真的不可逆了。

IDC预计2026年中国市场AI终端出货量超过3亿台，Counterpoint预测2028年GenAI手机将占全球出货量54%以上、存量超10亿部。这些数字背后的含义是：AI智能体不是一个可选的增值功能，而是即将成为智能手机的标配能力。

谷歌这次做的”豆包手机”，功能上确实保守了。但保守恰恰是因为它在做一件更难的事情：建立AI智能体与App生态之间的共存规则。

豆包手机证明了AI智能体在手机上的技术可行性。谷歌要证明的是商业可行性。

这两件事的难度差了一个数量级。

前者只需要模型够强、工程够硬。后者需要让数百万App开发者愿意主动配合，需要在AI的便利性和App的商业利益之间找到平衡点，需要在用户隐私、操作安全和自动化效率之间建立一套各方都能接受的规则。

谷歌选择了先把规矩立好，再慢慢放开能力。这在短期内会显得不如豆包手机”酷”，但从长期来看，这可能是AI Phone真正能跑通的唯一路径。

编辑于 2026-03-02 · 著作权归作者所有