如何看待三星谷歌合作首款AI手机上线,但未像豆包手机一样触及安卓权限,主要依靠Gemin大模型能力?

去年年底豆包手机上线的时候,我自己拿来用了几天。说真的,GUI Agent的体验确实惊艳——跟它说”帮我在美团上点一份黄焖鸡米饭加个鸡蛋”,它真的就一步步点进去,识别界面元素,模拟人手操作,把订单给你凑出来。这个完成度在当时国内是独一档的。

但后来发生了什么大家都知道了:主流App陆续开始对豆包的读屏和自动操作做限制。 火得快,凉得也快。

豆包手机的核心实现路径是:拿到系统级权限 → 读屏理解界面 → 模拟人类点击操作。整个过程不需要App开发者配合,甚至不需要开发者知情。字节作为一个”第三方”,绕过了应用开发者,直接在系统层面把别人家的App给”接管”了。

技术上完全可行。商业上完全不可行。站在别的app的角度:你凭什么替别人家App做决定的问题。 美团、饿了么、滴滴这些平台,每个用户的每一次交互都是它们精心设计的转化漏斗。你一个AI直接跳过所有的推荐位、广告位、会员引导,直奔下单——这等于把人家的商业模式给短路了。

这谁能忍?


谷歌这次在S26上做的事情。表面上功能范围要比豆包手机窄很多——目前主要就是Uber打车、DoorDash和Grubhub点外卖,还有一些杂货采购。三星+Gemini”只实现了局部能力”。

三星方面透露的信息是,应用商城排名前200的应用都能支持Gemini的操作。所以谷歌在发布之前,至少跟这些开发者有过某种程度的沟通和授权。Gemini能在Uber里帮你叫车,应该是Uber也同意让Gemini这么干。

谷歌去年就发布了一个叫AppFunctions的框架,允许开发者主动把应用内的特定功能入口暴露给AI助手调用。这个框架的存在意味着:开发者可以自己决定哪些功能可以被AI调用,哪些不行。

这才是最关键的设计。你想想,如果你是DoorDash的产品负责人,你面对的是两种设计思路:豆包模式:某个第三方AI未经你同意,直接读你的界面、模拟点击,绕过你所有的运营策略。你完全不知道AI在你App里干了什么,也没有任何控制权。

谷歌模式——Android官方提供一套标准框架,你可以选择性地开放某些功能入口给AI助手,保留对核心交互流程的控制权,同时你的App在AI时代不会被边缘化。

你选哪个?答案不言自明。


当前移动互联网的核心商业逻辑是什么?是App作为用户交互的唯一入口。 所有的流量分发、广告变现、用户画像、留存策略,都建立在”用户必须打开我的App,在我的界面里完成操作”这个前提上。

AI智能体的出现,正在动摇这个前提。

如果用户以后说一句”帮我订今晚七点两个人的位置,要那家上次去过的日料店”,AI就能自动帮你搞定——那用户还需要打开大众点评吗?还需要看大众点评精心排列的推荐列表吗?还会被首页Banner广告触达吗?

这就是为什么应用厂商对AI智能体如此警惕。 这不是隐私问题,不是安全问题。核心是:AI智能体在重构用户与应用之间的关系,而这直接威胁到App们赖以生存的流量和数据。

豆包手机用一种激进的方式揭开了这个矛盾。谷歌用一种温和的方式试图化解这个矛盾。

但矛盾本身并没有消失。

谷歌的AppFunctions框架,本质上是在说:AI时代的App不会消失,但App需要重新定义自己的边界——哪些功能可以被AI代劳,哪些功能必须由用户亲自完成。

这套框架如果能推广开来,意味着整个Android生态的交互范式要重写一遍。App不再只是一个给人看的界面,还得提供一套给AI看的接口。这对开发者来说是巨大的工作量,但也是不得不面对的现实。


字节跳动做豆包手机,在身份上是一个”第三方应用厂商”跨界搞硬件。无论技术多强,在生态话语权上天然处于弱势。美团封你、支付宝封你、微信封你,你没有任何反制手段。

谷歌是Android操作系统的拥有者。 全球超过70%的智能手机运行在Android上。谷歌说”我要在系统层面支持AI智能体”,这不是一个功能更新,这是一个生态级别的战略调整。

Gemini智能体首发在三星S26和Pixel 10上,后续会随Android 17推送到更多设备。这意味着几十亿台设备未来都可能获得这个能力。苹果那边也在跟谷歌合作,借助Gemini推动Siri的升级。

当Android和iOS两大操作系统都开始在系统层面原生支持AI智能体,App的形态变革就真的不可逆了。

IDC预计2026年中国市场AI终端出货量超过3亿台,Counterpoint预测2028年GenAI手机将占全球出货量54%以上、存量超10亿部。这些数字背后的含义是:AI智能体不是一个可选的增值功能,而是即将成为智能手机的标配能力。


谷歌这次做的”豆包手机”,功能上确实保守了。但保守恰恰是因为它在做一件更难的事情:建立AI智能体与App生态之间的共存规则。

豆包手机证明了AI智能体在手机上的技术可行性。谷歌要证明的是商业可行性。

这两件事的难度差了一个数量级。

前者只需要模型够强、工程够硬。后者需要让数百万App开发者愿意主动配合,需要在AI的便利性和App的商业利益之间找到平衡点,需要在用户隐私、操作安全和自动化效率之间建立一套各方都能接受的规则。

谷歌选择了先把规矩立好,再慢慢放开能力。这在短期内会显得不如豆包手机”酷”,但从长期来看,这可能是AI Phone真正能跑通的唯一路径。

编辑于 2026-03-02 · 著作权归作者所有