
豆包 AI 手机:代码很简单,复杂的是人
感谢知乎@答主评审团,2026 年的第一天,拿到字节的豆包 AI 手机。虽然它发布已逾一个月,有点明日黄花了,但一千个用户,就有一千种体验,和大家分享一下我的感受。

使用 5 天后,我得出了一个结论:
字节想做操作系统的心不死,但很遗憾,移动互联网的护城河比它想象的要深得多。
这款手机在闲鱼上曾经被炒到 7000 块,而现在价格回归理性。
这是价格的回归,更是理想主义撞上现实铁板后的回响。
豆包 AI 手机并不是一台成熟的消费级手机,它是一个装在盒子里的激进实验品。
一、 消失的中兴,重生的锤子
它的硬件底子是中兴努比亚 M153,16+512GB,除了保修页,中兴的存在感并不高。首先体现在豆包手机用的不是中兴的星云AIOS,而是名不见经传的Obric UI,然后是打开手机也是要登录豆包账号。

这台手机给我的第一感觉是:极度的割裂感。
1. 毛坯房式的系统体验
字节似乎有一种野心:他们并不想只给安卓换个皮,而是想从零开始重构交互。但结果就是,把系统拆得太干净了。
- • 洁癖般的干净: 豆包手机确实没有广告,这在当下的国产手机里简直是清流。

- • 粗暴的阉割: 这种干净是以牺牲功能为代价的。很多个性化选项没了,比如字体设置,整个系统像是一个刚写好内核、还没来得及装修的工程版。
- • 简陋的应用商店:当前版本号是 1.0.1,只陈列了为数不多的几款 App,很多 App,只能自己去找安装包安装。

- • 缺失的内容:很多系统软件如日历功能功能并不算完整,如日历竟然有两个版本,新版还有很多没有补全的内容。

- • 谷歌 GMS: 没有 Google 框架。这对极客是小麻烦,只需要去 APK Mirror 等海外网站下载安装包安装即可,但对普通用户可能是天堑,但可能普通用户也不需要。

2. 幽灵般的锤子遗产
有趣的是,在这一片荒芜中,我们又能看到很多熟悉的影子。
拟物化的图标、某些交互的阻尼感、甚至是一些铃声的设计,都在暗示我:当年锤子科技的那拨人,现在就在字节造这台手机 。

这带来了一种很奇妙的割裂感:硬件是努比亚的,灵魂是字节的,审美是老罗留下的,而体验是毛坯的。
三、 当 AI 的理想遇到现实的引力
字节做这台手机的核心逻辑是 Agent(智能体)。
但代码、工程相对简单,复杂的是人,或者说,是商业利益。
1. 技术越不过去的是巨头的围墙
按照产品经理的设想,逻辑非常性感:
手机不再是 App 的罗列,而是一个管家。
用户发指令说:“给我点个 xx 外卖。”AI 像人类一样识别屏幕,模拟点击,下单支付。
从技术上讲,这属于 图形界面智能体(GUI Agent)。它并不需要 App 开发者配合,直接用 AI 的“眼睛”看屏幕,用 AI 的“手”去点屏幕 。
代码逻辑是:识别 -> 决策 -> 执行。

如果世界是开源的,这台手机就是神器。
在最经典的场景——点外卖下,我发现理想崩塌了。
让它点餐,它不会也无法打开美团或饿了么(现在叫淘宝闪购了)比价,而是给我打开了京东外卖。
巨头们把门关上了,不允许 AI 自动操作他们的 APP。
字节动了腾讯、阿里、美团的蛋糕。豆包手机发布后数日,腾讯、微信、美团相继封禁了豆包 AI 的自动操作功能。
于是,最强大的“跨应用操作”,变成了最鸡肋的功能,用户再也不能 AI 回微信,各平台自动比价了。
为了让功能跑通,字节只能去找那些愿意合作、或者流量较小的平台(比如京东外卖)。
失去比价功能的结果就是,我们用着最先进的 AI 手机,吃着选择最少、价格可能还更贵的外卖。
2. 体验的悖论:AI 更贵更慢?
我尝试让豆包帮我点一份双杯的瑞幸美式咖啡,它一通思考打开了京东外卖,帮我找到了我想要的咖啡套餐。
但当我手动打开淘宝闪购比价,发现相同的套餐价格比京东外卖便宜了 10 元。

AI 的操作过程是正确的,但对用户来说显然不是最优的,而且从节约时间的角度,打开淘宝闪购,三下五除以二就点完单了,反而比豆包固定的等待页面加载时间加上操作时间更短,那么我们使用豆包的动机是什么呢?
我理解这是平台的补贴差异和竞争策略导致的,但这恰好让豆包手机失去了价值。
失去跨平台自动化能力的加持后,豆包手机对我而言,更像是一位退守后台的副驾(恰好很像github的辅助编程工具copilot)。
它的高光时刻,不再是帮我去各大App比价省钱,而是回归到了最基础的场景——解放双手。
想象一下这些时刻:
- • 高速驾驶的途中: 突然想听某首歌,不必分心去戳屏幕,可以让豆包帮我精准地从Apple Music音乐库里找到它。
- • 满手油污的厨房里: 正在做菜,不想让脏手弄脏屏幕去查看菜谱,又不想擦。让豆包帮我打开「下厨房软件」去看一眼告诉我,真的能派上用场。
在这些场景下,它不是一个试图颠覆其他巨头的革命者,而是一个专注服务于个人的、忠实可靠的“第二双手”。
这些或许不够宏大,但足够实用。
3. 竞品对比:赢了智商,输了综合体验
我忍不住和我手上的一款旗舰机的 AI 功能进行对比。
我日常高频使用的副机是一台 OPPO Find X8。

说实话,现在的手机厂商的旗舰机 AI 大部分都不弱了。OPPO 的小布助手接入了 Oppo AI,可以通过长按电源键唤醒,并进行语音交互。
- • 在 OPPO 上: 我用小布助手快速撰写文案、查百科,体验丝滑。
- • 在豆包手机上: 我多了一个“甚至不太好用”的自动操作功能,却失去了一个成熟系统的稳定、GMS 服务和丰富的自定义选项。
相比之下,豆包 AI 手机的价值显得单薄了许多。
我提出了一个马拉松训练相关问题。
我的问题是:全马 2 小时 50 分对应的配速是多少?
字节在大模型上的功力还是相当深厚的,豆包的回答非常准确,但小布助手失败了,不断死循环。

管中窥豹,可见一斑,豆包的大模型比 Oppo AI “聪明”一些。
二、作为工具,堪称听觉的救赎
看了上面的吐槽,你可能觉得豆包AI手机一无是处,并不是。
我发现它的音频处理挺好用的,可以说字节终于找回了主场优势。
在几天体验中,这是让我真正觉得“旦用难回”的部分。
1. 左侧召唤键
豆包手机在机身左侧面设计了一颗独立的 AI 唤醒按键。

在寸土寸金的手机内部堆叠中,专门留出一颗物理按键,代表了厂商对功能的优先级定义。就像 iPhone 16 的相机控制键是为了影像,豆包的这颗键是为了 “随时在线”。
它绕过了“解锁-寻找 App-点击”的繁琐流程。无论是在看文章、回消息还是待机状态,按下去,AI 就在手边。这种物理触感带来的确定性,比语音唤醒要踏实得多。
2. 录音笔的终结者
字节跳动旗下飞书的“飞书妙记”功能一直有口皆碑,我也一直是重度用户,而豆包手机显然继承了这份基因。

系统自带的录音机 App,不再是一个简单的音频存储器,而是一个实时速记员。
录音开启的同时,屏幕上文字就在实时更新,转写速度和准确率都挺高。
录音结束后,还能生成摘要,提炼出核心观点。这对于媒体人或文字工作者,尤其是喜欢用AI的人来说,这简直是生产力的降维打击。它把听录音这个痛苦的线性过程,变成了看摘要的高效非线性过程。从一字一句到一目十行,就问你是不是很爽?
3. 电话会议的外挂
在设置中开启“通话自动录音转文本”后,这台手机就成了电话会议的神器。现在基本不用手机电话了,用保险电话演示下。

和甲方的一通漫长且充满细节的的需求沟通,挂断电话后,一份清晰的文字版对话记录已经躺在备忘录里了。
它不仅记录了“对方说了什么”,还能通过 AI 分析,整理出关键数据。
总结来看,豆包手机在“听觉”上的表现太棒了。我忽然觉得,AI 手机目前最稳妥的落地路径,或许不是去挑战互联网巨头的商业壁垒(比如自动比价点外卖),而是利用端侧/云端能力,把录音、通话、笔记这些基础功能,用大模型重新做一遍。
在这个领域,基本不会挑起商业战争,只有纯粹的用户体验提升。
四、 结语:一次早产的野心
豆包 AI 手机,正如其名—「豆包手机助手技术预览版」当前还不是一台能予以厚望的主流手机。
它更像是一个 “为了这碟醋(AI Agent),包的一顿饺子(硬件)”。
字节跳动试图证明:未来的操作系统,不应该以 APP 为中心,而应该以“意图(Intents)”为中心。
这个方向是对的。但他们低估了旧世界的阻力。
当 AI 试图把所有 APP 降级为“后台API”时,它发起的不是技术革命,而是商业战争。
代码可以模拟点击,但代码模拟不了商业谈判。
在各大巨头没有坐下来制定出一套通用的“AI 接口协议”之前,像豆包手机这样的先行者,注定只能在围墙上撞得头破血流。
它是一台糟糕的手机,但它确实是一个值得尊重的、哪怕是失败的尝试。
我们向往一个没有关税、零商业摩擦的全球市场——愿景很美,但在孤岛林立的现实中,这注定是遥不可及的乌托邦,何其相似啊。
公众号:李二牛(ID:litwoniu)
B站、知乎、小红书、YouTube、X:李二牛li2niu
全马破三的可穿戴程序员,美股玩家,马拉松PB 122/254,关注我,一起洞察消费电子和可穿戴设备产业链上的投资机会。