如何评价最新发布的vivo X Fold6,AI 能让折叠屏手机有什么不一样?

AI 手机究竟是什么?

是能帮你修图的手机吗?是能帮你改文案的手机吗?是能帮你总结会议的手机吗?

是,当然是,但这些问题都很低级。

这不是手机这个形态怎么做 AI 的问题,这是「把大模型能力塞进手机里」的问题,你会发现这些事情网页上的 chatbot 能做,手机上的 app 能做,电脑上的软件能做,甚至一个破浏览器插件,也不是不能做。

这几年,AI 手机解决的主要是这个问题,让手机上能跑 AI,但随着 Agent(智能体)能力的发展,手机,作为人类历史上最重要的随身设备,凭什么还停留在 app 的时代?

在应用商店模式即将迎来 20 周年之际,手机不能继续当「app 容器」了,未来的手机,它一定是「意图的容器」。做不到这一点,什么 AI 手机都是扯淡,都是 PPT 上的营销词汇而已。

在一个手机发布会平均每场可能要讲 100 次 AI 的时代,我要来正本清源一下。我是一个折叠屏手机的重度用户,我见过折叠屏从遥控器一路发展成现在这种又轻又强能当主力机的样子, vivo X Fold6 的出现让折叠屏进入「意图交互时代 Intent User Interface」,这注定是人机交互的下一个范式。

人机交互史

要讲明白 vivo X Fold6 新一代原子工作台的价值,我得先讲一下当前所有折叠屏多任务界面的硬伤。要讲明白这个硬伤,我会用接下来一分钟的时间给你讲明白 UI/UX 在过去近 50 年内的发展

所谓人机交互界面,本质上是人类给「意图」找容器的过程。

命令行时代,人类的意图通过字符,翻译成命令表达。你不只要知道人的语言,还要知道机器的语言,把自己的意图翻译成代码,所以那个时候只有「程序员」才知道如何使用计算设备。

GUI 时代,人类的意图通过图像,翻译成控件和窗口表达。终端的复杂性倍隐藏在或拟物或扁平的图形中,门槛大大降低了,而不同的窗口,给了人可视化组织自己意图的空间,这个是文档、那个是聊天、这个是网页。

Dock 和任务栏的引入,是为了我们能够方便地切换窗口意图。

浏览器 Tab 的时代,在每个窗口里都有了数十个完全独立的上下文。

人的需求是多样的,是多线性的,我完全可能一边写东西,一边查资料,后台还等着下午抢「给阿嬷的情书」的电影票,还挂着我的 AI 智能体助手帮我 vibe code 一个网站。浏览器里几十个 tab 就是我需要的几十个意图,但你切到一个新的页面的时候,往往就蒙圈了——「诶我当时要干啥来着」。

这就是意图的断裂

在手机上,这个问题尤其严重,由于屏幕尺寸的限制,意图的表达被重新限制为单窗口的串行操作。每次切换应用的流畅动画,都是在大脑里种下零点几秒的空白。

我相信大家用手机工作的时候经常有这种「脑雾」的情况,我也会,就是切到一个应用,却想不起来自己是要干什么了。

为了解决这个问题,OriginOS 先后引入了侧边栏、小窗、分屏等方式,来帮助我们弥补手机与大屏设备——主要是电脑之间的鸿沟。

无论什么品牌、什么价位、什么定位,只要是直板机,面积的鸿沟就在这里。这不是 vivo 能解决,或者苹果能解决的问题,直板机的物理形态就决定了它不可能无限制的变大——你也不想你一直单手持一个 8 寸的平板在打字吧?

折叠屏的物理形态,决定了它天生适合承载复杂的、强大的多任务系统——你可以说平板也能干,没错,但你也不想把一个 8 寸的平板塞进你那牛仔裤的兜里吧?

还得是折叠屏。

只有大屏,才有资格讨论复杂多任务系统的 AI 交互,直板机也能和 AI 结合,但那是另外的课题。人的手就那么大,人的视野也就那么大,不然你为啥不在智能手表上做小窗呢,对不对?

只有想明白了这件事,才知道 AI 赋能手机到底是在赋能什么。

人要用合适的工具做合适的事情,而折叠屏手机,是目前技术条件下 AI 智能体的绝佳载体,很可能是最佳载体·。

智能体时代

让我们聊回 vivo X Fold6 的 OriginOS 6 Fold,和全新的原子工作台。

OriginOS 6 Fold 是业界第一个针对折叠屏 AI 多任务需求进行底层重构的 OS,这种事情在历史上并不少见,早在 Android 发展的早期,就推出过 Honeycomb(Android 3.x) 版本来为平板设计,而近些年,如 Android 12L,也是为大屏设备专门设计的版本。但要说到为折叠屏 AI 多任务设计,OriginOS 6 Fold 是毫无疑问的第一个。

人类五十年的 UI/UX 发展历程,自然是有非常多优秀的解法,这些解法各自有各自的长处,但从类别上分,无外乎两大类,一个是串行任务,一个是并行任务。

所谓串行,就是我需要同时关注几个事情,但其中只有一个是当前「焦点」,焦点会在不同的任务之间切换。Dock、任务栏、Tab、甚至 Stage Manager,都是解决这类问题的方案。

所谓并行,就是这里面每一个任务都很重要,我需要同时处理多个输入和输出。而分屏、dual view,是解决这类问题的方案。

一个完整的多任务系统,一定是能同时处理串行,也能处理并行任务的——例如我们熟悉的 Windows 和 macOS 操作系统。

而 vivo X Fold6 的原子工作台,首次将这两个系统有机结合在一起。在串行模式下支持 1+4 一屏五用,在并行模式下支持 4 窗口并行。

设计思路上,我们首次看到了将 app 从孤立的并列关系,变为协作关系的完善解决方案。它们应该围绕同一个任务,被放在同一个「界面」里。

vivo 还利用折叠屏轻弯折的动作,来实现这两种形态的交互——以往需要点击几次按钮才能完成切换的动作,现在就非常优雅。

vivo X Fold6 对于多任务的设计哲学是「消失」,它在两个状态之间切换的割裂感消失了,窗口之间无极调节、一键轮转,窗口的边界消失了、可以一键启动多个应用,启动设置的过程消失了。

这就是意图交互界面(Intent user interface)的雏形,它不仅是人好用,未来如果接入 Agent 智能体,也会一样好用。

配合大屏,也会更好用——vivo X Fold6 可以外接显示器启动电脑模式,并接入键鼠化身真 · 你的这一台电脑。

无论是折叠屏还是电脑模式,在 vivo X Fold6 上,每一个任务都是一堆复杂意图的组合,让所有的工具不再成为孤岛。

2025 年,CC 和 Codex 的出现,让智能体的概念迅速风靡。

智能体 AI 的本质是什么?本质是能够理解目标并拆解任务,为每个任务寻找合适的工具,一直到完成。

智能体时代,我们组织(orchestration) 能力不是按照 app 的能力,而是 Intent(意图),而 vivo X Fold6,告诉我们,是的,真的可以「随心所欲」。

IUI 新解

所以 AI 时代最关键的人机界面,不是一个聊天框。

我们需要的不只是入口,而是一整个工作台和任务现场。

新一代终端需要回答的问题是,你怎么接受用户的意图、理解用户的上下文、并组织用户的工作流,Intent、Context、Orchestration。

没有想明白这个问题,那 AI 设备就是纸上谈兵。

如果用户还是要自己来回切 App、找文件、复制粘贴、整理纪要、跨设备倒腾资料,那你所谓的 AI 手机就是个笑话。

在这个过程中体验出现了割裂,那也不可能成为真正的 AI 伙伴。AI 的核心,是 copilot。

我觉得 vivo 在这件事情上想的很透彻。凭借着 vivo 强大的 AI 能力,X Fold6 能够做到一拖转表格、一拖填表、一拖转文字、一拖翻译、一拖存名片等等能力。

你说这些东西技术上有难度吗,有,但不多。

但是能洞察到需求,并用 AI native 的方式去解决,很难。

AI 时代,写代码或许可以不用人,但是理解人,还得靠人。

你会发现支撑这几个功能背后的能力,其实是 OCR,但要根据不同的场景,OCR 后输出对应格式的能力,这个就需要深刻的 AI 洞察了。

当你想要看球赛的时候,你可以同时拉起视频、数据分析、聊天群和 AI 分析,也可以顺手下单一点零食。

当你像我想用折叠屏做 vibe coding 的时候,也可以拉起来一个 PRD、Codex 远程工作、再拉起一个 Github 甚至浏览器看看效果。

修图的时候,可以一边放教程、一边放修图软件,再开一个小红书窗口找找网感再开一个聊天软件告诉模特今天我一定返图。

每个人都有属于自己的的专属工作台。

你可以通过小 V 唤起它,X Fold6 也会在合适的时候提醒你,并帮你调整布局。

X Fold6 就是这样一套有灵气的机器。

只有当设备从工具变成伙伴,变成你生活里的一部分,变成在你需要搭把手的时候会拉你一把的「搭子」,AI 设备,才不是空谈。Intent User Interface,意图交互,是通向全 AI 设备的必点科技树。

交互以外,是 AI 能力

聊了这么多交互,是时候聊聊能力。交互是表,能力是里,没有里子,交互只是一层皮。

聊这么多工作流,最终还是要落在「文件」上,它可能是文本、图片、音频、视频,而如何把这些文件用好,打通,就是 AI 能力的基石。

苹果在今年的 WWDC 26 上,和新 Siri 一起到来的,是完全重构的底层 indexing 逻辑,为苹果智能准备好。这是行业的共识。

设备一定要能理解文件,才能谈得上真正的 AI 设备,这是必修的基础能力。

这就需要端侧的 embedding 模型能够常驻,并在保护用户隐私的情况下对内容进行「语义化」。

在 vivo X Fold6 上,我们也看到了这一技术能力的建设,从底层重构的文件管理应用,不止更加高效,还加入了基于 AI 的智能命名和文件搜索——只有你自己会知道在重命名和文件整理上花了多少时间。

不瞒你们说,我有一台电脑每天啥也不干,就是在跑我之前积累下来的几十万张图片的 embedding。

在全新的文件管理系统里,你可以轻松找到你用 vivo X Fold6 上的蔡司 2 亿超级主摄和蔡司 APO 超级长焦拍摄的动人大片。

无论是你漫步海滨时河对岸正在拍毕业照的学生,咖啡馆窗边低头读书的人,孩子在喷泉旁奔跑时扬起的笑脸,还有夜色里被灯光勾勒出来的城市轮廓。或者是你追星时用增距镜 G2 拍下的演唱会合集,都可以被清晰地归类和呈现。在影像条赛道上,X Fold6 大抵是最强折叠屏。

一句「帮我找一下 6 月张韶涵的演唱会图片」,就能智能归纳出演唱会的智能相册。你还可以让小 V 直接帮你修图,以前修图是一个个滑块来回拖,现在小 V 不仅可以帮你调节画面的颜色和对比等基础参数,还能理解你要的「背景暗一点,人白一点」这种自然语言需求。

从 embedding 出来的信息,自然而然地就可以衍生出 RAG,vivo X Fold6 的 AI 专题问答,就是基于本地文档的总结和提炼,最多支持 20 个文档,这个规格已经足够满足绝大多数用途了。

以前的会议录音分不清说话人,往往只是为了存档,在 AI 的加持下,我们不仅能知道长会中每个人说了什么,核心观点是什么,比如分别总结老板的管理要求、市场团队的执行进展、销售团队的客户反馈,以及教学团队的课程问题,最终生成一份结构清楚、责任明确、可直接跟进的会议复盘文档。

像前阵子大火的龙虾,vivo X Fold6 也有对应的小V Claw,可以通过远程在电脑上执行复杂的任务,就像有个在你电脑前随叫随到的助手,理解你的需求,整理你的文件,甚至帮你执行操作,查找资料、整理文件、处理文档。

比如你人在外面,只带着一台折叠屏手机,但电脑里有资料、软件、文件和工作流。以前你可能只能远程桌面进去,自己一点一点操作;现在则可以把任务交给小 V Claw,让它在电脑端完成更复杂的步骤,折叠屏和电脑就像一体的一样。

说实话,这些能力好用吗?好用。但这只是未来 AI 能力的基建,是我们贫瘠想象力暂时能触及的冰山一角。

非问其能

AI 时代,手机究竟能不能完成某件事情?

这是没有意义的问题,答案是能,迟早都能。

vivo X Fold 6 做到的,是将未来生活的范式,早一步带到我们的手上来。

vivo X Fold 6 对于大折叠屏下一个时代的展望,是我们对「任务现场」的思考,和对移动设备下一步的向往——从 app 时代,到意图时代。

它是我目前找到的,在 AI 交互与基础能力上思考最为深入的手机,它解决了三件事:

  1. 折叠屏形态本身要如何承载 AI – 原子工作台,私人化的工作流
  2. 智能手机的底层要如何为 AI 准备 – 文件级理解用户,意图级帮助用户
  3. 为了做到这两点,需要投入多少资源 – 从先旗舰、后折叠开始,做好每一个产品赛道

折叠屏不是唯一解,但 X Fold6,正在力求做到 AI 时代的最优解。

编辑于 2026-06-26 · 著作权归作者所有