如何看待很多不懂编程的普通人,用AI给自己写个「Agent」进手机,手机是不是能帮助我们干活了?

这几年,有一句话对我的影响特别大:

如果AI是一切的答案,那么问题是什么。

我说一下我最近Vibe Coding的两个产品,想必你对手机帮你干活这件事情也会有不同的理解。(文末我也放出了APK,大家可以下载玩一玩)

第一个。

Fold Creator。

我们现在用手机上的AI,很多时候就是在问一个问题,某某某是谁?旅行攻略怎么做?某个概念又是什么意思?然后AI回答你,你再复制进行下一步操作。

这个模式我们称为Chat,而现在大家关注的是Agent,能够自主规划,并且执行一些操作。

尤其是在当下,人人都能玩coding,但是我们都coding出来一些什么东西呢?你去看,还是老掉牙的 Todo list、番茄时钟,记账工具,要么就写一个贪吃蛇的小游戏。

无聊。

干活或者是解决生活中的一个小问题,有一个根本性的前提就是,你得知道自己需要什么。

一提到干活,肯定很多人想到的是写个文案呀,或者做个PPT。这个需求任何一个现在的AI软件都能做,但是问题是,不是所有人的干活交付物都是文案或者PPT。

换句话说,在当下这个谁都能写代码的情况下,实现已经不是什么难的事情。难的事情在于你得有一个好点子,或者你能明确的表达你的需求。

需求来自于哪里,需求藏在场景里。

所以我做了一个Fold Creator产品,第一个设计决策就是,扔掉对话框,使用摄像头。

所以手机做这件事情是更为流畅的。因为手机有摄像头,因为手机几乎时时刻刻的都在你的身边,至于为什么一定要是fold,看到下面你就能明白了

不过为了兜底起见,我现在还是保留了输入的。

你拍一张照片,AI自己去理解场景,告诉你「你可以做一个什么东西来解决你现在的问题」,拍发票,建议做报销管理,拍一堆相机和存储卡,建议做摄影师素材管理,比如拍摄了一个化妆品的照片,就会自动提炼出记录化妆品信息,还有到期提醒,以及分类管理,以及效果追踪等四个功能点。


因为照片提供了大量上下文——你的身边有什么东西、这些东西是什么关系、你大概在什么场景下,AI从这些信息里提炼需求,比从一句模糊的文字描述里提炼要靠谱得多。

举一个很简单的例子来解释下,比如我拍摄这个水杯。


如果是一个空白的背景。它会识别到是一个提醒喝水软件。



如果我拍这个水杯和笔记本结合起来。


它会生它会联想到是一个办公族健康管理,而不只是喝水这个单点功能了。

当然,有时候它的意图识别不准,你还可以通过换一换来切换到不同的思路。

这里其实更多的是一个启发性的思考,当你看到了这个场景,AI给你一定的建议之后,这时候你的需求有可能从刚才的模糊已经变成了明确。

需求有了,谁来实现呢?

其实最早只有一个系统级Agent什么都能干,也就是你需求输入之后,它就算,然后给你吐出一结果。

但在使用中,遇到两个问题。

一个是上下文的问题,用一个Agent做需求分析、设计风格把控以及代码生成,它有可能写到后边把前面的就忘掉了,导致结果十分不可控;

第二个就是作为产品创始人的我,没有任何参与感。一个Agent干所有事,你说了一句话,他思考了5分钟,给你吐出一个成品,中间发生了什么不知道,就算你能看到是思维链,你也无法介入,为什么做这个功能?没有做另一个功能?不知道你对结果不满意,想调整也不知道从哪改。

所以我把它拆成了四个AI角色,也就是四个Agent,产品经理、UI设计师、开发工程师、运营负责人,就像一个真实的产研开发团队一样。


每个Agent只负责自己的部分,职责边界清晰。产品经理出了PRD,设计师基于PRD 给出设计原则,工程师基于原型写代码,运营基于产品定位起名字和写文案。上下文在Agent之间传递的时候是结构化的,不是一坨文字。

这里必须要强调一下,为什么这个产品更适合在 vivo X Fold6 上使用,如果是直板机,你要查看不同的Agent的工作进度和交付物的话,就得不断的退出,进入,查看详情,返回上一级,再进入查看,这样的效率是很低的。

而现在,四个角色可以直接铺满四宫格,由于我给每个人物还做了一点动效谁在工作,谁已经完成交付了什么,产品设计、开发、运营之间的关系,从聊天记录变成了一张可以观察的工作台,在一个页面内你可以查看任何一个Agent的交付物,也可以通过聊天的方式随时跟任何一个Agent进行。

另外一点就是折叠屏自带着分屏功能,以前多数的折叠屏只是左右两栏,而现在 vivo X Fold 6可以 3个甚至4个APP同时在线,可以随意调整窗口的大小位置,甚至进入焦点模式。

比如这个场景,我可以看小红书上优秀的设计风格的同时,也可以看参考提前已经写好的一些设计准则,这样我就能够把握主线,有些想法就直接可以吐给AI设计师这个agent。

电脑相对于手机的开发场景的优势所在,其实就是多任务,而现在 vivo X Fold6 把这块的体验也在尽力追平,让你随时随地都能展开工作。

多任务是一方面,另一方面,大屏可以展示更多的信息,当你有更多的信息呈现空间的时候,你的产品功能也会发生改变。

这是我在V2所规划的,给设计这个Agent做一个实时原型组件的预览,这样你就可以基于原型去给他提建议了。

给开发工程师这个Agent做一个轻量的IDE,左侧是一个Agent的对话流,右侧会放一个代码的预览面板,这样你就可以去审查它的代码了,虽然你不一定会直接在手机上改,但是你看到代码问题可以让他去改。

这样,不论你在何时何地,都能展开手机做一个完整的开发工作,而不是必须回到电脑前。

Fold Creator还有一个圆桌会议的功能,这个功能能让用户看到每个决策是怎么做出来的。比如说产品要做5个功能,工程师说手机端做不了,只能做3个,设计说这个交付太复杂,然后这所有的一切需要您来拍板。

过程其实挺有意思,它会让从来没有接触过产品开发的人去理解,做一个产品是线性的流程,是不停的取舍。

当然不同的产品有可能需要有着不同的展示界面,这个问题我也考虑到了,幸好是在折叠屏这个屏幕上,所以我们能够发挥的也就更多了。



在真正落代码之前,我先让AI帮我出了一个视觉层的一个模板。


你会发现一件事情,当你的设计不再局限于直板手机的时候,折叠屏手机产品所能承载的功能,交互丰富性会更高,以前看到很多复杂的,或者是更加专业性的流程也可以在 X Flod 6上完成。


因为我有很多摄影器材,经常要去做一些焦距,或者是景深的一些换算,当我把这个需求给他之后,他就给我出了这样的一个产品,而且如你所见,他直接套用了我们上边那个小工具的模板,十分清楚。


为了方便使用,我还做了一个发布按钮,这样你可以直接把这个小应用放在桌面,下次方便直接打开。

这样下次如果有类似的计算需求,我就不用去搜索或者问AI,或者再去下载别人的什么APP了。

理论上, Flod Creator能够交付的产品是无限的,因为每个人的场景生活,都是不同的。你可以有会议工作台,旅行工作台,购物工作台。

它能够从你的场景中发掘中独属于你的需求,所有的策划、开发、运行完全是可以在手机上完成的,不需要接入电脑,不需要你太懂编程。


第二个。

Fold AI 拍摄向导。

这个需求来自于现实场景,因为我经常在一些景区呀或者是打卡点看到,被骂的男朋友或者女朋友。

构图不对,或者是角度不对,或者就是举个手机,用前置摄像头当人形三脚架。

一开始我的思路是,就是当我们拍摄一个场景时,AI分析这个场景,然后给出拍摄建议。


如你所见,提供的拍摄参考,其实做的还是很详细的,包括动作、姿势、表情和位置都有详细的说明。

这块的提示来自于我这么多年的拍摄积累的一些经验,这块的系统提示词我跟AI一起写了很久很久。


但是如果你仔细去观察他们这个拍摄场景,你会发现往往是一个人用着一个网络上的热门的出片帖子,让另一个人照着拍——

『让你照着拍,你都拍不明白!』

照着拍,从摄影师摄影创作的角度来讲,这样的做法没有什么意义,但是对于一些想要快速出片,景区打卡,只想要一个好看的照片的人来说,那『照着拍』这个功能其实是一个很现实的需求。

当问题很明确的时候,那解法自然就有了,所以我加了一个小红书链接导入的功能,系统会自动地解析这个帖子下的所有照片并且展示在左侧,选择一个样图后,它会自动在相机的右侧生成这张照片的轮廓预览层。


这时候你不需要考虑什么沟通,你只需要照着做就行,构图可能大部分小白不太明白,但是填空的话,应该是个人都能做的很好。

关键的是,不只是模仿,它在拍摄界面还会给出你一个最重要的姿势动作参考建议,比如这张图,它会提示你身体微侧,并且与背景保持距离,拿一件物品会更加自然。

我第一次给朋友展示这个功能的时候,他直接惊呼,那这是摄影小白救命神器呀。

你会发现如果要做拍摄指导,这件事情,只有折叠屏才能做得更好,一方面它可以展示原图,也可以展示更多的指导信息,这样你在拍摄过程中不知不觉也就提升了自己的摄影能力。

另外,折叠屏还有个好处,它有个外屏,所以你在拍摄的时候可以把预览画面也镜像出去,被拍摄者也能看到实时的一个情况。

而且它还可以成为一个免责的方式,『我都1:1照着拍了,还不好看的话,那就不是拍摄的问题了(狗头)』

所以有时候需求不止存在于你想要的瞬间,也有可能是让你难受的时候。

在设置中我做了一些让你拍摄更好的一些小配置,到时候你可以根据现场环境调节,这种你要拍摄一你主要背景的图片,那就可以把轮廓改成红色。


另外一个就是我还增加了一个手机本地样片库的功能,添加之后,可以把你别的网址或者是其他地方保存的喜欢的照片,用我们这种手把手辅导的方式,再拍一遍。

不想做太多的总结或者是升华,为了点题,我还是再说两句。

手机没有必要成为下一台电脑,他有着自己属于自己的一套生产的流程,在现场发现问题,用一张照片或者一句话发起任务,他就可以在手机上把这个结果交付给你,它是很流畅的,不是去在另一个平台上编译代码,然后再到手机上安装,再去测试,不管是多任务的交互或者是更强的计算能力,只是为了让你这个过程更加的顺。

而且以这样的方式产生的一个应用,它解决的痛点有可能更加贴合你;

所谓的干活也不只是工作,也不只是甲方,更没有什么轻任务和重任务之分,他只要把一件事情能够做得很好,那么他就是一台合格的手机,通过这两个例子,你也能发现,不管是工作里的报销流程或者PPT,还是出门前拍一张好看的照片, X Fold 6都能解决得很好。

说明:

  1. 由于两款产品都要用到视觉分析,以及大模型的能力,所以首次使用前需要配置对应的 API,点开设置配置即可;
  2. 如果手头有 vivo手机(最好的是折叠屏)的同学,APK 我放在这里,欢迎下载体验:APK下载链接

3. 由于个人开发加vibe coding 的方式,工期有点短,可能会存在些一些bug,大家可以及时向我反馈,看到了第一时间改;

编辑于 2026-06-26 · 著作权归作者所有
相关文章
追觅智能锁亮相硅谷:智慧家庭从一把智能门锁开始还我黑莓!为何2026年“食古不化”的人们依旧念念不忘?天作之合——iRobot&杉川能否重塑扫地机行业AI 智能眼镜使用体验当“豆包”崩了,我们才意识到比AI更重要的东西迈入“物理AI”上车阶段!智己汽车 x Momenta 推出IM AD ZETA追觅爬楼机,在扫地机市场赢麻了首款具身智能摄像头——华为海雀雀蛋,我的新晋带娃好搭子!鸿蒙7与iOS27的AI路线之争2026年618扫地机器人选购攻略|吸力大、拖地强、避障灵、功能全,哪一样才是核心关键?|石头P20 Max、科沃斯T90Pro、追觅S60Pro新机实测动态人机工学究竟是不是噱头?清闲 OC1 Pro、OC1、S1三款人机工学椅实测推荐,一文看懂三个型号的差异【微醺评测】2026 扫地机器人横评:追觅X50Pro/云鲸002MAX/石头P20/小米5Pro 全维度硬核实测深度狂飙 AI Agent 两个月,很想给大家讲讲 MacBook 的“含金量”华为与小米智能家居生态系统深度比较研究报告荣耀一个做手机的,凭啥机器人夺冠?2026 年,4家新入场的 NAS 厂家,值得关注CES 2026 AI智能眼镜看这篇就够了!追觅的拐点,中国智造的升维时刻都2026年了,扫地机器人不卷参数、只卷实用细节!200㎡大户型狂测150小时,科沃斯T90 Pro是否值得入手新买的智能电视爸妈不会用?这份保姆级海信小墨E5Q Pro使用攻略请收好,语音调控、一键呼出DeepSeek、稳定投屏,越用越智能