对比苹果空间生态布局,谷歌硬件 + 软件齐发力,I/O 之后谁更抢占下一代数码产品风口?
文后有对谷歌开发者大会的信息总结,我们先来研究核心一个问题:谷歌 vs 苹果,谁更抢占下一代数码产品风口?
我的判断是:两家公司在押注不同的「下一代」,短期内我觉得还是谷歌的路径更务实、更容易触达用户。
苹果的路径:空间计算(Vision Pro)
苹果押注的是「沉浸式空间计算」——头戴式设备、visionOS、空间视频、空间音频、眼动追踪交互。
它的优势是:
- 硬件工艺和显示技术领先(Micro-OLED、R1 芯片低延迟)
- 生态封闭但体验一致(M 芯片 + visionOS + 原生应用)
- 已有开发者生态和内容合作
它的问题是:
- 价格极高(Vision Pro 约 $3499),用户基数很小
- 头戴设备的社交接受度低,使用场景受限
- 缺乏杀手级应用,目前更像「高端体验品」而非日常工具
- 苹果在 AI 模型能力上明显落后于 Google 和 OpenAI
谷歌的路径:AI Agent + 轻量硬件(智能眼镜)
谷歌押注的是「AI 无处不在」——不是让你戴一个沉重的头显进入虚拟世界,而是让 AI 融入你已有的设备和日常场景。
它的优势是:
1. 硬件形态更轻、更日常。智能眼镜看起来就是普通眼镜,社交接受度远高于头显。秋季就发售,价格预计远低于 Vision Pro。
2. AI 能力是核心差异化。Gemini 3.5 Flash 是目前最快的前沿模型之一,Gemini Spark 是真正的 24/7 Agent。苹果目前没有对等的 AI 能力。
3. 开放生态 + 跨平台。Android XR 眼镜兼容 iOS,MCP 协议连接第三方工具。苹果的 Vision Pro 只在苹果生态内运行。
4. 用户基数碾压。Gemini App 9 亿月活,Search AI 25 亿月活。苹果 Vision Pro 的装机量可能只有几十万台。
5. 基础设施投入巨大。1800 亿美元资本支出、100 万+ TPU 集群、3.2 千万亿 token/月的处理量。这种规模的 AI 基础设施是苹果目前不具备的。
它的问题是:
- 谷歌硬件历史上成功率不高(Google Glass 一代失败、Pixel 市场份额小)
- 智能眼镜的电池、散热、显示技术仍有瓶颈
- 隐私争议(摄像头眼镜的社交接受度)
- 谷歌产品经常发布后砍掉,用户信任度不如苹果
我的结论
如果「下一代数码产品风口」指的是「取代手机成为下一个主计算平台」,那两家都还没到那一步。
但如果问的是「谁更有可能先让普通用户用上下一代交互方式」,我认为谷歌目前的路径更现实:
1. AI Agent 比空间计算更快落地。Gemini Spark 今天就能用,不需要买新硬件。而 Vision Pro 需要你花 2.5 万人民币买一个头显。
2. 智能眼镜比头显更容易被接受。一副好看的眼镜,戴着出门没有社交压力。头显目前只能在家用。
3. 谷歌的 AI 模型能力明显领先苹果。苹果的 Siri 和 Apple Intelligence 到现在还没有展现出和 Gemini 3.5 同级别的能力。
4. 谷歌的开放策略覆盖面更广。Android + iOS 双平台兼容,MCP 开放协议,850 万开发者。苹果的 visionOS 开发者生态还很小。
但苹果的长期优势不能忽视:
- 苹果一旦把 AI 能力补上来(比如和 OpenAI 的合作深化),它的硬件整合能力和用户体验打磨能力仍然是最强的。
- 如果 Vision Pro 降价到 $1000-1500 区间,并且出现杀手级应用,空间计算的想象空间比眼镜更大。
- 苹果用户的付费意愿和生态粘性远高于 Android 用户。
所以短期(1-2 年)看谷歌更务实,长期(3-5 年)看两家各有胜算。
真正的风口不是「头显 vs 眼镜」的硬件形态之争,而是谁的 AI 能力真的能切入用户的需求。
看起来,Google I/O 2026 展示的 Gemini Spark + 智能眼镜 + Antigravity 的组合,确实比苹果目前的 Vision Pro + Apple Intelligence 更接近「下一代日常计算」的样子。 但是我觉得,用户真的需要这些吗?我们日常性的需求,真的还需要 AI 来满足吗。比如翻译功能,日常有那么多情境需要一直用眼镜来翻译?
以及目前的 AI agent,说实话,几家 agent 产品都大差不大,没有谁形成了一个垄断的优势。所以我还是认为,未来在于开创一个新的需求品类,我期待着苹果的 vision 世界。
Google I/O 2026 核心发布内容
一、AI 模型与平台
1. Gemini 3.5 Flash:新一代旗舰模型,几乎所有基准测试超过上一代 3.1 Pro,编码能力大幅跃升,输出速度是其他前沿模型的 4 倍。价格不到同级模型的一半。Google 内部每天处理超过 3 万亿 token。
2. Gemini Omni:新模型家族,能从任意输入(文本、图片、视频)生成视频输出。首发 Gemini Omni Flash,可在 Gemini App、Google Flow 和 YouTube Shorts 中使用。
3. Gemini Spark:24/7 个人 AI Agent,运行在 Google Cloud 虚拟机上,即使关闭电脑也能持续工作。可设置定期任务、教它新技能、创建完整工作流。支持 MCP 协议连接第三方工具(Canva、OpenTable、Instacart 等)。
4. Antigravity 2.0:从代码编辑器升级为独立桌面应用,成为 Agent 编排中心。内部优化版 Flash 比其他前沿模型快 12 倍。
二、硬件:智能眼镜(Android XR)
这是本次大会最直接对标苹果空间计算的部分:
- 两种形态:音频眼镜(Audio Glasses)和显示眼镜(Display Glasses)
- 音频眼镜今年秋季首发
- 合作伙伴:Samsung + Qualcomm(平台层),Gentle Monster + Warby Parker(时尚设计)
- 核心功能:
- 说「Hey Google」或触摸镜框唤醒 Gemini
- 看到什么问什么(餐厅评价、路牌翻译、云的名字)
- 导航(知道你站在哪、面朝哪个方向)
- 免提通话、短信、消息摘要
- 拍照/录像 + AI 编辑(Nano Banana 模型去背景、加特效)
- 实时语音翻译(保留说话人音色)
- 多步骤任务(后台帮你在 Doordash 下单咖啡)
- 兼容 Android 和 iOS
三、软件生态
- Android Halo:新 UI 层,让你在手机上实时查看 Agent 任务进度
- Googlebook:新笔记本电脑产品线,为 Gemini Intelligence 设计
- Ask YouTube / Ask Maps:对话式搜索体验
- Docs Live:语音直接创建和编辑文档
- Google Pics:AI 图片创建/编辑工具
- Search 中的 Information Agents:后台 24/7 帮你找信息
- macOS 版 Gemini App:集成 Spark Agent,可操作本地文件
四、基础设施
- 2026 年资本支出预计 1800-1900 亿美元(2022 年为 310 亿)
- TPU 8t(训练)+ TPU 8i(推理):双芯片架构,训练算力是上一代近 3 倍
- 全球超过 100 万颗 TPU 分布式训练
- 能效提升 2 倍
五、规模数据
- Gemini App 月活从 4 亿增长到 9 亿
- AI Overviews 月活 25 亿
- AI Mode 月活超 10 亿
- 每月处理超过 3.2 千万亿(quadrillion)token
- 850 万开发者每月使用 Gemini API