你看好英伟达即将发布的首款笔记本电脑N1X吗?
如果早一年发布,这芯片的笔记本部署单机模型妥妥的神器,但现在发布,觉得它的定位会非常尴尬。
首先赶上天价内存了,这笔记本以统一大内存为卖点,高存储成本决定便宜不了的。
刚看了眼,现在看 128GB 的 Ryzen AI Max+ 395 机器基本是 2 万元的价格。
如果 N1X 的图形性能真能接近 RTX 5070 ,同时还带 CUDA 加持,那这机器卖 2 万到 4 万,应该一点都不奇怪。
然后是用途,这一年,尤其是最近几个月,AI 的使用方式变化太大了。
先看 LLM。
基本地球人都知道,DeepSeek V4 Pro 的 API 价格已经便宜到离谱。
按当前价格,V4 Pro 百万 token 输入缓存命中只要 0.025 元,缓存未命中 3 元,输出 6 元。不仅便宜,而且缓存命中率实际使用中能达到 95% 以上。
在我自己的编程体验里,实际折算下来每亿 token 也就是十几块钱。
这就很夸张了,我给你算笔账:
假设这台 N1X 笔记本卖 3 万元,按我自己的实际 API 成本粗算,差不多能买 2000 亿 token 级别的 DeepSeek V4 Pro API。
注意,是 2000 亿 token哦!
也就是你每天固定无休的烧 1 亿 token,也得烧 5 年半左右......
对个人用户来说,这基本已经不是“够不够用”的问题,而是“你根本不可能正常用完”的问题。
更关键的是,本地能跑的模型和 DeepSeek V4 Pro 根本不是一个级别。
DeepSeek V4 Pro 是 1.6T 总参数的 MoE 模型,激活参数 49B,官方混合精度权重仓库体积就已经接近 865GB。
实际部署时还要算推理框架、KV cache、buffer、长上下文等额外显存开销,保守说也得 1TB 以上显存。
也就是说,先不考虑算力,N1X 哪怕顶配 128GB 统一内存,刚够能完整运行 DeepSeek V4 Pro 显存需求的十分之一,它能跑的是小的本地模型。
可问题是,当云端 V4 Pro API 便宜到这种程度时,普通用户为什么要花几万元,买一台只能跑弱得多的模型的机器呢?
再看 AI 绘画。
现在基本上没多少普通用户折腾单机模型了,直接 Nano Banana、GPT-Image-2、Seedream 等闭源模型。
因为现在的闭源图像模型的 Text Encode 已经差不多是个多模态 AI Agent了:
能理解图像、理解文本、理解编辑意图,还能保持人物一致性、风格一致性,甚至还能联网搜索参考图......
这就造成,单机开源模型在泛用性上已经没法与它们抗衡了。
目前本地开源绘画模型的价值,只能越来越集中在很窄的应用场景里。
比如 Krita 配合 ComfyUI 做接近实时的二次元 AI 辅助绘画,或者训练特定 LoRA,进行高风格一致性的可控生成。
但这种场景需要的不是“大的统一内存”,而是足够强的显卡算力。
比如 Nunchaku 这类工具,通过低比特推理优化把 FLUX 之类模型跑得飞快,但真正想舒服的使用,需要的不是大显存(显存占用在 FP4 与 INT4 下大幅下降了),而是 90 系超高算力显卡。
至于视频模型?
先不论 90 系的显卡生成视频都慢,你弄个 5070 级别性能的大显存,难道想拿笔记本 7 X 24 炼丹不成?
而且闭源 Seedance 2已经从过年无敌到现在了,单机模型可以说生产力方面,几乎完全失去意义了。
所以为什么说 N1X 会很尴尬呢?
面对天价内存生不逢时,LLM 方面遇到 DeepSeek V4 这种价格“屠夫”,而 AI 绘画与动画都用云端闭源去了。
最后它定位就卡在中间了:
普通用户用不上,明显太贵了;
AI 玩家嫌它不够强,真有单机高显存需求4090 48GB 、 5090 ,或者直接 RTX 6000 Pro去了;
创作者改用闭源云端模型,本地部署的需求越来越少;
游戏玩家不需要那么大的显存。
当然,其实说到底,还是价格的原因。