如果黄仁勋愿意,凭借英伟达目前造算力卡的技术,最高可以造出什么水平的游戏显卡?
光栅理论上限实际上也就现在的2-3倍。
实际情况是,目前都已经撞到光栅极限了,堆规模不是说没有任何作用,只是提升浮点计算带来的收益几乎是负数。
三角形如果小到只有1个或者几分之一像素的时候,一个是几何引擎会极大量空转,第二个是无效计算极多(GPU的最小单位是个2x2的像素计算块,如果你只有一个像素甚至一个像素都没,会产生极大量的空转),这对于GPU和显存来说都是极大的黑洞,一头没效率,另一头因为细节太多,还得计算极多的数量,那不就是指数级负载上升么?
几何数据量过大还会导致显卡缓存,尤其是L2被直接冲爆。
触发GPU超时之后GPU驱动会直接把游戏关掉来保证不要死循环损坏显卡,闪退就是这么来的。
Nanite这种软件模拟本质上甚至都是额外增加计算量来绕过硬件低效,也只是个特别妥协的解决方案。
你提升浮点和堆规模有啥用呢?这不是GPU性能能解决的事,也不是说你并行一个卡能解的。
这也是为什么很多时候很多游戏优化差到没法跑以及短期内无法修复的原因,你能看到不少游戏是GPU利用率不高,但帧率一样也不高,还很容易闪退就这道理,固定管线拖累性能了。
这就是实实在在的客观瓶颈。
卡点压根不在算力单元上,厂商和TA也不可能把整个游戏的美术素材和渲染节奏全部刀一遍,这个工作量是天量的,自动LOD的话几十万个美术资产,你用自动化脚本跑谁能保证质量?
原理上可行,实际落地很难的。
手动看你一天才能看多少?模型总不可能重新渲一遍吧。
光追当然有更高的上限,但是呢。
本身他目前甚至没有一个全局能落地的整体式的解决方案,比如最简单的例子,光追渲染在游戏领域本身仍然在纸面上,往下看路径光追多吃性能反正都自知。
电影工业可以用重型机架服务器去几小时跑个一帧,反正有的是后期预算,为了后期跑个三五千万美元也不是大问题,反正都能拿回来,迪士尼的阵列大概都是9位数价格的,跑几个月就为了渲染电影,而你可能用10亿美元买一张光追显卡吗?
你根本不可能有电影公司的预算,就很难解决。
即时渲染的要求太高了。
不要做那种放大规模就能有效提升性能的白日梦,AI填内容才是实际未来的方向了。
黄是很清楚的,所以AI超分和光追技术是一起上的,这才是成套逻辑,光追哪怕本地算不动,可以用阵列训练模型+弱算力+本地推理来进行实现,约等于部分离线渲染+渲染基建化处理。
你可以质疑黄黑心,但是你质疑他没抓到方向就多少有点过了,大概就这么回事。