本文作者:kris

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced

kris 2025-01-24 23:33:53 3
DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced摘要: 前言  北京时间1月7日上午,在位于美国拉斯维加斯的CES 2025展会上,NVIDIA创始人黄仁勋身着一件鳄鱼皮衣出现在演讲台。随着演讲的深入,那...

前言


  北京时间1月7日上午,在位于美国拉斯维加斯的CES 2025展会上,NVIDIA创始人黄仁勋身着一件鳄鱼皮衣出现在演讲台。随着演讲的深入,那个让无数游戏玩家翘首以盼的“它”终于揭开了神秘的面纱,当老黄举起手中RTX 5090样卡的那一刻起,宣告游戏显卡正式进入了Blackwell时代。
  NVIDIA此次发布代号为Blackwell的GeForce RTX 50系列显卡共包括RTX 5090、RTX 5080、RTX 5070 Ti、RTX 5070四个型号,其中最先上市的是RTX 5090。
  但RTX 5090的AI算力超过禁售限制,所以其无法通过正式渠道在国内上市。NVIDIA针对中国大陆市场的特殊情况,仿照上一代的RTX 4090 D,开发了RTX 5090 D的中国大陆特供版,在不降低游戏体验的前提下,削弱AI算力确保合规,并将与海外的RTX 5090同步发售。
  我们也在第一时间收到了来自七彩虹的 iGame GeForce RTX 5090 D Advanced 32GB显卡产品,下面我就来领大家进入Blackwell的全新时代。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced

七彩虹iGame GeForce RTX 5090 D Advanced 32GB显卡解析

开箱部分


  iGame Advanced系列在七彩虹显卡的产品序列中处于承上启下的位置,上有水神、火神,下有Ultra、战斧,做工用料扎实,价格又不会太高。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  七彩虹此次首发的四款iGame系列的 RTX 5090 D显卡外观变化最大的应该就数Advanced了,七彩虹让这款RTX 40时代还是平平无奇的三风扇显卡产生了华丽地蜕变,充分地拉起了整个系列的颜值。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  正面居中的还是Advanced系列标志性的红色“引力之环”,而两翼呈银色展开装饰不由得让人联想到了“∞无穷符号”,或者说是“莫比乌斯环”,再披挂上半透明的磨砂外壳,内部结构若隐若现。整个显卡的设计充满了神秘的宇宙元素,艺术性相比于上代产品不知提高了多少个档次。“引力之环”由金属压铸而成。其引力散热装置使用新升级的iGame真空冰片技术以及面积增大的散热鳍片,配合三架“风镰”扇叶(107+101+107mm),为高负载场景保驾护航,其风扇智能启停技术能够根据用户的使用场景智能调节。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  显卡整体长度达到35.5cm(不含挡板),高度13.1cm(不含PCIE接口部分),厚度约6.9cm(3.5槽),是一款不折不扣的巨型显卡。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  与上一代不同的是,这代仅配备了双槽挡板,挡板为不锈钢材质,坚固耐用性上倒是完全不用担心。视频输出是3 DP2.1b+1 HDMI2.1b的标准配置,此外还有一个双BIOS切换按钮。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  背板镂空的地方其实隐藏了一个iGame的LOGO。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  拆下来之后看着更明显一点。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  GPU背面整齐MLCC电容排布整齐,并配有X形背板支撑。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  NVIDIA在这RTX 50系列显卡上采用12V-2×6接口来取代40系列的12VHPWR,而两者在本质上并没有什么区别,都是6组+12V回路加四条控制线的结构,接口互相兼容,可以使用上一代的模组线。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  七彩虹iGame GeForce RTX 5090 D Advanced显卡附赠了一条PCI-E 8pin*4转12V-2×6的转接头,和上一代RTX 4090附赠的线材放在一起你能分辨出来吗?

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  不过拿起来之后还是可以看到显著区别的,右侧的是新版接口,触点明显比旧版更靠外,考虑到早期RTX 40系列接口烧毁主要原因来自于接头插的不到位,接触不良内阻增加导致烧毁,触点的改动可以有效避免上述事故。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced

拆解部分


  接下我们继续来看下拆解。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  现在的高端显卡功耗越来越高,发热量越来越大,为了获得更出色的散热效果,几乎所有的高端显卡都采用了短板PCB,搭配超长散热器。这样的好处便是散热器超出PCB版长度的部分可以被风扇直接吹透,获得更好的通风效果。七彩虹iGame GeForce RTX 5090 D Advanced自然也不例外,虽然拆解后的PCB相比巨星散热器显得非常袖珍,但给人的视觉冲击力却不小,因为巴掌大的PCB上密密麻麻的排布了各式各样的元器件,可见其用料非常足。
  背面大量的MLCC电容为GPU的稳定运行提供支撑。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  RTX 5090 D的GPU编号为GB202-250-A1,而传闻中的海外版RTX 5090则使用GB202-300-A1并不一致,不排除AI算力方面存在着某些物理层面的屏蔽。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  显存是16颗来自三星最新的GDDR7,单颗2GB,总计32GB/512bit,从顶部开始顺时针按4525数量排列。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  供电PWM主控为MP29816-A,是一款比较新型的控制器。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  整卡采用16+7+6,即使面对仅600W的功耗也可以轻松应对。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  除了板卡以外,七彩虹iGame GeForce RTX 5090 D Advanced在散热器方面下的料也很足,巨大的均热板底座实现了GPU和显存的全覆盖。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  散热器总共配备了9根热管的豪华配置,其中7根达到8mm,2根6mm,并且使用回流焊工艺使热管与鳍片严丝合缝,优化散热效能,实现优异的散热效果。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  背板相对就没有那么出彩了,主要起个加固支撑作用。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  从拆解上来看,七彩虹iGame GeForce RTX 5090 D Advanced 32GB显卡做工精细,用料扎实,完全配得上RTX 5090 D这种旗舰GPU的规格,那么他的实际表现如何呢?

浅谈Blackwell的一些特性


  要想深入了解Blackwell,那么首先需要掌握这样一个重要的关键词——神经网络渲染。
  NVIDIA宣传神经网络渲染开启了计算机图形学的一个新时代,通过将神经网络集成到渲染过程中,我们可以在性能、图像质量和交互性方面取得巨大的飞跃,并提供新的沉浸感。
  最初的DLSS技术使用较低分辨率的渲染帧作为输入到神经网络,该神经网络经过训练以输出全分辨率帧,以至于它可以用较低的性能开销生成包括阴影、反射和遮挡等特殊效果的完整帧。
  随着DLSS技术的进步,多帧生成、低延迟等功能逐渐加入,使得其越来越完善。如今,随着Blackwell的推出,DLSS的最新版本也来到了DLSS 4,这将给我们带来什么样的惊喜呢?

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced

“多”帧生成——DLSS 4


  NVIDIA提到DLSS 4的主要特性有5项,包括1项新增(多帧生成)和4项增强(帧生成、光线重构、超分辨率、深度学习抗锯齿)。其中新增项目为RTX 50系列独占的DLSS Multi Frame Generation,相比RTX 40系列的Frame Generation多了一个“Multi”的关键词,也就是从“帧生成”进化为“‘多’帧生成”。
  DLSS 3 Frame Generation 的 AI 模型使用运动矢量和深度等游戏数据,配合GeForce RTX 40 系列的光流加速器的光流场生成一个额外帧。 但是这种方式在每生成额外一帧的时候都需要光流加速器和AI模型参与,所以在生成多个帧的时候开销过高。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  DLSS 4新的帧生成 AI 模型的速度提高了 40%,使用的显存减少了 30%,并且每个模型只需要运行一次渲染帧以生成多个帧。与此同时,NVIDIA使用AI光流模型替代硬件光流加速器来生成光流场,从而避免了硬件光流加速器造成的性能瓶颈。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  工作流程改变后, 每次渲染时GPU都需要跨超分辨率、光线重构、多帧生成等场景执行五个AI模型,并且每个渲染帧的重建和多帧生成都必须在几毫秒内完成,否则 DLSS 多帧将出现反效果,成为减速器。
  为了实现这一目标,GeForce RTX 50 系列 GPU 包含第五代 Tensor 核心,其AI 处理性能提升高达 2.5 倍。 一旦生成新帧,它们就会均匀分布以提供流畅的体验。
  DLSS 3 的帧生成使用基于 CPU 的节奏调度,在复杂场景下,额外帧与原帧合成输入时,容易出现每帧之间的帧节奏不一致的情况,从而影响整体平滑度。
  为了解决此问题,Blackwell 使用硬件Flip Metering来代替CPU进行帧节奏控制,它将帧节奏逻辑转移到显示引擎,让 GPU 能够进行更精确地统一管理调度,与此同时 Blackwell 显示引擎也得到了增强,像素处理能力提高了一倍,足以支持更高分辨率和刷新率,满足 Flip Metering 与 DLSS 4 的要求。
  结合以上软硬件方面的创新, DLSS 4 能够生成每 16 个像素中的 15 个像素,同时保证出色的画质、流畅度和延迟,让一次性生成多个帧成为现实。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced

全“新”模型——Transformer


  此前,DLSS 使用卷积神经网络 (CNN) 分析局部上下文并跟踪连续帧中这些区域的变化来生成新像素。但经过多年演进 DLSS CNN 模型已经基本到达极限,无法进一步优化。
  为此,NVIDIA引入了 DLSS Transformer 模型使用视觉 Transformer,支持通过自注意力操作来评估整个帧及连续多帧中每个像素的相对重要程度。Transformer模型采用双倍于 CNN 模型的参数量来更深入地理解场景,所生成的像素具有更好的稳定性、更少的伪影、更丰富的运动细节,边缘也更平滑。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  有个好消息是Transformer不会是Blackwell独占,RTX 40系列及以前的型号也可以享受得到。

唯“快”不破——Reflex 2


  在电子游戏中,玩家的每个操作需要通过键盘和鼠标的到游戏程序,由 CPU 进行计算其在游戏中的效果,将结果放置于渲染队列中,再按序送到 GPU 进行渲染,最后输出到显示器。整个流程较长,容易出现响应迟钝的现象。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  2020年,随着RTX 30系列的发布,NVIDIA同时也发布了Reflex 技术。Reflex 能够更好地调节 CPU 执行节奏,使其在最佳时机向 GPU 提交任务执行,从而有效地缩减渲染队列。比如让CPU 晚一些开始运行,可以在更接近向 GPU 提交帧的时间对鼠标输入进行采样,进一步提高了响应能力。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  此次发布的 Reflex 2 Frame Warp可以实现另一个方式的降低延迟。当一个帧被 GPU 渲染时,CPU 会根据最新键盘和鼠标的输入计算下一帧的视角位置。Frame Warp 从 CPU 采样新的视角位置,然后将 GPU 刚才渲染的帧扭转到最新的视角位置。在渲染帧被发送到显示器之前,在尽可能最新的时间进行扭转操作,确保屏幕上反映最新鼠标输入。
  当 Frame Warp 转移游戏像素时,图像中会产生缝隙撕裂、镜头位置的变化会让游戏场景中显示新的部分。为此,NVIDIA 开发了一种优化了延迟的预测渲染算法,该算法使用来自先前帧的视角、颜色和深度数据,对这些撕裂进行准确的图像修复。玩家可以通过更新的视角看到没有撕裂的渲染帧,并降低了改变游戏内视角位置而产生的延迟。这有助于玩家更好地瞄准目标,更精准地跟踪敌人,提高命中率。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  根据NVIDIA的测试,当 GPU 成为 PC 性能瓶颈的情况下,Reflex 低延迟模式效果最为明显。但在 CPU 和 GPU 均有瓶颈的情况下,采用 Frame Warp 技术的 Reflex 2 可大幅降低延迟。

“精”密量化——FP4


  像Stable Diffusion这样的生成式AI允许创作者仅使用文本生成令人惊叹的图像,但随着模型的复杂性和规模不断增长,其运行的硬件门槛也越来越高。
  GeForce RTX 50 系列添加了原生 FP4 支持来帮助解决此问题。 FP4是一种更低的量化方法,类似于文件压缩,可以减小模型尺寸。相比于FP16这一目前大模型最常采用的量化方法,使用 FP4 量化只需要占用不到一半的内存空间,与此同时还能在RTX 50 系列 GPU 上获得高达 2 倍性能提升。经过NVIDIA TensorRT 模型优化器提供的高级量化方法即可获得这些收益,且输出质量几乎没有损失。
  例如Black Forest Labs 的 FP16 FLUX.dev 模型需要超过 23GB 显存,也就是说 GeForce RTX 4090以下的显卡无法运行,而使用 FP4的FLUX.dev 模型仅需要10GB左右,因此可以让更多的小显存显卡运行。
  虽然上一代的Ada lovelace GPU 支持以 FP4 精度运行 AI 模型,但其FP4 实际上使用的是GPU上的 FP8 张量单元进行操作,Blackwell 系列 GPU 提供对 FP4 的原生支持在使用 FP4 精度模型时,可实现两倍于FP8的性能体验,这也是为什么RTX 5090 D标称的AI算力达到RTX 4090 D的两倍,但却没有触发禁受限制的原因。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  除了上面提到的“多”“新”“快”“精”以外,Blackwell还有一些其他特性,比如4:2:2格式硬件加速等等,那些并不是本文的重点,在这里就不再赘述了。

Blackwell大战Ada Lovelace


  理论终究是理论,是骡子是马还要实际牵出来遛遛。为了测试七彩虹iGame GeForce RTX 5090 D Advanced 32GB 显卡(以下简称RTX 5090 D)的实际性能表现,我找来了上一代旗舰卡NVIDIA GeForece RTX 4090 Founder’s Edition 24GB(以下简称RTX 4090)来做对比,具体测试平台如下:

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced

3DMARK基准测试


  按照惯例我们还是先来跑个分。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  在3Dmark的各项测试中,RTX 5090 D的总体领先幅度在30%-50%之间,其中TSE、SN、SP这种4K高压力的测试领先幅度比FS、FSE这种低分辨率的要大一些。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced

传统游戏测试


  接下来我选了10款游戏进行测试,关闭光线追踪有关的特效,关闭DLSS相关功能,开启其他全部特效和TAA抗锯齿,切换不同分辨率。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  第一波测下来的结果着实让人大跌眼镜,1080P分辨率下RTX 5090 D的性能表现显然受到了CPU的影响,个别场景甚至和RTX 4090的成绩出现了倒挂,整体只有个位数的提升。
  但随着分辨率的升高,CPU的瓶颈效应逐渐降低,到达4K分辨率后RTX 5090 D 逐渐与RTX 4090拉开差距,但始终没有达到3DMARK跑分所体现出的距离。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced

光线追踪游戏测试


  接下来选择几款带有光线追踪特效的游戏进行测试,这些测试全部采用4K分辨率,关闭DLSS相关功能,开启其余全部特效,切换不同等级光线追踪效果。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  由于光线追踪的开启,对显卡的压力进一步提高,特别是当光线追踪特效开到最高时,性能差距显著拉大,可见新一代的RT Core在光追特效的处理上比RTX 4090 有一定的进步。平均已经超过35%,个别游戏差距甚至已经接近50%,基本符合3Dmark的跑分结果。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced

DLSS 3游戏测试


  虽然DLSS 4已经发布,并且NVIDIA宣称首发将有至少75款游戏或者软件支持,但目前测试阶段能用的不多,所以在性能测试方面还是采取DLSS 3进行评估。
  本项测试采用4K分辨率,开启包括光线追踪在内的全部特效,并切换不同档位的DLSS

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  DLSS游戏中RTX 5090的表现也很有讲究,性能模式的DLSS渲染分辨率仅为1080P,但是RTX 5090所表现出来的性能差距远大于传统游戏中所体现的,这说明新一代的Tensor Core在处理DLSS的效率有了进一步的提高,即使同样只有2X插帧的DLSS 3中,也能提高实际表现。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced

DLSS 4实际表现


  最新的3Dmark测试版已经集成了DLSS4的相关测试。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  在这项测试中我们可以关注两个重点:
  一是DLSS 4 Performance+4X帧生成相比原生渲染高了整整300帧,提升幅度超过400%,“帧多多”模式威力仅限。
  二是观察2X帧生成,即使同样时Performance档或者Quantity档,DLSS 4得到的帧率都要略低于DLSS 3。可见DLSS 4更新算法之后,更适应多帧生成,而在两帧生成方面的性能反而有所下降,应该是由于算法优化方向导致的差异。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  接下来是游戏测试,测试方式与DLSS 3时相同,采用4K分辨率,开启包括光线追踪在内的全部特效,并切换不同档位的DLSS。
  目前开启DLSS多倍帧生成的方式有两种,一是直接在游戏界面里原生开启,二是在NVIDIA专用程序中强制覆盖配置,霍格沃茨之疑采用的则是前者。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  在霍格沃茨之遗中,可以看到RTX 5090采用原生渲染时帧率为96,而采用最高效率的DLSS 性能+4X帧生成可达429帧,提升幅度超过300%,于此同时PC延迟方面并没有显著增加,全程保持在30ms以内。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  除了多倍帧生成之外,NVIDIA这次带来的新特性还有DLSS模型更新,目前支持自由选择模型的游戏还不多,我这里使用beta版本的赛博朋克2077来做测试。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  从结果上来看,无论是哪一个档位的DLSS,Transform模型相比原来的CNN模型帧率略有降低。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  总的来说,DLSS 4的表现还是令我感到满意的。在性能方面,RTX 5090 D在赛博朋克2077的最高画质原生渲染平均帧率只有35帧左右,而开启DLSS性能+4X帧生成达到255以上,提升幅度令人惊讶。
  新的Transform模型的表现质量获得明显的提升。其实我在使用RTX 40系列显卡的时候,帧生成功能我时不开的,因为那时候的帧生成所产生的伪影、坏帧比较明显,影响使用体验。而更换Transform后的DLSS 4,虽不能说完全没有了伪影和坏帧,但即便是在4X帧生成的观感也远好于之前。如果要我形容一下的话,DLSS 3时代的伪影就像围棋棋盘的格子那种一块一块的坏块,而Transform模型DLSS 4就家中老式电视出现的雪花点,并且仅在复杂且快速运动的物体附近出现,如果不是硬盯着一个部位反复观看,其实很难感觉得到。
  更重要的是,Transform模型并不是RTX 50系列限定,既往的RTX显卡同样的可以得到惠及,可以说是玩家们的一大好消息。
  可惜由于帧率实在太高,无论是截图还是录屏,哪种方式都不能很好的表现出我测试时的感受,只能文字描述,还请见谅。

生产力测试


  现在的显卡,早就不再是单纯的玩游戏功能,内容创作、AI应用,几乎都需要显卡的参与,接下来我们一起看一下RTX 5090 D在生产力方面的表现。
  在Blender渲染测试中RTX 5090 D依然表现出强劲性能,领先RTX 4090约30%-40%,这也和游戏测试结果类似。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  而在大语言模型的测试中,首先使用了MLPerf的测试中,无论是Token生成速率还是首个Token生成时间,RTX 5090 D都要优于RTX 4090。说好的AI算力限制呢?别着急,我们继续往下看。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  大语言模型除了Token Generation以外,还有一个重要的性能指标就是Prompt Processing,而MLperf仅针对前者进行了测试,下面我换LLaMa-Bench来测试下另一项指标。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  在TG方面,测试结果与MLperf基本一致,RTX 5090 D的优势甚至更大。但到了PP方面,施展在RTX 5090 D身上的枷锁威力开始显现RTX 5090 D大幅度落后于RTX 4090,甚至在llama 80亿参数的F16模型中的表现仅有RTX 4090的三分之一,实在不怎么好看了。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  不过RTX 5090 D 32GB显存的优势是无法比拟的,例如跑到千问320亿参数Q6_K模型时,RTX 4090就已经趴窝了,而RTX 5090 D还可以顺利完成。再者RTX 50系列的撒手锏FP4的模型现在尚未铺开,待FP4生态完善之后,RTX 50系列的优势将更大。
  总而言之,RTX 5090 D依然可以用作大模型,但确实有一定的限制,不过按照国内目前的形势,普通个人用户恐怕也很难有更好的选择。

功耗与发热


  这个阶段的测试我采用3Dmark Steel Nomad压力测试,在室温28.5度的环境下运行约20分钟,机箱侧板敞开。
  整个过程中GPU频率最高为2685MHz,但仅出现在刚开始的时间段,进入稳定区间后维持在2630左右。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  GPU温度基本长时间稳定在72度左右,相对比较理想,但显存温度偏高,整体维持在86度上下。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  风扇转速相对稳定在2400转左右,噪音和RTX 4090 FE基本持平。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced


  功耗达到标称的575W,其中绝大部分都来自12V-2x6接口,而从PCI-E插槽取点基本只维持在20W以内。

DLSS4游戏渲染新乐章—七彩虹iGame GeForce RTX 5090 D Advanced

结语

喜忧参半的Blackwell旗舰


  作为新一代的NVIDIA卡皇,RTX 5090 D的性能相较上一代的RTX 4090提升了30几个百分点,幅度相比RTX 3090到RTX 4090这几乎翻倍自然是小了不少,但考虑到以往的进步来说,这个幅度也算是正常的,相反的RTX 4090那个提升才叫异常。再加上DLSS 4的加持,RTX 5090 D的性能表现还是能够令人满意的。
  而其缺点主要在于功耗实在太高,曾经我觉得RTX 4090的450W已经很夸张了,没想到这一代直接怼到了575W。光这么看可能还觉得没什么,但我大家可能不知道,我本次的测试环境是一个约20平方米的房间,本来室温是25度左右,但是插着RTX 5090 D跑了两个小时的大语言模型,直接把室温轰到了28.5度,其效果堪比电暖器。

颜值性能双丰收的iGame Advanced


  再回到七彩虹iGame GeForce RTX 5090 D Advanced 32GB这张显卡上来,这张卡做工优秀,散热效果出色,完整喂饱GB202这颗大核心。而莫比乌斯+引力之环的设计语言十分吸引眼球,就我个人的审美观点来看,这代的Advanced在颜值方面可以说是不输其大哥Vulcan。
  据悉,1月30日这款显卡将在七彩虹官网商城、京东、天猫、拼多多、抖音等电商平台及全国授权零售经销渠道开售。除了本次评测款,七彩虹还同时准备了iGame Vulcan、Neptune等多个不同系列的GeForce RTX 5090 D显卡供用户选购,售价16499元起。
  大年初二,拿这样一张顶级显卡作为年货,岂不美哉?

本文来自:什么值得买

文章版权及转载声明

作者:kris本文地址:https://www.damoyx.com/p/27183.html发布于 2025-01-24 23:33:53
文章转载或复制请以超链接形式并注明出处大漠游侠网

阅读
分享