大家好,我是黄昏百分百,很荣幸再次获得英伟达与七彩虹的联合邀请,参与到全新NVIDIA GeForce RTX 5090 D显卡的首发测评中,这次我拿到的是七彩虹 iGame GeForce RTX 5090 D Advanced 32GB,之前已经为大家做了显卡的开箱部分,而今天我终于可以与各位分享这款显卡点亮后的首发测评了,今天就让我们一起看一看,全新一代Blackwell架构的旗舰显卡RTX 5090 D的表现到底如何,提升有多大。
那么废话不再多说,我们开车吧。
Blackwell 架构优势分析
新架构,新制程
▲NVIDIA Blackwell架构作为 GeForce RTX 50 系列显卡的核心,必须要放在最前面说。Blackwell架构基于英伟达专门定制的台积电 4NP 工艺制造,晶体管数量从上一代的 760亿个激增至 2080 亿个,是目前世界上工艺最精湛的 GPU 架构。
▲我们来看在英伟达设计Blackwell架构时的目的,最重要第一条便是优化全新的神经工作任务,其次才是降低内存路径,提高能效等等,可见英伟达对神经渲染技术的重视程度,那么我们就从其架构上来看一下,全新Blackwell架构的显卡是如何强化显卡的神经渲染能力的吧。
▲从图灵架构开始,英伟达开始采用多单元流处理器 (Streaming Multiprocessor,SM)架构以执行光线追踪等运算工作,然后到安培架构、Ada架构,再到现如今的Blackwell架构,其
在从图中可以看出,SM布局基本与上代保持一致,不过在配置与功能上,每一代都有非常明显的进步。在GB202芯片组中,共有192 个SM,而每个SM包含128个CUDA核心。
▲而本代SM中最核心的变化,是其内所有的的CUDA核心既可以运算FP32数据类型,又可以运算INT 32数据类型,这意味着相较于Ada架构,Blackwell架构的INT32运算能力得到了翻倍增强,当然,每一个时钟期间,一个CUDA只能运算一种数据类型。
另外,第四代光追核心取代了之前的第三代光追核心,拥有4纹理核心,256KB注册文件空间,128KB L1共享内存的第五代Tensor核心也取代了第四代Tensor核心。
NVIDIA还改进了SM中的着色器渲染管道,将不同的渲染类型分配给Tensor 核心与Shader 核心,以便进一步提升着色器与张量核心的运算效率,NVIDIA将其称作RTX Neural Shaders(神经网络着色器),得益于此,Blackwell架构的着色器渲染效率是Ada架构的两倍
总的来说,Ada架构的SM是为标准着色器进行设计与优化的,而Blackwell架构的SM则是为了神经着色器而设计和优化的。
▲而每两个SM组成一个纹理处理集群(Texture Processing Clusters,TPCs),再由多个TPC组成一个图形处理集群(Graphics Processing Clusters,GPCs)。
▲而Blackwell架构的GPU则是由多个GPC组成的,以一个完整的GB 202芯片为例,其拥有12个GPC,96个TPC,192个SM,24576个 CUDA核心,192个光追核心以及Tensor核心与纹理单元各768个。
全新GDDR7 显存,速度更快,能效比更高
▲而除了GPU之外,显存也是影响一款显卡性能强大与否的重要因素,NVIDIA在显存方面的不懈努力也肉眼可见,在安培架构RTX 3090首发的时候,NVIDIA便首次使用了采用PAM4 信号传输(4 个级别,每个周期提供 2 位)的GDDR6X显存,使得显存传输速率大幅提升,显卡的游戏性能与AI性能也随之大幅提升。但是伴随性能提升而来的则是显存的耗电与发热显著增加,这点相信使用过RTX 3090、RTX 3080的朋友们应该还有印象。
▲而本次Blackwell架构显卡中,NVIDIA则首次使用了GDDR7显存,其采用了PAM3 信号传输(3 个级别,每个周期提供 1.5 位),配合着创新的pin 编码方案,GDDR7 能够实现显著增强的信噪比(SNR),并使得最小I/O通道数量得到了翻倍。
再配合着重新设计的时钟架构和增强的 I/O 训练,GDDR7 提供了更高的带宽,同时提升了显存的能效比。
支持FP4,大幅降低模型体积,提高运算效率
▲在2022年以StableDiffusion为代表的生成式AI普及后,AI运算对显卡的计算量与数据储存能力的需求呈现爆炸式的增长,而得益于全新的第五代Tensor核心,Blackwell架构显卡可以处理FP4数据类型,FP4 提供了一种较低的量化方法,类似于文件压缩,该方法能够显著减小模型大小,让AI运算对显存的要求更低,效率自然也大幅提升。
NVIDIA官方给出了例子:
在Black Forest Labs(黑暗森林实验室)的 FLUX.dev模型中,如果使用FP16数据类型,那么模型需要占用23GB的显存,只有像RTX 4090 D、RTX 5090 D这样的顶级显卡才能有运行,而如果使用FP4数据类型,那么只需要不到10个GB的显存空间,这样就可以有更多型号的显卡可以运行此模型了。同时,使用FP4的RTX 50系显卡的AIGC速度,也获得了极大的提升。
第四代RT核心,全新引擎提升光追效率
▲Blackwell的第四代光追核心包含Box Intersection Engine(箱体交集引擎)、Triangle Cluster Intersection Engine(三角形群集交集引擎)、Linear Swept Spheres(线性扫描球体),Opacity Micromap Engine(不透明度微观映射引擎)与Triangle Cluster Compression Engine(三角形群集压缩引擎)这五种引擎。
其中,Box Intersection Engine、Triangle Cluster Intersection Engine与Opacity Micromap Engine在上一代Ada架构上均有应用,我在RTX 4090的首发测评中也有详细介绍,有兴趣的可以去看,这里我们重点讲一下Linear Swept Spheres与Triangle Cluster Compression Engine。
▲毛发是渲染中的一大难点,为了模拟出头发曲线与直线的形态,传统渲染方式使用单面为三角形的棱柱,这样便需要非常多的三角形来增加画面的精确性,模拟出一个男性的头发大约需要6百万个三角形,十分占用显卡资源。
▲而全新的Linear Swept Spheres(线性扫描球体)模型则使用两个球体来定位头发的位置,球体不仅更适应头发的形状,也降低了三倍的数据量,换言之,使用Linear Swept Spheres能大幅降低显存使用率,进而提升游戏的帧率表现。
Neural Rendering(神经网络渲染)
▲Neural Rendering(神经渲染)是一种结合深度学习与图形技术的创新方法,能够高效、灵活地生成高质量图像。它借助深度学习模型模拟渲染过程,通过AI技术合成着色、纹理和光影效果,从而创造出逼真的图像。与传统依赖物理规律和数学模型的确定性渲染算法不同,神经渲染无需精确描述场景中的几何、材质和光照等细节,而是通过学习海量数据来模拟渲染效果。
▲英伟达在15日的活动现场演示了龙模型,其便是采用神经网络进行实时渲染产生的,从我的实拍照片上大家便可看到,整个画面完全达到了影视级的效果,且帧率也比较高,可见AI对生产力方面的明显提升。
▲而从这张照片上,我们便可以看到要渲染出这条龙,到底需要多少的多边形,正是得益于RTX Mega Geometry技术,RTX 5090 D才能够渲染出如此复杂的模型。
▲另外,神经网络渲染还拥有诸如RTX Neural Materal(RTX 神经材质)技术,比如活动现场演示的《Zorah》Demo中,左侧为标准材质渲染而出,占用47MB的显存,而右侧为使用RTX 神经材质技术进行渲染,仅占用16MB 显存。同时,右侧照片中宝石的猫眼效果更加明显,这是因为神经材质技术能够根本更好的还原出光线在照射到宝石上后的镜面反射、漫反射、散射等效果;同时,右侧桌面与台座上金属的老化效果,也比左侧标准材质渲染的更加真实,有机会大家可以去体验一下这个Demo,真的是效果提升明显。
DLSS 4 多帧生成,引领时代的游戏革命
▲终于讲到大家最关心的DLSS 4了,它最直观的提升,自然就是这个多帧生成技术,目前每个实际渲染的帧可通过AI生成额外的3帧,大幅提升游戏的流畅度。
▲另外,DLSS技术还可通过 Super Resolution超分辨率技术,进一步降低实际渲染画面时显卡的压力,比如显卡在输出4K分辨率的游戏画面的时候,便可使用原生渲染方式,先渲染一幅1080P分辨率的画面,再由 Super Resolution超分辨率技术将其提升至4K分辨率,然后再由多帧生成技术,最多生成出3个额外的帧。
因此,由GPU实际渲染的工作量仅为输出画面的1/16,而其余的15/16均由AI进行生成,进而大幅降低了高分辨率、高帧率游戏下,显卡的压力。
▲我们来看NVIDIA官方给的RTX 5090在不同版本DLSS下的游戏帧率表现,在4K分辨率下,未开启DLSS时,游戏帧率为27 FPS,PC延迟为71ms,而在开启DLSS 2、DLSS 3.5、DLSS 4后,游戏帧率分别为71 FPS、140 FPS、248 FPS,且延迟均为34 ms左右。
同时,DLSS 4所渲染出的画面,相较于前代DLSS甚至相较于原生渲染时,其细节都有明显的提升,大家可以注意外卖盒子上的褶皱,DLSS 4所渲染的画面明显细节更加丰富。
因此,我们可以得出结论,在4K分辨率,最高光线追踪画质下,DLSS 4技术能提供高达8倍以上的帧率提升,同时还能使得电脑延迟减半,进而大幅提升玩家的游戏体验。
▲DLSS 4多帧生成技术严重依赖Blackwell架构CPU中的张量运算核心等专有部分,所以其目前为RTX50系独占。DLSS Mutil Frame Generation 潜在多帧生成技术与DLSS Ray Reconstrucion 光线重构技术、DLSS Super Resolution 超分辨率技术与Deep Learning Anti-Aliasing 深度学习抗锯齿技术共同构建了DLSS 4。
▲除了潜在多帧生成技术之外,NVIDIA 还在DLSS 4中将之前的CNN Model改为了更为先进的Transformer Model,在使用DLSS 2与DLSS 3上的CNN卷积神经网络是将本地像素数据聚合在一起,并以一个树形结构进行分组分析,其计算效率已经很高,游戏画质提升很明显。
▲而最新使用的Transformer Model中,如何使用与分析数据这件事,将由数据本身进行驱动,神经网络上将会集中注意力在更有趣的数据特点上,从而做出更好的决策。DLSS 4正式引入了Transformer Model,NVIDIA增加了模型的大小,在更大的数据集上进行训练,并且记住在训练期间的更多案例,因此,DLSS 4的计算效率高的令人难以置信。
▲Transformer Model其能够参考2倍的参数,并提供4倍的计算量,进而提供更为令人惊讶的画面质量,尤其在光线重构与超分辨率技术的提升尤为明显。
▲比如在照明环境很差的场景中,Transformer Model的光线重构功能在处理网格状栅栏的细节处理的稳定度表现就要优秀,画面明显更加清晰,没有了糊的感觉。
▲而在Transformer Model在超分辨率方面,也证明了其有更好的稳定性,更少的鬼影,更高的运动细节。
▲为了处理非常复杂的多帧生成过程,Blackwell架构的GPU采用了全新的硬件AI Management Processor,它可以将帧同步的逻辑转移到显示引擎上,能使GPU更加精确的管理显示的时序。
得益于全新的Blackwell架构,DLSS 4在部分场景下帧率提升高达八倍,相较于DLSS 3,帧生成到多帧生成的速率也提升了1.7倍。
另外,显卡同时处理语言模型与游戏引擎传入GPU的数据时,可以更高效的分别RT 核心、CUDA 核心、Tensor核心间的工作负载与工作优先级,进而提升显卡的整体效率。
▲在RTX 50系显卡解禁的当天,便会有75款游戏在RTX50发售时即支持DLSS 4,这是一个极其夸张的数字,所以大家完全不用担心买了新显卡,却没有游戏支持DLSS 4。
iGame GeForce RTX 5090 D Advanced 32GB外观与参数
▲说到这里,我们就该正式介绍一下本次测评的iGame GeForce RTX 5090 D Advanced 32GB了,之前已经做过开箱内容,所以本次只是简单介绍一下。
▲七彩虹iGame GeForce RTX 50 系 Advanced 显卡依旧采用经典的三风扇设计, 在设计上,本代产品引入了更多的圆角和曲线元素,环绕着三个风扇的装饰的灵感来之莫比乌斯环。
▲补上之前开箱时想发而不能发的上机灯效图,七彩虹iGame Advanced 显卡一直十分适合竖装,能最大限度的发挥其灯效优势,尤其这代的透光材质,更是让其灯效得到巨幅进步。
▲紧接着,我们正式介绍一下本次测评的iGame GeForce RTX 5090 D Advanced 32GB的详细参数:它共有用21760个CUDA核心,总共拥有2375 AI TOPS的算力,其基础核心频率为2017MHz,按下一键超频按钮后,其频率可飙升至2407MHz,显卡配备了32GB的GDDR7显存,显存位宽高达512bit,显存带宽高达1792GB/s,简而言之,配置十分奢华。
▲从这张图上可以看到,本代iGame GeForce RTX 5090 D Advanced 32GB无论从CUDA数量上,还是显存容量版本上,都是质的飞跃,3E2GB、GDDR7这些强大配置,都堆在了RTX 5090 D这款旗舰显卡上,让人不禁好奇,它到底有多强大。
▲最后再介绍一下本次的测评平台,本次我依旧使用了intel的酷睿Ultra 9 285K进行测试,配合与显卡同品牌的七彩虹iGame Z890 Vulcan X V20主板,七彩虹不仅显卡异常强大,其主板这些年来的进步也十分神速,这款主板的发布会我也去了,它真心是一款十分出色全面的主板,且BIOS功能上也非常完善了,个人起来很放心。
同时,为了保证游戏中,诸如Direct Storage等功能的流畅运行,并保证生产力测试部分内存的充足,本次选择了PCIe 5.0的SSD固态硬盘与32GBx2的大容量内存。
最后,为了保证供电与CPU散热能力的充足,本次选用了1200W的大功率白金全模组电源,与公认强大的360水冷,显示器方面也使用了4K高刷的AOC AGON AG276UX。
这部分我将放在文末进行介绍,首先让我们开始显卡的性能测试。
七彩虹 iGame GeForce RTX 5090 D Advanced 32GB DLSS 4 性能测试
终于到了最激动人心的性能测试的环节,首先自然是对DLSS 4性能测试了,目前能够测试的还基本上是媒体体验版的软件与游戏,支持DLSS 4的正式版游戏需要在显卡测试解禁后更新,所以本次能够测试DLSS 4的游戏不算很多,首先是3DMark的DLSS 4测试。
3DMark DLSS功能测试
在3DMark DLSS 功能测试1.5版本中,已经提供了对NVIDIA DLSS 4技术的支持,其中Frame Generation的2x意味着通过AI额外生成1帧,而3x意味着额外生成2帧,4x意味着额外生成3帧。这里,我将尽可能测试更多的模式,来看一看DLSS 4对帧率的提升有多明显。
首先,在4K分辨率下,开启DLSS 4 性能模式,并选择4倍帧生成,在DLSS 关闭时,七彩虹 iGame GeForce RTX 5090 D Advanced 32GB能够提供75.68 FPS的平均帧率,而在开启DLSS 4后,iGame GeForce RTX 5090 D Advanced 32GB能够提供381.55 FPS的平均帧率,是未开启DLSS时的5倍,当然,这并不是意味着DLSS 4技术通过AI为每个实际渲染帧额外生产了4帧,而是其超分辨率技术降低了显卡的渲染压力,使其有能力实际渲染出更多的帧,再结合AI帧生产技术,二者强强联合,才带来这种帧率5倍的提升。
除此之外,我还分别测试了DLSS 4性能模式 2x,DLSS 4性能模式 3x的帧率,得益于本代Blackwell 架构显卡性能的提升,即使是DLSS 4性能模式 2x,也就是只插入一帧的情况下,RTX 5090 D依旧能够提供233 FPS的平均帧率,基本上也能跑满目前最高端的电竞显示器了。
因此,我有了一个大胆的想法,之前我们使用4K分辨率的时候,都是开启DLSS性能模式,而现在有了1帧能够AI生成3帧的2025年,我们完全可以使用更高的渲染率,比如DLSS 4平衡模式、质量模式、甚至DLAA 深度学习抗锯齿配合帧生成来提供更为优秀的画质。经过我的实测,即使在DLAA 100%原生渲染的情况下,RTX 5090 D配合 4x级别的帧生成,依旧能够提供217 FPS的平均帧率,这么高的帧率,对于不强求时时刻刻跑满4K 240Hz显示器的朋友来说,也非常够用了。
可以说,DLSS 4的多帧生成技术让玩家能够有机会同时享受到更好的画质与更高的帧率,实在是太棒了。
你以为这就结束了?并没有,我还测试了RTX 5090 D在8K分辨率下的表现,在DLSS 4 超级性能模式与 4x帧生成的情况下,iGame GeForce RTX 5090 D Advanced 32GB可以提供217.45 FPS的高帧率,让8K游戏真真正正的走近玩家视野,富哥完全可以买4款4K 240Hz刷新率的QD-OLED显示器,拼接成一块8K 240Hz的超大显示器,把显卡的4个视频输出接口全用上。
《赛博朋克 2077》Benchmark
紧接着我们用实际游戏来体验一下DLSS 4的表现,第一款游戏是《赛博朋克 2077》,这款游戏一直紧跟显示技术最前沿,当时首测RTX 40系显卡的时候,它便是最早支持DLSS 3潜在帧生成技术的游戏之一,而后的DLSS 3.5光线重建它也最早支持,而现在RTX 50系显卡首发,它又当之无愧的成为了最早支持DLSS 4多帧生成技术的游戏大作之一。
在测试中,首先我们按照绝大多数玩家帧率为王的年代,我们以帧率提升最明显的DLSS 4,帧生成4x 模式测试4K分辨率、光线追踪:超速画质,其平均帧率为257 FPS,已经超过了目前高端的4K 240Hz高端电竞显示器的最大刷新率,这一次是显卡显示技术跑过了显示器的刷新率了。
我分别测试了关闭DLSS、DLSS性能模式+帧生成2x、DLSS性能模式+帧生成3x、DLSS性能模式+帧生成4x的表现,即使在DLSS 4性能模式 2x下,FPS依旧有148 FPS, 搭配主流的4K 144Hz显示器轻轻松松。
虽然显卡的平均帧率非常高,但我们还是要把注意力放在游戏的整体流畅度上,也就是我们常提的1% Low FPS,毕竟最复杂的场景,往往也是决定游戏胜负的场景。NVIDIA提出了新的计量方法,被称作1% Low (MsBetweenDisplayChange) ,从上图可以得知,传统的1% Low (MsBetweenPresents) 统计的是CPU向渲染队列中帧数,但实际上,这个帧数据需要经过下渲染队列、GPU渲染、整合等一系列流程的等待,如果此时游戏画面与此帧相差甚远,那么这个帧只能被抛弃,玩家并不能看到这一帧,让CPU白做无用功。
而得益于AMP芯片等Blackwell架构的一系列优化,RTX 50系显卡能够大幅提升从CPU渲染帧到实际输出到屏幕上帧率的达成度,进而大幅提升有意义的1% Low(MsBetweenDisplayChange) 。
这里我做了刚才《赛博朋克 2077》Benchmark 前300帧的生成情况,橙色为实际渲染到屏幕上的每帧之间的间隔,而蓝色则为CPU渲染出每一帧之间的间隔,可以看到,橙色曲线的波动明显比蓝色曲线波动小,而在这次测试中,本电脑 的1% Low (MsBetweenDisplayChange)
为136 FPS,而1% Low (MsBetweenPresents) 却只有 58FPS,因此我们可以得出结论,RTX 50系显卡能够大幅提升实际游玩中的实际1% Low帧,让游戏体验更加丝滑。
另外,我还记录了预设光线追踪:超级画质下,七彩虹 iGame GeForce RTX 5090 D Advanced 32GB在4K原生分辨率、DLSS关闭时与开启DLSS 帧生成4x时的游戏游戏帧率:
原生分辨率、DLSS关闭时,iGame GeForce RTX 5090 D Advanced 32GB可提供33 FPS的平均帧率,属于可以体验剧情的级别,而在开启DLSS 4 帧生成4x时,游戏帧率暴涨至257 FPS,性能提升近8倍。
同时,开启DLSS 4 帧生成4x后,游戏的1% Low FPS也由开启前的25 FPS提升到了136 FPS,提升了近5.5倍。
同时,开启DLSS 4后,游戏的平均PC延迟也由开启前的58ms下降到了37ms,下降了约三分之一。
虽然DLSS技术能够大幅提升游戏帧率,但是一直有玩家纠结开启DLSS,尤其是开启超分辨率技术是否会使得画面变差,至少在RTX 50系,我敢说绝大多数场景下,开启DLSS技术不仅不会使画面变差,甚至还会让画面变得好。为了证明这一点,NVIDIA专门推出了画质比较工具ICAT,不仅能够比较图片的画质,甚至能够同时加载两段游戏录屏进行直接比较,上面是NVIDIA官方给的测试场景,我有样学样,在多次Benchmark中,分别测试了开启DLSS前后的游戏视频,以及使用传统CNN Model与使用Transformer Model时的游戏视频,我们来比较一下画面的差异。
左侧为DLSS开启后的画面,右侧为原生画面,肉眼可见左侧画面明显更锐利清晰。
尤其在细节上,比如这个猴子旗子,左侧的字体与团明显更加锐化可分辨,而右侧原生分辨率下字体已经明显糊了,很难分辨上面写了什么。
同样的,LED灯与其下方的墙砖缝隙,也都是开启DLSS后效果更好,尤其墙砖缝隙,辨别起来明显比原生渲染要好很多。
铁栏杆的处理上,开启DLSS后也比开启前效果好很多,金属光泽更加明显,上方铁丝网的细节处理也更加优秀。
最后,远处楼房的窗户,也在开启DLSS 4后变得更加清晰可辨认,画质更胜一筹。
紧接着,我还比较了全新Transformer Model与之前的CNN Model的画质差异,二者都要比原生渲染好,不过在细节上,还是Transformer Model略胜一筹。
比如依旧是这个墙面,左右两侧的墙砖纹理都清晰可见,不过明显左侧Transformer Model的墙面的漫反射更为充分,把酒吧那种使人沉醉迷离的气氛一下就烘托出来了。
最后我们再来看一下这扇门,因为其上有波纹形的柱状纹理,所以反射光线会非常复杂,但是门上的纹路并不会因为光照而看不清,相信凭借各位的生活常识,应该一下就知道Transformer Model的光线重构功能在处理这种暗光、复杂场景的能力,是明显好于CNN Model的。
尤其我在英伟达的活动现场,肉眼比较两台显示器的画面,DLSS 4所提供的画质完全能够做到真假难辨,甚至青出于蓝,因此,我在这里还是劝各位放心大胆的开启DLSS 功能,体验更顺滑的游戏体验吧。
《霍格沃兹之遗》
《霍格沃兹之遗》可能是《哈利波特》粉丝这些年能玩到还原度最高的游戏了,这款游戏的媒体版本中,也将DLSS 4多帧生成放入了UI中,进度很快。
我依旧测试了DLSS 4性能模式开启前后,各种设置下显卡的表现,其中原生分辨率下游戏帧率为101 FPS,DLSS 4帧生成4x开启后,游戏帧率达到了425,流畅度提升了4倍以上。
同时,1% Low FPS也由78 FPS上升到了239 FPS,提升了3倍左右。
最后,开启DLSS 4后,游戏的平均PC延迟也有一定的下降,总体而言,表现很好。
《龙腾世纪》&《漫威争锋》
将有75款游戏在Day 0便支持DLSS 4技术,当然,对于将DLSS 4的开关集成到游戏的UI中并正确运行还是需要一定时间打磨的,所以NVIDIA直接在其新版的驱动管理软件NVIDIA App中增加了DLSS Overrides开关,玩家可以直接在此软件中开启DLSS 4并调整其各项参数,比如《龙腾世纪》&《漫威争锋》。
在NVIDIA APP中的图形-程序页面,可以找到各款游戏与应用,进行优化,比如开启多倍帧率生成,调整DLSS所使用的模型,甚至如果游戏并不支持DLAA与超级性能模式,也可在NVIDIA APP中强制开启。
首先我们测试一下《龙腾世纪》的帧率表现,原生分辨率下,游戏帧率80 FPS,1% Low FPS为64 FPS,开启DLSS 4 帧生成4x后,游戏帧率上升到了335 FPS,1% Low 帧也达到了247 FPS,因此,如果使用4K 240Hz显示器的朋友,完全可以开启垂直同步与帧率锁定,达到最流畅的240 FPS游戏体验。
同时原生分辨率与开启DLSS 4 帧生成4x时,游戏的平均PC延迟都为31ms,因此我们可得知DLSS并不会导致游戏的延迟。
因为NVIDIA APP能够强制开启超级性能模式,我这里便强制开启了,然后比较了CNN Model与Transformer Model下的画质差异,可见Transformer Model的画面明显细节更明显,右上角雨布的材质渲染差异尤为明显。
《漫威争锋》同样可在NVIDIA APP中开启DLSS 4多帧生成,我在训练场环境下同样测试了开启DLSS 4前后的游戏帧率表现。
七彩虹 iGame GeForce RTX 5090 D Advanced 32GB在原生分辨率下可提供110 FPS的帧率表现,其1% Low FPS为82 FPS,而开启DLSS 4 4x帧生成后,游戏帧率达到了438 FPS,1% Low FPS也高达193 FPS,对于电竞网游来说很高了。
同时,开启DLSS前后,游戏的平均PC延迟变化不大,仅由20ms上升到了23ms。
至此,我们可以得出一个结论,DLSS 4能够大幅提升游戏帧率,且其性能的大幅提升还能让我们考虑开启DLAA或者DLSS 画质模式下畅玩3A大作,且多帧生成并不会对电脑游戏延迟造成明显负面影响,哪怕是电竞玩家也可以安心开启。
七彩虹 iGame GeForce RTX 5090 D Advanced 32GB 常规游戏性能测试
聊完了DLSS 4,我们再拿暂不支持DLSS 4的软件与游戏,测试一下七彩虹 iGame GeForce RTX 5090 D Advanced 32GB这款显卡,当然,其中很多游戏在不久的将来就会支持DLSS 4了,只是目前我们只用其正式版本中支持最高的DLSS版本来测。
3DMark Time Spy & Time Spy Extreme
3D MARK Time Spy是一个DirectX 12 基准测试,支持原生新的API 功能,如异步计算,显式多显卡适配器技术和多线程,而其Extreme版本则是将分辨率提升至4K。
▲本电脑的3D MARK Time Spy得分为38149分,其中显卡得分45810分。
▲而在4K分辨率的3D MARK Time Spy Extreme中,本电脑得分22669分,其中显卡得分25341分。
▲因为与前代显卡的测试平台有大幅变化,所以本次只做显卡得分的比较,可以看到七彩虹 iGame GeForce RTX 5090 D Advanced 32GB的3D MARK Time Spy Extreme显卡得分是RTX 4090的1.26倍。
3D Mark Fire Strike & 3D Mark Fire Strike Ultra
▲本电脑的3D MARK Fire Strike得分为46767分,其中显卡得分63863分。
▲而在4K分辨率的3D MARK Fire Strike Ultra中,本电脑得分30347分,其中显卡得分32046分。
▲七彩虹 iGame GeForce RTX 5090 D Advanced 32GB 的3D MARK Fire Strike Ultra显卡得分是RTX 4090的1.25倍。
3D MARK Steel Nomad & Speed Way
▲而在3D Mark专为测试显卡性能而提供的Steel Nomad 与 Speed Way测试中,七彩虹 iGame GeForce RTX 5090 D Advanced 32GB得分分别为14172与14410,显卡测试帧率均在140 FPS左右。
《黑神话:悟空》 Benchmark
▲其余游戏可以合在一起做一张图,不过作为国产游戏之光,《黑神话:悟空》必须单独拿出来说,在4K影视级画质+超高光追的情况下,七彩虹 iGame GeForce RTX 5090 D Advanced 32GB在DLSS 3 性能模式下可提供133 FPS的平均帧率。而且这款游戏很快便会支持DLSS 4技术,我在NVIDIA的活动现场已经抢鲜体验过了,表现实在是太优秀了。
其余游戏帧率表现
▲我还另外测试了其余8款游戏,均为4K最高画质,支持DLSS的话则使用最新版本DLSS性能模式,可见绝大多数游戏都能提供240 FPS以上的帧率,即使是对显卡压力极大又不支持DLSS 帧生成的《地铁:离去》加强版也有134 FPS的帧率,可以说,拥有七彩虹 iGame GeForce RTX 5090 D Advanced 32GB,基本可以畅玩市面上所有的3A大作了。
七彩虹 iGame GeForce RTX 5090 D Advanced 32GB AI与生产力测试
Al lmage Generation Benchmark
首先,我们进行AIGC性能测试,使用的是Procyon的Al lmage Generation Demo for NVIDlA,模型为Flux1DEV_ONNX。
▲在使用FP8数据结构时,七彩虹 iGame GeForce RTX 5090 D Advanced 32GB生成单个图片所需时间为6.617s,而使用FP4数据结构时,所需时间为3.931s,用时下降了40%。
▲同时,在测试的过程中,如果我们打开资源管理器,可以看到使用FP8数据结构时,显卡的显存占用高达26.4GB,如此大的占用,即使是RTX 4090 D都无法胜任,而使用了FP4数据结构时,显存占用了下降到了21.7 GB,显存占用量下降了约18%。
因此,Blackwell架构的显卡使用FP4数据结构,会极大增强电脑的整体AI运算效率。
AI Text Generation Benchmark
▲而在AI Text Generation Benchmark中,七彩虹 iGame GeForce RTX 5090 D Advanced 32GB在PHI 3.5、MISTRAL 7B、LLAMA 3.1、LLAMA 2这4个大语言模型下的得分分别为5590、6070、6378、6471,因为这个Benchmark太新了,我手头没有任何的对照数据,所以这里只能罗列数据,未来有更多的显卡测试得分后再与各位分享。
Blender Benchmark
Blender是一款开源 3D 创建套件。它支持3D 建模、动画、视频编辑等诸多功能,同时支持NVIDIA RTX 渲染OptiX AI 降噪,而Blender Open Data Benchmark将进行monster、junkshop、classroom三个场景的渲染测试。
▲七彩虹 iGame GeForce RTX 5090 D Advanced 32GB在monster、junkshop、classroom三个场景得分分别为7291,3861,3609分。
▲同样的,我放上RTX 3090 Ti、RTX 4090的测试得分做对比,可见七彩虹 iGame GeForce RTX 5090 D Advanced 32GB渲染能力大概是RTX 4090的140%左右,提升还是很明显的。
V-Ray 6 Benchmark
▲最后我们测试了七彩虹 iGame GeForce RTX 5090 D Advanced 32GB的V-Ray 6 GPU RTX得分为15143分,之前测试RTX 4090的时候使用的还是V-Ray 5 Benchmark,二者得分不相同,这里只能给一个参考:RTX 4080 SUPER的V-Ray 6 GPU RTX得分为7142分,本次把这个得分放在这里,等后续测试其他显卡的时候,我们再来详细建立参考系。
iGame Center功能简介
文末这里简单介绍一下全新的iGame Center软件,它不仅可以调整硬件灯效,快捷的进行硬件超频,还可以为Vulcan系列显卡(包括之前几代Vulcan火神显卡)的LCD屏定制输出图案,且不只是静态图片,gif动图同样可以完美显示。
总结
好了,以上便是本次测评的全部内容了,总结一下,NVIDIA GeForce RTX 5090 D 是目前最强高端的游戏显卡,在DLSS 4与神经网络渲染的加持下,可以轻松跑满4K 240Hz的显示器,甚至可以尝试开8K分辨率进行游玩。
同时,NVIDIA 首次将32GB大容量GDDR7显存装备到 Geforce 系列显卡中,在配合RTX 5090 D强大的AI运算能力,无论创作AIGC内存还是训练大语言模型,再或者用于渲染视频、动画,它都可以说是游刃有余。
七彩虹作为显卡销量第一的品牌,在性能,设计,做工上一直在精益求精。本次测试的七彩虹 iGame GeForce RTX 5090 D Advanced 32GB 是iGame系列的次旗舰,做工用料上都十分考究优秀,尤其是本次的半透明设计,更是十分出彩,个人非常喜欢,目前已经有搞一个竖装机箱,将其放在桌面上炫耀的想法了。
七彩虹全系列iGame GeForce RTX 5090 D 将于1月30日在各大电商平台预售,同日我也会为大家带来RTX 5080显卡的首发测评,关注我,获取第一时间的更新。另外,别走开,我们一起来看一看本次测评所使用的其它硬件。
本次测试其它硬件简介
CPU+主板:intel 酷睿 Ultra9 285K+七彩虹 iGame Z890 Vulcan X V20
▲本次测试,我决定使用intel 酷睿 Ultra9 285K来进行测试,这款U的性能我就不过多提及了,目前仍是intel的旗舰CPU。而且毕竟估计这次测试,使用AMD平台的人会比较多,Intel平台的性能表现反而更具有参考性,为此,我选择了同样是七彩虹高端电竞子品牌的旗舰主板七彩虹 iGame Z890 Vulcan X V20,这是七彩虹的iGame Vulcan主板的诚意力作,为了让这款主板能够尽善尽美,七彩虹甚至在Z790主板的技术末期,专门出了一款与此主板外观一致的 iGame Z790 Vulcan为这款主板“打样”,可见其对这款主板有多么上心。
▲这款主板采用了20+1+1+1相供电,105A旗舰级DrMOS、片式聚合电容与服务器级8层低损耗板材,电气性能极为优秀,可以为intel 酷睿 Ultra9 285K提供充足而稳定的供电。
▲同时,这款火神主板主板搭载了PCIe 5.0x16显卡接口与PCIe 5.0x4 SSD固态硬盘接口,完全能够释放出高端硬件的潜力。
▲最后,包括USB 4、WiFi 7、5G有线网口等高端主流接口在这款主板上也都有实装,可以说从内到外,扩展性极强。
最后,有句话叫做士别三日,当刮目相看,七彩虹主板的BIOS在这几年的励精图治后,主要功能已经与御三家的相差不大,完全值得正视了,这里我必须要手动给七彩虹的BIOS团队点赞。
内存:宏碁掠夺者 Hera 影锋 6000 32GBx2
▲本次测试包含一定的生产力部分与AI部分测试,系统内存最小需要64GB,因此,我选择了宏碁掠夺者 Hera 影锋 6000 32GBx2,它采用特挑SK海力士A-Die颗粒,双面结构,每面16GB内存颗粒。
▲作为生产力工具使用,最重要的是稳定性,尤其是内存双面都有颗粒的时候,散热压力会大幅加大,为此,宏碁掠夺者 Hera 影锋采用了霜镜散热装甲,单侧装甲厚度达2mm,X型设计大幅强化气流传导,使得内存拥有强劲的散热性能,保障其能够持久、稳定运行。
▲而在灯效方面,宏碁掠夺者 Hera 影锋配备了缀影RGB模组,拥有8个独立灯光区域,支持1680万色ARGB,灯效明亮,颜色过渡自然,放在机箱中绝对是画龙点睛版的点缀。
SSD: 佰维X570 Pro 2TB PCIe 5.0 SSD
固态硬盘方面选择了国产大厂佰维全新推出的X570 Pro 2TB,手头刚好也要测这个SSD的测评,这次就拿来用了,它选用了全新一代6nm制程主控,温度控制能力强劲,其采用了DRAM独立缓存芯片设计+SLC模拟缓存技术,性能表现十分优秀。
官方标称其顺序读取14000 MB/s,顺序写入13000MB/s,我在AMD X870主板上已经实测全部达标,可以说它跑满了PCIe 5.0x4的总带宽,是一款教科书级别的PCIe 5.0 SSD。
另外,佰维还开发了集性能测试、固件升级、系统迁移等多个常用功能于一体的SSD管理软件,这点是国产品牌很少想到去做的,佰维绝对是走在最前沿的国产存储品牌,这点还是要手动点赞的。
电源:安耐美 PX1200W白金全模组电源
▲安耐美 PX1200W白金全模组电源采用了其家族统一的黑色磨砂外观,其上用白色的粗大字体印刷了品牌和型号,辨识度极强,而且它是一款获得了80 PLUS白金认证的旗舰级电源,能效表现极为优秀。
▲安耐美 PX1200W电源的供电接口丰富充足,拥有235%的瞬时峰值功率,高于ATX 3 Intel电源标准200%的要求,同时拥有原生的12V-2x6接口,可以为本次测评的RTX 5090 D与RTX 4090 D等上代旗舰显卡提供充足、稳定的供电。
▲另外,我之前拆解过同系列的安耐美 PX1000W,其内部布局工整,做工精细,规规矩矩。空间利用非常高效,整体布局并不拥挤,为不同元器件提供了充足的散热空间。通过拆解可以看到电源与宣称的一样,采用主动式PFC+全桥LLC以及同步整流+DC-DC的高端主流方案,电源内部也预留了足够的散热空间,这次要测新显卡,就不拆了。
▲从电源铭牌处可以确认,安耐美 PX1200W电源符合ATX 3.1规范,可12V输出最大电流100A(1200W),可以满足高端CPU与旗舰显卡的供电需求。
▲这款电源还配备了135mm的双滚珠风扇,不仅支持智能启停,更拥有逆转弹尘功能,可以反向出风,吹出电源内部灰尘,提升电源的散热效果与使用寿命,使其更为经久耐用。
最后,这款电源使用了全日系电容,10年质保,买来放心,用着安心。
本文来自:什么值得买