大家好,非常荣幸能够在英伟达与七彩虹的联合邀请下继续为大家带来RTX 5070显卡的首发测评。
上一张测过的RTX 5070 Ti虽然官方定位仍为2K卡,不过实际测试中,它在4K分辨率最高画质下依旧能够提供很高的帧率,因此,本次测试的七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB显卡便当仁不让的成为了全新一代2K卡皇。
今天就让我们一起来看一看,在DLSS4 多重帧生成技术的加持下,全新RTX 5070显卡的2K游戏表现到底有多强。那么废话不再多说,我们开车吧。
七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB显卡 外观与参数
▲七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB显卡采用了嘻哈风格设计,给人眼前一亮的感觉,上图左边为RTX 50系的iGame Ultra显卡,右侧为RTX 40系的iGame Ultra显卡,你喜欢哪款呢?
▲七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB显卡可以说是将嘻哈进行到底,不止以放纵不羁的字体喷涂了Ultra字样,其下方更是有一个超大的ARGB灯板,单就灯效而言,本代iGame Ultra显卡可以说是进步巨大。
▲直接放点亮的照片,类似霓虹灯的ARGB灯条贯穿显卡侧面,呈现出涂鸦艺术极强的视觉冲击以及字体设计的美感,使之成为独特的显卡风景。
▲透过iGame Center软件,不仅能够调整七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB显卡的灯效,还可以设置快捷的进行包括显卡在内的硬件超频,十分的方便。
▲另外,iGame系列大名鼎鼎的一键超频按键在七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB显卡上得到了延续,可以一键将显卡的核心频率由2325 MHz提升到2557 MHz,而在接口方面,七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB显卡则是中规中矩的3*DP 2.1b + 1*HDMI 2.1b接口的配置,使用DP接口时可以获得满血的4K 240Hz视频输出信号。
▲这款显卡的详细参数在这里,大家可以自行查看,我就不做复述了。
RTX 50系显卡优势分析
▲除了众所周知的独享DLSS 4多种帧生产功能与支持FP4数据结构之外,BlackWell架构的NVIDIA GeForce RTX 50系显卡还有诸多架构性的优势,在正式进行显卡测试前,我还是简单回顾下RTX 50系显卡的优势。
▲首先,BlackWell架构显卡的CUDA核心既可以运算FP32数据类型,又可以运算INT 32数据类型,这意味着相较于Ada架构,Blackwell架构的INT32运算能力得到了翻倍增强。
▲其次,NVIDIA改进了SM中的着色器渲染管道,将不同的渲染类型分配给Tensor 核心与Shader 核心,以便进一步提升着色器与张量核心的运算效率,NVIDIA将其称作RTX Neural Shaders(神经网络着色器),得益于此,Blackwell架构的着色器渲染效率是Ada架构的两倍
总的来说,Ada架构的SM是为标准着色器进行设计与优化的,而Blackwell架构的SM则是为了神经着色器而设计和优化的。
▲再次,BlackWell架构的NVIDIA GeForce RTX50系显卡搭载了GDDR7显存,使得显存传输速率大幅提升,显卡的游戏性能与AI性能也随之大幅提升,另外,其显存发热则大幅降低,让机箱散热压力得到了缓解。
BlackWell架构显卡还有很多提升,这里就不多说了,我们进入显卡的性能测试环节。
测试平台简介
▲本次测试,我搭建了一个比较纯血的七彩虹iGame全家桶,其中机箱、电源、水冷三件套均为iGame全家桶,主板与CPU则是七彩虹iGame Z890 Flow V20与intel 酷睿U9 285K,并搭配了32GBx2 DDR5 6000MHz的内存。
▲而作为对照组,我使用的是RTX 4070 SUPER显卡,从上面参数可以看到,RTX 4070 SUPER相较于RTX 4070有着巨幅的参数提升,CUDA数量直逼RTX 4070 Ti,一会我们就一起来看一看,本代RTX 5070显卡,与上代RTX 4070 SUPER显卡相比,能有多大的性能提升。
DLSS 4 让帧率起飞
▲得益于Blackwell架构GPU专有张量运算核心等专有部分,RTX 50系显卡才能独占
DLSS Mutil Frame Generation 潜在多帧生成技术,它与DLSS Ray Reconstrucion 光线重构技术、DLSS Super Resolution 超分辨率技术与Deep Learning Anti-Aliasing 深度学习抗锯齿技术共同构建了DLSS 4。
▲同时,DLSS技术还可通过 Super Resolution超分辨率技术,进一步降低实际渲染画面时显卡的压力,比如显卡在输出4K分辨率的游戏画面的时候,便可使用原生渲染方式,先渲染一幅1080P分辨率的画面,再由 Super Resolution超分辨率技术将其提升至4K分辨率,然后再由多帧生成技术,最多生成出3个额外的帧。
▲因此,由GPU实际渲染的工作量仅为输出画面的1/16,而其余的15/16均由AI进行生成,进而大幅降低了高分辨率、高帧率游戏下,显卡的压力。
▲为了处理非常复杂的多帧生成过程,Blackwell架构的GPU采用了全新的硬件AI Management Processor,它可以将帧同步的逻辑转移到显示引擎上,能使GPU更加精确的管理显示的时序。
得益于全新的Blackwell架构,DLSS 4在部分场景下帧率提升高达八倍,相较于DLSS 3,帧生成到多帧生成的速率也提升了1.7倍。
另外,显卡同时处理语言模型与游戏引擎传入GPU的数据时,可以更高效的分别RT 核心、CUDA 核心、Tensor核心间的工作负载与工作优先级,进而提升显卡的整体效率。
▲除了潜在多帧生成技术之外,NVIDIA 还在DLSS 4中将之前的CNN Model改为了更为先进的Transformer Model,在使用DLSS 2与DLSS 3上的CNN卷积神经网络是将本地像素数据聚合在一起,并以一个树形结构进行分组分析,其计算效率已经很高,游戏画质提升很明显。
3DMark DLSS功能测试
技术介绍完成了,紧接着我们便开始进行性能实测吧,首先自然是3DMark的 DLSS功能测试。
▲在3DMark DLSS 功能测试1.5版本中,已经提供了对NVIDIA DLSS 4技术的支持,其中Frame Generation的2x意味着通过AI额外生成1帧,而3x意味着额外生成2帧,4x意味着额外生成3帧。这里,我将尽可能测试更多的模式,来看一看DLSS 4对帧率的提升有多明显。
▲在2K分辨率下,未开启DLSS时,七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB的帧率为66 FPS,是对照组RTX 4070 SUPER帧率60 FPS的110%。而在开启DLSS 4技术后,帧生成2X、3X、4X下,游戏帧率分别上升到了159 FPS、220 FPS、271 FPS,DLSS 4 帧生成4X下的帧率是未开启DLSS时的410%,是RTX 4070 SUPER开启DLSS 3后帧率121 FPS的224%。
《赛博朋克 2077》Benchmark
▲紧接着我们用实际游戏来体验一下DLSS 4的表现,第一款游戏是《赛博朋克 2077》,这款游戏一直紧跟显示技术最前沿,当时首测RTX 40系显卡的时候,它便是最早支持DLSS 3潜在帧生成技术的游戏之一,而后的DLSS 3.5光线重建它也最早支持,而现在RTX 50系显卡首发,它又当之无愧的成为了最早支持DLSS 4多帧生成技术的游戏大作之一,目前,正式版本的《赛博朋克 2077》已经可以选择DLSS 4的各项功能了。
▲我这里分别测试了七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB显卡在不同DLSS帧生成下的表现,且与RTX 4070 SUPER开启DLSS 3时的帧率进行比较。
可以看到,在2K分辨率,光线追踪:超速画质下,七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB开启DLSS 4帧生成4X的时候,帧率高达176,近乎RTX 4070 SUPER所能提供帧率(99 FPS)的1.8倍。
▲另外,我还比较了DLSS开启前后的游戏画质:左侧为DLSS开启后的画面,右侧为原生画面,肉眼可见左侧画面明显更锐利清晰。
▲尤其在细节上,比如这个猴子旗子,左侧的字体与团明显更加锐化可分辨,而右侧原生分辨率下字体已经明显糊了,很难分辨上面写了什么。
▲同样的,LED灯与其下方的墙砖缝隙,也都是开启DLSS后效果更好,尤其墙砖缝隙,辨别起来明显比原生渲染要好很多。
▲紧接着,因为《赛博朋克2077》的Benchmark可以切换Transformer Model与之前的CNN Model,所以我还做了二者的画质比较。
▲首先,二者的画质都比原生分辨率好,不过在细节上,还是Transformer Model略胜一筹。
▲比如依旧是这个墙面,左右两侧的墙砖纹理都清晰可见,不过明显左侧Transformer Model的墙面的漫反射更为充分,把酒吧那种使人沉醉迷离的气氛一下就烘托出来了。
▲还有这扇门,因为其上有波纹形的柱状纹理,所以反射光线会非常复杂,但是门上的纹路并不会因为光照而看不清,相信凭借各位的生活常识,应该一下就知道Transformer Model的光线重构功能在处理这种暗光、复杂场景的能力,是明显好于CNN Model的。
《霍格沃兹之遗》
▲《霍格沃兹之遗》可能是《哈利波特》粉丝这些年能玩到还原度最高的游戏了,这款游戏也进行了更新,正式版也已经支持DLSS 4多帧生成技术了。
▲在2K分辨率下,七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB显卡在仅开启DLSS 4而不开启帧生成时,游戏帧率为46 FPS,开启DLSS 4 帧生成4x后,游戏帧率上升到了146 FPS,此时游戏帧率是RTX 4070 SUPER开启DLSS 3后的1.8倍。
▲而在对游戏流畅度同样很重要的1% Low FPS中,七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB在开启DLSS 4帧生成2K下可的1% Low FPS为109帧,远超RTX 4070 SUPER开启DLSS 3后的68帧。
《漫威争锋》
▲《漫威争锋》在最新的更新中,也已经将DLSS 4的帧生成选项集成到了游戏UI中,我们无需再使用NVIDIA APP进行设置了。
▲七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB显卡在《漫威争锋》2K分辨率下,帧生成关闭时游戏帧率121 FPS,1% Low FPS为92 FPS,开启DLSS 4 帧生成4x后,游戏帧率上升到了305 FPS,1% Low 帧也达到了191 FPS,游戏的流畅度提升了近3倍。而RTX 4070 SUPER的帧率为181 FPS,RTX 5070 Ti 的表现约为RTX 4070 SUPER的1.7倍。
▲2款显卡在系统延迟方面表现都非常优秀,应该是NVIDIA Reflex技术的功劳。
《永劫无间》
▲网易旗下的武侠工作类吃鸡游戏《永劫无间》目前也支持了DLSS 4与光线追踪,而且就在前几次更新中,也将DLSS4选项集成到了游戏菜单中。
▲在2K分辨率下,七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB显卡在仅开启DLSS 4而不开启帧生成时,游戏的帧率为200 FPS,1% Low为170 FPS,而在开启DLSS 4 帧生成4x后,游戏帧率上升到了330 FPS,1% Low 帧也达到了263 FPS,游戏的流畅度提升了近1.65倍,对竞技游戏更重要的1% Low帧更是提升了1.55倍。此时游戏帧率约为RTX 4070 SUPER的1.35倍。
▲两张显卡的系统延迟方面都表现很好,iGame GeForce RTX 5070 Ultra W OC 12GB在DLSS 4 帧生成4x的情况下也仅有25ms!
《暗黑破坏神4》
▲最后一款测试的DLSS 4游戏为《暗黑破坏神4》,目前,我们还是需要在NVIDIA APP中调整帧生成数量。游戏测试环境为2K分辨率,最高画质+光线追踪极致,玩家角色在圣光大教堂的台阶上来回跑动。
▲在2K分辨率下,iGame GeForce RTX 5070 Ultra W OC 12GB在仅开启DLSS 4而不开启帧生成时,游戏的帧率为59 FPS,1% Low为53 FPS,而在开启DLSS 4 帧生成4x后,游戏帧率上升到了268 FPS,1% Low 帧也达到了180 FPS,游戏的流畅度提升了近5倍。此时游戏帧率约为RTX 4070 SUPER的1.7倍。
▲游戏系统延迟方面差别不大,两款显卡的延迟均在30ms左右,表现很好,本次测试无论是DLSS 4的帧率提升,还是游戏的延迟降低,相较之前RTX 5070 Ti首测时都有明显的优化,可见DLSS 4对游戏性能的提升,会随着NVIDIA 显卡的驱动得到持续优化。
七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB常规游戏性能测试
虽然目前支持DLSS 4的游戏越来越多,不过受限于时间与经费的关系,我仅测试了5款DLSS 4的游戏。因此,我们还是要来测试一下3DMark的基准测试,以及其他的游戏。
3D Mark Time Spy
3D MARK Time Spy是一个DirectX 12 基准测试,支持原生新的API 功能,如异步计算,显式多显卡适配器技术和多线程,其测试分辨率为2K。
▲本电脑搭载七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB时的3D MARK Time Spy得分为22333分,其中显卡得分22634分。
▲而RTX 4070 SUPER的3D MARK Time Spy显卡得分为22634分,RTX 5070 得分是RTX 4070 SUPER的110%。
3D Mark Fire Strike & 3D Mark Fire Strike Extreme
3D MARK Fire Strike则是DirectX 11的 基准测试,标准版本分辨率为1080P,而其Extreme版本则是将分辨率提升至2K。
▲本电脑搭载七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB时的3D Mark Fire Strike得分为41256分,其中显卡得分50080分。
▲而RTX 4070 SUPER的3D MARK Fire Strike显卡得分为49435分,RTX 5070 略高于RTX 4070 SUPER的得分。
▲而在2K分辨率的3D MARK Fire Strike Extreme中,本电脑搭载七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB总得分为26765分,其中显卡得分29063分。
▲而RTX 4070 SUPER的3D MARK Fire Strike Extreme显卡得分为24792分,RTX 5070 得分是RTX 4070 SUPER的117%。
可见,分辨率越高,RTX 5070相较于RTX 4070 SUPER的优势越明显。
3D Mark Steel Nomad & Speed Way
3D Mark专为测试显卡性能而提供的Steel Nomad 与 Speed Way测试,这两个测试都会尽量排除其他硬件的影响,将所以测试都集中在显卡上,所以也只会给出一个显卡分数。
▲在3D Mark Steel Nomad测试中,七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB得分5041,是RTX 4070 SUPER得分4563的110%。
▲而在3D Mark Speed Way测试中,七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB得分5960,是RTX 4070 SUPER得分5197的115%。
其余游戏帧率表现
▲我还另外测试了其余6款游戏,均为2K最高画质,DLSS质量模式,可见在所有游戏中,RTX 5070 相较RTX 4070 SUPER都有不同幅度的领先,尤其在《黑神话:悟空》与《光明记忆:无限》中,RTX 5070的优势更为明显。
七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB AI与生产力测试
Al lmage Generation Benchmark
▲为了测试FP4数据类型对AIGC性能的提升,使用的是Procyon的Al lmage Generation Demo for NVIDlA进行测试,模型为Flux1DEV_ONNX,这里需要注意的是,此测试要求使用NVIDIA RTX GPU,且显存容量最低为16GB,而无论是RTX 5070,还是RTX 4070 SUPER,搭载的都是12GB显存。
▲不出意料,以FP8数据结构进行测试时,会出现Workload error,换句话说,就是爆显存了。
▲而得益于全新的第五代Tensor核心,Blackwell架构显卡可以处理FP4数据类型,FP4 提供了一种较低的量化方法,类似于文件压缩,该方法能够显著减小模型大小,让AI运算对显存的要求更低,效率自然也大幅提升。
▲因此,在使用FP4数据结构时,七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB顺利的完成了测试,而RTX 4070 SUPER并不支持FP4数据结构,这里就不测试了。
可见,对FP4数据结构的支持,让Blackwell架构的RTX 50系显卡,在应对大体积模型时的表现要明显好于RTX 40系及再之前的显卡。
AI Text Generation Benchmark
▲而在AI Text Generation Benchmark中,七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB在PHI 3.5、MISTRAL 7B、LLAMA 3.1、LLAMA 2这4个大语言模型下的得分分别为3934、3943、3517、3232分。
▲我这里对全部RTX 50系显卡以及测试过的RTX 40系显卡的得分进行了整理,做了这个表格,可以看到,七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB不仅在部分模型得分明显高于RTX 4070 SUPER(LLAMA 2尤其明显,性能甚至翻倍),甚至在部分项目上,要比上代的RTX 4070 Ti SUPER得分更高,可见NVIDIA在BlackWell架构上,对显卡AI性能有着明显的加强。
Blender Benchmark
▲Blender是一款开源 3D 创建套件。它支持3D 建模、动画、视频编辑等诸多功能,同时支持NVIDIA RTX 渲染OptiX AI 降噪,而Blender Open Data Benchmark将进行monster、junkshop、classroom三个场景的渲染测试,目前测过的各款显卡数据如上图。
V-Ray 6 Benchmark
▲最后我们测试了七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB的V-Ray 6 GPU RTX得分为6628分,这里我们依旧与其余几张显卡的得分进行比较,可见其性能甚至超过了上代的RTX 4070 Ti SUPER,BlackWell显卡的生产力提升很大。
总结
好了,以上便是本次测评的全部内容了,总结一下,RTX 5070在仅开启DLSS 4而不开启多重帧生成时,游戏性能略高于上代RTX 4070 SUPER显卡,而在开启DLSS 4多重帧生成4X后,游戏帧率可以提升到RTX 4070 SUPER的约1.7倍,部分电竞网游可以达到2K 300FPS以上的帧率,是电竞玩家的绝配。
同时,在支持FP4数据类型后,配合RTX 5070虽然显存容量为12GB,不过依旧可以运行很多大模型,这点在以往显卡中是做不到的。另外,RTX 5070显卡搭载的GDDR7显存要比RTX 4070 SUPER搭载的GDDR6X显存能效比高很多,大家无需担心显存发热,机箱内的散热压力得到了明显的释放。
七彩虹作为显卡销量第一的品牌,在性能,设计,做工上一直在精益求精。本次测试的七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB作为iGame系列中价格最亲民的产品,设计上可以说是十分年轻化,灯效表现更是远超前代,同时七彩虹还提供了包括主板、机箱、电源、水冷、内存在内的七彩虹iGame Ultra全家桶,我个人是非常喜欢这种全家桶的,有兴趣的玩家可以一步到位打造自己的全套iGame桌面生态。
目前,这款显卡将在七彩虹官网商城、京东、天猫、拼多多、抖音等电商平台及全国授权零售经销渠道正式开售,喜欢的朋友可自行选择合适平台进行购买。
iGame GeForce RTX 5070 Ultra W OC 12GB
iGame GeForce RTX 5070 Advanced OC 12GB
iGame GeForce RTX 5070 Vulcan OC 12GB
好了,以上便是本次测试的全部内容,希望对你有所帮助,我是黄昏百分百,我们下次见。
本文来自:什么值得买