大家好,我是黄昏百分百,很荣幸再次获得英伟达与七彩虹的联合邀请,参与到RTX 5070 Ti的首发测评,本次我为大家带来的是七彩虹iGame RTX 5070 Ti Vulcan OC 16GB的首发测评。
相较于RTX 5090 D与RTX 5080而言,RTX 5070 Ti的价格更加亲民。个人觉得,70级显卡在英伟达RTX显卡的产品线里很特别:虽然RTX 5070 Ti显卡在英伟达官方的定位为2K分辨率旗舰卡,不过得益于其强悍的硬件参数,很多玩家也会用70级显卡在4K分辨率下玩游戏并获得不错的帧率表现。
尤其这次的RTX 5070 Ti采用了与Blackwell次旗舰RTX 5080同源的GB-203核心,在显存容量、显存位宽等重要参数上同样保持一致,而价格上则要低很多,可以说是性价比爆棚。今天我们就一起来看一看,在英伟达全新DLSS 4和科技的加持下,RTX 5070 Ti到底能够提供多么让人惊喜的性能表现。那么废话不再多说,我们开车吧。
Blackwell 架构优势分析
首先,我们还是简单介绍一下NVIDIA全新Blackwell架构的设计理念与优势吧。
▲NVIDIA Blackwell架构英伟达专门定制的台积电 4N 工艺制造,晶体管数量从上一代的 760亿个激增至 2080 亿个,是目前世界上工艺最精湛的 GPU 架构。其最重要的设计目的便是优化全新的神经工作任务,其次还有降低内存路径,提高能效等等。因此,我们也将重点介绍英伟达对全新Blackwell架构的显卡是如何强化显卡的神经渲染能力的。
▲从图灵架构开始,英伟达开始采用多单元流处理器 (Streaming Multiprocessor,SM)架构以执行光线追踪等运算工作,然后到安培架构、Ada架构,再到现如今的Blackwell架构,其在从图中可以看出,SM布局基本与上代保持一致,不过在配置与功能上,每一代都有非常明显的进步。
▲而本代SM中最核心的变化,是其内所有的的CUDA核心既可以运算FP32数据类型,又可以运算INT 32数据类型,这意味着相较于Ada架构,Blackwell架构的INT32运算能力得到了翻倍增强,当然,每一个时钟期间,一个CUDA只能运算一种数据类型。
另外,第四代光追核心取代了之前的第三代光追核心,拥有4纹理核心,256KB注册文件空间,128KB L1共享内存的第五代Tensor核心也取代了第四代Tensor核心。
NVIDIA还改进了SM中的着色器渲染管道,将不同的渲染类型分配给Tensor 核心与Shader 核心,以便进一步提升着色器与张量核心的运算效率,NVIDIA将其称作RTX Neural Shaders(神经网络着色器),得益于此,Blackwell架构的着色器渲染效率是Ada架构的两倍
总的来说,Ada架构的SM是为标准着色器进行设计与优化的,而Blackwell架构的SM则是为了神经着色器而设计和优化的。
▲每两个SM组成一个纹理处理集群(Texture Processing Clusters,TPCs),再由多个TPC组成一个图形处理集群(Graphics Processing Clusters,GPCs)。
▲而Blackwell架构的GPU则是由多个GPC组成的,简而言之,完整的GB203已经用到了GeForce RTX 5080上,而GeForce RTX 5070 Ti则使用了GB203-200-A1芯片,共包含456亿个晶体管,6个GPC,35个TPC,70个SM,8960个CUDA Core,70个第四代RT Core,280个第五代Tensor Core,280个纹理单元和96个光栅操作单元ROP,共可提供1406 AI TOPS的算力。
▲除了GPU之外,显存也是影响一款显卡性能强大与否的重要因素,NVIDIA在显存方面的不懈努力也肉眼可见,在安培架构RTX 3090首发的时候,NVIDIA便首次使用了采用PAM4 信号传输(4 个级别,每个周期提供 2 位)的GDDR6X显存,使得显存传输速率大幅提升,显卡的游戏性能与AI性能也随之大幅提升。而本次Blackwell架构显卡中,NVIDIA则首次使用了GDDR7显存,其采用了PAM3 信号传输(3 个级别,每个周期提供 1.5 位),在内存速率与能效表现上得到了进一步提升。
再配合着创新的pin 编码方案,GDDR7 能够实现显著增强的信噪比(SNR),并使得最小I/O通道数量得到了翻倍。而重新设计的时钟架构和增强的 I/O 训练,使GDDR7 显存能够提供更高的带宽,同时还能提升显存的能效比。
▲而本代SM中最核心的变化,是其内所有的的CUDA核心既可以运算FP32数据类型,又可以运算INT 32数据类型,这意味着相较于Ada架构,Blackwell架构的INT32运算能力得到了翻倍增强,当然,每一个时钟期间,一个CUDA只能运算一种数据类型。
另外,第四代光追核心取代了之前的第三代光追核心,拥有4纹理核心,256KB注册文件空间,128KB L1共享内存的第五代Tensor核心也取代了第四代Tensor核心。
NVIDIA还改进了SM中的着色器渲染管道,将不同的渲染类型分配给Tensor 核心与Shader 核心,以便进一步提升着色器与张量核心的运算效率,NVIDIA将其称作RTX Neural Shaders(神经网络着色器),得益于此,Blackwell架构的着色器渲染效率是Ada架构的两倍。
总的来说,Ada架构的SM是为标准着色器进行设计与优化的,而Blackwell架构的SM则是为了神经着色器而设计和优化的。
▲每两个SM组成一个纹理处理集群(Texture Processing Clusters,TPCs),再由多个TPC组成一个图形处理集群(Graphics Processing Clusters,GPCs)。
▲而Blackwell架构的GPU则是由多个GPC组成的,简而言之,GeForce RTX 5080使用了一颗完整的GB203芯片,共包含456亿个晶体管,7个GPC,42个TPC,84个SM,10752个CUDA Core,84个第四代RT Core,336个第五代Tensor Core,336个纹理单元和112个光栅操作单元ROP。内存子系统包含了10752KB L1缓存,21504KB寄存器文件与64MB L2缓存。
▲除了GPU之外,显存也是影响一款显卡性能强大与否的重要因素,NVIDIA在显存方面的不懈努力也肉眼可见,在安培架构RTX 3090首发的时候,NVIDIA便首次使用了采用PAM4 信号传输(4 个级别,每个周期提供 2 位)的GDDR6X显存,使得显存传输速率大幅提升,显卡的游戏性能与AI性能也随之大幅提升。而本次Blackwell架构显卡中,NVIDIA则首次使用了GDDR7显存,其采用了PAM3 信号传输(3 个级别,每个周期提供 1.5 位),在内存速率与能效表现上得到了进一步提升。
再配合着创新的pin 编码方案,GDDR7 能够实现显著增强的信噪比(SNR),并使得最小I/O通道数量得到了翻倍。而重新设计的时钟架构和增强的 I/O 训练,使GDDR7 显存能够提供更高的带宽,同时还能提升显存的能效比。
七彩虹iGame GeForce RTX 5070 Ti Vulcan OC 16GB 介绍
▲RTX 50系iGame「 VULCAN 」显卡在外观设计上延续了iGame Vulcan显卡犀利的硬核赛博朋克设计风格,并在各个角度进行了优化。
▲首先,火神显卡的散热外甲由金属压铸工艺打造,结构更为坚固,质感也得到了全面提升,旋涡散热器由3个“风镰:风扇与导流型鳍片、豪华热管组成,散热能力更为强大。同时,其外观上也采用了更为激进的锐角三角形元素,让显卡整体外观更为犀利炫酷。
▲iGame Vulcan火神显卡最为著名的LCD智屏“维”,分辨率为800*216,。在RTX 50系上更是新增了旋转机械机构,可支持多角度悬停,在显卡竖装时有着很好的视觉效果。
LCD智屏配合着随显卡送的桌面底座,通过USB线连接至电脑,打造成炫酷的桌面摆件,屏幕上的旋转机械机构更是让显示无死角。
▲配合着全新的iGame Center软件,玩家可以下载诸多经典屏幕素材,也可自行制作gif图片用于智屏显示,可玩性非常强。
既然提到了iGame Center软件,这里就直接把它提前吧,它不仅可以设置显卡智屏内容,还可以调整硬件灯效,设置快捷的进行包括显卡在内的硬件超频,可以说已经十分成熟了。
▲iGame系列大名鼎鼎的一键超频按键在iGame GeForce RTX 5070 Ti Vulcan OC 16GB上得到了延续,可以一键将显卡的核心频率由2295MHz提升到2542 MHz,而在接口方面,七彩虹iGame GeForce RTX 5070 Ti Vulcan OC 16GB则是中规中矩的3*DP 2.1b + 1*HDMI 2.1b接口的配置,使用DP接口时可以获得满血的4K 240Hz视频输出信号。
▲七彩虹iGame GeForce RTX 5070 Ti Vulcan OC 16GB显卡的详细参数在这里,大家可以自行查看,我就不做复述了。
测试平台简介
▲最后再介绍一下本次的测评平台,本次我依旧使用了intel的酷睿Ultra 9 285K进行测试,配合与显卡同品牌的七彩虹iGame Z890 Flow V20主板,七彩虹不仅显卡异常强大,其主板这些年来的进步也十分神速,我参加了这款主板首发测评,它真心是一款十分出色全面的主板,且BIOS功能上也非常完善了,个人起来很放心。
同时,为了保证游戏中,诸如Direct Storage等功能的流畅运行,并保证生产力测试部分内存的充足,本次选择了PCIe 5.0的SSD固态硬盘与32GBx2的大容量内存。
最后,为了保证供电与CPU散热能力的充足,本次选用了1200W的白金全模组电源与公认强大的360水冷,显示器方面也使用了4K高刷的AOC AGON AG276UX。
这部分我将放在文末进行介绍,首先让我们开始显卡的性能测试。
DLSS 4 让帧率起飞
▲紧接着我们直接把DLSS 4提到最前,其最主要的提升便是多帧生成技术,目前每个实际渲染的帧可通过AI生成额外的3帧,大幅提升游戏的流畅度。
▲同时,DLSS技术还可通过 Super Resolution超分辨率技术,进一步降低实际渲染画面时显卡的压力,比如显卡在输出4K分辨率的游戏画面的时候,便可使用原生渲染方式,先渲染一幅1080P分辨率的画面,再由 Super Resolution超分辨率技术将其提升至4K分辨率,然后再由多帧生成技术,最多生成出3个额外的帧。
因此,由GPU实际渲染的工作量仅为输出画面的1/16,而其余的15/16均由AI进行生成,进而大幅降低了高分辨率、高帧率游戏下,显卡的压力。
▲我们来看NVIDIA官方给的RTX 5090在不同版本DLSS下的游戏帧率表现,在4K分辨率下,未开启DLSS时,游戏帧率为27 FPS,PC延迟为71ms,而在开启DLSS 2、DLSS 3.5、DLSS 4后,游戏帧率分别为71 FPS、140 FPS、248 FPS,且延迟均为34 ms左右。
同时,DLSS 4所渲染出的画面,相较于前代DLSS甚至相较于原生渲染时,其细节都有明显的提升,大家可以注意外卖盒子上的褶皱,DLSS 4所渲染的画面明显细节更加丰富。
因此,我们可以得出结论,在4K分辨率,最高光线追踪画质下,DLSS 4技术能提供高达8倍以上的帧率提升,同时还能使得电脑延迟减半,进而大幅提升玩家的游戏体验。
▲DLSS 4多帧生成技术严重依赖Blackwell架构GPU中的张量运算核心等专有部分,所以其目前为RTX50系独占。DLSS Mutil Frame Generation 潜在多帧生成技术与DLSS Ray Reconstrucion 光线重构技术、DLSS Super Resolution 超分辨率技术与Deep Learning Anti-Aliasing 深度学习抗锯齿技术共同构建了DLSS 4。
▲除了潜在多帧生成技术之外,NVIDIA 还在DLSS 4中将之前的CNN Model改为了更为先进的Transformer Model,在使用DLSS 2与DLSS 3上的CNN卷积神经网络是将本地像素数据聚合在一起,并以一个树形结构进行分组分析,其计算效率已经很高,游戏画质提升很明显。
▲而最新使用的Transformer Model中,如何使用与分析数据这件事,将由数据本身进行驱动,神经网络上将会集中注意力在更有趣的数据特点上,从而做出更好的决策。DLSS 4正式引入了Transformer Model,NVIDIA增加了模型的大小,在更大的数据集上进行训练,并且记住在训练期间的更多案例,因此,DLSS 4的计算效率高的令人难以置信。
▲Transformer Model其能够参考2倍的参数,并提供4倍的计算量,进而提供更为令人惊讶的画面质量,尤其在光线重构与超分辨率技术的提升尤为明显。
▲比如在照明环境很差的场景中,Transformer Model的光线重构功能在处理网格状栅栏的细节处理的稳定度表现就要优秀,画面明显更加清晰,没有了糊的感觉。
▲而在Transformer Model在超分辨率方面,也证明了其有更好的稳定性,更少的鬼影,更高的运动细节。
▲为了处理非常复杂的多帧生成过程,Blackwell架构的GPU采用了全新的硬件AI Management Processor,它可以将帧同步的逻辑转移到显示引擎上,能使GPU更加精确的管理显示的时序。
得益于全新的Blackwell架构,DLSS 4在部分场景下帧率提升高达八倍,相较于DLSS 3,帧生成到多帧生成的速率也提升了1.7倍。
另外,显卡同时处理语言模型与游戏引擎传入GPU的数据时,可以更高效的分别RT 核心、CUDA 核心、Tensor核心间的工作负载与工作优先级,进而提升显卡的整体效率。
3DMark DLSS功能测试
技术介绍完成了,紧接着我们便开始进行性能实测吧,首先自然是3DMark的 DLSS功能测试。
▲在3DMark DLSS 功能测试1.5版本中,已经提供了对NVIDIA DLSS 4技术的支持,其中Frame Generation的2x意味着通过AI额外生成1帧,而3x意味着额外生成2帧,4x意味着额外生成3帧。这里,我将尽可能测试更多的模式,来看一看DLSS 4对帧率的提升有多明显。
▲首先我们比较一下七彩虹iGame GeForce RTX 5070 Ti Vulcan OC 16GB在4K分辨率,DLSS 4性能模式,不同帧生成数下的表现,在DLSS 4关闭的时候,游戏帧率为42 FPS,开启2X、3X、4X的DLSS 4帧生成之后,游戏帧率分别上升到了155 FPS、212 FPS、258 FPS,RTX 5070 Ti 在DLSS 4 4X帧生成时的帧率是RTX 4070 Ti SUPER在DLSS 3下帧率(117.55 FPS)的219%,提升十分明显。
《赛博朋克 2077》Benchmark
▲紧接着我们用实际游戏来体验一下DLSS 4的表现,第一款游戏是《赛博朋克 2077》,这款游戏一直紧跟显示技术最前沿,当时首测RTX 40系显卡的时候,它便是最早支持DLSS 3潜在帧生成技术的游戏之一,而后的DLSS 3.5光线重建它也最早支持,而现在RTX 50系显卡首发,它又当之无愧的成为了最早支持DLSS 4多帧生成技术的游戏大作之一,目前,正式版本的《赛博朋克 2077》已经可以选择DLSS 4的各项功能了。
▲我这里还分别测试了七彩虹iGame GeForce RTX 5070 Ti Vulcan OC 16GB在不同DLSS设置下的帧率表现,且与RTX 4070 Ti SUPER开启DLSS 3时的帧率进行比较。
可以看到,在4K分辨率下,RTX 5070 Ti开启DLSS 4帧生成4X的时候,帧率高达150,近乎RTX 4070 Ti SUPER所能提供帧率(86 FPS)的两倍。
▲而在2K分辨率下的测试结果也基本相同,RTX 5070 Ti开启DLSS 4帧生成4X的时候可提供222 FPS的平均帧率,是RTX 4070 Ti SUPER所能提供帧率(118 FPS)的近两倍。
▲另外,除了平均帧率,1% Low FPS对游戏的整体流畅度也十分重要,毕竟最复杂的场景,往往也是决定游戏胜负的场景。NVIDIA提出了新的计量方法,被称作1% Low (MsBetweenDisplayChange) ,从上图可以得知,传统的1% Low (MsBetweenPresents) 统计的是CPU向渲染队列中帧数,但实际上,这个帧数据需要经过下渲染队列、GPU渲染、整合等一系列流程的等待,如果此时游戏画面与此帧相差甚远,那么这个帧只能被抛弃,玩家并不能看到这一帧,让CPU白做无用功。
而得益于AMP芯片等Blackwell架构的一系列优化,RTX 50系显卡能够大幅提升从CPU渲染帧到实际输出到屏幕上帧率的达成度,进而大幅提升有意义的1% Low(MsBetweenDisplayChange) ,让游戏体验更加丝滑。
▲虽然DLSS技术能够大幅提升游戏帧率,但是一直有玩家纠结开启DLSS,尤其是开启超分辨率技术是否会使得画面变差,至少在RTX 50系,我敢说绝大多数场景下,开启DLSS技术不仅不会使画面变差,甚至还会让画面变得好。好画质不怕比,NVIDIA专门推出了画质比较工具ICAT,不仅能够比较图片的画质,甚至能够同时加载两段游戏录屏进行直接比较,上面是NVIDIA官方给的测试场景,我有样学样,在多次Benchmark中,分别测试了开启DLSS前后的游戏视频,以及使用传统CNN Model与使用Transformer Model时的游戏视频,我们来比较一下画面的差异。
▲左侧为DLSS开启后的画面,右侧为原生画面,肉眼可见左侧画面明显更锐利清晰。
▲尤其在细节上,比如这个猴子旗子,左侧的字体与团明显更加锐化可分辨,而右侧原生分辨率下字体已经明显糊了,很难分辨上面写了什么。
▲同样的,LED灯与其下方的墙砖缝隙,也都是开启DLSS后效果更好,尤其墙砖缝隙,辨别起来明显比原生渲染要好很多。
▲铁栏杆的处理上,开启DLSS后也比开启前效果好很多,金属光泽更加明显,上方铁丝网的细节处理也更加优秀。
▲远处楼房的窗户,也在开启DLSS 4后变得更加清晰可辨认,画质更胜一筹。
▲紧接着,我还比较了全新Transformer Model与之前的CNN Model的画质差异,二者都要比原生渲染好,不过在细节上,还是Transformer Model略胜一筹。
▲比如依旧是这个墙面,左右两侧的墙砖纹理都清晰可见,不过明显左侧Transformer Model的墙面的漫反射更为充分,把酒吧那种使人沉醉迷离的气氛一下就烘托出来了。
▲最后我们再来看一下这扇门,因为其上有波纹形的柱状纹理,所以反射光线会非常复杂,但是门上的纹路并不会因为光照而看不清,相信凭借各位的生活常识,应该一下就知道Transformer Model的光线重构功能在处理这种暗光、复杂场景的能力,是明显好于CNN Model的。
▲尤其我之前在英伟达的活动现场,肉眼比较两台显示器的画面,DLSS 4所提供的画质完全能够做到真假难辨,甚至青出于蓝,因此,我在这里还是劝各位放心大胆的开启DLSS 功能,体验更顺滑的游戏体验吧。
《霍格沃兹之遗》
▲《霍格沃兹之遗》可能是《哈利波特》粉丝这些年能玩到还原度最高的游戏了,这款游戏也进行了更新,正式版也已经支持DLSS 4多帧生成技术了。
▲在2K分辨率下,iGame GeForce RTX 5070 Ti Vulcan OC 16GB显卡在仅开启DLSS 4而不开启帧生成时,游戏帧率为99 FPS,开启开启DLSS 4 帧生成4x后,游戏帧率上升到了222 FPS,此时游戏帧率是RTX 4070 Ti SUPER的1.55倍。
▲而到了4K分辨率,iGame GeForce RTX 5070 Ti Vulcan OC 16GB显卡在仅开启DLSS 4而不开启帧生成时,游戏帧率为80 FPS,开启开启DLSS 4 帧生成4x后,游戏帧率上升到了197 FPS,是开启帧生成前的2.5倍,此时游戏帧率是RTX 4070 Ti SUPER的1.53倍。
《龙腾世纪:影障守护者》
▲将有75款游戏在Day 0便支持DLSS 4技术,当然,对于将DLSS 4的开关集成到游戏的UI中并正确运行还是需要一定时间打磨的,所以NVIDIA直接在其新版的驱动管理软件NVIDIA App中增加了DLSS Overrides开关,玩家可以直接在此软件中开启DLSS 4并调整其各项参数,首先是我测了好多轮的《龙腾世纪:影障守护者》。
▲在NVIDIA APP中的图形-程序页面,可以找到各款游戏与应用,进行优化,比如开启多倍帧率生成,调整DLSS所使用的模型,甚至如果游戏并不支持DLAA与超级性能模式,也可在NVIDIA APP中手动开启。
▲iGame GeForce RTX 5070 Ti Vulcan OC 16GB显卡在《龙腾世纪》2K分辨率下,帧生成关闭时游戏帧率105 FPS,1% Low FPS为75 FPS,开启DLSS 4 帧生成4x后,游戏帧率上升到了273 FPS,1% Low 帧也达到了210 FPS,游戏的流畅度提升了约3倍。此时游戏帧率约为RTX 4070 Ti SUPER的2倍。
▲而游戏的延迟,并没有因为开启DLSS帧生成而显著提升。
▲到了4K分辨率的时候,iGame GeForce RTX 5070 Ti Vulcan OC 16GB在仅开启DLSS 4而不开启帧生成时,游戏的帧率为102 FPS,1% Low为81FPS,而在开启DLSS 4 帧生成4x后,游戏帧率上升到了237 FPS,1% Low 帧也达到了187 FPS,游戏的流畅度提升了2倍以上。此时游戏帧率约为RTX 4070 Ti SUPER的2倍。
▲而且,在4K分辨率下,即使开启DLSS 4多倍帧生成技术,游戏的系统延迟也要比RTX 4070 Ti SUPER更低,延迟降低的原因我不做过度猜测,仅复述结果。
《漫威争锋》
▲《漫威争锋》同样可在NVIDIA APP中开启DLSS 4多帧生成,我在训练场环境下同样测试了开启DLSS 4前后的游戏帧率表现。
▲iGame GeForce RTX 5070 Ti Vulcan OC 16GB显卡在《漫威争锋》2K分辨率下,帧生成关闭时游戏帧率147 FPS,1% Low FPS为103 FPS,开启DLSS 4 帧生成4x后,游戏帧率上升到了525 FPS,1% Low 帧也达到了305 FPS,游戏的流畅度提升了约3倍以上,此时的游戏帧率已经可以满足电竞选手的需求。而RTX 4070 Ti SUPER的帧率为221 FPS,RTX 5070 Ti 的表现约为RTX 4070 Ti SUPER的2.4倍。
▲2款显卡在系统延迟方面表现都非常优秀,应该是NVIDIA Reflex技术的功劳。
▲到了4K分辨率,iGame GeForce RTX 5070 Ti Vulcan OC 16GB在仅开启DLSS 4而不开启帧生成时,游戏的帧率为120 FPS,1% Low为84 FPS,而在开启DLSS 4 帧生成4x后,游戏帧率上升到了293 FPS,1% Low 帧也达到了141 FPS,游戏的流畅度提升了2倍以上。此时游戏帧率约为RTX 4070 Ti SUPER的近3倍。
▲在4K分辨率下,iGame GeForce RTX 5070 Ti Vulcan OC 16GB的系统延迟在20ms到32ms之间,表现要比RTX 4070 Ti SUPER更好一些,可见多倍帧生成技术并不会影响游戏体验。
《暗黑破坏神4》
▲我是玩过《暗黑破坏神1》的暗黑老粉,《暗黑破坏神4》游戏本身的口碑随着赛季更新大起大落我们姑且不提,单说其对新的显示技术的支持,可以说表现一直很好,从首发时即支持DLSS 3帧生成功能,而后又在更新中添加了对光线追踪的支持,本次更是成为了DLSS 4多帧生成的Day0支持大作之一。
▲目前,我们还是需要在NVIDIA APP中调整帧生成数量,并可开启超级质量与DLAA模式。游戏测试画质为最高画质+光线追踪极致,玩家角色在圣光大教堂的台阶上来回跑动。
▲在2K分辨率下,iGame GeForce RTX 5070 Ti Vulcan OC 16GB在仅开启DLSS 4而不开启帧生成时,游戏的帧率为78 FPS,1% Low为53 FPS,而在开启DLSS 4 帧生成4x后,游戏帧率上升到了217 FPS,1% Low 帧也达到了134 FPS,游戏的流畅度提升了近3倍。此时游戏帧率约为RTX 4070 Ti SUPER的近2倍。
▲游戏系统延迟方面差别不大,两款显卡的延迟均在40ms左右,应该是光追极致与最高画质对CPU带来了较大压力。
▲而在4K分辨率下,iGame GeForce RTX 5070 Ti Vulcan OC 16GB在仅开启DLSS 4而不开启帧生成时,游戏的帧率为103 FPS,1% Low为59 FPS,而在开启DLSS 4 帧生成4x后,游戏帧率上升到了261 FPS,1% Low 帧也达到了199 FPS,游戏的流畅度提升了2.6倍,1% Low帧更是提升了3.3倍。此时游戏帧率约为RTX 4070 Ti SUPER的约1.7倍。
▲而在DLSS 性能模式下,游戏系统延迟明显下降,基本都在40ms以下。
《永劫无间》
▲网易旗下的武侠工作类吃鸡游戏《永劫无间》目前也支持了DLSS 4与光线追踪,所以这里我依旧测试了2K与4K分辨率下,RTX 5070 Ti的表现。
▲在2K分辨率下,iGame GeForce RTX 5070 Ti Vulcan OC 16GB在仅开启DLSS 4而不开启帧生成时,游戏的帧率为204 FPS,1% Low为104 FPS,而在开启DLSS 4 帧生成4x后,游戏帧率上升到了344 FPS,1% Low 帧也达到了234 FPS,游戏的流畅度提升了近1.7倍,对竞技游戏更重要的1% Low帧更是提升了2.25倍。此时游戏帧率约为RTX 4070 Ti SUPER的1.7倍。
▲两张显卡的系统延迟方面都表现很好,iGame GeForce RTX 5070 Ti Vulcan OC 16GB在DLSS 4 帧生成4x的情况下也仅有28ms!
▲而在4K分辨率下,iGame GeForce RTX 5070 Ti Vulcan OC 16GB在仅开启DLSS 4而不开启帧生成时,游戏的帧率为188 FPS,1% Low为103 FPS,而在开启DLSS 4 帧生成4x后,游戏帧率上升到了300 FPS,1% Low 帧也达到了212 FPS,游戏的流畅度提升了1.6倍,1% Low帧更是提升了2倍。此时游戏帧率约为RTX 4070 Ti SUPER的近2倍。
▲两张显卡的系统延迟表现依旧很优秀。
七彩虹iGame GeForce RTX 5070 Ti Vulcan OC 16GB常规游戏性能测试
虽然目前支持DLSS 4的游戏越来越多,不过受限于时间与经费的关系,我仅测试了6款DLSS 4的游戏。因此,我们还是要来测试一下其他的游戏。
因此,我们还是要来测试一下其他的游戏。
3D Mark Time Spy & Time Spy Extreme
3D MARK Time Spy是一个DirectX 12 基准测试,支持原生新的API 功能,如异步计算,显式多显卡适配器技术和多线程,而其Extreme版本则是将分辨率提升至4K。
▲本电脑搭载七彩虹iGame GeForce RTX 5070 Vulcan OC 16GB时的3D MARK Time Spy得分为26304分,其中显卡得分27762分。
▲而RTX 4070 Ti SUPER的3D MARK Time Spy显卡得分为24614分,RTX 5070 Ti得分是RTX 4070 Ti SUPER的113%。
▲而在4K分辨率的3D MARK Time Spy Extreme中,本电脑搭载七彩虹iGame GeForce RTX 5070 Ti Vulcan OC 16GB时的得分为13677分,其中显卡得分13536分。
▲而RTX 4070 Ti SUPER的3D MARK Time Spy Extreme的显卡得分为12153,RTX 5070 Ti 得分是RTX 4070 Ti SUPER的111%。
3D Mark Fire Strike & 3D Mark Fire Strike Ultra
3D MARK Fire Strike则是DirectX 11的 基准测试,标准版本分辨率为1080P,而其Ultra版本则是将分辨率提升至4K。
▲本电脑搭载七彩虹iGame GeForce RTX 5070 Ti Vulcan OC 16GB时的3D MARK Fire Strike得分为43024分,其中显卡得分53317分。
▲而RTX 4070 Ti SUPER的3D MARK Time Fire Strike的显卡得分为51549,RTX 5070 Ti的得分是RTX 4070 Ti SUPER的103%。
▲而在4K分辨率的3D MARK Fire Strike Ultra下,本电脑搭载七彩虹iGame GeForce RTX 5070 Ti Vulcan OC 16GB的总得分为18572分,其中显卡得分为18008分。
▲而RTX 4070 Ti SUPER的3D MARK Time Fire Strike Ultra的显卡得分为14788,RTX 5070 Ti的得分是RTX 4070 Ti SUPER的122%。
3D Mark Steel Nomad & Speed Way
3D Mark专为测试显卡性能而提供的Steel Nomad 与 Speed Way测试,这两个测试都会尽量排除其他硬件的影响,将所以测试都集中在显卡上,所以也只会给出一个显卡分数。
▲在3D Mark Speed Way测试中,七彩虹iGame GeForce RTX 5070 Ti Vulcan OC 16GB得分7685,是RTX 4070 Ti SUPER得分6566的117%。
▲而在3D Mark Steel Nomad测试中,七彩虹iGame GeForce RTX 5070 Ti Vulcan OC 16GB得分6380,是RTX 4070 Ti SUPER得分6751的110%。
其余游戏帧率表现
▲我还另外测试了其余6款游戏,均为4K最高画质,支持DLSS的话则使用最新版本DLSS性能模式,可见在所有游戏中,RTX 5070 Ti 相较RTX 4070 Ti SUPER都有不同幅度的领先。
▲值得一提的是,《鸣潮》的内测服务器已经支持DLSS插帧与光线追踪技术,我也申请了账号进行游玩,相比未来在PC上玩跨平台游戏,可以享受到更加流畅的游戏体验与更加真实的画质将会是业界大趋势。
▲另外,在2K分辨率下,我也测试了5款游戏,可见RTX 5070 Ti 相较RTX 4070 Ti SUPER依旧有不同幅度的领先。
七彩虹iGame GeForce RTX 5070 Ti Vulcan OC 16GB AI与生产力测试
Al lmage Generation Benchmark
▲在2022年以StableDiffusion为代表的生成式AI普及后,AI运算对显卡的计算量与数据储存能力的需求呈现爆炸式的增长,而得益于全新的第五代Tensor核心,Blackwell架构显卡可以处理FP4数据类型,FP4 提供了一种较低的量化方法,类似于文件压缩,该方法能够显著减小模型大小,让AI运算对显存的要求更低,效率自然也大幅提升。
▲为了测试FP4数据类型对AIGC性能的提升,使用的是Procyon的Al lmage Generation Demo for NVIDlA进行测试,模型为Flux1DEV_ONNX。
▲在FP8数据类型下可以看到,除了RTX 5090 D的性能一骑绝尘之外,其余及款显卡的图片生成速度呈现阶梯形排列,RTX 5070 Ti相较RTX 4070 Ti SUPER仅有7%左右的性能提升。
▲不过这个差距在FP4数据结构下被无限放大,RTX 5070 Ti仅需33.419秒即可完成的任务,放到RTX 4070 Ti SUPER上则需要6460.583秒才能完成。
▲经确认,这是因为BlackWell架构的RTX 5070 Ti可以对FP4结构的数据进行一直类似压缩的处理,进而模型并没有爆显存,而ADA 架构的RTX 4070 Ti SUPER则大概率是因为爆显存而导致了性能低下,从这个角度来讲,如果未来打算用显卡来进行AI相关应用,还是一步到位选择最新的BlackWell架构显卡更加合适。
AI Text Generation Benchmark
▲而在AI Text Generation Benchmark中,七彩虹iGame GeForce RTX 5070 Ti Vulcan OC 16GB在PHI 3.5、MISTRAL 7B、LLAMA 3.1、LLAMA 2这4个大语言模型下的得分分别为3931、4185、4273、4173分。
▲我这里对全部RTX 50系显卡以及测试过的RTX 40系显卡的得分进行了整理,做了这个表格,可以看到,七彩虹iGame GeForce RTX 5070 Ti Vulcan OC 16GB不仅得分明显高于RTX 4070 Ti SUPER,甚至在部分项目上,要比上代的RTX 4080 SUPER得分更高,可见NVIDIA在BlackWell架构上,对显卡AI性能有着明显的加强。
▲具体小分如下,RTX 5070 Ti SUPER的反映明显比上代显卡更为迅捷,获取Token用时更短,Token输出速度更快。
Blender Benchmark
Blender是一款开源 3D 创建套件。它支持3D 建模、动画、视频编辑等诸多功能,同时支持NVIDIA RTX 渲染OptiX AI 降噪,而Blender Open Data Benchmark将进行monster、junkshop、classroom三个场景的渲染测试。
▲RTX 5070 Ti相较RTX 4070 Ti SUPER有着不同程度的领先,当然,RTX 5090 D依旧是一骑绝尘。
V-Ray 6 Benchmark
▲最后我们测试了七彩虹iGame GeForce RTX 5070 Ti Vulcan OC 16GB的V-Ray 6 GPU RTX得分为8101分,这里我们依旧与其余几张显卡的得分进行比较,可见其性能甚至超过了上代的RTX 4080 SUPER,BlackWell显卡的生产力提升很大。
总结
好了,以上便是本次测评的全部内容了,总结一下,GeForce RTX 5070 Ti 与本代次旗舰RTX 5080出自同源,都采用了GB-203核心,并且在显存容量、显存带宽等均保持一致,在DLSS 4与神经网络渲染的加持下,性能远超RTX 4070 Ti SUPER显卡,是当之无愧的游戏利器。
同时,在支持FP4数据类型后,配合RTX 5070 Ti拥有比以往更不俗的AI运算能力,无论创作AIGC内存还是训练大语言模型,再或者用于渲染视频、动画,它都可有一战之力,甚至在部分应用中超过了上代RTX 4080 SUPER显卡。当然,这里有一说一,如果把显卡当作纯粹的AI生产力工具来用,个人还是建议直接选择RTX 5090 D。
七彩虹作为显卡销量第一的品牌,在性能,设计,做工上一直在精益求精。本次测试的七彩虹iGame GeForce RTX 5070 Ti Vulcan OC 16GB作为iGame系列的双旗舰之一,设计上可以说是登峰造极,不仅外观出色,而且做工用料上都十分考究优秀,LCD智屏的可玩性也非常强,可以打造自己的定制化显卡。而且本次七彩虹同时公布了黑白双色火神显卡,大家可以根据自己的喜好选择配色。
目前,这款显卡将在七彩虹官网商城、京东、天猫、拼多多、抖音等电商平台及全国授权零售经销渠道正式开售,喜欢的朋友可自行选择合适平台进行购买。
iGame GeForce RTX 5070 Ti Vulcan OC 16GB 8799元
iGame GeForce RTX 5070 Ti Advanced OC 16GB 7999元
iGame GeForce RTX 5070 Ti Ultra W OC 16GB 7599元
战斧 GeForce RTX 5070 Ti 豪华版 16GB 6299元
好了,以上便是本次测试的全部内容,希望对你有所帮助,我是黄昏百分百,别走开,后面还有我为各位介绍本次测试所使用的其余硬件。
本次测评其余硬件简介
CPU+主板:intel 酷睿 Ultra9 285K+七彩虹 iGame Z890 FLOW V20
▲本次测试,我决定使用intel 酷睿 Ultra9 285K来进行测试,这款U的性能我就不过多提及了,目前仍是intel的旗舰CPU。而且毕竟估计这次测试,使用AMD平台的人会比较多,Intel平台的性能表现反而更具有参考性。为此,我选择了同样是七彩虹高端电竞子品牌的旗舰主板七彩虹 iGame Z890 FLOW V20,这是七彩虹的iGame 主板的诚意之作,单就超频性能等,其甚至不输于Vulcan主板,但价格上却亲民很多。
▲这款主板采用了20+1+1相供电,90ADrMOS、片式聚合电容,电气性能很优秀,可以为intel 酷睿 Ultra9 285K提供充足而稳定的供电。
▲同时,这款主板搭载了PCIe 5.0x16显卡接口与PCIe 5.0x4 SSD固态硬盘接口,完全能够释放出高端硬件的潜力。
▲最后,包括USB 4、WiFi 7、2.5G有线网口等高端主流接口在这款主板上也都有实装,可以说从内到外,扩展性极强。
最后,有句话叫做士别三日,当刮目相看,七彩虹主板的BIOS在这几年的励精图治后,主要功能已经与御三家的相差不大,完全值得正视了,这里我必须要手动给七彩虹的BIOS团队点赞。
内存:宏碁掠夺者 Hera 影锋 6000 32GBx2
▲本次测试包含一定的生产力部分与AI部分测试,系统内存最小需要64GB,因此,我选择了宏碁掠夺者 Hera 影锋 6000 32GBx2,它采用特挑SK海力士A-Die颗粒,双面结构,每面16GB内存颗粒。
▲作为生产力工具使用,最重要的是稳定性,尤其是内存双面都有颗粒的时候,散热压力会大幅加大,为此,宏碁掠夺者 Hera 影锋采用了霜镜散热装甲,单侧装甲厚度达2mm,X型设计大幅强化气流传导,使得内存拥有强劲的散热性能,保障其能够持久、稳定运行。
▲而在灯效方面,宏碁掠夺者 Hera 影锋配备了缀影RGB模组,拥有8个独立灯光区域,支持1680万色ARGB,灯效明亮,颜色过渡自然,放在机箱中绝对是画龙点睛版的点缀。
SSD:英睿达Crucial T705 PCIe 5.0 2TB
▲本次测试使用的是英睿达Crucial T705 PCIe 5.0 SSD 2TB版本,它搭载了群联PS5026-E26 Max14um主控+美光自家的232L 3D TLC NAND颗粒,英睿达Crucial 作为美光自有品牌,在颗粒来源与品控上都无需担心。英睿达T705 白色限量版的预装了一块Premium级别的被动式散热器。SSD的两面均被散热器包裹,这款散热器采用铝+镀镍铜材质,其上拥有多条通风散热镂空,经实测,即使是被动散热,其也能够保证英睿达Crucial T705可以低温、稳定运行。
▲经实测,在七彩虹iGame Z890 FLOW主板 + intel Ultra 9 285K平台上测试时,英睿达Crucial T705的顺序读取12310 MB/s,顺序写入12474 MB/s,4K随机读取(Q1T1)97MB/s,4K随机写入(Q1T1)377MB/s。可以说基本跑满了在intel 平台上PCIe 5.0的理论带宽,同时其随机4K读写方面,intel平台的表现要比AMD平台锐龙9000系CPU好一些。
电源:安耐美 PX1200W白金全模组电源
▲安耐美 PX1200W白金全模组电源采用了其家族统一的黑色磨砂外观,其上用白色的粗大字体印刷了品牌和型号,辨识度极强,而且它是一款获得了80 PLUS白金认证的旗舰级电源,能效表现极为优秀。
▲安耐美 PX1200W电源的供电接口丰富充足,拥有235%的瞬时峰值功率,高于ATX 3 Intel电源标准200%的要求,同时拥有原生的12V-2x6接口,可以为本次测评的RTX 5090 D与RTX 4090 D等上代旗舰显卡提供充足、稳定的供电。
▲有一说一,测试RTX 5070 Ti并不需要使用1200W的电源,不过同系列的安耐美 PX1000W被我给拆了,经拆解实拍,其内部布局工整,做工精细,规规矩矩。空间利用非常高效,整体布局并不拥挤,为不同元器件提供了充足的散热空间。通过拆解可以看到电源与宣称的一样,采用主动式PFC+全桥LLC以及同步整流+DC-DC的高端主流方案,电源内部也预留了足够的散热空间,这次要测新显卡,秉着不作死就不会死的原则,还是使用未拆解过的电源更加保险。
▲从电源铭牌处可以确认,安耐美 PX1200W电源符合ATX 3.1规范,可12V输出最大电流100A(1200W),可以满足高端CPU与旗舰显卡的供电需求。
▲这款电源还配备了135mm的双滚珠风扇,不仅支持智能启停,更拥有逆转弹尘功能,可以反向出风,吹出电源内部灰尘,提升电源的散热效果与使用寿命,使其更为经久耐用。
最后,这款电源使用了全日系电容,10年质保,买来放心,用着安心,而且除了1200W与1000W,还有850W可选,大家装机的话,选择850W或者1000W都比较合适。
显示器:AOC AGON PRO AG276UX
本次测试使用的显示器是AOC旗下高端电竞子品牌 AGON PRO的 AG276UX,它搭载了一块27英寸,4K分辨率的 Fast IPS屏幕,刷新率为160Hz,支持Adaptive-Sync技术,在游戏过程中能避免画面的撕裂与卡顿,无论是连接显卡玩PC游戏,还是连接XBOX、PS5玩主机游戏都能流畅丝滑。
这款屏幕色彩表现非常优秀,覆盖了95%的DCI-P3色域且经过了出厂的预调校,色准也非常高。同时,AGON PRO AG276UX获得了VESA的DisplayHDR 600认证,配合着80000000:1的高对比度,显示HDR画面时也十分优秀。
关于这款显示器,目前用起来可以用一个“爽”字形容,我会在晚些时候为大家带来详细测评,敬请期待。
本文来自:什么值得买