本文作者:kris

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

kris 2025-02-19 23:12:18 9
RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法摘要: RTX 4070 Ti性能不仅可以吊打RTX 3090, 甚至还可以跟RTX 3090 Ti掰掰手腕,但RTX 4070 Ti这样的提升幅度只是属于...

RTX 4070 Ti性能不仅可以吊打RTX 3090, 甚至还可以跟RTX 3090 Ti掰掰手腕,但RTX 4070 Ti这样的提升幅度只是属于特例,这是因为RTX 40是前所未有的吃了至少2代的工艺红利:30系的三星8nm本质是10nm工艺节点,而40系是直接越过7nm,直接采用NVIDIA同TSMC定制的高性能4N工艺,不仅大大提升了晶体管密度,还大幅拉高了频率,这样使得排行老三的AD104都有叫板满血AD102的实力。

并且这还不是RTX 4070 Ti性价比神话的终结,NVIDIA在在RTX 40系生命中期又推出采用下放AD103的RTX 4070 Ti SUPER来进一步提升性能,其不仅扩大了GPU的SM规模,同时还保持了完整的256 Bit显存位宽,使得4070 Ti SUPER性能有十分显著的提升,完全可以说是RTX 4080的青春版。并且NVIDIA还将RTX 4070 Ti SUPER售价从RTX 4070 Ti的7099下调到了6499元,这样的加量减价可谓十分厚道。

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

而新一代RTX 5070 Ti也是延续了RTX 4070 Ti SUPER的产品脉络,其也是由RTX 5080的GB203下放而来,屏蔽了一个完整的GPC和一组TPC,保留了RTX 5080 83.3%的流处理器规模和完整的256 Bit显存位宽。

在RTX 4070 Ti SUPER上市后,RTX 4070 Ti在清完尾货以后基本就退出了市场,因此无论是从产品对位角度上还是在消费者购买选择的立场上,现在RTX 5070 Ti主要对比的应该是RTX 4070 Ti SUPER而不是RTX 4070 Ti。

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

RTX 5070 Ti的ROP光栅化单元是和GPC绑定,一个GPC 16个,6个GPC 96个,和RTX 4070 Ti SUPER一样,而纹理单元/Tensor Core/RT Core都是同SM绑定,和流处理器数同比增加6%。但流处理器还算比RTX 4080 SUPER少12.5%。因此我们在测试之前, 就应该有个心理预期,RTX 5070 Ti的规格和性能应该在RTX 4070 Ti SUPER和RTX 4080 SUPER之间。

L2缓存同之前RTX 4070 Ti SUPER一样为48 MB,屏蔽了完整64MB的1/4容量,而显存方面,之前21 Gbps的GDDR6X升级为了RTX 5090 D同款的28 Gbps的GDDR7,28 Gbps x 256 Bit x / 8 = 896 GB/s的显存带宽相比RTX 4070 Ti SUPER提升了1/3。

影驰Geforce RTX 5070 Ti 16GB圣刃赏析

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

RTX 5070 Ti并无Founder Edition,我们收到的MSRP首发测试样卡是影驰的全新的圣刃系列。

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

其采用十分简洁而又硬朗设计风格,正面有三个轴流风扇。白色的外观给人感觉十分的清爽。

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

正面的塑料件延展到背板形成一个整体的中框,这样使得显卡整体有更高的强度,PCB不会因为散热器重量而弯曲变形。

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

圣刃相比上一代的RTX 4070 Ti SUPER大将颜值提升很多,大将设计风格比较机甲风,而圣刃更简洁清爽,更符合现在的主流审美趋向。并且结构设计更为紧凑,尺寸符合NVIDIA的SFF-Ready规范。

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

在头部有个银色的磁吸Aurora RGB照明模块,上面有GALAX的Logo,这个模块还可以取下来安装在侧面的磁吸接口上,并通过aRGB连线实现ARGB同步。

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

ARGB效果灯光的亮度和饱和度都很不错,这样是很聪明的设计,相比风扇面,安装在机箱内这两个的位置都更容易看见。当然你装的不是白色套装主机也不用担心,影驰的RTX 5070 Ti除开白色的圣刃,还有黑色主题的魔刃,能够更好的适配更为主流黑灰的主机配色。

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

接口方面影驰Geforce RTX 5070 Ti 16GB圣刃为标准的3DP+1 HDMI,DP和之前发布的RTX 5090 D / RTX 5080一样升级为满血的UHBR20 80 Gbps带宽的DP 2.1b,在满血DP 2.1的显示器的配合下,输出4K 240或者2K 500 Hz 10 bit都不会触发DSC。。

测试平台

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

本次测试平台依然使用AMD Ryzen 9800X3D,测试内存使用的是DDR5 32GB x 2 6400 FCLK同步。 具体参数为6400 32-42-42-58,均设置为tREFI=65535/FCLK=2200。测试显卡在没有特别说明的情况下均使用NVIDIA公版标准频率和功耗限制。

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

虽然RTX 5070 Ti的目标用户虽然相当比例会使用2K分辨率显示器,但我觉得现在DLSS时代还在纠结原始分辨率意义不大,4K DLSS质量基本就是2K原生,DLSS性能就是1080p原生,并且在部分性能需求过高的游戏我们也将测试DLSS超高性能模式,实际就是720P原生=2K DLSS性能,因此这次测试依然使用4K分辨率。

3DMARK性能/功耗和温度

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

我们本次测试影驰Geforce RTX 5070 Ti 16GB圣刃是公版的2452 MHz核心频率,功耗限制在300W,但我估计实际主力销售的OC版会适当拉高默认频率,并解锁更高的功耗上限。

虽然3DMark并不能完全代表游戏性能,但其负载更稳定,合适一些细节特性分析。

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

DX12光栅化的Timespy Extreme RTX 5070 Ti可以达成RTX 4080 SUPER 99%的性能,而光线追踪的Port Royal和Speed way性能则可以反超5%以上,RTX 5070 Ti在3DMARK中这样的性能表现明显是好于预期,但3DMARK的跑分是否可以代表RTX 5070 Ti也可以强过RTX 4080 SUPER,后面的游戏实测环节我们会来回答这个问题。

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

我们在运行Speed Way时候记录了GPU的频率和功耗,测试过场RTX 5070 Ti的TGP功耗全程顶300W功耗墙,这说明对于RTX 5070 Ti而言300W的功耗是不太够的,因此GPU频率波动比较大,开头段在2.75 GHz,中段跌落到2.7 GHz。不过实际游戏负载基本都没这样高,300W的功耗限制基本是很难跑满的。实际上RTX 5070 Ti虽然标称的2452 MHz频率比RTX 5080的2617 MHz要低,但实际工作频率并没有明显差别,RTX 5070 Ti和RTX 5080的理论性能差距基本看SM的数量就好。

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

我们依然在25度环境温度使用Speed way压力测试进行负载测试,影驰Geforce RTX 5070 Ti 16GB圣刃在20分钟20轮满载测试后,GPU最高温度71.7度,显存最高温度78度,风扇最高转速在21xx RPM,测试过程无异响和啸叫。

游戏性能测试

赛博朋克2077

赛博朋克2077 在2.1更新了对DLSS 4的支持,本次测试设置4K分辨率/游戏最高画质/DLSS 4,使用游戏自带Benchmark进行测试。

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

RTX 5070 Ti可以在DLSS超高性能模式下实现稳定可用的性能,而在开启2x帧生成和4x多帧生成后,在DLSS性能和质量档也可以分别满足120/240 FPS高刷的性能需求,并且在赛博朋克2077开启FG/MFG帧数稳定性也很出色,4x多帧生成使得RTX 5070 Ti的体验是远超RTX 4080 SUPER的。

星球大战:亡命之徒

星球大战:亡命之徒虽然和阿凡达潘多拉边境一样使用雪莲花引擎,不仅增加了对于光线追踪的支持,还支持路径追踪。测试使用最高画质(包括高级图像设置),使用FrameView记录第一关城镇内固定路线30秒的性能。

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

RTX 5070 Ti在全特效下,不开启帧生成没有可用性能,在开启2x帧生成和4x多帧生成后,平均FPS可以达到76.48和136.19FPS,分别满足60 FPS基本流畅和120 FPS高刷的性能需求。

心灵杀手2

心灵杀手2和赛博朋克2077一样,提供了路径追踪和光线重构功能。心灵杀手2我们使用回归/邀请任务的城镇街道作为测试场景,游戏设置全特效,使用FrameView记录60秒性能数据。

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

RTX 5070 Ti在全特效下在超高性能DLSS下,可以维持60 FPS以上性能,并且即使是渲染分辨率在1280 x 720的情况下,全新的TRANSFORMER DLSS算法也提供了可用接受的画质。在开启2x帧生成和4x多帧生成后,在DLSS性能和质量档也可以分别满足60 FPS基本流畅和120 FPS高刷的性能需求。

夺宝骑兵:古老之圈

夺宝骑兵:古老之圈使用Vulkan的id Tech 7引擎,并且支持路径追踪,测试使用全最高画质,使用FrameView记录黄金神像关卡进入血色神庙雨林场景30秒的性能。

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

夺宝骑兵:古老之圈十分的吃显存容量,在稍早的RTX 5080测试中,16GB的显存不能在4K DLSS性能模式开启帧生成,而在本次测试中,我发现即使在4K DLSS超高性能模式下,其显存占用也大于13GB,12GB RTX 4070 Ti运行3D场景直接黑屏。如果进一步开启帧生成,那显存占用甚至高达15GB,要知道此时4K DLSS超高性能模式实际渲染分辨率只有1280 x 720。

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

因此本次测试是16GB的RTX 4070 Ti SUPER起步,RTX 5070 Ti在DLSS超高性能下可以基本维持60 FPS的性能,在开启帧生成后帧数就可以达到90 FPS,并且性能也无限贴近RTX 4080 SUPER。

RTX 5070 Ti其实在性能模式开启帧生成就应该可以有可用性能,现在不能开启还是显存容量的限制。前几天NVIDIA已经公布了夺宝骑兵:古老之圈支持DLSS 4的时间表。在经过DLSS4降低显存占用后,RTX 5070 Ti应该可以DLSS性能模式开启帧生成或者4x的多帧生成,届时应该可以有不错的游戏体验。

地铁离去增强版

地铁离去增强版是唯一仅支持光线追踪的3A游戏,这样场景设计的时候可以简化一些预烘培和光源设置。我们使用Extreme画面并手动开始Hairworks和高级PhysX,使用游戏自带benchmark进行测试。

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

地铁离去虽然对GPU有极高负载,但却不怎么吃显存,因此RTX 5070 Ti高带宽的GDDR7获得收益就比较小,相对RTX 4070 Ti SUPER仅有5%不到的性能优势,相对RTX 4080 SUPER差距也接近10%。

黑神话悟空

黑神话悟空使用的是虚幻5引擎,并且在UE5的基础上重新构建了一套基于路径再采样的实时路径追踪的光照系统,相比UE5原生的Lumen实现效果更好,并且还有不错的执行效率。黑神话悟空使用全最高特效进行测试。

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

RTX 5090 D在4K DLSS性能模式也才勉强流畅,而RTX 5070 Ti在DLSS性能模式就4x FPS的性能水平,不过得益于DLSS 3帧生成,在开启后平均帧数还是可以有74 FPS。但目前黑神话悟空仅支持DLSS 3,高速运动场景还是有明显的噪点,这个问题需要后续DLSS 4更新来解决。

黑神话悟空UE5是十分吃显存带宽的,因此升级28 Gbps GDDR7的RTX 5070 Ti相较RTX 4070 Ti SUPER优势明显,相比RTX 4080 SUPER也就慢1 FPS.

地狱之刃2:塞娜的传说

地狱之刃2:塞娜的传说是第一个采用虚幻5引擎的3A游戏,其使用的是UE5自带的Lumen光照系统,而没有附加额外的RTX特性,但其Nanite的运用相比黑神话更为充分。地狱之刃2测试除了开启VRS,其他均为最高特效。

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

地狱之刃2由于没有RTX的路径追踪,其硬件需求是明显低于黑神话悟空,RTX 5070 Ti在不开启帧生成的情况下也可以保持60 FPS以上的性能,但UE5还是十分吃带宽,RTX 5070 Ti的性能依然贴紧RTX 4080 SUPER。

极限竞速

极限竞速是Forza正统系列的第8作,相比地平线系列其拟真度和专业性更高,测试我们设置未最高画质,使用游戏自带Benchmark进行测试。

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

RTX 5070 Ti在开启DLSS质量后就可以稳定60 FPS以上性能,而DLSS性能模式就可以接近百帧,整体性能表现也无限接近RTX 4080 SUPER。不过4K DLAA的性能不可用,我就没有列出。

怪物猎人荒野

怪物猎人荒野虽然游戏还没正式发售,但CAPCOM已经提前放出了独立的Benchmark给各位猎人评估性能。怪物猎人荒野依然还是采用的RE引擎,但这次增加了对光线追踪和DLSS 3的支持,并且还支持DirectStorage 。

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

怪物猎人荒野也是吃带宽的游戏,特别是在开启帧生成后,RTX 5070 Ti甚至可以反超RTX 4080 SUPER,这个时候显存占用基本在15GB以上。在DLAA和DLSS质量档位,两者的性能差距也十分的小,而RTX 4070 Ti 12GB则直接爆了显存,在测试后段进入雪山场景就有明显的卡顿。

阿凡达潘多拉边境

Massive使用雪莲花引擎做的同名电影IP游戏,阿凡达潘多拉边境虽然支持光线追踪,但走是RTGI方式,设置超高画质使用游戏自带benchmark进行测试。

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

RTX 5070 Ti在开启DLSS后可以满足60 FPS基本流畅的性能需求,但距离满足高刷性能需求还是有一定的差距。

荒野大镖客救赎2

荒野大镖客救赎2虽然还是上个十年的游戏,但其现在依然是光栅化游戏的画面巅峰。测试我们设置使用Vulkan渲染路径的最高特效(包括高级图形设置),使用游戏自带的Benchmark进行测试。

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

RTX 5070 Ti在4K分辨率全特效下可以满足60 FPS+的基本流畅需求,开启DLSS性能也基本能够满足120 FPS高刷的性能需要。虽然荒野大镖客救赎2虽然没有光线追踪,但对于 256 Bit的70 Ti级别相对还是比较吃带宽,在TAA和DLSS质量模式下同RTX 4080 SUPER的差距较小。

刺客信条幻景

刺客信条幻景从其售价上就可以发现其并不是个全价的3A,而更多是利用英灵殿资产复用次级项目,游戏场景规模要小于之前的神话三部曲。

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

RTX 5070 Ti在4K原生分辨率下满足60 FPS的基本需求,在开启DLSS后则可以满足4K 120-144 Hz的高刷需求。但刺客信条幻景不怎么吃显存带宽,因此RTX 5070 Ti同RTX 4080 SUPER的性能还是有段差距。

游戏性能小结

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

RTX 5070 Ti在4K DLSS性能模式下,大概是RTX 4070 Ti SUPER 108%的性能,相对RTX 4080 SUPER弱5%,基本就是RTX 4080性能。当然上面说的是整体情况,不同游戏相对性能还是有明显差别,这个差别的核心取决于游戏对于显存带宽的敏感程度,如路径追踪的游戏/虚幻5引擎的游戏基本都很吃显存,RTX 5070 Ti相比RTX 4070 Ti SUPER就可以提升10%,而对于光栅化游戏或者地铁这样不吃显存的游戏,性能提升幅度就只有5%。

前面3DMARK测试RTX 5070 Ti性能都是优于RTX 4080 SUPER的,甚至还快不少,这主要是由于3DMARK是原生4K分辨率,而且场景设计吞吐很大,这样就可以充分的吃到256 Bit GDDR7的高带宽Buff,但在实际游戏,特别是在开启DLSS实际渲染分辨率降低的情况下,对于显存带宽就没有那样敏感,导致RTX 5070 Ti的实际游戏性能表现相比3DMARK跑分有明显落差。

AI性能测试

MLPerf性能测试

MLPerf是基准测试由来自学术界、研究实验室和行业的 AI 领导者联盟 MLCommons 开发,旨在对硬件、软件和服务的训练和推理性能进行无偏评估测试程序。

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

虽然RTX 5070 Ti的SM和Tensor Core规模是明显小于RTX 4080 SUPER的,但28 GB GDDR7的带宽优势使得RTX 5070 Ti AI性能能够反超RTX 4080 SUPER,有7%以上的性能优势。

Procyon Flux文生图测试

虽然目前ComfyUI最新版提供了对RTX 50系的支持,但依然不能运行TensorRT和NF4实现性能最优化,因此Flux文生图测试依然采用UL的Procyon进行,分别测试各个GPU的Flux Dev的FP8和FP4性能。

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

得益于更大的GDDR7显存带宽,RTX 5070 Ti的FP8性能基本和RTX 4080 SUPER相当,而得益于Blackwell新增的FP4支持,RTX 5070 Ti的性能几乎还可以有一倍的提升。另外需要注意的是由于RTX 4070 Ti由于仅12GB显存并不能正常运行FP8,因此其性能数据并未列出。RTX 5070 Ti再往下的RTX 5070也是12GB显存,如果你要将文生图用在生产力领域,那RTX 5070 Ti那也应该是适用性/性能和性价比最平衡的选择。

Blender渲染性能测试

这部分测试我们使用最新版的Blender 4.3分别使用Optix和CUDA渲染输出一张1920 x 1080家装图,输出结果为渲染完成秒数,越短越好。

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

RTX 5070 Ti在CUDA路径性能相比RTX 4070 Ti SUPER稍低,复测验证的时候发现功耗便宜,估计优化问题。不过还好OptiX路径性能正常,OptiX利用RT Core参与渲染可以将渲染时长缩短43%,RTX 5070 Ti在OptiX路性能基本同RTX 4080 SUPER持平。

视频编码能力测试

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

RTX 5070 Ti和RTX 5080一样是双编码器,新一代编码器提供了对H265/H264 10 Bit 4:2:2的硬件编码支持,具体测试RTX 5070 Ti编码性能和RTX 5080一样,也比上一代的双编码器型号性能更好。需要注意的是RTX 5070 Ti往下的型号都是单编码器,视频编码性能会有比较大的下降,如果你将视频处理作为生产力应用需求,那建议使用RTX 5070 Ti起步。

RTX 5070 Ti 6299的性价比之选

RTX 5070 Ti的跨代性能提升或许不够惊艳,但其真正的价值在于DLSS 4与AI能力的全面进化。DLSS 4不仅通过4X多帧生成技术大幅提升帧率上限,更显著改善了高负载场景的显存占用问题。而在AI领域,RTX 5070 Ti凭借GDDR7带宽优势,MLPerf推理性能反超RTX 4080 SUPER 7%,FP4精度文生图效率更是接近翻倍,成为内容创作者的性价比利器。

RTX 5070 Ti实测对比RTX 4080 SUPER:95%性能+DLSS4的6299元解法

价格方面,RTX 5070 Ti 6299元的官方建议零售价比RTX 4070 Ti SUPER低200元,同实际成交价相比持平,但却提供了108%的前代性能;RTX 5070 Ti相比RTX 4080 SUPER,则以千元价差实现95%以上的性能覆盖。这种“加量不加价”的策略,结合DLSS 4与AI生产力的双重加持,使RTX 5070 Ti成为现在时间点中高端GPU市场的性价比之选。当然,这一切的前提是能以原价入手,若因溢价炒作太脱离6299元区间,其性价比光环将大打折扣。

作者声明本文无利益相关,欢迎值友理性交流,和谐讨论~

本文来自:什么值得买

文章版权及转载声明

作者:kris本文地址:https://www.damoyx.com/p/34467.html发布于 2025-02-19 23:12:18
文章转载或复制请以超链接形式并注明出处大漠游侠网

阅读
分享