略有束缚的显卡天花板:耕升RTX3090炫光评测

时间:2020年10月18日 07:23:33 作者:李小白

英伟达新显卡发布的节奏非常快,RTX3080还没发布多久,RTX3090就发布了,而RTX3070也将在下月中旬发布。

小熊错过了RTX3080,这次先写RTX3090的评测。对比RTX 3080,RTX 3090的流处理器数量、Tensor Core、 ROP单元、显存带宽、纹理单元都提升了20%左右,TDP也从RTX 3080的320W进一步提高到了350W。9月24日上市,售价11999元,相比RTX3080的价格也翻了一倍。

▼这次拉来作对比的是RTX2080s,完全同步的对比评测。以前玩过RTX2080Ti,所以也有些数据,但平台和驱动都不同。最大的遗憾是没有一手的RTX3080数据,只能参考现在网上的评测数据。

纸上谈兵

RTX2080TI的的流处理器(CUDA)数量是4352,RTX2080S是3072,而RTX3080则暴增到了8704个,RTX3090更夸张,是10496个,那么RTX3090,3080相对RTX2080TI的性能提升不应该是200%以上吗?但是并没有!原因就是要从SM单元说起。

显卡运算处理方式主要有2种,一种是负责浮点型运算,负责比较大小,处理结果,计算最大值最小值的数学运算;另一种是负责整数运算,主要负责内存寻址和获取资料等工作。但在Turing诞生之前,GPU核心中并没有单独的FP32和INT32单元,从Kepler到Maxwell到再到Pascal,无论整数还是浮点都交给相同的核心进行运算,显卡所以核心在一个周期内只能进行一种运算。

就强度而说浮点运算是高于整数运算的。经过英伟达的分析每100条指令操作中有62条是浮点指令操作,38条是整数指令操作,即浮点(FP32)/整数(INT32)核心的科学比例为62:38(也有说是64:36的)。

Turing设计思路是认为之前的运算效率太低,造成了大量核心的闲置,于是将负责浮点和整数的核心分开,每个SM单元拥有64个FP32核心,64个INT32小核心,但由于这些小核心性能比较弱,所以NVDIA并未把这些核心算作CUDA核心。

新一代Ampere(安培)架构的RTX30系列显卡则又统一了INT32与FP32单元,原本只能做整数运算的INT32单元现在既能做整数运算,也能做单精度浮点运算,即原来的FP32并没有动,INT32变成了INT32与FP32的混合核心,并且由小核心变成和FP32一样的大核心,这样这些混合核心也被算进了CUDA。所以其实严格意义上说Ampere的CUDA数量提升远没有官方说的那么夸张。

再回到到开头说的,那Ampere不是把Turing的改动又改回去了?正应了那句话,天下大事合久必分,分久必合。当然小熊毕竟是门外汉,也不明白这两种架构哪个更好,个人也觉得大家就不要在意CUDA数量了,毕竟性能提升才是实实在在的。

测试平台介绍:

买不起10900k,只能用OC 5GHz的10700k为大家作测试了,还请大家谅解!具体配置如下:

CPU:英特尔(intel) i7 10700k OC 5GHz

主板:华擎(ASRock) Z490 Phantom Gaming-ITX/TB3

内存:影驰(Galaxy)HOF OC Lab 大师 DDR4 4000 8G*2

显卡:耕升(GAINWARD)RTX 3090炫光

索泰(ZOTAC) RTX2080super玩家力量至尊PGF OC

SSD:西部数据 (Western Digital)WD_BLACK SN750 1TB

电源:安钛克(Antec) HCG 1000 Extreme

机箱:安钛克 (Antec) Striker 锋芒

▼在RTX3090的24G显存面前,16G的内存已经抬不起头了

▼电源采用了额定1000w,保证电力供给充足。

▼由于Striker机箱的特殊结构,使得显卡被安装在正面,对显卡来说是一个基本完全开放的平台。

提示:有任何问题,请联系管理员;欢迎学习德安县房产信息网:http://www.dazfbz.com;

相关文章