登上性能之巅的RTX 3090 Ti，为什么要取代“老大哥”RTX 3090？

最近RTX 3090 Ti终于开卖了，关于NV发布RTX 3090 Ti这件事本身，很多人表示看不懂老黄的操作，如果没有RTX 3090 Ti的“背刺”，老大哥RTX 3090现在还能保持“消费级最强GPU”的名号，这一波直接撑到40系发布不香吗？难不成是GA102滞销了？网上关于老黄清库存的阴谋论也开始流传了。

　　那么今天我们就来分析一波，为什么RTX 3090 Ti要在526天之后，取代了老大哥RTX 3090性能之巅的“王座“。

　　对于游戏玩家来说，在8K游戏尚未普及的当下，即便是负载最高的4K游戏， RTX 3080 Ti的游戏表现已经和RTX 3090足够接近，满足60帧甚至更高的游戏帧数显然不成问题。土豪玩家要是想体验8K游戏，直接上RTX 3090拉满就完事了。

　　这么一说，貌似RTX 3090 Ti好像没什么发布的必要了？可能对于很多人来说，显卡就只是用来玩游戏这么简单。殊不知，显卡已经逐步发展成为满足创意工作、工程建模、机器学习等专业领域的必备硬件。而RTX 3090 Ti不仅是目前最强的游戏卡，在数据科学AI、深度学习，以及创意应用等领域，同样也有着它施展拳脚的空间。

　　可能有同学要问了：论专业领域NV早已深耕多年，无论是以前的Quadro系列，还是如今的NVIDIA RTX系列，都是面向专业领域的GPU，那RTX 3090 Ti岂不是要和自家系列抢饭碗？

RTX A6000

　　从软件优化的角度出发，以RTX A6000为代表的新一代专业图形卡，面向例如3DS Max、CAD、SolidWorks这样的专业工程软件，会提供专门的软件优化和驱动，以及独有的vGPU支持。而GeForce显卡同样也有面向创意工作者的NVIDIA Studio驱动，像Adobe全家桶、blender、达芬奇此类的创作软件，Studio驱动和工具套件会与硬件结合，提供更好的加速性能。

NVIDIA STUDIO工具套件

　　从硬件规格的角度出发，RTX 3090 Ti配备了和A6000相同的GA102核心，10752个CUDA流处理器，受益于更高的TDP，RTX 3090 Ti单精度浮点运算达到了40 TFLOPS，是目前Ampere架构显卡中运算和性能之王。

　　显存是两款GPU差别最大的地方，A6000最高配备可达48GB容量的GDDR6显存，但是RTX 3090 Ti则是更为均衡一些，它配备了更高速率的24GB GDDR6X 21Gbps显存，并且配备了面向专业领域的功能特性——显存ECC功能。

RTX 3090 Ti搭载显存ECC功能

　　ECC，中文名叫做“错误检查和纠正技术”，以往显存ECC技术是只有专业卡才能独享，它的好处就是在显卡处理复杂工作流时，如果显存在存放运算数据时出现错误，ECC会自动进行纠正，使系统不至于因为错误而中断运行，保持整个平台的运行稳定。

　　因为不少用户购买RTX 3090用于创意工作、机器学习等使用场景，工作流占用显存较高的场景下，出现运行错误容易导致系统和平台的不稳定。RTX 3090 Ti补上了ECC功能，即使不是特定领域的工作站用户，也能选择价格相对更低的GeForce显卡体验到这一专业特性。毕竟一张RTX A6000的价格，已经是RTX 3090 Ti 的三倍有余。

　　前面提到，RTX 3090 Ti在专业能力和硬件规格方面完全不虚专业卡，那么它的散热稳定性和实际体验又如何呢？

　　和以往的TITAN系列不同，NVIDIA将RTX 3090 Ti放开给AIC厂商打造，以首发测试的影驰RTX 3090 Ti 星曜OC显卡为例，Furmark烤机测试中显卡长时间保持在450W的功耗，核心和显存温度的表现也相当不错。因此在碰到大型工作项目渲染的时候，其实不必太担心显卡的散热稳定性问题。

影驰RTX 3090 Ti 星曜OC烤机稳定性测试

　　在进行实际的创意工作流的过程中，RTX 3090 Ti的24GB显存在运行达芬奇8K分辨率RAW项目时，正常的无特效渲染播放，其实并不会占用过多的缓存，10GB的占用，RTX 3080 Ti都可以满足。

　　但是在调整了运动效果中的时域降噪、时间阈值、动态模糊等一系列我们想要的特效之后，8K高分辨率的特效渲染会大量占用显存空间进行运算，这时候RTX 3090 Ti的大显存优势便得到了发挥，如果是RTX 3090以下的显卡，渲染会直接提示报错。

影驰RTX 3090 Ti 星曜OC达芬奇实时渲染

　　来到热门3D建模软件blender，我们同时加载了一个双镜头的动画和实时场景动画项目，在使用内置的Cycles渲染器在交互渲染的过程中，会利用实时RTX光线计算和OpitX AI去噪技术的实时加载，类似这样的多工作流同时运行，对于显存的占用其实是相当之大的。

影驰RTX 3090 Ti 星曜OC blender实时渲染

RTX 3080 Ti blender实时渲染爆显存

　　在同时运行两个工作流之后，最后将实时场景进行帧渲染，可以看到显卡最高占用已经达到21GB，拥有高性能核心和大显存优势的RTX 3090 Ti在面对复杂的创意工作环境显然会更加游刃有余。

　　通过一系列的分析和影驰RTX 3090 Ti 星曜OC的实际体验，RTX 3090 Ti这块性能猛兽，在专业领域，依托于GA102满血大核心、24GB容量的高速ECC显存以及NVIDIA STUDIO创意工具，为创意设计人士发挥灵感带来高效和迅速的GPU加速性能体验。同时也能用于数据分析、深度学习以及可视化场景的深度应用。这是目前消费级最强大的GPU，对配置要求硬核的游戏玩家、内容创作者和数据科学家，相对而言，选择RTX 3090 Ti，比选择A6000更有“性价比”。

第三代NVLink模块

　　如果你觉得24GB显存不够折腾，购买2张RTX 3090 Ti+NVLink组成双卡48GB显存，价格都要比一张A6000低不少，可以说是组建顶级深度计算或图形工作站较为“划算”的方案了。

登上性能之巅的RTX 3090 Ti，为什么要取代“老大哥”RTX 3090？

Related Post

摩托罗拉被网友当成了曾经很火但已经消失了的品牌

携手Canonical：微软将systemd引入Windows Linux子系统

Corsair推超薄机械键盘K100 AIR 最薄处仅有11毫米