玩光追,有它才暢快!8款光追遊戲GPU效能對比測試

NVIDIA GeForce RTX 20系列GPU的誕生讓實時光線追蹤這一概念被眾多遊戲玩家所熟知,反射、陰影、全域性光照等渲染效果讓遊戲玩家體驗到了光線追蹤的魅力,DLSS技術則讓玩家在享受逼真渲染效果的同時還能獲得足夠流暢的遊戲幀率。去年9月,NVIDIA GeForce RTX 30系列GPU攜第二代RT Core和升級後的Tensor Core而來,給玩家提供更暢爽的光追體驗是它的使命之一。或許是認識到光線追蹤將成為遊戲大作的主流配置,AMD也推出了支援光線追蹤的Radeon RX 6000系列GPU。那麼對於想要暢玩光追遊戲的玩家來說,什麼GPU更值得購買呢?針對這一問題,我們決定用測試結果來給你答案。

理論戰力對比

在進行實測對比之前,我們不妨先透過NVIDIA GeForce RTX 30系列和AMD Radeon RX 6000系列GPU的規格引數來對比它們的“理論戰力值”。NVIDIA GeForce RTX 30系列GPU(下文簡稱RTX 30系列GPU)基於目前最新的NVIDIA Ampere架構,該架構採用改進的Streaming Multiprocessor (下文簡稱SM) ,它由不同核心、單元以及記憶體構成。

NVIDIA Ampere架構SM的一大變化是FP32操作的吞吐量變為兩倍。為實現這一目標,新資料路徑設計是每個SM分割槽每時鐘能夠執行32個FP32操作,所有四個SM分割槽組合在一起,每個時鐘可執行128 FP32操作。這能帶來什麼好處呢?簡單來說,圖形、計算操作和演算法、現代著色器工作負載通常混合使用FP32算術指令。FP32加速也有助於光線追蹤降噪著色器。光線追蹤渲染工作負載越大,相對於上一代產品的效能提升越大。

和RTX 20系列GPU相比,RTX 30系列GPU的RT Core和Tensor Core均進行了增強。其中,RTX 30系列GPU搭載的是第二代RT Core。NVIDIA的資料表明,第二代RT Core的效能達到上一代的兩倍左右,同時其運動模糊渲染效率更是達到上一代RT Core的8倍。

▲光線追蹤過程簡介和硬體實現方法介紹

▲NVIDIA在RTXGPU的RT核心上的實現方法

在GPU上引入Tensor Core(中文名為“張量核心”)是NVIDIA近年來的一大創舉。RTX 30系列GPU上搭載的是第三代Tensor Core,其主要特點是支援更多的資料格式,大幅度加強了在稀疏矩陣計算時的效能。比如在原始矩陣具有稀疏性時,第三代Tensor Core的速度可達到第一代的20倍等。而在實際遊戲中,第三代Tensor Core提供的就是玩家熟悉的NVIDIA DLSS功能,其主要作用是在遊戲中有效遏制幀率下降,同時還能提供優秀的畫質表現。目前,NVIDIA DLSS已經更新至2。1版本,並在遊戲中提供了質量、平衡、效能和超效能這4種模式供玩家選擇。

▲面向圖形的安培架構也加入了第三代張量計算核心,專門為稀疏矩陣最佳化。

此外,引入光線追蹤動態模糊加速也是基於NVIDIA Ampere架構的第二代RT Core上一個重要的技術創新。動態模糊是一種非常流行且重要的計算機圖形效果,它可用於遊戲、電影以及許多專業渲染應用程式中。從原理上來講,動態模糊的本質和膠片攝影相關,因為膠片攝影時,影象不是立即建立的,而是透過將膠片在有限的時間段內曝光來建立的。這意味著目標物體在膠片快門時間內的高速移動將帶來模糊的曝光效果。如果GPU想要建立類似效果,必須模擬相機和膠片工作流程。動態模糊對於電影是非常重要的,它能夠避免畫面出現斷續卡頓的情況,對遊戲來說亦是如此。

▲RTX 30系列GPU上的動態模糊光線追蹤實現方法和具體結果

AMD Radeon RX 6000系列(下文簡稱RX 6000系列)GPU是AMD第一代支援硬體光線追蹤渲染的產品。該系列GPU基於AMD最新推出的RDNA 2架構,並透過引入硬體光線追蹤單元(下文簡稱:RA單元)以實現對硬體光線追蹤渲染的支援。目前的資料顯示,RDNA 2架構的每個CU單元配備1個RA單元,同時AMD宣稱RA單元的光線追蹤交叉效能是傳統軟體執行的10倍。資料顯示,RDNA 2架構的GPU在微軟DXR SDK的Procedural Geometry的測試中帶來了471fps的成績,在軟體模擬下只有34fps,因此效能達到了軟體的13。8倍。實際上Procedural Geometry只是整個DXR SDK中的一部分,用於測試地面以上所有物件在光線追蹤上的效能,其圖元資訊包括解析幾何、體積幾何和帶符號的距離幾何等多重內容。

▲RX 6000系列GPU的RDNA 2架構加入硬體光線追蹤模組

從前文中的規格引數來看,RTX 30系列GPU和RX 6000系列GPU均在硬體層面支援實時光線追蹤渲染,但考慮到RTX 30系列GPU還得到第三代Tensor Core的加持,它可以大幅提升遊戲幀率,所以我們認為RTX 30系列GPU在光追遊戲中開啟DLSS之後的遊戲效能應該更加出色。那麼實際情況如何呢?下面我們就在遊戲實測中一探究竟。

光追效能對比測試

參與本次測試的GPU是來自NVIDIA的GeForce RTX 3080、GeForce RTX 3070、GeForce RTX 3060 Ti(下文分別簡稱RTX 3080、RTX 3070、RTX 3060 Ti),以及它們各自的對位GPU—AMD Radeon RX 6800XT、Radeon RX 6800、Radeon RX 6700XT(下文分別簡稱RX 6800XT、RX 6800、RX 6700XT)。同時,我們還為這些參測GPU搭配了以AMD銳龍 9 5950X處理器、ROG CROSSHAIR Ⅷ DARK HERO主機板、DDR4 3200 32GB雙通道記憶體為核心的測試平臺。

測試遊戲的選擇上,《賽博朋克2077》這款時下火爆的光追遊戲自然不可或缺,同時我們還挑選了包含《堡壘之夜》《我的世界》《控制》等共計8款光追遊戲參與測試。考慮到來自NVIDIA的3款RTX 30系列GPU還支援DLSS技術,所以我們在測試中將分別測試這3款GPU在“光追:開+DLSS:關”,以及“光追:開+DLSS:開”設定下的效能。遊戲設定方面,所有參測遊戲的光線追蹤等級將設為最高,同時部分參測遊戲支援多種DLSS模式,我們在本次測試中統一選擇平衡模式。需要說明的是,由於RTX 3080、RTX 3070、RTX 3060 Ti在1080p解析度下執行《古墓麗影:暗影》和《地鐵:離去》時不支援開啟DLSS,所以在這兩款遊戲中,我們不考察這3款GPU在1080p解析度下同時開啟光線追蹤和DLSS的效能。

測試平臺一覽

GPU:NVIDIA GeForce RTX 3080

NVIDIA GeForce RTX 3070

NVIDIA GeForce RTX 3060 Ti

AMD Radeon RX 6800XT

AMD Radeon RX 6800

AMD Radeon RX 6700XT

處理器:AMD銳龍 9 5950X

記憶體:DDR4 3200 32GB雙通道

主機板:ROG CROSSHAIR Ⅷ DARK HERO

電源:ROG THOR 1200W

享受光追,享用DLSS

目前,光線追蹤提供了反射、漫反射、全域性光照、陰影等多種渲染效果,那麼在實際遊戲中,光線追蹤能給遊戲畫質帶來怎樣的變化呢?我們不妨參考《控制》《賽博朋克2077》《我的世界》這3款遊戲的截圖。此外,DLSS在提升遊戲幀率的同時,還在畫質上有著不錯的表現,這一點我們也可以透過遊戲截圖來實際對比一下——光追+DLSS的確是當下頂級遊戲感官享受的天作之合。

▲從《控制》的遊戲截圖我們可以看到,開啟光線追蹤之後,玻璃幕牆上反射出遊戲主角和周圍環境的倒影,而且開啟DLSS前後的遊戲畫面在細節上的表現也幾乎保持同一水準。

▲對比《賽博朋克2077》的遊戲截圖我們可以看到,開啟光線追蹤後,地面上的倒影更加細膩且逼真。在開啟光線追蹤的基礎上,我們再將這款遊戲的DLSS設為“平衡”模式。對比DLSS開啟前後的截圖我們可以看到,遠處廣告牌的細節基本保持一致。

測試成績解析部分,我們將首先對比參測GPU在開啟光線追蹤,並關閉DLSS時的遊戲效能。隨後我們還會把RTX 3080、RTX 3070、RTX 3060 Ti在同時開啟光線追蹤和DLSS之後的遊戲效能,分別與RX 6800XT、RX 6800、RX 6700XT進行對比。

首先在開啟光線追蹤,並關閉DLSS時f,參測3款RTX 30系列GPU大獲全勝。例如在2。5K解析度和最高畫質下,RTX 3080執行《控制》的平均幀率達到72fps,而其對位GPURX 6800XT在相同設定下執行《控制》的平均幀率僅有49fps,後者的測試成績不僅落後RTX 3080約47%,同時還遠低於60fps這一絕對流暢基準線。可以預見的是,在一些光線追蹤環境較為複雜,或者玩家與敵人進行激烈對抗的過程中,RX 6800XT在2。5K解析度和最高畫質下很難給玩家提供足夠流暢的光追體驗。不僅如此,分別在1080p、2。5K和4K下執行《我的世界》時,RTX 3080和RTX 3060 Ti測得的平均幀率都達到其對位GPURX 6800XT和RX 6700XT的兩倍或更高。同時相比RX 6800,RTX 3070在上述3種解析度下執行《我的世界》的平均幀率也都高出85%以上。

下面我們再來看看開啟DLSS之後,參測3款RTX 30系列GPU的光追遊戲效能。測試成績顯示,相比關閉DLSS時,這3款RTX 30系列GPU在開啟DLSS之後的效能提升非常大。例如關閉DLSS時,RTX 3080在4K解析度和最高畫質下執行《我的世界》的平均幀率為34fps,而當開啟DLSS之後,其平均幀率提升180%,達到95fps。不僅如此,和6800XT、RX 6800、RX 6700XT這3款GPU相比,參測3款RTX 30系列GPU開啟DLSS之後的光追效能領先非常多。同樣以《我的世界》為例,RX 6700XT在4K解析度和最高畫質下執行這款遊戲的平均幀率為10fps,而其對位GPURTX 3060 Ti在相同設定下執行《我的世界》的平均幀率高達60fps,是前者的6倍。

RTX 30系列GPU,光追遊戲玩家的不二之選

憑藉強大的NVIDIA Ampere架構,特別是效能大幅增強的第二代Tensor Core,RTX 30系列GPU在光線追蹤遊戲中的效能完全碾壓競爭對手的RX 6000系列GPU,這一點在我們本次測試中就得到證明。需要注意的是,光線追蹤開啟之後,遊戲幀率往往會存在不同程度上的下降,就目前來看這是在所難免的。不過對於 DLSS技術來說,這正是它大顯身手的時候。得益於深度學習和 AI 的強大功能,DLSS可以大幅提升遊戲幀率。從我們的測試成績可以看到,RTX 3060 Ti的定位雖然比RX 6800XT更低一些,但在開啟DLSS之後,其光追遊戲效能也能在不同程度上領先RX 6800XT。不得不說,能給一款GPU帶來越級的效能提升,目前只有DLSS能做到。

想要獲得更逼真的遊戲畫質,同時有能體驗非常流暢的遊戲幀率,這是玩家不變的追求。就目前來看,光線追蹤所提供的逼真遊戲畫面基本可以看作當下“天花板”一般的存在。那什麼才能幫助玩家實現體驗高幀率的夢想呢?答案自然是DLSS。換而言之,逼真的遊戲遊戲畫面和流暢的遊戲幀率,它們在以前就像魚和熊掌不可兼得,但有了光線追蹤和DLSS,這一切就成為可能。不難看出,光線追蹤和DLSS就像是一對絕佳拍檔,玩光追就得有DLSS。放眼當下,基於最新的NVIDIA Ampere架構,並同時支援光線追蹤和DLSS的RTX 30系列GPU,無疑是遊戲玩家享受暢爽光追體驗的不二之選。

相關文章