欧美vvv,亚洲第一成人在线,亚洲成人欧美日韩在线观看,日本猛少妇猛色XXXXX猛叫

新聞資訊

    開發商Inti Creates宣布,《少女射擊2》(Gal Gun 2)現已通過DMM Game Player平臺在日本登陸PC,售價7538日元。本作支持Window 7、Windows 8.1和Windows 10系統。

    《少女射擊2》最早在今年3月登陸PS4和Switch平臺。

    《少女射擊2》是一款由INTI CREATES CO., LTD.制作發行的動作冒險類游戲,在本作中,2位新的可愛女主角將接受天使“麗絲”的委托,將展開一場新的惡魔掃蕩大冒險!玩家可以一邊享受校園生活,一邊接受各種冒險委托。

    NVIDIA RTX 40系顯卡終于與我們見面,按照以往的慣例,通常都是游戲級別的“80”型號顯卡率先與我們見面,不過此次最先推出的卻是“90”級別的產品。

    其實根據目前的情況來看,GeForce RTX 4090率先推出,也是為了照顧到仍在市售的RTX 30系產品。還記得在RTX 30系顯卡推出時,大部分RTX 20系顯卡其實已經停產,整體的更新換代節奏明顯。

    而目前GeForce RTX 3090的價格基本不足萬元,也已經停產。所以在此時推出GeForce RTX 4090,其實并不足以影響到RTX 30系整體的銷售。

    每一次“90”級別的產品NVIDIA官方,其實很少宣傳游戲領域,不過此次在性能懸殊如此大的情況下,即便是NVIDIA對于它的游戲性能也是侃侃而談。

    順帶一提,本次NVIDIA將限量推出GeForce RTX 4090 FE公版,將會于北京時間10月12日晚9點在京東首發上市。喜歡公版設計或是想要收藏的玩家務必下手,只有當你拿在手里后,才能夠感受到什么叫滿分工業設計。

    01 NVIDIA GeForce RTX 4090 概覽

    今年的GeForce RTX 4090在外觀上變化不大,不過包裝還是一如既往的精美,并且此次NVIDIA還加入了環保的理念。

    外包裝依舊采用了啞光黑色硬紙盒,而且可以清楚地看到“GeForce RTX 4090”字體的變化,GeForce RTX的英文字樣更圓滑,而數字則更“厚實”。

    從側面可以看到,本次顯卡的包裝除了外圈的硬紙盒,內部全部采用了黑色瓦楞紙。在盒子兩側還有黑色膠帶防止運輸過程損壞。

    打開后的包裝有點像帳篷形狀,這張“性能怪獸”靜靜躺在那里,而且有意思的是,顯卡周圍的裝飾紋路自帶“震驚”效果。

    拿出顯卡后,包裝內還附贈了一根16pin轉8pin*4的轉接線。其實本次GeForce RTX 4090的建議電源與GeForce RTX 3090 Ti相同,都是850W,所以如果在RTX 30系配備了高瓦數電源的玩家大可以放心升級。

    NVIDIA GeForce RTX 4090 FE顯卡的整體尺寸為304×137×61mm,占用3槽空間。其實長度相較RTX 30系顯卡沒有變化,甚至比RTX 3090 Ti還少了10mm,但整體的質感和分量都有所提升,整卡約為2.2kg,這還是以簡約設計著稱的公版,很難想象各家AIC的顯卡到底會有多重。

    NVIDIA GeForce RTX 4090的整體設計依舊沿用了RTX 30系顯卡的外觀,但由于架構升級,發熱量增大,散熱自然也需要同步升級。本次的GeForce RTX 4090風扇尺寸再次增大,基本已經達到了顯卡整體框架的直徑,而在散熱風扇增大的基礎上,最大氣流動態增加20%,同噪音等級的氣流動態增加15%。

    視頻輸出接口上,依舊采用了HDMI 2.1 + DP 1.4a*3的四接口設計。HDMI 2.1可支持4K 120Hz HDR、8K 60Hz HDR,對于目前階段的產品來說完全夠用。

    至于呼聲較高的DP 2.0,其實目前絕大部分消費級游戲顯示器都沒有實裝,且DP 1.4a標準也能夠支持8K 60Hz刷新率的顯示器。所以,綜合來看,絕對夠用。

    況且,我們真的需要那么極致的規格嗎?羊毛出在羊身上的道理大家都懂。

    另外由于公版采用的雙軸流散熱系統,所以在視頻輸出接口部位能夠看到大量的散熱鰭片,這一點與上一代相同。

    本次GeForce RTX 4090的整卡功耗為450W,采用單16pin的輔助供電。目前已有部分電源廠商發布了最新的ATX 3.0標準高端電源,自帶12VHPWR的16pin供電接口,最高可支持600W供電。所以不出意外的話,或許下一代顯卡也將采用這樣的單16pin來供電。

    雖然目前所有顯卡廠商基本都會附贈一根轉接線,不過8pin*4的雜亂程度可想而知,有條件的話,一個ATX 3.0標準的電源簡直不要太整潔。

    需要注意的是,目前適用于RTX 30系列的12pin接口和電源轉接器與RTX 40系列顯卡不兼容。

    另外在RTX 40系顯卡中,即便是首發的旗艦GeForce RTX 4090也不支持NVLink,所以想要重現往日的四路泰坦是不可能了。

    最后來看一下GeForce RTX 4090內部的PCB板,依舊采用了“深V”的異形PCB,依舊緊湊的排布了所有的元器件,沒有一點浪費,并且在如此緊湊的環境下搭載了20+3相供電。整整齊齊,堪稱藝術品。

    NVIDIA同時還強調,在高負載下,GeForce RTX 4090的供電更穩定,不會出現劇烈的電壓、電流波動。

    02 Ada Lovelace 姓甚名誰?

    下面我們來看一下此次推出NVIDIA Ada Lovelace架構,我們先從Ada Lovelace這個人講起,相較于Ampere,這位似乎大家更陌生一些。

    Ada Lovelace(1815-1852)是英國數學家、計算機程序創始人,建立了循環和子程序概念,被稱為世界上第一位程序員

    Ada從小對數學有極高天賦,其父稱她為“平行四邊形公主”,后來的合作伙伴Charles Babbage稱她為“數字女巫”。在19歲時Ada嫁給了自己曾經的科學家庭教師,婚后的她對數學熱情不減。

    1842年到1843年花了9個月時間翻譯了Babbage的《分析機概論》的備忘錄,寫了很多注記,其中給出了用計算機進行Bernoulli數求解的詳細說明。由此,Ada被廣泛認為是世界上第一位程序員。

    而以她名字命名的語言——ada語言,已經成為了美國軍方開發戰斗機等尖端武器的語言。

    從幾行簡短的生平簡介中,不難看出Ada的生命雖然只經歷了短暫的37個春秋,但卻足以被后人銘記。

    這也是為什么此次NVIDIA RTX 40的先行宣傳中,用到了“以未來敬傳奇”的slogan,下面我們詳細剖析一下,這次的Ada Lovelace還有哪些創新和超越。

    03 NVIDIA Ada Lovelace架構

    本次發布的GeForce RTX 40系顯卡由全新的NVIDIA Ada Lovelace架構打造,采用TSMC 4nm定制工藝(TSMC 4 nm NVIDIA Custom Process),旗艦核心AD102達到了恐怖的760億個晶體管,而在RTX 30系顯卡中為280億個。

    與上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的性能提升。最高可達到90-TFLOPS的著色器數據吞吐量,而本次發布的GeForce RTX 4090則達到83-TFLOPs,相比上一代NVIDIA Ampere則只有40-TFOPs。

    完整的AD102核心共有18432個CUDA,其中包含12個圖形處理集群(GPCs), 72個紋理處理集群(TPCs), 144個流式多處理器(SMs)。144個第三代光追核心(RT Cores)、576個第四代張量核心(Tensor Cores)。另外可以看到Boost頻率也從1.9GHz猛增到了2.5GHz。

    另外一點在架構圖上沒有體現的是,AD102核心還包含288個FP64雙精度浮點核心(每SM 2個),用來確保FP64代碼正確處理,包括FP64張量核心代碼。

    通常來講,單精度浮點運算會用于深度學習模型訓練,而雙精度浮點運算則用于數值模擬工作。通常游戲卡都會砍掉FP64,這既節省了成本,又對游戲本身沒有影響。而專業卡都保留有FP64,目的就是為了精度更高訓練與計算。

    此次資料中只提到了AD102核心搭載了288個FP64,尚不知道后續的推出的產品有無變更。

    了解了完整的GA102核心,我們再來看一下RTX 4090的核心,其實知道了RTX 4090的參數,我們大概也能了解到后續可能推出的“Ti”系列究竟相差在哪。

    相比完整的GA102來說,RTX 4090共有16384個CUDA,其中包含11個GPC、64個TPC以及128個SM單元,第三代RT Cores為128個,第四代Tensor Cores為512個。

    其實根據完整的架構圖就能看出,此次Ada架構整體結構性的改動并不大,這一點從SM單元便能清晰印證,同樣的FP32 CUDA核心,同樣的FP32/INT32混合CUDA核心,同樣的L1級緩存等等。當然,每個SM單元內部的Tensor Core升級為第四代。

    不過變化最為顯著的,則是第三代光追核心,我們結合兩代架構來看。在第二代光追核心中,包含負責邊界交叉測試的Box Intersection Engine引擎,和負責三角形交叉測試的Triangle Intersection Engine引擎。

    而在第三代光追核心中,還增加了兩個新的引擎:Opacity Micro-Map Engines(OMM)Displaced Micro-Mesh Engines(DMM),這兩個新的硬件單元可以極大地提升光追性能(具體原理后文詳細介紹)。

    至此,每2個SM單元組成一個TPC單元,每6組TPC單元組成一個完整的GPC頂層單元(在部分核心中,會出現5組TPC組成一個GPC單元的情況)。

    而每個GPC單元又搭載一個獨立的光柵引擎、兩組ROP分區(每組包含8個ROP單元)。

    過多關于數數的部分就不再介紹了,畢竟此次架構圖的大面上與NVIDIA Ampere架構基本相同,下面我們分別來看看,除了性能Ada架構還有哪些升級。

    Shader Execution Reordering (SER)著色器執行重排序

    SER主要的作用是提升著色器性能,它可以將效率低下的工作負載,動態重組為更高效的工作負載。主要針對光線追蹤的性能提升非常大。

    簡單地說,GPU在執行類似工作的時候效率最高。但隨著光追效果越來越強大,每個場景可能有數百萬條光線照射在不同材質上,而我們知道不同材質的反射率,以及反射效果也是不同的。所以這樣就為著色器創建了大量的、發散的,效率低下的工作負載。

    SER則可以將這些雜亂的指令重新分門別類,動態重組為更高效的工作負載。根據NVIDIA的說法,SER可將著色器性能最多提升2倍,并將游戲幀率最高提升25%。

    舉個簡單的例子,當光線第一次從發射端到碰撞端是非常有規律的射線,而碰撞到物體后的二次光追,則會出現大量發散的、無規律的反射,這對于光追負載是非常高的。而從圖中便能看到,SER可以將這些指令進行二次排序,以發揮出著色器的最大性能。

    不過好在這么實用的功能并不是RTX 40系的專利,它是一個易于集成的SDK,目前需要游戲開發商集成在游戲中。另外由于它是一個通用的邏輯,后續也有可能直接集成在Windows的API中,這樣游戲開發者就無需特意引用,直接調用系統API即可。

    可以說SER對于手持RTX 20系及以上(能夠開啟光線追蹤)的N卡用戶來說,是極大地福音。畢竟免費提升的光追性能,誰不喜歡呢。

    第三代 RT Cores

    RT Core的作用在于更快的光線追蹤計算能力,如果說在RTX 30系顯卡中,想要暢享4K高幀率游戲有點吃力,那么RTX 40系顯卡中,將顯得輕而易舉。

    在GeForce RTX 4090這張顯卡上,達到了191 RT-TFLOPs的處理能力,而RTX 30系顯卡最快處理能力為78 RT-TFLOPs,足足為2.4倍。并且根據NVIDIA的官方說法,第三代RT Core的峰值RT-TFLOPs相比于前代提高了2.8倍。而這只能說明,這張4090并非Ada Lovelace架構的最終形態。

    Opacity Micro-Map Engines

    在第三代RT Cores中引入了兩個重要的硬件單元,首先是Opacity Micro-Map Engines,可以理解為微映射透明度引擎,它主要的作用是優化光線追蹤渲染,可大幅減輕著色器的工作負擔。

    比如樹葉之類的復雜物體,不同的光線都會影響它的表現狀態,以及樹葉之間的光線反彈,所以對于光線追蹤的計算量是巨大的。

    不過Opacity Micro-Map Engines可以將光線追蹤特性烘焙到不透明蒙版中,所以那些不規則形狀和半透明的對象,也就能夠更快更精準的渲染出來,從而極大減輕著色器的工作負擔。

    Displaced Micro-Mesh Engines(DMM)

    Displaced Micro-Mesh Engines可理解為微網格置換引擎,它構建光線追蹤的BVH(Bounding volume hierarchy)的速度提高了10倍!所使用的的顯存減少了20倍!

    DMM由第三代RT core本地處理,與前幾代相比,它只使用基本三角形渲染復雜幾何圖形,極大減少了存儲和處理需求。

    具體的工作原理從圖中一目了然,新的DMM可以將面數非常多的復雜圖形做簡化,創造出簡單的模型,但整體的光線追蹤效果不變。

    通過一些模型數據我們可以具體看到,新的DMM將模型簡化了多少。原本1100萬三角面的模型,經過簡化后,只有15萬左右的微網格,BVH的構建速度提升了8.5倍,小了6.5倍。

    而這還不是最夸張的,越復雜的模型往往優化的效果越好,在官方展示的這幾組對比示例中,最快可提升大于15倍的速度,容量簡化20倍的模型。

    第四代 Tensor Cores

    除了光追單元的升級外,第四代張量核心的升級更加恐怖。它采用了新的FP8張量引擎,在GeForce RTX 4090這張顯卡上,吞吐量達到了1.32 Tensor petaFLOPs,提高了5倍。

    注意這里的單位——petaFLOPs。以往的TFLOPs為萬億次浮點運算,而petaFLOPs則為千萬億次浮點運算。

    DLSS 3

    本次推出的DLSS 3也是RTX 40系一大賣點,從DLSS 2.3直接邁入了3.0版本,也能看出此次的升級之大。而DLSS 3也被NVIDIA官方稱為神經網絡渲染新時代。

    全新的DLSS 3在原有的DLSS超分辨率的基礎上,添加了光學多幀生成技術,以生成全新的幀,而不像原來只能生成像素。

    DLSS 3結合了DLSS超分辨率、DLSS幀生成和NVIDIA Reflex這三大技術,能夠重建八分之七的像素,極大提高性能。

    在GPU受限的游戲中,比如2K分辨率及以上的更高分辨率,DLSS 2能夠將幀率提高2倍,DLSS 3則能夠提升4倍。

    本次DLSS 3跨越了一個大版本,從想法和原理上也再度升級,完全“猜想”1幀的技術,我們解釋起來簡單,但實施起來需要大量的推理與演算,以及絕對超前的想法。

    不過“憑空”生成的1幀,在延遲上絕對要比DLSS 2高。所以此次完整的DLSS 3中,捆綁了NVIDIA Reflex,可以有效幫助減小延遲。

    這也不負NVIDIA給它起了個“神經網絡渲染新時代”的名號。縱觀目前市面上的XeSS、FSR技術,DLSS絕對稱得上“巨人的肩膀”。當然,連年的創新,苦的是手持上一代顯卡的玩家,想體驗DLSS 3的幀生成,目前唯一的辦法就是購入一張RTX 40系顯卡。

    New Optical Flow Accelerator

    New Optical Flow Accelerator光流加速器是在第四代Tensor Cores中最新引入的,這也是為何DLSS 3中的幀生成為RTX 40系顯卡獨享。

    光流加速器在原本DLSS 2的基礎上,還可以計算兩個連續幀內的光流場,能夠捕捉游戲畫面從第1幀到第2幀的方向和速度,從中捕捉粒子、反射和光照等像素信息。并分別計算運動矢量和光流來獲得精準的陰影重建效果。

    以《賽博朋克2077》為例,在第一幀,光流加速器會捕捉到每一個像素中的粒子、反射和光照等信息。并在第二幀中查找匹配的像素區域,計算幀之間的差值。

    如果說原來DLSS 2能夠“猜”出一張圖剩下的像素,那么DLSS 3除了這些,還能夠“猜”出下一幀的畫面。

    另外由于DLSS 3的幀生成是在GPU中處理和運行的,所以即使遇到CPU瓶頸的游戲,AI同樣能夠提升幀率。這也是為什么在此次發布會中說到,DLSS 3能夠突破CPU的限制來提升幀數。

    雙AV1編碼器

    本次升級的第八代NVENC編碼器可以說是直播、視頻、后期工作者的極大福音。它首次加入了對AV1編碼的支持,最顯而易見的效果就是直播。

    相比傳統的H.264編碼,AV1編碼的效率平均提升了40%,在同碼率下AV1編碼的畫質將更好。目前大部分直播的分辨率和清晰度,均受限于平臺規定的最大比特率。以Twitch限制的8Mbps為例,可以看到在同等帶寬下,同為2K 60幀的畫面,采用AV1編碼的清晰度明顯比H.264更高。

    說起直播,OBS相信大家都不陌生,在10月份即將發布的補丁中,OBS就加入了對NVENC的AV1編碼支持

    當然,直播只是我們更容易見到的AV1優勢,在視頻工作的所有環節,AV1編碼都可以帶來極大提升。

    所以,如圖所見。NVIDIA已經為廣大用戶鋪好了一條完整的生態鏈,從編碼API、軟件、平臺到播放器,將全面支持AV1編碼。

    另外再說一下NVIDIA一直強調的雙AV1編碼。顧名思義,即部分顯卡內搭載了兩個編碼器,它所帶來的效果也是顯而易見的。

    首先,根據官方宣傳的,在4K H.265的導出速度上,RTX 4090是RTX 3090 Ti的2.2倍;在8K H.265的導出速度上更是達到了2.5倍。這部分的提升,大家常用的剪映同樣適用,感興趣的用戶不妨親自體驗一下。

    除了導出速度,8K 60幀的視頻錄制在以前簡直難以想象,而雙編碼器的好處就是可以將圖像一分為二,兩個編碼器分別處理7680×2160的圖像信息,最后拼合完整。

    關于編碼部分,可能大部分用戶的感受不深,但當有一天,你想錄屏的時候,卻發現顯卡不支持,才會發覺它的重要性……

    隨著圖像逐漸進入到超清時代,硬件編碼和渲染幾乎已經成為不可或缺的幫手。雖然論質量,硬件編碼仍不及CPU軟編,但軟編做到了極限畫質,也要承受時間的無窮長。甚至在一張8K渲染圖中,兩種編碼方式的時間差距就已經達到了幾個小時,遑論一段10秒的CG動畫。在不斷進步的硬件編碼中,質量和時間也在不斷地被挑戰和刷新。

    04 測試平臺簡介

    首先介紹一下測試平臺,為了保障NVIDIA GeForce RTX 4090這張怪獸的性能發揮,我們的平臺也再次進行了全面更新。

    不過由于手頭上沒有旗艦處理器,采用了本代中高端產品,并且電源和顯示器上進行了著重升級。

    本次因為性能大幅升級,且DLSS 3的加入,所以真正的4K時代已經來了。我們選擇了愛攻&保時捷(Porsche Design)聯合設計的PD32M。設計理念這里不再多講,但這款顯示器的性能也著實強悍。

    首先配備了4K/144Hz的硬性指標,并且采用MiniLED背光技術,支持1600尼特峰值亮度,8000萬:1動態對比度,通過HDR1400認證。

    10.7億顯示色數, 97% DCI-P3、99% Adobe RGB覆蓋率,色彩精準度ΔE<2(平均值),色彩呈現更加精準、豐富。

    RTX 40系顯卡性能暴漲的同時功耗也有較大幅度上漲,鑫谷昆侖KL-1250G金牌全模組電源配備原生的12VHPWR 16pin線材,無需轉接線,扎實的做工設計、高品質日系電容等用料,保證電源的穩定性和長壽命,1250W的額定功率提供了較大的冗余,輕松應對RTX 4090,80Plus金牌認證可提供高達90%的轉換效率,讓高功率電源更加節能省電。

    首先看一下GPU-Z的參數,NVIDIA GeForce RTX 4090采用AD102核心,采用TSMC 4nm定制工藝(TSMC 4 nm NVIDIA Custom Process),芯片面積608平方毫米,這里相對于RTX 30系的GA102的628平方毫米更小。

    擁有16384個CUDA,相比RTX 3090 Ti的10752多52%,Boost頻率達到了2520MHz,而RTX 3090 Ti為1860MHz,提升非常大。

    采用24GB GDDR6X Micron顯存,位寬為384bit,顯存帶寬達到了1008.4 GB/s,光柵單元和紋理單元為176和512。

    05 理論性能測試

    下面先進行的是用來衡量顯卡DX11理論性能的3DMARKFS套裝:FS,FSE,FSU三者分別對應顯卡在1080P、2K、4K的理論性能,取顯卡分數實際測試結果如下:

    在針對顯卡DX11性能的3DMARK FS套裝測試中,GeForce RTX 4090的提升非常驚人,可以看到在分辨率越高的情況下這張顯卡提升越大,其中FS提升了48%;FSE提升了66%;FSU則暴力提升了75%

    綜合來看,在整個FS套裝的測試中,GeForce RTX 4090相較GeForce RTX 3090 Ti的提升約為63%

    而在針對DX12環境下的Time Spy和Time Spy Extreme測試中,GeForce RTX 4090相較GeForce RTX 3090 Ti的提升分別為:TS提升56%;TSE提升69%,綜合下來約為63%。

    PortRoyal是3DMARK中專門針對光追性能的測試項,GeForce RTX 4090相較GeForce RTX 3090 Ti的提升約為56%

    綜合來看,GeForce RTX 4090的理論性能相較GeForce RTX 3090 Ti的提升約為61%。根據CUDA數量來看,這個成績還是比較合理的。

    不過,其實在功耗測試中,我們發現這張卡被限制了比較大的功耗,這一點我們后邊會進行詳細說明。

    在本次測試中,我們使用3DMARK的測試版進行了DLSS 3的相關測試。其中DLSS關閉為52.19幀,DLSS 3開啟后為154.98幀。

    另外我們也測試了GeForce RTX 3090 Ti在該程序下成績,其中DLSS關閉為32.73幀,由于不支持DLSS 3,所以在DLSS 2下的成績為83.63幀。

    以兩代不同架構的產品來說,對比有些不公平,我們對比自身的不同提升。

    GeForce RTX 4090在開啟DLSS 3后,相比關閉提升了197%;而GeForce RTX 3090 Ti在開啟DLSS 2后,相比關閉提升了155%。

    當然DLSS 3最夸張的還不止數字上這么簡單,我們再來看看這張圖。

    在8K(7680×4320)分辨率下的DLSS 3測試中,GeForce RTX 4090在DLSS關閉的情況下僅有12.7幀,屬于PPT范疇了,而在開啟DLSS 3后,一躍達到了86.11的流暢水準,提升了578%!

    通過DLSS的測試,其實給我的震驚很大。感覺老黃在RTX 30系顯卡中說的“8K游戲體驗”在RTX 40系顯卡中,終于能有機會實現了。順便做一下預告,在后續我們也會拿到一款8K顯示器來對游戲進行真實測試,看看8K到底離我們還多遠。

    06 常規游戲性能測試

    由于本次RTX 40系加入了DLSS 3新技術,所以后面會進行單獨測試,這里依然選擇主流的幾款3A大作進行游戲性能對比。

    首先在《地平線5》中,可以明顯看到,不止在1080p分辨率下,即使在2K分辨率中,受限CPU的情況依然明顯。可以說如果你入手這張GeForce RTX 4090,4K/144Hz的顯示器應該是最低配置。

    性能方面,GeForce RTX 4090相比GeForce RTX 3090 Ti的提升分別為:1080p提升32%;2K提升35%;4K提升56%,綜合提升41%

    在《刺客信條:英靈殿》中,GeForce RTX 4090相比GeForce RTX 3090 Ti的提升分別為:1080p提升48%;2K提升51%;4K提升40%,綜合提升46%

    在《無主之地3》中,GeForce RTX 4090相比GeForce RTX 3090 Ti的提升分別為:1080p提升43%;2K提升63%;4K提升65%,綜合提升57%

    《光明記憶:無限》的光追測試軟件是獨立于游戲的測試工具,比游戲中用到的光線追蹤技術更多,測試條件為“RTX最高/DLSS質量”。所以測試幀數相對較低,但實際游戲配置相當親民。

    性能方面,GeForce RTX 4090相比GeForce RTX 3090 Ti的提升分別為:1080p提升42%;2K提升54%;4K提升60%,綜合提升52%

    在另外一款國產游戲《邊境》的跑分軟件中,情況基本與《光明記憶:無限》相同,測試條件均在“RTX最高/DLSS質量”下進行。

    在《邊境》中,GeForce RTX 4090相比GeForce RTX 3090 Ti的提升分別為:1080p提升50%;2K提升67%;4K提升77%,綜合提升65%

    07 DLSS 3性能測試

    由于本次新技術DLSS 3的推出,將有35款游戲將于近期推出全新的DLSS 3功能,本次我們也拿到了部分游戲的測試版。

    另外《超級人類》、《生死輪回》、《逆水寒》“拂云庭“、《微軟模擬飛行》、《瘟疫傳說:安魂曲》都將在10月陸續發布支持DLSS 3的版本。

    《賽博朋克2077》、《F1 22》、《瘟疫傳說:安魂曲》、《微軟模擬飛行》、《逆水寒》本次進行了DLSS 3的測試,另外Unity和虛幻引擎也提供了本次的測試程序。

    本次DLSS 3的測試圖標比較繁瑣,并且增加了1% Low FPS和延遲的測試,普通的FPS好理解,那么這個1% Low FPS是什么意思。

    首先,游戲benchmark通常測試的FPS即為,一段時間內的游戲平均幀。而1% Low FPS則是將一段時間內的幀數從大到小排列,取最小的1%出來,再對這1%的數求平均值。

    其實簡單來說,這兩個數值都不能代表我們在游玩時,具體哪一刻的感受,但FPS更注重整體,而1% Low FPS則是從最差的里面求平均,更謹慎一些。

    看懂了1% Low FPS,我們再來看這張圖表,在坐標軸左側的為延遲(越低越好),坐標軸右側的均為幀數(越高越好),并且由于牽扯到正負坐標,所以兩側的值有可能會不同。

    由于目前測試DLSS 3的游戲均為測試版,所以難免出現BUG。

    在《微軟模擬飛行》中,在開啟和關閉DLSS 2的時候,分數幾乎無變化。這款游戲是極度吃CPU資源的游戲,如果瓶頸卡在處理器上,那么傳統的DLSS 2的確無法提供更多的幀數加成。

    而在DLSS 3中,我們能夠明顯看到幀數的大幅提升,要知道我們所有DLSS 3的測試均在4K分辨率下進行。看來利用幀生成來突破CPU瓶頸限制,實際表現確實如宣傳的那樣神奇。

    不過幀生成并不是毫無弊端,這也是為什么此次測試加入了延遲。并且在開啟DLSS 3后,NVIDIA Reflex是捆綁開啟的。但相對于DLSS 2增加的這點延遲,在實際體驗中的感受并不強。

    在《賽博朋克2077》中的數據反映比較真實,可以看到在DLSS關的光線追蹤最高的情況下,即便GeForce RTX 4090顯卡也只有41幀,并且延遲達到了85.7毫秒。而在開啟DLSS 3后,幀數為127,提升了210%。雖然相比DLSS 2的延遲高了6毫秒左右,但依然維持在較低的水平。

    《瘟疫傳說:安魂曲》是即將發布的一款游戲,在DLSS 3和DLSS關之間的幀數提升,同樣達到了130%。可以看到雖然DLSS 3的延遲有所增加,但仍然比DLSS關閉后要低。

    目前《F1 22》的數據測試同樣有問題,在DLSS關和DLSS 2中均沒有延遲數據。這一組主要看幀數的提升。其中DLSS 3相比DLSS關的幀數提升了124%,相比DLSS 2的提升也達到了55%。

    最后則是國產游戲《逆水寒》的光追測試,本次我們選擇的測試demo采用了真正的全局光照。所以在我嘗試關閉DLSS運行后,第一次電腦直接崩潰重啟,第二次僥幸能夠運行,幀數也僅有個位數,而延遲早已上萬。

    還記得在純光線追蹤軟件中測試的《光明記憶無限》和《邊境》,在本次只有DLSS 2的情況下都能夠達到80幀左右。而《逆水寒》這款真正意義上的全局光照,在DLSS 2開啟后僅有40幀左右,著實恐怖。

    當然針對畫質方面,我們也進行了測試,在上圖中我們截取《賽博朋克2077》中的一角,可以看到在兩種DLSS模式下,相較原畫質幾乎沒有明顯變化,只在柵欄處的光影效果有所不同,但對于如此大幅度的幀數提升,這點瑕疵幾乎可以忽略不計。

    在Unity的測試程序中,有一組實時演算的光線追蹤+DLSS的幀數對比。GeForce RTX 4090在開啟DLSS 3后,實時幀數為83;而GeForce RTX 3090 Ti在開啟DLSS 2后,實時幀數為39幀,提升約為113%

    在UE5提供的測試游戲中,方便的給出了DLSS的快捷測試,這里分為DLSS關(超分辨率關+幀生成關+Reflex關);DLSS 2(超分辨率性能+幀生成關+Reflex開);DLSS 3(超分辨率性能+幀生成開+Reflex開)三檔測試。

    其中,DLSS關的即時幀數為66幀,DLSS 2為112幀,DLSS 3為154幀。不過UE5這個測試的DLSS 3延遲為57.1ms,而DLSS 2為20.5ms,相對較高。

    08 專業軟件測試

    作為“90”級別的顯卡,擁有24GB的超大顯存,內容創作者領域的應用是必不可少的。我們使用SPECviewperf 13這款工業、專業軟件跑分測試。

    對比顯卡為GeForce RTX 4090顯卡、上一代旗艦GeForce RTX 3090 Ti顯卡以及上一代游戲旗艦GeForce RTX 3080 Ti顯卡。

    在SPECviewperf 13的軟件測試中,其實仍然出現不少問題。每款專業軟件對于性能提升的程度不盡相同,而且剛剛推出的顯卡對軟件適配也多多少少存在著問題,3DS MAX甚至出現了負增長的情況,所以后續在軟件更新完善后將再做測試。不過目前部分軟件的分數仍能反映出GeForce RTX 4090的強悍之處。

    Blender是一款專業的三維渲染軟件,本次推出了固定的benchmark跑分軟件,省去了安裝軟件下載素材的麻煩。這款跑分軟件只需下載好啟動程序,軟件會自動渲染測試monster/junkshop/classroom共三個場景。

    上圖為GeForce RTX 4090顯卡得分,分別為6320/2894/2937分,平均4050分;下圖為GeForce RTX 3090 Ti顯卡得分,分別為3136/1812/1549分,平均2165分。通過平均分的比較不難發現提升非常明顯,達到了87%,這對于以幀為渲染單位的動畫來說,能夠大幅度節省時間。

    09 功耗及溫度測試

    功耗測試中,我們選擇FurMark軟件進行拷機測試,并采用GPU-Z檢測溫度,功耗僅計算顯卡自身。

    GeForce RTX 4090這張顯卡最讓人驚嘆的地方在于溫度控制,看來改進的散熱器效果顯著。通過14分鐘左右的拷機測試,溫度一直控制在60℃以下,核心溫度也僅有66℃,對于這張AD102的旗艦芯片來說難能可貴。

    值得一提的是,在拷機測試中我們發現,盡管顯卡占用達到滿載,但峰值功耗一直在300W左右徘徊,TDP也鮮有超過70%的情況。而官方數據中GeForce RTX 4090的整卡功耗為450W。

    在3DMARK的TSE拷機中,功耗有所增加,但依然與450W相距甚遠。

    所以筆者后續嘗試了手動增加功耗,雖然理論測試的分數有所提升,但效果不大。所以推測在當前參數配置下,300W是否為一個甜蜜區間?即超過該功耗后,雖然顯卡分數有所提升,但與增加的功耗其實不成正比。又或者是首發為了穩定性考慮,驅動限制了較大的性能發揮,所以后續我們也會隨著RTX 40系的上市,持續觀察。

    10 小改動 大飛躍

    本次GeForce RTX 4090顯卡的首測其實時間非常緊張,并且由于DLSS 3的性功能增加,大部分游戲均為測試版,其中存在著各種各樣不穩定因素和BUG,后續我們也會持續更新測試方法及游戲。

    Ada架構的問世,其實在看到架構圖時,并沒有帶來很驚艷的感覺。畢竟在大框架上,它和Ampere太像了,我們能看到的變化,僅僅是在光追單元增加了兩個微引擎。

    然而實測后的結果確實出乎了所有人的預料,尤其是《微軟模擬飛行》,這個最新的硬件殺手能夠極大限度的榨取CPU和GPU性能。但在4K分辨率下,開啟DLSS 3后的平均幀數能夠達到150幀,這是什么概念?

    以前的顯卡,包括RTX 30系的旗艦產品,在4K分辨率下測試3A游戲基本都無法達到100幀。而Ada和DLSS 3的橫空出世,讓4K/144不再是我們一直追求的極限,甚至唾手可得!

    可以這么說,如果你置辦一張GeForce RTX 4090顯卡,那么4K/144Hz的顯示器應該是最低配,但這個最低配也是市面上顯示器的頂配了。變相帶動顯示器行業發展,這也只是其中之一,視頻協議甚至也將再次升級。

    除了強關聯的顯示器領域,電源、數據線、鼠標等與之相關的領域也將相繼升級。可以說此次RTX 40系顯卡的推出對于整個DIY行業都是一次難得提升。

    說回顯卡本身,在外觀方面,由于沿用了RTX 30系公版的設計,整體變化不大,但做工用料依舊堪稱王道,拿在手上讓人忍不住摩挲幾下,但又生怕粘上指紋不好清除。

    而此次GeForce RTX 4090散熱器的升級,除了外觀上顯得更加厚重外,散熱效果當屬滿分。滿載拷機僅60℃,這對于一款TITAN級別的旗艦顯卡來說著實難得,簡單打打3A游戲風扇甚至都不轉,這是一種什么體驗。

    在性能提升上,GeForce RTX 4090的理論成績,相較GeForce RTX 3090 Ti提升約為60%,根據CUDA數量來看,這個提升較為合理。不過或許是因為首發較為保守,我認為仍沒有達到它的極限。

    關于GeForce RTX 4090或者是RTX 40系的市場定位,很難說它會快速頂上RTX 30系或者RTX 20系的地位,況且這種“超時代”的產物不是大部分玩家所需。而有違常理的率先推出“90”級別顯卡,NVIDIA也有意讓RTX 30系再消化一點時間,畢竟這個時間節點到了,不發點什么說不過去。

    最后強調一下,本次NVIDIA將限量推出GeForce RTX 4090 FE公版,將會于北京時間10月12日晚9點在京東首發上市。喜歡公版設計或是想要收藏的玩家務必下手,只有當你拿在手里后,才能夠感受到什么叫滿分工業設計。

網站首頁   |    關于我們   |    公司新聞   |    產品方案   |    用戶案例   |    售后服務   |    合作伙伴   |    人才招聘   |   

友情鏈接: 餐飲加盟

地址:北京市海淀區    電話:010-     郵箱:@126.com

備案號:冀ICP備2024067069號-3 北京科技有限公司版權所有