您的位置:首頁 > 國內 >

全球熱頭條丨NVIDIA RTX 40系列顯卡Ai測評

2023-07-04 12:21:27 來源:PConline太平洋科技

在Ai繪畫領域火熱的前夕,我們針對15款NVIDIA顯卡進行了一次針對StableDiffusion模型的生成時間測試


(資料圖片)

Ai生成

通過使用多模態(tài)的StableDiffusion測試,我們將充分挖掘這些顯卡的算力性能。并且,從個人玩家的角度出發(fā),我們將為你揭示哪款顯卡是你在Ai領域的最優(yōu)選擇。在接下來的評測中,我們將對40系顯卡家族的各成員進行詳細介紹和性能測試,包括RTX4090、RTX4080、RTX4070、RTX4070Ti、RTX4060Ti和RTX4060,以及RTX3060。通過對比他們在StableDiffusion模型上的表現(xiàn),將為你提供關于顯卡性能和價格的綜合考量。

首先介紹一下測試背景與條件:隨著StableDiffusion上的模型與圖片生成算法的不斷豐富,我們采用了4個測試環(huán)節(jié)來進行全面且多角度的顯卡Ai算力測試:

1.利用NVIDIA官方提供的“Ai房屋”測試,來生成符合官方數(shù)據(jù)的測試結果。

2.利用civitAi(一個Ai模型聚合網站)上火熱的Ai人像模型與圖片生成算法進行一組模擬真實小姐姐的測試。

3.利用civitAi(一個Ai模型聚合網站)上火熱的Ai人像模型與圖片生成算法進行一組模擬魔幻怪物小姐姐的測試。

4.針對第2個測試環(huán)節(jié)增加生成圖像的分辨率,盡量占用每一張顯卡的顯存,來觀察在極限顯存占用的情況下,各顯卡之間的表現(xiàn)。

首先還是先來看一下參賽選手們的“個人信息”匯總:

其中與Ai繪圖會高度相關的參數(shù),我們總結出了這幾點,Ai生成圖像主要依賴于顯卡的并行計算能力。以下是幾個顯卡核心參數(shù)及其與Ai生成圖像之間的關系:

1. 顯卡流處理器數(shù)量(SM): 流處理器數(shù)量是顯卡內部處理單元的數(shù)量。每個流處理器包含一定數(shù)量的CUDA核心、Tensor核心和其他處理資源。流處理器數(shù)量越多,顯卡并行處理任務的能力越強,對Ai生成圖像的性能提高更明顯。

2. 顯卡CUDA內核數(shù)量(CUDACores): CUDA核心是NVIDIA顯卡的基本處理單元,用于執(zhí)行并行計算任務。CUDA核心數(shù)量越多,顯卡的并行計算能力越強,Ai生成圖像的速度也會相應提高。

3. 顯卡Tensor內核(TensorCores): Tensor核心是NVIDIA顯卡特有的處理單元,專為深度學習和Ai任務設計。它們可以高效地執(zhí)行矩陣乘法和累加運算,這是深度學習中的核心計算操作。Tensor核心數(shù)量越多,顯卡在Ai生成圖像任務中的性能越優(yōu)秀。

*3060的Tensor核心為第三代,40系顯卡為第四代

4. 顯卡顯存容量、顯存位寬、顯存帶寬: 顯存容量對Ai生成圖像的影響取決于模型的大小和復雜度。顯存容量越大,可以處理的模型和數(shù)據(jù)越多。顯存位寬和顯存帶寬影響數(shù)據(jù)在顯卡內部的傳輸速度。顯存位寬越寬、顯存帶寬越高,顯卡處理大型Ai任務的能力越強。

顯存容量

顯存位寬

5. L1緩存(MB): L1緩存位于每個流處理器(SM)內部,離CUDA核心和Tensor核心非常近。它的訪問速度非常快,但容量相對較小。L1緩存主要用于存儲局部變量和線程間共享的數(shù)據(jù)。在Ai生成圖像任務中,高效的L1緩存可以提高處理速度,降低內部數(shù)據(jù)傳輸延遲。

6. L2緩存(MB): L2緩存位于顯卡的全局內部,所有SM共享。它的容量比L1緩存更大,但訪問速度相對較慢。L2緩存主要用于緩存全局內存中的數(shù)據(jù),以減少顯存訪問延遲。對Ai生成圖像任務來說,高效的L2緩存可以提高數(shù)據(jù)處理速度,特別是在處理大型模型和數(shù)據(jù)集時。

L2緩存(MB)

不多說,我們進入測試環(huán)節(jié),首先來個官方的開胃菜,畫圖的參數(shù)是:使用v2-1768-emapruned模型;768*768的尺寸;Steps:50;CFGscale:7.5,一組10張圖,每次繪畫3組,該測試能夠反應絕大多數(shù)Ai繪圖的生成效果成績,尤其是在做一些工業(yè)Ai、實物生成的用途時。

第二組就是我們可愛的Ai小姐姐,我們使用了majicmixRealistic_v6模型,搭配FilmVelvia2Lora與修復眼睛、姿態(tài)的插件進行了生成式繪圖。Steps:50,采集器:Euler,CFG:7.5,Seed:172450070,Size:1024x768,共生成1組,6張圖片,代表了絕大場景下的Ai模特(女友(誤))的生成場景。

第三組是體現(xiàn)Ai創(chuàng)意與耦合生成能力的魔女小姐姐,在關鍵詞中,我們使用了“龍角、血跡、邪惡、猙獰”等,生成效果非常令人滿意。使用了majicmixRealistic_v6模型,搭配FilmVelvia2Lora與修復眼睛、姿態(tài)的插件進行了生成式繪圖。Steps:32,采樣器:DPM++2MKarras,CFG:7.5,Seed:2316746276,Size:1200x675,測試意義為更加普遍的DPM++2M采樣器(常用于復雜的人物模型生成)時的成績,共生成1組,6張圖片,與第二組相互對照。

第四組測試便是針對第2個測試環(huán)節(jié)增加生成圖像的分辨率,盡量占用每一張顯卡的顯存,來觀察在極限顯存占用的情況下,各顯卡之間的表現(xiàn)。同樣使用了majicmixRealistic_v6模型,搭配FilmVelvia2Lora與修復眼睛、姿態(tài)的插件進行了生成式繪圖。Steps:50,采集器:Euler,CFG:7.5,Seed:172450070,Size:1800x1800,共生成1組,6張圖片。此測試主要驗證顯存與Ai生成圖像效率之間的關系,是否顯存越大必然越快。

由于大多數(shù)Ai模型訓練使用512x512圖像,生成超高分辨率圖像時,Ai模型對資源的需求會呈指數(shù)級增長,需要消耗大量顯卡資源,特別是顯存資源。同時,圖像會大量失真,產生怪異效果,因此不建議生成超高分辨率Ai圖像。

在占滿了每一張顯卡的顯存情況下(包括擁有24GB顯存的RTX4090),這6張圖片的生成時間如下:

從測試結果可以解答許多網友的誤解,即Ai生成僅與顯存相關(挖礦的想法)。測試結果顯示,盡管RTX3060的顯存(12GB/192位)明顯高于RTX4060(8GB/128位),但在顯存飽和后的生成時間上,兩者之間仍有約35%的差距。可見,升級Tensor核心的RTX40系列顯卡,盡管顯存上處于劣勢,性能表現(xiàn)仍遠超前代。

測試結果顯示,在真實場景下的Ai生成圖像任務中,40系顯卡表現(xiàn)出明顯的階梯式成績分布,與各卡的CUDA內核數(shù)及Tensor內核數(shù)密切相關。尤其是高端且價格相對友好的RTX4070及RTX4070Ti,其性能表現(xiàn)令人印象深刻。

看到此處,相信大家已對40系顯卡在Ai繪圖算力方面有初步判斷。那么,作為普通用戶,我們會推薦哪款卡?哪款最具“Ai性價比”?我們選擇了某知名顯卡品牌的40系全系列定價,并結合常規(guī)Ai人像繪圖的成績,計算“Ai算力定價”。由于RTX3060僅作為對照組,我們不會進行推薦,僅參考40系列的成績與價格。

我們假設RTX4090在短發(fā)小姐姐Ai繪圖中的35.46秒為100%,來看其他顯卡在Ai繪畫時需要RTX4090的多少倍:

我們可以通過比較顯卡的性價比來衡量它們在Ai繪圖任務上的表現(xiàn)。為了計算性價比,我們可以使用以下公式:Ai性價比=顯卡算力指數(shù)x顯卡價格。以RTX4090為基準,我們可以計算其他顯卡在相同算力下的性價比。在這個例子中,RTX4090算力性價比=100%算力指數(shù)x13999元。接下來,我們可以將其他顯卡的性價比與RTX4090的性價比進行比較。這樣,我們就可以得出一個各個顯卡相對于RTX4090性價比的結論,從而可以更好地判斷哪款顯卡在Ai繪圖任務上性價比更高。

可見,相對于RTX4090來說, RTX4070Ti的純算力性價比 是較高的,也是在算力轉化后最為接近RTX4090的一張顯卡,那單純從算力的性價比角度出發(fā),這張卡是除了RTX4090外的最佳選擇,而如果屏幕面前的你只是想要在游戲之余,偶爾跑跑Ai,那么我認為RTX4070會是你的最佳選擇,一組6張的精致人像圖片75秒的運算時間在大多數(shù)人的可忍耐范圍之內,而RTX4060這樣超過2分鐘的選手,可能在等待的過程中會有些無聊了。

總的來說,考慮Ai繪圖場景下的應用, 我們推薦RTX4070或RTX4070Ti這兩款顯卡 。

如今顯卡的多功能性是由于技術發(fā)展和市場需求共同推動的。在過去的幾十年里,計算機圖形學的研究取得了重要突破,顯卡硬件的性能也得到了顯著提升。隨著GPU的計算能力越來越強大,顯卡逐漸從單純的渲染圖形發(fā)展為具備廣泛計算能力的硬件平臺。此外,各行各業(yè)對高性能計算、Ai等領域的需求不斷增長,顯卡廠商也紛紛投入研發(fā),使顯卡更好地適應這些需求。

顯卡之所以具有多功能性,關鍵在于GPU具備強大的并行計算能力和通用計算能力。GPU最初設計用于處理計算機圖形,需要同時處理大量像素和頂點。為了高效執(zhí)行這些任務,GPU采用了高度并行的架構。這使得GPU在處理其他涉及大量并行計算的任務時,也能發(fā)揮出強大的性能。

在未來,隨著GPU計算能力破繭成蝶般的蛻變,顯卡在各個領域的應用將猶如波濤般洶涌澎湃。短短的數(shù)年內我們就可以預見顯卡將在高性能計算、Ai繪圖、Ai生成計算等多重功能的舞臺上,如繁星閃爍般綻放越來越耀眼的光芒。

關鍵詞:

參與評論

国内精品人妻无码久久久影院| 国产精品福利网站导航| 国产精品VIDEOSSEX久久发布 | 久久久久久亚洲精品不卡| 精品国产伦一区二区三区在线观看 | 国产精品无码久久久久| 精品久久久久久无码不卡| 久久精品国产99国产电影网 | 国产精品成人一区二区| 亚洲AV永久无码精品一福利| 久久精品视频久久| av无码精品一区二区三区四区| 55夜色66夜色国产精品视频| 久久国产精品久久| 亚洲精品视频在线观看你懂的| 国产精品久久久久久麻豆一区| 精品久久久久久综合日本| 日本精品久久久久影院日本 | 老司机91精品网站在线观看| 免费a级毛片18以上观看精品| 亚洲国产精品成人综合久久久 | 久久夜色精品国产| 国产精品午夜爆乳美女| 波多野结衣久久精品| 日韩精品无码一本二本三本| 国内精品视频在线观看| 国产精品99久久久久久www| 精品伊人久久香线蕉| 精品国产日韩久久亚洲| 久久精品国产亚洲AV麻豆网站| 亚洲色精品aⅴ一区区三区| 精品久久久久中文字幕一区| 国产精品毛片在线完整版| 99久久综合国产精品免费| 69精品久久久久| 久久国产精品久久久久久久久久| 99re6在线精品免费观看| 亚洲第一区精品日韩在线播放| 国产精品va在线观看无| 青青国产精品视频| 亚洲精品人成网线在线播放va|