在Ai繪畫領域火熱的前夕,我們針對15款NVIDIA顯卡進行了一次針對StableDiffusion模型的生成時間測試
(資料圖片)
Ai生成
通過使用多模態(tài)的StableDiffusion測試,我們將充分挖掘這些顯卡的算力性能。并且,從個人玩家的角度出發(fā),我們將為你揭示哪款顯卡是你在Ai領域的最優(yōu)選擇。在接下來的評測中,我們將對40系顯卡家族的各成員進行詳細介紹和性能測試,包括RTX4090、RTX4080、RTX4070、RTX4070Ti、RTX4060Ti和RTX4060,以及RTX3060。通過對比他們在StableDiffusion模型上的表現(xiàn),將為你提供關于顯卡性能和價格的綜合考量。
首先介紹一下測試背景與條件:隨著StableDiffusion上的模型與圖片生成算法的不斷豐富,我們采用了4個測試環(huán)節(jié)來進行全面且多角度的顯卡Ai算力測試:
1.利用NVIDIA官方提供的“Ai房屋”測試,來生成符合官方數(shù)據(jù)的測試結果。
2.利用civitAi(一個Ai模型聚合網站)上火熱的Ai人像模型與圖片生成算法進行一組模擬真實小姐姐的測試。
3.利用civitAi(一個Ai模型聚合網站)上火熱的Ai人像模型與圖片生成算法進行一組模擬魔幻怪物小姐姐的測試。
4.針對第2個測試環(huán)節(jié)增加生成圖像的分辨率,盡量占用每一張顯卡的顯存,來觀察在極限顯存占用的情況下,各顯卡之間的表現(xiàn)。
首先還是先來看一下參賽選手們的“個人信息”匯總:
其中與Ai繪圖會高度相關的參數(shù),我們總結出了這幾點,Ai生成圖像主要依賴于顯卡的并行計算能力。以下是幾個顯卡核心參數(shù)及其與Ai生成圖像之間的關系:
1. 顯卡流處理器數(shù)量(SM): 流處理器數(shù)量是顯卡內部處理單元的數(shù)量。每個流處理器包含一定數(shù)量的CUDA核心、Tensor核心和其他處理資源。流處理器數(shù)量越多,顯卡并行處理任務的能力越強,對Ai生成圖像的性能提高更明顯。
2. 顯卡CUDA內核數(shù)量(CUDACores): CUDA核心是NVIDIA顯卡的基本處理單元,用于執(zhí)行并行計算任務。CUDA核心數(shù)量越多,顯卡的并行計算能力越強,Ai生成圖像的速度也會相應提高。
3. 顯卡Tensor內核(TensorCores): Tensor核心是NVIDIA顯卡特有的處理單元,專為深度學習和Ai任務設計。它們可以高效地執(zhí)行矩陣乘法和累加運算,這是深度學習中的核心計算操作。Tensor核心數(shù)量越多,顯卡在Ai生成圖像任務中的性能越優(yōu)秀。
*3060的Tensor核心為第三代,40系顯卡為第四代
4. 顯卡顯存容量、顯存位寬、顯存帶寬: 顯存容量對Ai生成圖像的影響取決于模型的大小和復雜度。顯存容量越大,可以處理的模型和數(shù)據(jù)越多。顯存位寬和顯存帶寬影響數(shù)據(jù)在顯卡內部的傳輸速度。顯存位寬越寬、顯存帶寬越高,顯卡處理大型Ai任務的能力越強。
顯存容量
顯存位寬
5. L1緩存(MB): L1緩存位于每個流處理器(SM)內部,離CUDA核心和Tensor核心非常近。它的訪問速度非常快,但容量相對較小。L1緩存主要用于存儲局部變量和線程間共享的數(shù)據(jù)。在Ai生成圖像任務中,高效的L1緩存可以提高處理速度,降低內部數(shù)據(jù)傳輸延遲。
6. L2緩存(MB): L2緩存位于顯卡的全局內部,所有SM共享。它的容量比L1緩存更大,但訪問速度相對較慢。L2緩存主要用于緩存全局內存中的數(shù)據(jù),以減少顯存訪問延遲。對Ai生成圖像任務來說,高效的L2緩存可以提高數(shù)據(jù)處理速度,特別是在處理大型模型和數(shù)據(jù)集時。
L2緩存(MB)
不多說,我們進入測試環(huán)節(jié),首先來個官方的開胃菜,畫圖的參數(shù)是:使用v2-1768-emapruned模型;768*768的尺寸;Steps:50;CFGscale:7.5,一組10張圖,每次繪畫3組,該測試能夠反應絕大多數(shù)Ai繪圖的生成效果成績,尤其是在做一些工業(yè)Ai、實物生成的用途時。
第二組就是我們可愛的Ai小姐姐,我們使用了majicmixRealistic_v6模型,搭配FilmVelvia2Lora與修復眼睛、姿態(tài)的插件進行了生成式繪圖。Steps:50,采集器:Euler,CFG:7.5,Seed:172450070,Size:1024x768,共生成1組,6張圖片,代表了絕大場景下的Ai模特(女友(誤))的生成場景。
第三組是體現(xiàn)Ai創(chuàng)意與耦合生成能力的魔女小姐姐,在關鍵詞中,我們使用了“龍角、血跡、邪惡、猙獰”等,生成效果非常令人滿意。使用了majicmixRealistic_v6模型,搭配FilmVelvia2Lora與修復眼睛、姿態(tài)的插件進行了生成式繪圖。Steps:32,采樣器:DPM++2MKarras,CFG:7.5,Seed:2316746276,Size:1200x675,測試意義為更加普遍的DPM++2M采樣器(常用于復雜的人物模型生成)時的成績,共生成1組,6張圖片,與第二組相互對照。
第四組測試便是針對第2個測試環(huán)節(jié)增加生成圖像的分辨率,盡量占用每一張顯卡的顯存,來觀察在極限顯存占用的情況下,各顯卡之間的表現(xiàn)。同樣使用了majicmixRealistic_v6模型,搭配FilmVelvia2Lora與修復眼睛、姿態(tài)的插件進行了生成式繪圖。Steps:50,采集器:Euler,CFG:7.5,Seed:172450070,Size:1800x1800,共生成1組,6張圖片。此測試主要驗證顯存與Ai生成圖像效率之間的關系,是否顯存越大必然越快。
由于大多數(shù)Ai模型訓練使用512x512圖像,生成超高分辨率圖像時,Ai模型對資源的需求會呈指數(shù)級增長,需要消耗大量顯卡資源,特別是顯存資源。同時,圖像會大量失真,產生怪異效果,因此不建議生成超高分辨率Ai圖像。
在占滿了每一張顯卡的顯存情況下(包括擁有24GB顯存的RTX4090),這6張圖片的生成時間如下:
從測試結果可以解答許多網友的誤解,即Ai生成僅與顯存相關(挖礦的想法)。測試結果顯示,盡管RTX3060的顯存(12GB/192位)明顯高于RTX4060(8GB/128位),但在顯存飽和后的生成時間上,兩者之間仍有約35%的差距。可見,升級Tensor核心的RTX40系列顯卡,盡管顯存上處于劣勢,性能表現(xiàn)仍遠超前代。
測試結果顯示,在真實場景下的Ai生成圖像任務中,40系顯卡表現(xiàn)出明顯的階梯式成績分布,與各卡的CUDA內核數(shù)及Tensor內核數(shù)密切相關。尤其是高端且價格相對友好的RTX4070及RTX4070Ti,其性能表現(xiàn)令人印象深刻。
看到此處,相信大家已對40系顯卡在Ai繪圖算力方面有初步判斷。那么,作為普通用戶,我們會推薦哪款卡?哪款最具“Ai性價比”?我們選擇了某知名顯卡品牌的40系全系列定價,并結合常規(guī)Ai人像繪圖的成績,計算“Ai算力定價”。由于RTX3060僅作為對照組,我們不會進行推薦,僅參考40系列的成績與價格。
我們假設RTX4090在短發(fā)小姐姐Ai繪圖中的35.46秒為100%,來看其他顯卡在Ai繪畫時需要RTX4090的多少倍:
我們可以通過比較顯卡的性價比來衡量它們在Ai繪圖任務上的表現(xiàn)。為了計算性價比,我們可以使用以下公式:Ai性價比=顯卡算力指數(shù)x顯卡價格。以RTX4090為基準,我們可以計算其他顯卡在相同算力下的性價比。在這個例子中,RTX4090算力性價比=100%算力指數(shù)x13999元。接下來,我們可以將其他顯卡的性價比與RTX4090的性價比進行比較。這樣,我們就可以得出一個各個顯卡相對于RTX4090性價比的結論,從而可以更好地判斷哪款顯卡在Ai繪圖任務上性價比更高。
可見,相對于RTX4090來說, RTX4070Ti的純算力性價比 是較高的,也是在算力轉化后最為接近RTX4090的一張顯卡,那單純從算力的性價比角度出發(fā),這張卡是除了RTX4090外的最佳選擇,而如果屏幕面前的你只是想要在游戲之余,偶爾跑跑Ai,那么我認為RTX4070會是你的最佳選擇,一組6張的精致人像圖片75秒的運算時間在大多數(shù)人的可忍耐范圍之內,而RTX4060這樣超過2分鐘的選手,可能在等待的過程中會有些無聊了。
總的來說,考慮Ai繪圖場景下的應用, 我們推薦RTX4070或RTX4070Ti這兩款顯卡 。
如今顯卡的多功能性是由于技術發(fā)展和市場需求共同推動的。在過去的幾十年里,計算機圖形學的研究取得了重要突破,顯卡硬件的性能也得到了顯著提升。隨著GPU的計算能力越來越強大,顯卡逐漸從單純的渲染圖形發(fā)展為具備廣泛計算能力的硬件平臺。此外,各行各業(yè)對高性能計算、Ai等領域的需求不斷增長,顯卡廠商也紛紛投入研發(fā),使顯卡更好地適應這些需求。
顯卡之所以具有多功能性,關鍵在于GPU具備強大的并行計算能力和通用計算能力。GPU最初設計用于處理計算機圖形,需要同時處理大量像素和頂點。為了高效執(zhí)行這些任務,GPU采用了高度并行的架構。這使得GPU在處理其他涉及大量并行計算的任務時,也能發(fā)揮出強大的性能。
在未來,隨著GPU計算能力破繭成蝶般的蛻變,顯卡在各個領域的應用將猶如波濤般洶涌澎湃。短短的數(shù)年內我們就可以預見顯卡將在高性能計算、Ai繪圖、Ai生成計算等多重功能的舞臺上,如繁星閃爍般綻放越來越耀眼的光芒。
關鍵詞:
參與評論
- 全球熱頭條丨NVIDIA RTX 40系列顯卡Ai測評2023-07-04
- 內存卡有保護無法格式化怎么辦 內存卡格式2023-07-04
- 世界最資訊丨核心危機最終幻想7_關于核心危2023-07-04
- 悲傷逆流成河演員表_電視劇悲傷逆流成河有2023-07-04
- 我國多種礦產勘查開發(fā)實現(xiàn)新突破2023-07-04
- 天天速看:晚間多重利好 今天繼續(xù)漲2023-07-04
- 滬深股通|科瑞技術7月3日獲外資賣出0.17%股份2023-07-04
- 東風雪鐵龍首款SUV C3怎么樣及東風標致2002023-07-04
- 性傘毛2023-07-04
- 資本占GDP比重:我國從31%上升43%,日本美2023-07-04
- 多家公司因信披問題遭交易所發(fā)函|天天精選2023-07-04
- 事實證明,“消失”的央視一姐李思思, 已2023-07-04
- 國內專家匯聚哈密研討能源裝備再制造技術及2023-07-04
- 世界熱點!7月3日基金凈值:工銀戰(zhàn)略轉型股2023-07-04
- ins是什么社交軟件下載(ins是什么網站 是2023-07-04
- 龍虎榜 | 寧夏建材今日漲停 滬股通買入22023-07-03
- 不愛又何必糾纏鋼琴譜_不愛又怎樣2023-07-03
- 1997年Ac歌SLX為Radwood獲得350匹實際的Ac歌馬力2023-07-03
- 東方日升再簽1GW異質結伏曦組件供貨協(xié)議 2023-07-03
- 衛(wèi)寧健康實控人周煒被留置,市值單日蒸發(fā)462023-07-03
- 豪華空間,強勁動力,新能源大五座SUV新摩2023-07-03
- 蘇州市迎來首家碳中和三甲醫(yī)院2023-07-03
- 四川省氣象臺繼續(xù)發(fā)布暴雨藍色預警,今明兩2023-07-03
- 四川省長寧縣發(fā)布大風藍色預警_世界熱推薦2023-07-03
- 環(huán)球通訊!水利部首次批復珠江流域水庫群聯(lián)2023-07-03
- 公司40億光伏項目是啥情況?華民股份回應 2023-07-03
- 容百科技(688005.SH):定增相關工作在正常2023-07-03
- 夏季坐月子必看|產后腳疼竟是月子期間沒穿2023-07-03
- 每日時訊!特種離子交換樹脂有毒嗎(特種離2023-07-03
- 河津原創(chuàng)民族交響樂《龍門頌》亮相_環(huán)球快2023-07-03