国产精品天干天干,亚洲毛片在线,日韩gay小鲜肉啪啪18禁,女同Gay自慰喷水

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

4070Ti顯卡的深度學(xué)習(xí)性能測試和結(jié)論

2023-02-23 14:18 作者:千夜明  | 我要投稿

環(huán)境:

  • pytorch環(huán)境:conda install pytorch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1 cudatoolkit=11.6 -c pytorch -c conda-forge

  • 測試代碼:霹靂吧啦Wz的GitHub中的swin-L和FastRCNN。


4070Ti顯卡深度學(xué)習(xí)模型個(gè)人測試結(jié)果

swin-L模型單位是 圖像/秒,F(xiàn)astRCNN模型單位是 秒/圖像


備注1:主流顯卡的測評分

? time spy跑分參考:https://www.gpu-monkey.com/en/gpu_benchmark-3dmark_time_spy_and_fire_strike-5


備注2:其他顯卡的測試性能(SSD模型,F(xiàn)P32訓(xùn)練)

https://lambdalabs.com/gpu-benchmarks

備注3:另一個(gè)網(wǎng)站上的綜合評分

https://mtli.github.io/gpubench/

備注4:各類GPU的FP16和FP8訓(xùn)練和推理性能

https://timdettmers.com/2023/01/30/which-gpu-for-deep-learning/#Raw_Performance_Ranking_of_GPUs(國內(nèi)有很多此篇文章的完整翻譯)

感覺備注4和我真實(shí)測試的有較大差異,F(xiàn)P16的訓(xùn)練,4070ti竟然和2080Ti幾乎一樣,不知道為什么作者會得出此結(jié)論。


個(gè)人總結(jié)

  1. timespy 4K跑分非常適合深度學(xué)習(xí)性能評估:作為經(jīng)過本人驗(yàn)證,4070ti的深度學(xué)習(xí)性能(FP32訓(xùn)練和推理)相對1080T和2080T顯卡的差異,幾乎跟time spy 4K跑分差異幾乎一致。至于FP16和FP8,還未測試。

  2. 操作系統(tǒng)基本不影響顯卡深度學(xué)習(xí)性能:Ubuntu 22.04和win11系統(tǒng)下,4070ti的訓(xùn)練和推理速度幾乎一模一樣。

  3. 12G顯存是硬傷:4070T相對3090速度上并不差,只是顯存12G真的是硬傷,分類網(wǎng)絡(luò)swin-L的batchsize都只能設(shè)為8(圖像224*224)。


4070Ti顯卡的深度學(xué)習(xí)性能測試和結(jié)論的評論 (共 條)

分享到微博請遵守國家法律
白沙| 庐江县| 车致| 奉化市| 河西区| 宽城| 同心县| 内江市| 泾阳县| 邓州市| 容城县| 婺源县| 杭锦后旗| 教育| 江阴市| 鄂托克前旗| 保靖县| 日喀则市| 柘荣县| 平塘县| 洛川县| 德令哈市| 富平县| 资中县| 永新县| 平山县| 新闻| 清新县| 平乡县| 龙山县| 郧西县| 阿尔山市| 岚皋县| 和龙市| 朝阳区| 綦江县| 霞浦县| 墨脱县| 崇仁县| 鹤峰县| 南溪县|