AMD GPU驅(qū)動(dòng),ROCM,Pytorch安裝教程(A卡6700xt)

我用的操作系統(tǒng)為ubuntu20.04,其他系統(tǒng)應(yīng)該類似,只是命令稍有不同。
安裝AMD GPU驅(qū)動(dòng)
AMD驅(qū)動(dòng)下載地址:https://www.amd.com/en/support/kb/release-notes/rn-amdgpu-unified-linux-22-20
進(jìn)去之后找到你想安裝的版本,這里是閉源驅(qū)動(dòng)。
下載好后運(yùn)行sudo apt install amdgpu-install_5.4.50403-1_all.deb
這個(gè)名字根據(jù)自己下載的文件進(jìn)行更改,直接Tab就行。
如果報(bào)依賴錯(cuò)誤可以嘗試sudo apt-get -f install命令來(lái)修復(fù)依賴錯(cuò)誤。
之后更新依賴sudo apt update.
安裝ROCM
安裝ROCM,這里要--no-dkms不安裝內(nèi)核,看資料好像現(xiàn)在的ubuntu自己帶內(nèi)核,所以加上好像會(huì)有問題。有知道的可以評(píng)論區(qū)討論。
sudo amdgpu-install --usecase=rocm,hip,mllib --no-dkms
到這里驅(qū)動(dòng)和ROCM就安裝完了。
安裝Pytorch
可以在pytorch官網(wǎng)找到安裝命令
https://pytorch.org/

例如我用pip安裝
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/rocm5.4.2
測(cè)試安裝
打開python3
import torch
torch.cuda.is_available()
如果返回True
恭喜你,安裝成功。
安裝完之后可能還需要進(jìn)行一些操作。
#添加環(huán)境
sudo usermod -a -G video $LOGNAME
sudo usermod -a -G render $LOGNAME
#在文件執(zhí)行
vim ~/.bashrc #添加下面
export HSA_OVERRIDE_GFX_VERSION=10.3.0 #我這里的顯卡是amd的RX6700xt
export LD_LIBRARY_PATH=/opt/rocm/lib
source ~/.bashrc#通重新執(zhí)行剛修改的初始化文件
# 如果運(yùn)行import之后報(bào)錯(cuò)找不到這些文件,復(fù)制一下鏈接文件
cd $LD_LIBRARY_PATH
cp librocblas.so.0 librocblas.so
cp libMIOpen.so.1 libMIOpen.so
cp librocrand.so.1 librocrand.so
這里可以參考這個(gè)UP的視頻。