国产精品天干天干,亚洲毛片在线,日韩gay小鲜肉啪啪18禁,女同Gay自慰喷水

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

類似D-ID的免費開源虛擬數(shù)字人制作工具SadTalker搭建教程及效果演示

2023-04-14 16:44 作者:愷哥筆記  | 我要投稿

大家好,我是佳愷,最近在研究數(shù)字人生成項目,發(fā)現(xiàn)了一個叫SadTalker的項目,可以用一張圖片生成數(shù)字人口播視頻,這兩天在本地搭建好環(huán)境測試了下

先看下生成效果,后面再講搭建和使用方法(多視頻預(yù)警)

生成效果演示:

輸入圖片:

生成效果:

因為ai驅(qū)動會改變口形眼神,有時候跟原圖看起來不太像,但是總體來說SadTalker是開源數(shù)字人項目里效果比較好的了,特別是他的口形,中文還是比較像的,感覺比D-ID要像一些。

其他方面,比如自然程度,畫質(zhì)比起D-ID要差一些,當(dāng)然更別說國內(nèi)幾家大廠的收費數(shù)字人項目了,他們身體,手勢都有,挺像真人的,所以需要自己判斷下使用場景。

SadTalker的安裝及使用方法:

SadTalker主頁:https://github.com/Winfredy/SadTalker

安裝步驟:

1、安裝NVIDIA cuda11.3

安裝方法看這篇文章:
https://blog.csdn.net/zzjcymbq/article/details/125040993

注意不要這篇文章最后一步 pytorch配置,后面在“項目下載和運行環(huán)境配置”會安裝pytorch


2、安裝 anaconda

由于這個項目是python開發(fā)的所以需要先安裝一個方便管理python版本的工具

anaconda安裝方法可以看這篇教程:https://blog.csdn.net/qq_45344586/article/details/124028689


3、項目下載和運行環(huán)境配置

(1)下載文件并解壓

因為github以及相關(guān)模型直接下載會比較慢,我打包上傳到百度網(wǎng)盤了

項目源碼百度盤:

https://pan.baidu.com/s/1_2qdL8OAFO-RBrtBpicAqQ?pwd=sm6w

從網(wǎng)盤下載后解壓到電腦某個盤,這里舉例就下載解壓到D盤了

(2)命令行安裝

點擊開始菜單找到前面已經(jīng)安裝好的 Anaconda Prompt


挨著輸入下面的命令,注意“#”后面的文字是注釋,不要在命令行里輸入

每一行命令輸完后按回車,有的步驟安裝過程比較久需要耐心等待,有幾步安裝過程中會詢問是否安裝,需要輸入 “y”確認(rèn)



在剛才的命令行工具里輸入命令查看虛擬環(huán)境路徑

把SadTalker源代碼里面的:

gfpgan\weights\GFPGANv1.4.pth?

剪切到虛擬環(huán)境的

Lib\site-packages\gfpgan\weights 目錄下


舉個例子:

我的虛擬環(huán)境就是截圖紅框路徑,所以需要把gfpgan\weights\GFPGANv1.4.pth?剪切到虛擬環(huán)境的??D:\ProgramData\Anaconda3\envs\sadtalker\Lib\site-packages\gfpgan\weights 這個目錄下


提前準(zhǔn)備好語音文件和一張圖片,這里假設(shè)你已經(jīng)準(zhǔn)備好語音和圖片了(需要做某個人物聲音的,可以用相關(guān)的聲音克隆項目克隆聲音,空了我再寫一篇聲音克隆的教程)

把語音文件放到

SadTalker\examples\driven_audio 目錄下

把圖片

放到SadTalker\examples\source_image 目錄下


1、基礎(chǔ)使用命令

然后輸入下面的命令



等待執(zhí)行完成后,就可以在SadTalker\results下面的文件夾里面找到生成的結(jié)果了

效果如下:


首先看下相關(guān)參數(shù):


細(xì)心的同學(xué)可能會發(fā)現(xiàn)一個問題,上面的基礎(chǔ)使用,用到的圖片是一張半身照,但是生成的視頻是只有頭部了

對,這個是需要參數(shù)控制的,接下來我們加上--preprocess full 和 --still這兩個參數(shù)

--preprocess full?表示完整圖片

--still 可以減少頭部運動

第一個參數(shù)好理解,為什么會有第二個參數(shù)呢??

原因是,項目在用完整圖片生成視頻的時候,頭部在動,但是肩膀會保持不動,交接處就會產(chǎn)生比較扭曲的現(xiàn)象

加上--still后就可以防止交接處扭曲,但是整個視頻就幾乎只有眼睛和口型的變化了,看起來沒那么自然。

其他參數(shù),也可以自己試一試。


整體來說,對質(zhì)量要求不那么高的場景,SadTalker還是能用一用,畢竟是免費的。然后參數(shù)的話想要自然就用基礎(chǔ)命令,想要完整圖片生成就加上那兩個參數(shù)。

最后這個環(huán)境如果是小白,搭建其實還是比較麻煩的,我想的是租一臺云服務(wù)器,然后搭建好webui版的,大家可以直接上傳語音和圖片直接生成,甚至可以把語音克隆功能也搭建好。

最后,對數(shù)字人制作感興趣的小伙伴可以留言或者加我交流


再來幾個演示:


類似D-ID的免費開源虛擬數(shù)字人制作工具SadTalker搭建教程及效果演示的評論 (共 條)

分享到微博請遵守國家法律
苏尼特右旗| 凤冈县| 长宁区| 余庆县| 甘孜县| 墨江| 太仆寺旗| 许昌市| 奎屯市| 唐海县| 丰台区| 平定县| 洛隆县| 运城市| 安图县| 额尔古纳市| 张北县| 伊宁市| 天柱县| 吴忠市| 屏南县| 莆田市| 桦甸市| 赤壁市| 封丘县| 巴青县| 常州市| 布拖县| 潼南县| 霞浦县| 夏河县| 揭阳市| 文昌市| 霍城县| 雷山县| 广平县| 大理市| 娄底市| 富顺县| 宿松县| 阿拉善左旗|