国产精品天干天干,亚洲毛片在线,日韩gay小鲜肉啪啪18禁,女同Gay自慰喷水

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

【AI歌聲 / sovits】在 so-vits-svc 4.1 中訓(xùn)練與推理 4.0 版本模型的方法

2023-07-03 18:32 作者:風(fēng)澪瑟  | 我要投稿

so-vits?4.1?將默認(rèn)的聲音特征輸入更換為了?ContentVec 第 12 層 Transformer 輸出(簡稱 vec768l12),而 4.0 版本默認(rèn)使用的是 ContentVec 第 9?層 Transformer?輸出(簡稱?vec256l9)。因此,4.1 版本的模型結(jié)構(gòu)也與 4.0 版本產(chǎn)生了區(qū)別。但?so-vits?4.1?版本仍然支持 4.0 版本模型的推理與訓(xùn)練,只是需要更改一些參數(shù)??偨Y(jié)歸納如下:

1. 在?config 文件中,如果需要適配 so-vits 4.0 的 vec256l9 模型,則將以下選項設(shè)為指定的值:

"filter_channels": 768,

"gin_channels":?256,

?"ssl_dim": 256,

"speech_encoder":"vec256l9",

同時,也順便給出?so-vits 4.1 的?vec768l12 模型的配置選項值:

"filter_channels": 768,

"gin_channels": 768,

?"ssl_dim": 768,

"speech_encoder":"vec768l12",

需要注意的是,這兩種模型的?filter_channels 均為 768;

2.?也存在直接生成對應(yīng)的 config 文件的方法,在調(diào)用?preprocess_flist_config.py 時指定 --speech_encoder 命令行參數(shù) 為?vec256l9 即可。但需要注意的是,需要將生成的 config?文件中的?filter_channels 項改為?768,否則模型結(jié)構(gòu)還是與 4.0 版本不兼容;

3. 在進(jìn)行數(shù)據(jù)集預(yù)處理,即調(diào)用 preprocess_hubert_f0.py 時,指定 F0 預(yù)測器(--f0_predictor 命令行參數(shù))為 dio。因為 so-vits 4.0 在數(shù)據(jù)集預(yù)處理時使用的就是 dio 預(yù)測器(但在推理時使用的是 pm 預(yù)測器)。不同 F0 預(yù)測器具有不同的效果,可以自行測試一下。



【AI歌聲 / sovits】在 so-vits-svc 4.1 中訓(xùn)練與推理 4.0 版本模型的方法的評論 (共 條)

分享到微博請遵守國家法律
中卫市| 云浮市| 丹东市| 西丰县| 黄冈市| 阿勒泰市| 且末县| 河间市| 兴化市| 新野县| 江安县| 阜康市| 宝丰县| 漯河市| 邹城市| 佛冈县| 徐闻县| 长沙市| 蓬莱市| 卫辉市| 洞头县| 舟山市| 固阳县| 三河市| 灯塔市| 伊金霍洛旗| 金堂县| 昌宁县| 青岛市| 韶关市| 武威市| 北碚区| 航空| 浪卡子县| 桂林市| 临汾市| 民乐县| 墨竹工卡县| 石渠县| 延津县| 赞皇县|