国产精品天干天干,亚洲毛片在线,日韩gay小鲜肉啪啪18禁,女同Gay自慰喷水

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

【技術(shù)分享】AI數(shù)字人實(shí)時(shí)互動(dòng)直播技術(shù):數(shù)字人口型驅(qū)動(dòng)(算法篇)

2023-05-18 19:46 作者:Siyuejiang  | 我要投稿

數(shù)字人口型驅(qū)動(dòng)

FACS根據(jù)面部肌肉群對(duì)面部動(dòng)作編碼

51個(gè)通道


音頻特征:MFCC、基于深度學(xué)習(xí)的表征方法etc,選擇deepspeech,音頻-文本工具/音頻抽取特征,音頻轉(zhuǎn)成音頻圖


面部口型驅(qū)動(dòng):音頻特征提取——切分音頻特征(階梯過(guò)濾器)——縮放后到vit——加一層MLP——加一層position embedding

用到19個(gè)通道

階梯過(guò)濾器;attention機(jī)制(關(guān)注靠后音頻);loss function





【技術(shù)分享】AI數(shù)字人實(shí)時(shí)互動(dòng)直播技術(shù):數(shù)字人口型驅(qū)動(dòng)(算法篇)的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
两当县| 麻江县| 阿尔山市| 陇南市| 璧山县| 嵊泗县| 田阳县| 福鼎市| 上高县| 海城市| 玛纳斯县| 蓝山县| 清原| 广丰县| 景德镇市| 宁明县| 仁化县| 霍城县| 穆棱市| 肃宁县| 安仁县| 日土县| 河曲县| 曲靖市| 桓台县| 姚安县| 南安市| 建湖县| 崇明县| 林州市| 宣化县| 六安市| 方山县| 龙游县| 永春县| 安义县| 建瓯市| 平阴县| 西华县| 彝良县| 扎兰屯市|