国产精品天干天干,亚洲毛片在线,日韩gay小鲜肉啪啪18禁,女同Gay自慰喷水

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

深度學(xué)習(xí)多模態(tài)科研小班五期

2023-02-26 14:47 作者:云影璃沫  | 我要投稿

特征提取

  1. 視覺的提取,大多用的是Faster R-CNN:
    1.1 直接提取視覺向量;
    1.2 進(jìn)行目標(biāo)檢測,輸出bounding box和對應(yīng)位置;
    1.3 進(jìn)行目標(biāo)檢測,提取類別特征。
    潛在問題:提取的信息有冗余和噪音,對下游任務(wù)有益的視覺信息沒有被有效提取,和對應(yīng)的文本信息有語義鴻溝,不好做視覺-文本對齊等。

  2. 文本一般會用BERT或者Roberta做初始化,大規(guī)模訓(xùn)練集會從頭開始訓(xùn)練。

Early fusion:特征提取后,一般是直接concat,進(jìn)入transformer;
Late fusion:特征提取后,模態(tài)內(nèi)部再進(jìn)行深度學(xué)習(xí),再做模態(tài)交互。


深度學(xué)習(xí)多模態(tài)科研小班五期的評論 (共 條)

分享到微博請遵守國家法律
门源| 仁布县| 手游| 苏尼特右旗| 山阴县| 平武县| 宜昌市| 宣汉县| 西宁市| 清新县| 呼和浩特市| 利辛县| 西和县| 九龙县| 城固县| 渑池县| 平顶山市| 洱源县| 延边| 特克斯县| 玛纳斯县| 乌鲁木齐市| 阿克陶县| 德昌县| 城固县| 济源市| 绥芬河市| 房山区| 德安县| 香港 | 新龙县| 永福县| 唐海县| 嘉鱼县| 广宁县| 贡山| 图们市| 区。| 桐乡市| 阿瓦提县| 通山县|