国产精品天干天干,亚洲毛片在线,日韩gay小鲜肉啪啪18禁,女同Gay自慰喷水

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

12.1 Swin-Transformer網(wǎng)絡結(jié)構(gòu)詳解

2022-10-13 22:51 作者:不敗阿豪  | 我要投稿

2021 best paper

?
02:11
?

不同任務排名

目標檢測:coco數(shù)據(jù)集

?
03:22
?

比較難理解的在4、5部分

?
04:10
?

swin transformer vs VIT

1、swin transformer構(gòu)建的feature map具有層次性,所以對目標檢測、分割等任務更有優(yōu)勢

VIT直接下采樣16倍,后面一直保持下采樣倍率不變,無法像swin transformer一樣構(gòu)建具有層次性的特征層

2、swin transformer的feature map當中,用的是一個個窗口的形式將feature map分隔開,窗口之間沒有重疊

vit當中是一個整體,沒有進行分割

這一個個window就是待會講的windows multi-head self-attention,引入這個結(jié)構(gòu)就可以在每個window內(nèi)部計算self-attention,window之間不進行信息傳遞

好處:大大降低運算量,尤其是在淺層網(wǎng)絡(下采樣倍率低),相對于在整個特征圖上進行multi-head self-attention可以減少計算量

表格:對比

?
08:04
?

網(wǎng)絡框架



?
09:32
?

patch partition是什么

?
10:27
?

linear embedding干什么

將48變成C

?
11:36
?

每個stage重復堆疊swin transformer block n次,n是偶數(shù)


?
13:47
?

patch merging如何操作


?
15:06
?

W-MSA模塊


?
16:57
?

MSA vs W-MSA


?
18:33
?

兩個公式怎么來的



?
24:49
?

SW-MSA


?
26:01
?

示例:黑色是特征圖

窗口移動前

移動后


?
28:00
?


5和3本來是分開的兩個區(qū)域,我們把他們強行劃分在一個window里,對它們進行MSA是有問題的


?
29:54
?

如何單獨計算5的MSA和3的MSA

和原來在整個窗口進行自注意計算量一樣,只是多了一個mask操作

?
33:15
?

注意還原會原來位置

?
33:52
?

滑動窗口舉例


?
36:52
?

相對位置偏移(通過表格展示其重要性)


?
39:22
?

什么是相對位置偏移?


?
42:15
?

如何將二元坐標轉(zhuǎn)一元坐標,




?
44:03
?




?
45:30
?

為什么是(2M-1)*(2M-1)



?
47:08
?



12.1 Swin-Transformer網(wǎng)絡結(jié)構(gòu)詳解的評論 (共 條)

分享到微博請遵守國家法律
龙州县| 乐亭县| 安岳县| 绍兴市| 苍山县| 平湖市| 牡丹江市| 九台市| 广平县| 贵南县| 青神县| 衡东县| 资兴市| 新河县| 松溪县| 涿州市| 兰溪市| 普宁市| 太谷县| 澄江县| 颍上县| 财经| 慈利县| 库车县| 彝良县| 巩义市| 通许县| 镇原县| 两当县| 武邑县| 平定县| 新野县| 阿瓦提县| 扶余县| 西平县| 东港市| 耿马| 阜新市| 万年县| 普定县| 赫章县|