国产精品天干天干,亚洲毛片在线,日韩gay小鲜肉啪啪18禁,女同Gay自慰喷水

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

12.1 Swin-Transformer網(wǎng)絡結(jié)構(gòu)詳解

2022-10-13 22:51 作者:不敗阿豪 0人讀過 | 我要投稿

2021 best paper

?

02:11

?

不同任務排名

目標檢測：coco數(shù)據(jù)集

?

03:22

?

比較難理解的在4、5部分

?

04:10

?

swin transformer vs VIT

1、swin transformer構(gòu)建的feature map具有層次性，所以對目標檢測、分割等任務更有優(yōu)勢

VIT直接下采樣16倍，后面一直保持下采樣倍率不變，無法像swin transformer一樣構(gòu)建具有層次性的特征層

2、swin transformer的feature map當中，用的是一個個窗口的形式將feature map分隔開，窗口之間沒有重疊

vit當中是一個整體，沒有進行分割

這一個個window就是待會講的windows multi-head self-attention，引入這個結(jié)構(gòu)就可以在每個window內(nèi)部計算self-attention，window之間不進行信息傳遞

好處：大大降低運算量，尤其是在淺層網(wǎng)絡（下采樣倍率低），相對于在整個特征圖上進行multi-head self-attention可以減少計算量

表格：對比

?

08:04

?

網(wǎng)絡框架

?

09:32

?

patch partition是什么

?

10:27

?

linear embedding干什么

將48變成C

?

11:36

?

每個stage重復堆疊swin transformer block n次，n是偶數(shù)

?

13:47

?

patch merging如何操作

?

15:06

?

W-MSA模塊

?

16:57

?

MSA vs W-MSA

?

18:33

?

兩個公式怎么來的

?

24:49

?

SW-MSA

?

26:01

?

示例：黑色是特征圖

窗口移動前

移動后

?

28:00

?

5和3本來是分開的兩個區(qū)域，我們把他們強行劃分在一個window里，對它們進行MSA是有問題的

?

29:54

?

如何單獨計算5的MSA和3的MSA

和原來在整個窗口進行自注意計算量一樣，只是多了一個mask操作

?

33:15

?

注意還原會原來位置

?

33:52

?

滑動窗口舉例

?

36:52

?

相對位置偏移（通過表格展示其重要性）

?

39:22

?

什么是相對位置偏移？

?

42:15

?

如何將二元坐標轉(zhuǎn)一元坐標，

?

44:03

?

?

45:30

?

為什么是（2M-1）*（2M-1）

?

47:08

?

標簽：

12.1 Swin-Transformer網(wǎng)絡結(jié)構(gòu)詳解的評論 (共條)

龙州县| 乐亭县| 安岳县| 绍兴市| 苍山县| 平湖市| 牡丹江市| 九台市| 广平县| 贵南县| 青神县| 衡东县| 资兴市| 新河县| 松溪县| 涿州市| 兰溪市| 普宁市| 太谷县| 澄江县| 颍上县| 财经| 慈利县| 库车县| 彝良县| 巩义市| 通许县| 镇原县| 两当县| 武邑县| 平定县| 新野县| 阿瓦提县| 扶余县| 西平县| 东港市| 耿马| 阜新市| 万年县| 普定县| 赫章县|