国产精品天干天干,亚洲毛片在线,日韩gay小鲜肉啪啪18禁,女同Gay自慰喷水

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

深藍生成式預訓練語言模型:理論與實戰(zhàn)

2023-07-16 13:38 作者:戰(zhàn)億殤  | 我要投稿

提出基于雙向的Encoder表示。


使用兩個策略:


(1)masked-language-model(MLM),受經(jīng)典的完形填空Cloze task[4]啟發(fā)。這也是絕大多數(shù)預訓練模型所采用并且優(yōu)化的切入點。從語料里mask掉(可以隨機,也可以加入一些知識)一些字詞,試圖準確地預測task掉的內(nèi)容。


(2) next sentence prediction,判斷兩個句子是否具有上下文關系。(貌似在某個地方看到,這個任務沒有決定性的功能,不確定。)


也就是說,GPT只有單向學習;ELMo雖然是雙向學習,但是過于簡單。

BERT雙向學習,并且更加復雜。


?

深藍生成式預訓練語言模型:理論與實戰(zhàn)的評論 (共 條)

分享到微博請遵守國家法律
潢川县| 麻城市| 定南县| 江源县| 华蓥市| 八宿县| 浦东新区| 洛南县| 商河县| 铅山县| 东港市| 郸城县| 镇沅| 丽水市| 吴旗县| 金塔县| 永新县| 囊谦县| 白玉县| 平南县| 襄城县| 三河市| 毕节市| 平遥县| 富顺县| 新昌县| 周至县| 巢湖市| 祁连县| 铜鼓县| 镇雄县| 东台市| 纳雍县| 米林县| 舒兰市| 巫溪县| 道真| 闽侯县| 电白县| 海晏县| 噶尔县|