国产精品天干天干,亚洲毛片在线,日韩gay小鲜肉啪啪18禁,女同Gay自慰喷水

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

深度之眼預(yù)訓(xùn)練大模型背景下的知識(shí)問答與對(duì)話生成

2023-06-21 21:49 作者:呀我滴sixgod尼  | 我要投稿

BERT 預(yù)訓(xùn)練模型及文本分類

BERT?全稱為 Bidirectional Encoder Representations from Transformer,是谷歌在 2018 年 10 月發(fā)布的語言表示模型。BERT 通過維基百科和書籍語料組成的龐大語料進(jìn)行了預(yù)訓(xùn)練,使用時(shí)只要根據(jù)下游任務(wù)進(jìn)行輸出層的修改和模型微調(diào)訓(xùn)練,就可以得到很好的效果。BERT 發(fā)布之初,就在 GLUE、MultiNLI、SQuAD 等評(píng)價(jià)基準(zhǔn)和數(shù)據(jù)集上取得了超越當(dāng)時(shí)最好成績(jī)的結(jié)果。但在深入了解 BERT 結(jié)構(gòu)之前,先需要了解一下什么是語言模型,以及在 BERT 誕生之前人們是如何進(jìn)行文本向量化的。

語言模型和詞向量

語言模型?是用于計(jì)算文本序列概率的模型。在自然語言處理的發(fā)展中,應(yīng)用較為廣泛的語言模型有兩種:統(tǒng)計(jì)式語言模型和神經(jīng)網(wǎng)絡(luò)語言模型。接下來就將分別介紹一下它們。
統(tǒng)計(jì)式語言模型
統(tǒng)計(jì)式語言模型(Statistical Language Model)是根據(jù)概率分布,計(jì)算字詞所組成的字符串的幾率的模型,簡(jiǎn)單來說,統(tǒng)計(jì)式語言模型就是計(jì)算一句話符不符合語言規(guī)律。比如,使用語言模型計(jì)算出「我今天吃了一個(gè)蘋果」的概率,一定比「蘋果個(gè)我今天吃了一」的概率大,所以前者比后者存在的可能性更大。
在具體構(gòu)建統(tǒng)計(jì)式語言模型時(shí),了便于計(jì)算,轉(zhuǎn)化為公式 (2):


深度之眼預(yù)訓(xùn)練大模型背景下的知識(shí)問答與對(duì)話生成的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
门源| 抚远县| 静乐县| 安多县| 金昌市| 江华| 田阳县| 新民市| 屏边| 安仁县| 海伦市| 蓝山县| 屏南县| 郯城县| 玉溪市| 虹口区| 丹凤县| 伊金霍洛旗| 武川县| 沭阳县| 莒南县| 清原| 宁陕县| 富蕴县| 勐海县| 成安县| 临洮县| 临海市| 密云县| 额济纳旗| 古蔺县| 会宁县| 潼关县| 石河子市| 肥乡县| 宁乡县| 施甸县| 潞城市| 杂多县| 全南县| 大名县|