国产精品天干天干,亚洲毛片在线,日韩gay小鲜肉啪啪18禁,女同Gay自慰喷水

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

基于SVD的單詞分布式表示

2023-03-16 18:56 作者:Hedarko  | 我要投稿


參考了《深度學(xué)習(xí)進(jìn)階:自然語言處理》的第二章,基于共現(xiàn)矩陣計(jì)算點(diǎn)互信息,然后用SVD降維做word embedding

感想:拿基于統(tǒng)計(jì)的方法做詞嵌入還是太慢了!雖然解釋性比較強(qiáng),但是對(duì)于大的詞表來說算起來太慢了。莎士比亞的數(shù)據(jù)我只敢喂一小部分,全部喂進(jìn)去詞表維度有兩萬維,算共現(xiàn)矩陣的時(shí)間復(fù)雜度是n方,SVD降維時(shí)時(shí)間復(fù)雜度是n立方!數(shù)據(jù)清洗也很麻煩,拿到的原始數(shù)據(jù)得用正則表達(dá)式先處理下,正則匹配的時(shí)候記得用re.escape()方法來處理pattern。

數(shù)據(jù)集:https://ocw.mit.edu/ans7870/6/6.006/s08/lecturenotes/files/t8.shakespeare.txt


基于SVD的單詞分布式表示的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國家法律
建平县| 金坛市| 吉木萨尔县| 宜君县| 凉城县| 神农架林区| 精河县| 措勤县| 镇雄县| 西充县| 湘潭县| 游戏| 襄城县| 阿合奇县| 乐至县| 钦州市| 湖口县| 楚雄市| 耒阳市| 南郑县| 从化市| 庐江县| 汶川县| 宕昌县| 洞口县| 米林县| 三都| 封丘县| 北碚区| 保山市| 济宁市| 科技| 康平县| 巴马| 霍山县| 庆元县| 定兴县| 青川县| 台湾省| 余姚市| 衡阳市|