“精神內(nèi)耗”如何用古詩表達?清華大學這個“據(jù)意查句”神器值得擁有!
發(fā)朋友圈翻來覆去才憋出幾個字?那么這個檢索神器值得了解一下。
比如這兩天大家都在說的“精神內(nèi)耗”。
它給出了一段盧梭的話,“忿怒和煩悶會摧殘人的精力,破壞人的健康,沮喪人的意志,毀滅人的前途”??梢娡耆媚笞×嗽~語本來的意思,語言逼格立馬提升好幾度。

甚至還能找出意思相近的古詩文。

其中歐陽修《秋聲賦》中的這句“百憂感其心,萬事勞其形,有動乎中,必遙其情”,就可以很好的表達出其中深意。
不僅如此,句子類型還能按需選取,名言警句、歇后語、古詩文都不在話下。
那么,這個好用又好玩的神器,到底是什么來頭呢?
以上說的這個神器是由清華大學推出的“據(jù)意查句”神器——WantQuotes。誕生自清華大學計算機系自然語言處理與社會人文計算實驗室(THUNLP)。
能夠快速從全世界這么多語料中找到你想要的句子,這個神器主要靠的是一個超大的數(shù)據(jù)集和一個推薦模型。
數(shù)據(jù)集包含了英語、現(xiàn)代漢語和文言文三大部分。其中,英語部分有6108個名言警句,126713個上下文文本段;現(xiàn)代漢語部分,包含有3004句名言和408433個相關上下文;文言文部分,則有4438段文言典故(包括古詩)和116537段相關上下文。

推薦模型方面,“據(jù)意查句”神器——WantQuotes提出使用BERT作為句子編碼器來學習名言警句和相關文本表示,并將義原引入到編碼器中,以表達出名言警句中的多層意思。
目前“據(jù)意查句”還只能在網(wǎng)頁端使用,大家感興趣的話可以去試試哦!
標簽: