論文查重系統(tǒng)的技術(shù)局限有哪些?

論文查重系統(tǒng)雖然能快速比對(duì)目標(biāo)論文與已發(fā)表文獻(xiàn)中的重復(fù)內(nèi)容,但查重系統(tǒng)受到系統(tǒng)設(shè)計(jì)、技術(shù)實(shí)現(xiàn)等因素的限制,在查準(zhǔn)率、查全率方面存在系統(tǒng)缺陷,不能準(zhǔn)確判別重復(fù)內(nèi)容在學(xué)術(shù)上的關(guān)系。
1)查重系統(tǒng)通常融合多種語(yǔ)義相似度算法來(lái)檢測(cè)目標(biāo)論文是否存在重復(fù),采用這種相似度算法盡管有利于檢測(cè)文字表達(dá)形式不同但語(yǔ)義相同的內(nèi)容,但是也會(huì)造成誤檢,導(dǎo)致查全率不是百分之百。
2)相似度算法的閾值設(shè)置過(guò)低可能會(huì)造成誤判,如表達(dá)含義完全不同的對(duì)比文字存在多個(gè)相同詞語(yǔ)或語(yǔ)義相近詞語(yǔ)時(shí),會(huì)因相似度過(guò)高而被判為重復(fù)。
3)圖表、公式等類(lèi)似具有特定文字結(jié)構(gòu)和表達(dá)形式的內(nèi)容,即使內(nèi)容不同?也會(huì)被誤判為重復(fù)。
4)預(yù)處理過(guò)程中,如果目標(biāo)論文的組成部分識(shí)別不準(zhǔn)確,可能會(huì)導(dǎo)致作者單位、參考文獻(xiàn)等內(nèi)容被誤判為重復(fù)內(nèi)容。
5)查重系統(tǒng)的主要功能是檢測(cè)剽竊行為,對(duì)于剽竊行為的界定,其比對(duì)的對(duì)象應(yīng)當(dāng)是整個(gè)人類(lèi)知識(shí)。盡管查重系統(tǒng)開(kāi)發(fā)公司掌握了海量的文獻(xiàn)數(shù)據(jù),但是受版權(quán)、數(shù)據(jù)獲取技術(shù)和收納時(shí)滯等因素的限制,查重系統(tǒng)的文獻(xiàn)數(shù)據(jù)庫(kù)中的數(shù)據(jù),相對(duì)于整個(gè)人類(lèi)知識(shí)而言畢竟是少數(shù)。
6)查重系統(tǒng)對(duì)未收錄的外文著作和小語(yǔ)?種期刊等、沒(méi)有及時(shí)收錄的文獻(xiàn)以及圖像和音視頻等?非文本內(nèi)容,都不能進(jìn)行有效對(duì)比?。
7)在相似度計(jì)算時(shí),語(yǔ)義相同的改寫(xiě)因“相似度”不高而被判為不重復(fù);
8)對(duì)研究思路、方法等較為抽象的內(nèi)容,查重系統(tǒng)也不能進(jìn)行有效檢測(cè);
9)相同內(nèi)容的圖表、公式等非文本數(shù)據(jù)轉(zhuǎn)化為文字時(shí),往往不能被準(zhǔn)確識(shí)別 。
從技術(shù)原理上看,查重系統(tǒng)是通過(guò)比對(duì)文本的某些特征或規(guī)律實(shí)現(xiàn)的,但查重結(jié)果不能自動(dòng)判斷目標(biāo)論文中的重復(fù)內(nèi)容與已有文獻(xiàn)在學(xué)術(shù)上的關(guān)系,因此它就不能從科學(xué)規(guī)范、作者學(xué)術(shù)動(dòng)機(jī)以及內(nèi)容重復(fù)造成的后果危害上作出作者學(xué)術(shù)行為的判定,這是查重系統(tǒng)在技術(shù)上的本質(zhì)局限。
論文查重降重綜合平臺(tái):checkvvip.com?
(checkvvip論文查重系統(tǒng)有萬(wàn)方、維普、源文鑒、Turnitin、iThenticate、早降重等十多個(gè)系統(tǒng),官方授權(quán),權(quán)威檢測(cè)?。?/p>