国产精品天干天干,亚洲毛片在线,日韩gay小鲜肉啪啪18禁,女同Gay自慰喷水

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

Kaggle新賽:LLM文本檢測(cè)大賽上分攻略(NLP)

2023-11-11 14:00 作者:深度之眼官方賬號(hào)  | 我要投稿


賽題名稱(chēng):LLM - Detect AI Generated Text

賽題鏈接:https://www.kaggle.com/competitions/llm-detect-ai-generated-text

賽題背景

隨著LLM的普及,許多人擔(dān)心它們會(huì)取代或改變通常由人類(lèi)完成的工作。教育工作者特別關(guān)注它們對(duì)學(xué)生技能發(fā)展的影響,盡管許多人仍然樂(lè)觀地認(rèn)為L(zhǎng)LM最終將成為幫助學(xué)生提高寫(xiě)作技巧的有用工具。

LLM可能導(dǎo)致剽竊的潛在問(wèn)題是學(xué)術(shù)界最大的關(guān)注點(diǎn)之一。LLM在大規(guī)模的文本和代碼數(shù)據(jù)集上訓(xùn)練,這意味著它們能夠生成與人類(lèi)書(shū)寫(xiě)的文本非常相似的文本。例如,學(xué)生可以使用大型語(yǔ)言模型生成不是他們自己的文章,錯(cuò)過(guò)了關(guān)鍵的學(xué)習(xí)步驟。

賽題任務(wù)

本次比賽要求參賽者開(kāi)發(fā)一個(gè)機(jī)器學(xué)習(xí)模型,該模型可以準(zhǔn)確檢測(cè)論文是由學(xué)生還是LLM撰寫(xiě)的。

參賽者在本次競(jìng)賽中的工作可以幫助識(shí)別大型語(yǔ)言模型的特征,并推進(jìn)該領(lǐng)域的技術(shù)發(fā)展。

評(píng)價(jià)指標(biāo)

提交的方案將基于預(yù)測(cè)概率和觀測(cè)目標(biāo)之間的ROC曲線下面積進(jìn)行評(píng)估。

提交文件

對(duì)測(cè)試集中的每個(gè)id,參賽者必須預(yù)測(cè)生成該文章的概率。文件應(yīng)包含一個(gè)標(biāo)頭,并采用以下格式:

數(shù)據(jù)描述

競(jìng)賽數(shù)據(jù)集包含約10000篇文章,其中一些是學(xué)生寫(xiě)的,一些是由各種大型語(yǔ)言模型(LLM)生成的。競(jìng)賽的目標(biāo)是確定文章是否由LLM生成。

所有文章都是針對(duì)7個(gè)作文題目中的一個(gè)而寫(xiě)的。在每個(gè)題目中,學(xué)生被要求閱讀一個(gè)或多個(gè)源文本,然后寫(xiě)出回應(yīng)。在生成文章時(shí),同樣的信息可能已經(jīng)作為輸入提供給LLM,也可能沒(méi)有提供。

來(lái)自?xún)蓚€(gè)題目的文章組成訓(xùn)練集,其余的文章組成隱藏的測(cè)試集。訓(xùn)練數(shù)據(jù)集中的幾乎所有文章都是學(xué)生寫(xiě)的,只給出了幾篇作為示例生成的文章。

文件和字段信息:

  • {test/train}_essays.csv

    • id - 每篇文章的唯一標(biāo)識(shí)符。

    • prompt_id - 標(biāo)識(shí)文章所對(duì)應(yīng)的題目。

    • text - 文章正文。

    • generated - 文章是由學(xué)生寫(xiě)的(0)還是由LLM生成的(1)。

  • train_prompts.csv - 文章是針對(duì)這些字段中的信息而寫(xiě)的。

    • prompt_id - 每個(gè)題目的唯一標(biāo)識(shí)符。

    • prompt_name - 題目的標(biāo)題。

    • instructions - 給學(xué)生的指示。

    • source_text - 文章回應(yīng)的文章文本,Markdown格式。

  • sample_submission.csv - 正確格式的提交文件。

時(shí)間安排

  • 2023 年 10 月 31 日 - 開(kāi)始日期

  • 2024 年 1 月 15 日 - 報(bào)名截止日期

  • 2024 年 1 月 15 日 - 合并截止日期

  • 2024 年 1 月 22 日 - 提交截止日期

賽題獎(jiǎng)金

排名獎(jiǎng)

  • 第一名 - 20,000美元

  • 第二名 - 10,000美元

  • 第三名 - 8,000美元

  • 第四名 - 7,000美元

  • 第五-七名 - 5,000美元

效率獎(jiǎng)

  • 第一名 - 20,000美元

  • 第二名 - 10,000美元

  • 第三名 - 8,000美元

  • 第四名 - 7,000美元

  • 第五名 - 5,000美元

新賽火熱報(bào)名中?。?!

戳海報(bào)了解詳情??

添加小享,報(bào)名新賽
有其他問(wèn)題也可以咨詢(xún)哦


Kaggle新賽:LLM文本檢測(cè)大賽上分攻略(NLP)的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
邹平县| 蚌埠市| 革吉县| 吴忠市| 泊头市| 白玉县| 双江| 宜君县| 拉孜县| 习水县| 徐闻县| 平邑县| 宁安市| 日照市| 大庆市| 重庆市| 满洲里市| 贵南县| 岑巩县| 扎兰屯市| 新宁县| 龙井市| 无锡市| 普格县| 夏津县| 合川市| 鹰潭市| 龙岩市| 武宁县| 正蓝旗| 湘潭市| 岳普湖县| 许昌县| 邯郸市| 海晏县| 武义县| 洪湖市| 威远县| 通道| 沈阳市| 胶州市|