使用qq聊天記錄訓(xùn)練一個(gè)自己的對(duì)話機(jī)器人
使用qq聊天記錄訓(xùn)練一個(gè)自己的對(duì)話機(jī)器人
需要提前準(zhǔn)備的有可靠的python環(huán)境、cuda環(huán)境等、本地已經(jīng)部署好的chatglm-6b模型(本地模型,不用擔(dān)心聊天記錄被上傳)、qq電腦版、還有一個(gè)能把qq聊天記錄格式轉(zhuǎn)化成一問一答格式訓(xùn)練集的腳本。
其中腳本是我昨天寫的,我會(huì)提供給大家(我python水平其實(shí)不咋地,能用就行大家見諒)
腳本地址:https://github.com/liuhr144/qq/tree/main
chatGLM-6b官方開源地址:https://github.com/THUDM/ChatGLM-6B
而其他準(zhǔn)備需要大家自己去完成,如果有什么報(bào)錯(cuò)沒法解決請(qǐng)留言,我會(huì)盡力幫助。
那么正式開始!
1.在這個(gè)qq設(shè)置界面打開消息管理

2.?選擇云消息設(shè)置漫游數(shù)據(jù)(7天就行。開會(huì)員也行)

3.?選擇導(dǎo)出消息記錄(注意要為txt格式)


4.之后改名為test1.txt(也可按照腳本內(nèi)注釋改腳本不改這個(gè))

5.?按照腳本中的注釋修改參數(shù)

6.運(yùn)行腳本得到兩個(gè)json文件(記得檢驗(yàn)json內(nèi)容哈)

7.復(fù)制這兩個(gè)文件去微調(diào)的訓(xùn)練集目錄(如圖)

8.通過cmd執(zhí)行訓(xùn)練并等待訓(xùn)練完成


9.通過cmd執(zhí)行推理并等待推理完成


10.運(yùn)行web_demo進(jìn)行對(duì)話

這樣,一個(gè)像自己說話方式的對(duì)話機(jī)器人就弄好了,去和朋友對(duì)話看看他們能否發(fā)現(xiàn)吧
(真是惡趣味)
效果如圖:還湊合?


謝謝大家觀看!