從“虛”到“實”的游戲AI,騰訊正在以游戲科技助力產(chǎn)業(yè)發(fā)展
導(dǎo)語
人類玩的游戲AI已經(jīng)無法滿足了?
前幾日,我被問及一個看似很尋常的問題,“游戲是什么”。想了想,腦海里浮現(xiàn)起來的都是類似游戲規(guī)則、游戲畫面、游戲設(shè)計的素材。但游戲的含義似乎不僅限于此,游戲來源于生活,有時再反哺給生活。
國外大學(xué)將游戲《俠盜獵車手5》用于無人駕駛技術(shù)的訓(xùn)練,前些日子《塞爾達(dá)》《刺客信條》進(jìn)校園歷史地理課堂,包括我們在手機(jī)上就能云游長城……游戲正在憑借逼真生動的環(huán)境設(shè)計、豐富的人文故事背景跨界至更多領(lǐng)域。

一方面,游戲?qū)ΜF(xiàn)實場景的模仿和還原,離不開AI技術(shù)的發(fā)展。另一方面,復(fù)雜及仿真的游戲虛擬環(huán)境,又成為游戲AI訓(xùn)練的絕佳試煉場。近些日子,隨著繪畫AI技術(shù)和Chatpgt的嶄露頭角,在游戲領(lǐng)域掀起生成式AI的火熱。國內(nèi)游戲廠商如騰訊、網(wǎng)易、米哈游、完美世界等都加入這場混戰(zhàn)之中。游戲AI的應(yīng)用性正在延展至交通、醫(yī)療等現(xiàn)實生活領(lǐng)域,帶來更多具現(xiàn)實意義的影響。
01
進(jìn)擊:游戲與AI的發(fā)展
首先來聊聊游戲AI的最早雛形。查看電子游戲和人工智能的發(fā)展歷史,可發(fā)現(xiàn)兩者從一開始便是相輔相成的好伙伴。
井字棋,作為網(wǎng)絡(luò)資料可溯源到的歷史上最早的電子游戲,在1952年由英國計算機(jī)科學(xué)家Douglas設(shè)計。兩人輪流在九格方盤上劃叉或圓, 誰先把三個同一記號排成橫線、直線、斜線便獲得勝利。這也是人類首次在電子平臺與游戲AI對戰(zhàn)。

游戲AI的精妙設(shè)計,在電子游戲的體驗及發(fā)展中有著不可或缺的作用。除了井字棋,提到游戲AI更為人津津樂道的是1980年代的街機(jī)游戲《吃豆人》。在巖谷徹的設(shè)計下,《吃豆人》中的四個AI有著截然不同的性格,會從不同方向?qū)ν婕覈范陆亍A硗馊缃?jīng)典游戲《淘金者》中的高難度AI設(shè)計,也讓玩家對那種“汗流浹背”的感覺印象深刻。

《吃豆人》
當(dāng)然,面對早期游戲AI,玩家或許還能通過反復(fù)練習(xí)和查看攻略獲勝。不過游戲AI也暗自通過各位人工智能研究者的勤加訓(xùn)練,逐漸變強(qiáng),人類也逐步失守。1950年,“人工智能之父”圖靈就曾在論文《計算機(jī)器與智能》預(yù)言——棋類游戲會是展示人工智能的一個突破口。
1997年,一場現(xiàn)場直播的特殊比賽印證了圖靈的“預(yù)言”。國際象棋大師卡斯帕羅夫,面對最早的人工智能體“深藍(lán)”最終遺憾落敗。深藍(lán)是一臺重約1.4噸,總共擁有256塊處理器的超級電腦。這在當(dāng)時重重打擊了象棋棋手的士氣,卻極大振奮了人工智能研究者的信心。

在“深藍(lán)”之后,面對AlphaGo、AlphaStar等后輩AI的乘勝追擊,人類玩家也在圍棋乃至《Dota2》《星際爭霸》《王者榮耀》等游戲領(lǐng)域相繼失守。
1962年 IBM的薩繆爾研制的西洋跳棋AI程序擊敗了當(dāng)時全美西洋棋冠軍
1997年 國際象棋 卡斯帕羅夫輸給IBM深藍(lán)
2013年 雅達(dá)利2600 Deepmind擊敗人類
2016年 圍棋 DeepMindAlphaGo4:1打敗人類世界冠軍李世石
2017年 圍棋AlphaGo以3:0戰(zhàn)勝人類排名第一選手柯杰。
2017年《Dota2》OpenAI Bot擊敗烏克蘭現(xiàn)役職業(yè)玩家Dendi
2018年《王者榮耀》 騰訊AI Lab王者絕悟打敗王者榮耀頂尖高手
2019年《星際爭霸2》 DeepMind AlphaStar10:0 完勝人類
當(dāng)然這只是一個游戲發(fā)展的一個橫截面,面對進(jìn)擊的游戲AI,電子游戲所帶給玩家的體驗也與日俱增??梢哉f游戲與AI的發(fā)展關(guān)系,就像科技巨人向前邁步的一雙腿,一榮俱榮。正如騰訊天美L1工作室總經(jīng)理、《王者榮耀》執(zhí)行制作人黃藍(lán)梟所說,“游戲和科技的發(fā)展相互促進(jìn),因為游戲本來就是一個天然的仿真虛擬環(huán)境”。
游戲作為現(xiàn)實的微縮盆景,讓AI更加智能。目前人工智能現(xiàn)在正從專家系統(tǒng)邁向強(qiáng)化學(xué)習(xí)階段。如果說圍棋、象棋等作為完美信息類的游戲,玩家能對場上所有玩家的信息全知全覺,這時,AI所依賴的是“搜索”技術(shù)和強(qiáng)大計算能力,即思考下一個落子點的所有可能性以及計算勝率,擇優(yōu)對弈。后來AI的訓(xùn)練環(huán)境如撲克、《王者榮耀》《Dota2》等,則趨向于多邊對抗的不完美信息博弈,即玩家不能完全知曉其它玩家的行動,AI在虛擬環(huán)境中通過模仿學(xué)習(xí)、自我博弈等深度強(qiáng)化學(xué)習(xí)方法達(dá)到自我進(jìn)化成“多智能體協(xié)作AI”。騰訊“王者絕悟”團(tuán)隊曾向媒體透露,平均每天自對戰(zhàn)局?jǐn)?shù)相當(dāng)于人類訓(xùn)練440年的量。

相較圍棋、象棋以一方棋盤為天地,《王者榮耀》《Dota2》等多人對抗的游戲系統(tǒng)更貼近現(xiàn)實環(huán)境,要獲得勝利,裝備、走位、屬性克制等多種因素缺一不可。有種說法,要是連Moba這樣復(fù)雜的場景人工智能體都能輕松應(yīng)對,那么,AI將能輔佐用于更多現(xiàn)實的生活場景之中。
02
布局:國內(nèi)大廠爭相研究游戲AI
而近大半年來,隨著AI技術(shù)的發(fā)展在對話及繪畫領(lǐng)域讓人刮目相看,也掀起了生成式AI火熱,擁有豐富數(shù)據(jù)資源的游戲大廠也進(jìn)一步公布AI項目計劃。

早期加入競爭的為騰訊AI Lab。知名項目包括有棋藝的AI“絕藝”、《王者榮耀》AI“王者絕悟”及與《王者榮耀》聯(lián)合打造的AI開放研究平臺“開悟”。此外,在今年3月的游戲開發(fā)者大會,騰訊還帶來了可研發(fā)部署游戲AI開發(fā)平臺Game AIR,可適配MOBA、紙牌、射擊等五種品類;此前,騰訊光子工作室群還曾舉辦AI創(chuàng)作美術(shù)大賽。近日王者榮耀團(tuán)隊還宣布將游戲AI運(yùn)用于醫(yī)療及交通。從整體動作上來看,騰訊對AI研究一直保持擁抱態(tài)度。

然后是網(wǎng)易旗下的伏羲工作室及AI Lab工作室。兩者都在2017年成立,伏羲工作室前身為雷火游戲AI實驗室,2020年后升級為網(wǎng)易伏羲事業(yè)部,成立伏羲科技與伏羲機(jī)器人。網(wǎng)易伏羲AI的主要研究方向在強(qiáng)化學(xué)習(xí)、自然語言處理、智能捏臉、反外掛技術(shù)等上。最新消息為今年2月,網(wǎng)易旗下游戲《逆水寒》宣布實裝國內(nèi)首個“游戲版ChatGPT”。該功能由網(wǎng)易自研的伏羲AI支持運(yùn)行,玩家可實現(xiàn)與NPC自由對話,獲得NPC的即時反應(yīng)。
字節(jié)朝夕光年無雙工作室,2016年成立,是朝夕光年旗下四大中重度自研工作室,側(cè)重大DAU中重度游戲項目。該工作室除研發(fā)《全民無雙》《擇天記》等手游,也與字節(jié)游戲AI團(tuán)隊合作研發(fā)了競技場AI機(jī)器人。除此之外,字節(jié)跳動曾在2019年全資收購人工智能企業(yè)北京深極智能科技有限公司。
米哈游也在2018年成立了“逆熵”研究部門,后來在2022年升級為米哈游“逆熵科技研究院”。去年7月在B站直播中彈幕炸屏的數(shù)字人“鹿鳴”,便是“逆熵”出品。逆熵AI支持了自然的聲音,這一黑科技也在《未定事件簿》中首次商用。另外,近期上線的手游《星穹鐵道》中,游戲內(nèi)大量級的劇情對話讓人印象深刻,其后AI生成工具“無盡的三月七”更是攢足了話題和風(fēng)頭。還有其制作人大衛(wèi)就透露,目前團(tuán)隊已開始探索用AI工具輔助游戲研發(fā),包括NPC臺詞、劇情,NPC行為模式等,讓NPC的臺詞不會重復(fù),讓其行為更加自然。此外,也有傳言顯示,米哈游準(zhǔn)備參與國內(nèi)AI創(chuàng)業(yè)公司MiniMax的新一輪投資。
巨人網(wǎng)絡(luò)的創(chuàng)始人史玉柱也非常重視AI,近日公司在接受機(jī)構(gòu)調(diào)研回復(fù):已組建AI團(tuán)隊。目前公司在休閑競技賽道正在探索玩法與AI技術(shù)相結(jié)合,此外,公司多款MMORPG游戲已開始探索智能NPC,讓NPC與玩家對話時的文字、表情、語音的能通過AI自由生成,并且能夠基于對話內(nèi)容做出合乎邏輯的行為反饋。
完美世界則在2022年年報中透露,公司內(nèi)部已成立AI中心,并且將由公司游戲業(yè)務(wù)CEO負(fù)責(zé),中臺技術(shù)部門牽頭,各項目制作人參與。目前公司已將AI 相關(guān)技術(shù)應(yīng)用于游戲中的智能 NPC、場景建模、AI 繪畫、AI 劇情、AI 配音等方面。
此外像為莉莉絲、靈犀互娛等提供AI產(chǎn)品解決方案的公司“啟元世界”,由原騰訊AI Lab總經(jīng)理、T4技術(shù)專家劉永升創(chuàng)立的“超參數(shù)科技”,剛完成數(shù)千萬元天使輪融資“行者AI”等,也各自在SLG、推理AI小游戲等領(lǐng)域開始小試身手。新時代的游戲AI探索或許才剛剛開始。
03
應(yīng)用:游戲內(nèi)外
從以上廠商游戲AI的研發(fā)內(nèi)容,可看出它們的研發(fā)內(nèi)容多聚焦在以下方面:
1、智能角色的研發(fā),讓NPC的行為、語言、表情反饋更加具有實時性,豐富游戲體驗,如網(wǎng)易伏羲工作室及巨人網(wǎng)絡(luò)正在探索的;
2、游戲內(nèi)容的海量生成,包括場景及劇情內(nèi)容,極大增加游戲世界的信息密度。如騰訊AI Lab 今年發(fā)布的3D虛擬場景自動生成技術(shù),就能讓開發(fā)者AIGC技術(shù)迅速搭建一座 3D 虛擬城市,將開發(fā)時間從“年”縮短至“周”;
3、競技場AI機(jī)器人,字節(jié)無雙工作室正在研發(fā)這類技術(shù),將可能解決大DAU產(chǎn)品玩家流失后體驗不佳的問題,延長產(chǎn)品生命周期。

騰訊AI Lab今年發(fā)布的3D虛擬場景自動生成技術(shù)
在游戲外,黃藍(lán)梟和楊巍共同表示,游戲AI正從“虛”走向“實”,解決現(xiàn)實場景問題:“以我們的兩個項目為例,第一個是‘開悟’跟西南交通大學(xué)正在合作做智慧交通,解決車路協(xié)同的一些效率問題;第二方面是醫(yī)療領(lǐng)域,‘覺悟’去年發(fā)布了一個研究成果‘絕悟 RLogist’,將 AI 深度強(qiáng)化學(xué)習(xí)技術(shù)遷移到病理全片掃描圖像診斷領(lǐng)域,在性能接近的情況下,將傳統(tǒng)病理閱片效率提升 400%?!?/p>
文化場景的保護(hù)也是個有趣方向。騰訊運(yùn)用游戲科技技術(shù)優(yōu)勢打造的“數(shù)字藏經(jīng)洞”、“數(shù)字長城”小程序,則通過實地考察掃描,再運(yùn)用PCG(程序化內(nèi)容生成)技術(shù)生成地形及植被數(shù)據(jù),用UE5引擎及AI技術(shù)開發(fā)出讓玩家感受逼真、身臨其境的云游長城及敦煌的體驗。

04
教育:“先把黑箱打開”
最后回到AI到底向善還是趨惡?國際輿論場眾說紛紜。前些日子AI之父杰弗里·辛頓離開谷歌,就表達(dá)AI讓網(wǎng)絡(luò)信息真假難辨。今年3月,也有一些科技界知名人士共同簽署了一封信,呼吁停止培訓(xùn)最強(qiáng)大的人工智能系統(tǒng)的培訓(xùn)至少六個月。
到底如何看待AI?在教育領(lǐng)域,北京大學(xué)人工智能研究院副院長李文新說:“作為教育者,我們所要做的第一件事是在課程上把這個黑箱子打開,看它的技術(shù)是什么,我們希望通過教育和傳播來把它的頂層技術(shù)讓所有人知道?!碑?dāng)然她也提到,如何規(guī)范它的方展是件需要大家坐下來共同商討的緊迫且重要的事。
對于這個問題,騰訊AI Lab的總經(jīng)理楊巍則表示,“很早之前,騰訊就在提科技向善,并在人工智能正向價值方面做了很多工作。我們目前沒有看到技術(shù)跟我們產(chǎn)生很強(qiáng)的對立,我個人看到它還是會向好的方面發(fā)展,但是我們要謹(jǐn)慎?!?/p>
截至目前,全國大概有近500所學(xué)校開設(shè)人工智能這門課程,阿爾法Go戰(zhàn)勝人類的新聞也讓不少學(xué)生對游戲AI的強(qiáng)化學(xué)習(xí)方向感到蠢蠢欲動又“愛而不得”。一位該專業(yè)的學(xué)生就表示,“這樣的大模型AI研究,對算力及環(huán)境的要求頗高,我想做一個簡單的游戲試驗環(huán)境,需要實驗室所有同學(xué)放下手頭工作,把所有算力讓我試驗,也得要三個月才能完成一次試驗”。
而這或許也是騰訊開悟平臺今年從“邀請賽”正式升級為“公開賽”的意義——先提供環(huán)境、算法、代碼、安裝包等讓更多學(xué)生能夠共同打開黑箱瞧瞧,也為AI研究方向提供更多技術(shù)人才。

第一屆開悟比賽的冠軍團(tuán)隊選手趙鑒說,“從游戲達(dá)人轉(zhuǎn)變的契機(jī)是在2016年,聽聞用深度深度強(qiáng)化學(xué)習(xí)技術(shù)的游戲AI竟然能打敗人類專家,這讓我提起了興趣”。
電子科技大學(xué)“清水河畔混分王”的選手曾達(dá)表示,“自己參加了兩屆開悟比賽,最緊張的無異于決賽的最后一周,不到提交的最后一刻,都還在訓(xùn)練AI”。
清華大學(xué)“五殺蔡文姬”的選手嚴(yán)喻梓表示,“我認(rèn)為未來AI肯定不會停留在虛擬世界,而是與現(xiàn)實世界產(chǎn)生更多交互”。
當(dāng)然值得注意的是,除了芯片、算力等是游戲AI發(fā)展必備的硬件基礎(chǔ),公眾精神認(rèn)知上的局限也值得關(guān)注。在前幾日的騰訊的stac科創(chuàng)聯(lián)合大會上,聊到目前班上男女占比的問題,李文新表示,"這非常遺憾,我在讀大學(xué)時,男女比例是4:1,而目前班上的男女比例是9:1”。曾達(dá)也表示,今年參賽選手也很少看見女性。對此李文新說:“不是不能扭轉(zhuǎn),需要全社會的關(guān)注。計算機(jī)或者人工智能是非常有趣的而且好的智力工具,女生不應(yīng)該放棄這個學(xué)科。而且女性看問題的視角跟男性不一樣,在創(chuàng)造性工作里面可能有不一樣的發(fā)現(xiàn)。”
另外,對游戲認(rèn)知也存在誤區(qū)也老生常談的問題。在談及目前國內(nèi)教育對游戲的恐慌時,李文新說,“游戲是不影響學(xué)習(xí)的,其實是啟發(fā)智力的?!彼J(rèn)為,游戲能打得特別好一定是聰明的,“游戲能力,其實也能鏈接至一個人的學(xué)習(xí)能力和理解能力”。
結(jié)語
在2018年的KPL總決賽上,《王者榮耀》AI“王者絕悟”曾和五位王者榮耀的頂尖高手展開一場表演賽,最終AI戰(zhàn)勝“人類軍團(tuán)”。這也是國內(nèi)Moba類游戲AI的首次勝利。
在這次比賽之后,“王者絕悟”模型負(fù)責(zé)人表示,“AI的下一個里程碑很有可能在復(fù)雜的策略游戲中誕生”。
那么問題來了,為下一個AI里程碑提供訓(xùn)練場的游戲類型會是哪款開放世界游戲呢?