通用還是行業(yè)?哪個(gè)才是大模型的未來發(fā)展方向
無人不談大模型,無疑是當(dāng)下科技界的真實(shí)寫照。 ChatGPT的出現(xiàn),瞬間點(diǎn)燃了科技圈對(duì)于大模型的熱情。無論是科技巨頭還是研究機(jī)構(gòu),亦或是AI創(chuàng)業(yè)公司,都紛紛入局該領(lǐng)域,以搶抓發(fā)展先機(jī)。 自2023年3月以來,大模型相關(guān)產(chǎn)品如雨后春筍般涌現(xiàn),有的專注文學(xué)創(chuàng)作,有的善于數(shù)學(xué)題解答,有的用于工具開發(fā),還有的擅長(zhǎng)常識(shí)問答……不得不說,目前市面上的大模型產(chǎn)品,難免讓人有些眼花繚亂。 通用大模型存在局限性? 實(shí)際上,根據(jù)應(yīng)用場(chǎng)景和目標(biāo)人群的不同,可以將大模型分為通用大模型和行業(yè)大模型兩大類。 所謂通用大模型,是指具有廣泛適用性的大型生成式AI模型,能夠處理多種任務(wù)和應(yīng)用于不同領(lǐng)域。這類大模型通常包含深度學(xué)習(xí)領(lǐng)域中的各種技術(shù)和算法,例如神經(jīng)網(wǎng)絡(luò)、自注意力機(jī)制、預(yù)訓(xùn)練等,可以用于處理自然語言處理、計(jì)算機(jī)視覺、語音識(shí)別等領(lǐng)域的任務(wù)。 例如,ChatGPT就是一種通用大模型,擁有語言理解和文本生成能力,能夠通過連接大量的語料庫(kù)來訓(xùn)練模型,這些語料庫(kù)包含了真實(shí)世界中的對(duì)話,使得ChatGPT具備根據(jù)聊天的上下文進(jìn)行互動(dòng)的能力,做到像人類一樣來聊天交流,甚至能完成編寫電子郵件、論文和代碼等任務(wù)。 不過,需要指出的是,縱使通用大模型非常強(qiáng)大,卻也存在著一些局限性。 首先,通用大模型需要大量的數(shù)據(jù)來進(jìn)行訓(xùn)練和優(yōu)化,通常會(huì)消耗大量的計(jì)算資源、時(shí)間和成本。據(jù)國(guó)盛證券發(fā)布的《ChatGPT需要多少算力》估算,ChatGPT的單次訓(xùn)練成本約為140萬美元,對(duì)于一些更大的大模型,訓(xùn)練成本介于200萬美元至1200萬美元之間。另外,以ChatGPT在2023年1月的獨(dú)立訪客平均數(shù)1300萬來計(jì)算,其對(duì)芯片需求為3萬多片英偉達(dá)A100?GPU,初始投入成本約為8億美元,每天的電費(fèi)支出大約在5萬美元。 其次,通用大模型數(shù)據(jù)主要來自公開文獻(xiàn)和互聯(lián)網(wǎng)信息,專業(yè)知識(shí)與行業(yè)數(shù)據(jù)積累不足,特別是在醫(yī)療、金融等專業(yè)性較強(qiáng)的產(chǎn)業(yè),通用大模型提供的服務(wù)有限。此外,網(wǎng)上可能存在錯(cuò)誤、謠言、偏見的信息,這可能會(huì)導(dǎo)致通用大模型精準(zhǔn)度不夠,生成有誤或有偏見的響應(yīng)。 瞄準(zhǔn)行業(yè)大模型 行業(yè)大模型的出現(xiàn),可以彌補(bǔ)通用大模型無法最優(yōu)化適配到各行各業(yè)中的不足。 行業(yè)大模型是指針對(duì)于某個(gè)特定行業(yè)或領(lǐng)域需求,采用大規(guī)模數(shù)據(jù)訓(xùn)練和先進(jìn)算法的深度學(xué)習(xí)模型。行業(yè)大模型通常包括該行業(yè)的關(guān)鍵流程、價(jià)值鏈、參與者、關(guān)系和其他重要要素,可以幫助理解行業(yè)的運(yùn)作機(jī)制、業(yè)務(wù)流程和價(jià)值創(chuàng)造方式。不僅如此,由于模型參數(shù)少,訓(xùn)練和推理的成本更低。 值得一提的是,如今,有諸多企業(yè)加入到了行業(yè)大模型賽道。 例如,百度聯(lián)合行業(yè)頭部企業(yè)、機(jī)構(gòu)打造的文心行業(yè)大模型,目前已涵蓋電力、燃?xì)狻⒔鹑?、航天、傳媒、城市、影視、制造、社科等領(lǐng)域; 華為發(fā)布的盤古大模型3.0圍繞“行業(yè)重塑”“技術(shù)扎根”“開放同飛”三大創(chuàng)新方向,為行業(yè)客戶、伙伴及開發(fā)者提供服務(wù),已在金融、金融、制造、醫(yī)藥研發(fā)、煤礦、鐵路等諸多行業(yè)發(fā)揮著巨大價(jià)值; 騰訊云打造的大模型一站式服務(wù)MaaS(Model-as-a-Service)內(nèi)置多個(gè)高質(zhì)量行業(yè)大模型,涵蓋金融、傳媒、文旅、政務(wù)、教育等多個(gè)行業(yè)場(chǎng)景; 京東推出的言犀大模型是立足于產(chǎn)業(yè)研發(fā),融合了70%通用數(shù)據(jù)與30%數(shù)智供應(yīng)鏈原生數(shù)據(jù),具有“更高產(chǎn)業(yè)屬性、更強(qiáng)泛化能力、更多安全保障”的優(yōu)勢(shì),致力于各種產(chǎn)業(yè)場(chǎng)景,解決真實(shí)的產(chǎn)業(yè)問題; 網(wǎng)易有道推出的教育領(lǐng)域垂直大模型“子曰”現(xiàn)已應(yīng)用于有道生態(tài)內(nèi)的軟件和硬件上,包括大模型翻譯、AI作文批改、英語語法精講、虛擬人口語教練、AIBox、文檔問答等; 新華三發(fā)布的私域大模型百業(yè)靈犀(LinSeer)面向的是政府、企業(yè)等這類對(duì)數(shù)據(jù)安全天然敏感的場(chǎng)景…… 可以說,從目前市場(chǎng)現(xiàn)狀來看,大模型競(jìng)賽從通用大模型轉(zhuǎn)向行業(yè)大模型似乎正成為一種趨勢(shì)。而且,業(yè)內(nèi)也普遍認(rèn)為,未來只會(huì)有兩三家“獨(dú)大”的通用大模型,并涌現(xiàn)出無數(shù)更貼近產(chǎn)業(yè)需求的行業(yè)大模型。 寫在最后: 前不久,IDC對(duì)基于大模型的AI市場(chǎng)規(guī)模進(jìn)行了預(yù)測(cè),預(yù)計(jì)中國(guó)人工智能市場(chǎng)規(guī)模在2023年將超過147億美元,到2026年這一規(guī)模將超過263億美元。 由此可見,大模型潛力不可小覷。因此,對(duì)于入局者而言,無疑將會(huì)擁有非常大的發(fā)展機(jī)遇。至于,未來的大模型會(huì)走向何方,還要看廠商們接下來如何布局。畢竟,大模型的競(jìng)賽才剛剛開始。