掘金AIGC正當時,開放、開源的AI大模型是正解
近期,ChatGPT的火爆,讓國內(nèi)相關(guān)企業(yè)對于AI大模型再次趨之若鶩,那么問題來了,此番ChatGPT的火爆,給相關(guān)產(chǎn)業(yè)會帶來怎樣的影響?國內(nèi)類“ChatGPT”的發(fā)展之路又在何方?
ChatGPT火爆,大模型打開AIGC萬億市場之門
? 去年11月30日,OpenAI公司發(fā)布聊天機器人模型ChatGPT到今年1月,ChatGPT的活躍用戶數(shù)或已達1億,成為史上增長最快的消費者應(yīng)用。 ? 而隨著ChatGPT的火爆,有分析師預(yù)計,到2030年,ChatGPT有望為AIGC(生成式AI)打開一個萬億的市場規(guī)模。具體到中國,根據(jù)《中國AI數(shù)字商業(yè)展望2021-2025》預(yù)測,到2025年,中國生成式AI技術(shù)應(yīng)用規(guī)模預(yù)計上升至2070億元,2020—2025年年均復(fù)合增長率高達84.1%。 ?
究其原因,主要是以ChatGPT為代表的AI大模型能為AIGC的發(fā)展提供更好的基礎(chǔ)和支持。 ? 例如通過使用大規(guī)模的AI模型,可以生成更加準確、自然、豐富的文本內(nèi)容;研發(fā)人員可以更快地生成和調(diào)整AIGC的內(nèi)容,從而加速AIGC的研發(fā)過程;實現(xiàn)更加自然、流暢、準確的對話,為用戶提供更好的交互體驗;在游戲、電影、教育等諸多領(lǐng)域中,可以生成更加逼真、自然的對話和場景,為用戶提供更好的體驗。 ?
惟開放與開源,AIGC商業(yè)前景方無限
? 如上述,以ChatGPT為代表的AI大模型的發(fā)展為AIGC的發(fā)展提供了更好的基礎(chǔ)和支持(例如可以提高AIGC的質(zhì)量、加速AIGC的研發(fā)、增強AIGC的交互性和促進AIGC的應(yīng)用等),且前景無限,但事實是,在全球范圍內(nèi),大模型的落地都還處于早期階段。至于國內(nèi)各個大廠所研發(fā)的大模型雖然有內(nèi)部業(yè)務(wù)的落地場景,但整體上尚未有成熟的商業(yè)化模式。 ? 究其原因,大模型是對人類知識體系的抽象與提煉,所以它能夠應(yīng)用的場景和產(chǎn)生的價值是巨大的。但只有通過開放與開源,大模型的應(yīng)用潛力才能在眾多有創(chuàng)造力的開發(fā)者那里得到最大程度的釋放,并轉(zhuǎn)換為商業(yè)價值。 ? 基于此,作為一個人工智能語言模型,盡管 OpenAI提供了API接口供開發(fā)者使用,但它并非完全開源,因為其代碼和訓練數(shù)據(jù)集仍然是OpenAI獨有,并未向開發(fā)者開放。而隨之而來的問題是,大模型通過開放API所能提供的能力相當有限,難以承擔復(fù)雜多樣的應(yīng)用需求,盡管目前市場上已經(jīng)催生出一些具有創(chuàng)意的APP,但整體上還處于一種“小兒科”的階段,遠沒有達到大規(guī)模產(chǎn)業(yè)化的程度。 ? 與之相比,國內(nèi)AI大模型有的已經(jīng)走上了完全開放和開源的道路。 ? 例如國內(nèi)的“源1.0”大模型,其目前已上線開放平臺,開放模型API、開源高質(zhì)量中文數(shù)據(jù)集、模型訓練代碼、推理代碼、應(yīng)用代碼、面向AI芯片的模型移植開發(fā)代碼,開放平臺已服務(wù)超4000名行業(yè)開發(fā)者,覆蓋互聯(lián)網(wǎng)、金融、教科研和自動駕駛等行業(yè)領(lǐng)域,大大降低了不同行業(yè)、不同任務(wù)的AI應(yīng)用開發(fā)門檻,開發(fā)者只需幾行代碼便可以開發(fā)出一個完整應(yīng)用,使其無需關(guān)心底層技術(shù),甚至無需配置編程環(huán)境,就可以直接將應(yīng)用構(gòu)建于AI大模型的能力之上的應(yīng)用,在降低開發(fā)門檻的同時,讓開發(fā)人員能夠?qū)⒏嗟木劢购诵臉I(yè)務(wù)邏輯。 ? 以源社區(qū)開發(fā)者“一鍵構(gòu)建專屬你的數(shù)字人”的數(shù)字人生成平臺Fay為例,它就是一個完整的開源項目,包含Python內(nèi)核及UE數(shù)字人模型,開發(fā)人員可以利用該項目可簡單構(gòu)建各種類型的數(shù)字人或數(shù)字助理。值得一提的是,該項目各模塊之間耦合度非常低,包括聲音來源、語音識別、情緒分析、NLP處理、情緒語音合成、語音輸出和表情動作輸出等模塊。每個模塊都可以輕松地更換。
不知業(yè)內(nèi)看到這個作何感想?但在我們看來,這套架構(gòu)相當于給只能文字聊天的ChatGPT裝上好看的皮囊,并更像真人般能夠?qū)崟r對話,使ChatGPT更像人。而源大模型如同ChatGPT,在整個數(shù)字人流程中充當大模型的大腦和靈魂,能輸出智能實施的對話。 ? 那么問題來了,開放與開源的國內(nèi)AI大模型真的可以充分釋放其價值,助力開發(fā)者加速AIGC商業(yè)化的落地嗎? ?
開發(fā)者淘到第一桶金,“源1.0”大模型成助力掘金AIGC標桿
? 所謂事實勝于雄辯,與當下火爆的ChatGPT商業(yè)模式還存有爭議、商業(yè)化落地還停留在“雷聲大雨點小”相比,由于國內(nèi)AI大模型的開放與開源,開發(fā)者們通過AI大模型已經(jīng)淘到了AIGC的第一桶金。 ? 這里我們以源開發(fā)者社區(qū)開發(fā)者Digital socialworker team為例,其團隊在社區(qū)志愿服務(wù)中心,深刻感受到基層社工的工作的繁瑣及困難,便計劃用科技幫助基層社工,開發(fā)出更智能的產(chǎn)品,為此,他們選擇了基于源大模型強大的智能及完善便捷的開發(fā)平臺,在極短的時間內(nèi),便開發(fā)出成熟產(chǎn)品“臨小助”。 ? “臨小助”可以隨時隨地為基層社區(qū)工作者提供沉浸式、針對性的一對一群眾工作能力培訓,目前已經(jīng)開設(shè)了疫情防控、加裝電梯、業(yè)委會換屆等8堂社區(qū)治理高頻情景對話課程,社區(qū)工作者通過手機載體與“臨小助”進行互動對話形式,提高接待群眾服務(wù)群眾的經(jīng)驗與信心,讓社區(qū)小白“秒變”服務(wù)群眾的能人。試用階段顯示,某高頻場景中,社區(qū)工作人員培訓學習效率提升5倍,有效輔助問答建議達75%。目前,該產(chǎn)品已在上海市靜安區(qū)臨汾路街道、嘉定區(qū)安亭鎮(zhèn)落地,獲得一致好評,并成為基層工作智慧化轉(zhuǎn)型的案例在新民晚報、學習強國等媒體重點宣傳報道。 ?
不要小看“臨小助”這樣的數(shù)字助理產(chǎn)品,據(jù)Digital socialworker team介紹,在基層社工領(lǐng)域,大模型加持的數(shù)字助理,將有廣闊的商業(yè)前景。按民政部網(wǎng)站數(shù)據(jù),截至2020年底,中國共有38741個街道(鎮(zhèn)、鄉(xiāng))級政府。按15%的滲透率計算,基礎(chǔ)服務(wù)部分市場規(guī)模就高達5.57億元/年。當然,這還僅僅是AIGC應(yīng)用落地的冰山一角。 ? 又如來自于源開發(fā)者社區(qū)開發(fā)者的郭澤斌,其基于源大模型構(gòu)建的“一鍵式構(gòu)建專屬數(shù)字人”的開源架構(gòu),已被深圳某公司應(yīng)用到平板中充當自個人助力,產(chǎn)生了巨大商業(yè)價值。一些主打情感陪伴的兒童玩具公司也從這套架構(gòu)中挖掘出巨大商業(yè)價值,在兒童玩具中搭載這套開源架構(gòu),目前已投入生產(chǎn),即將上線售賣。?
其實,數(shù)字人的未來遠遠超出僅作為人類的助力,當通用人工智能充分發(fā)展,如Chat的變革。未來,數(shù)字人或被當作虛擬世界的獨立個體,,甚至把它作為生活中的主體當成獨立的人格,甚至賦予它法律的權(quán)利,給具有看起來獨立人格有趣靈魂,外表皮囊又很像人的數(shù)字人,或者甚至于是機器人,應(yīng)不應(yīng)該給他一個獨立的主體資格,甚至于賦予它一些法律權(quán)益。 ? 總之,AI大模型給了我們充分的想象空間。 ? 不僅如此,除以上數(shù)字人以外,源大模型在不同的領(lǐng)域都發(fā)揮著巨大價值。例如在智能客服領(lǐng)域,大模型加持智能客服大腦榮獲《哈佛商業(yè)評論》新技術(shù)突破獎,數(shù)據(jù)中心專業(yè)問題解決率高達80%,可將復(fù)雜技術(shù)咨詢問題的業(yè)務(wù)處理時長降低65%,提升整體服務(wù)效率達160%; ? 在反詐領(lǐng)域,基于“源1.0”大模型,社區(qū)開發(fā)者開發(fā)出一個能夠無障礙進行微信聊天的人工智能“反詐AI——小源”,并在與詐騙犯的真實對話場景中進行測試,小源不僅能發(fā)現(xiàn)詐騙犯的動機,精準識別詐騙套路,甚至能將計就計在對話過程中反擊,成功套路到詐騙犯520元紅包,為公眾樹立反詐榜樣增加公眾反詐騙意識和識別能力,守護公眾安全,從而實現(xiàn)科技向善。 ? 通過上述國內(nèi)AI大模型的應(yīng)用,我們認為,無論是現(xiàn)在,還是將來,AI大模型的發(fā)展已經(jīng)呈現(xiàn)出“安卓”生態(tài)的發(fā)展模式。 ? 眾所周知,安卓之所以成為當前全球最大的移動生態(tài)(擁有最多的開發(fā)者和用戶),首先就得益于其將安卓系統(tǒng)及其應(yīng)用等開發(fā)工具、代碼等的開源(等同于“源1.0”大模型的開放與開源),讓開發(fā)者基于此開發(fā)出更符合不同市場和用戶需求的第三方應(yīng)用(等同于開發(fā)者基于“源1.0”開發(fā)出的各種應(yīng)用,例如我們上面提到的“臨小助”、“數(shù)字人”等),其次,作為安卓系統(tǒng)本身,也會結(jié)合開發(fā)者的反饋不斷改善自己的系統(tǒng)、開發(fā)工具等,并以新的系統(tǒng)更新的形式反哺給開發(fā)者,讓他們開發(fā)出更好、更新、更多的應(yīng)用,以此往復(fù)形成良性的移動生態(tài)閉環(huán)(等同于“源1.0”大模型根據(jù)開發(fā)者的反饋不斷進化,讓開發(fā)者據(jù)此開發(fā)出體驗更好、更多的應(yīng)用)。而這種生態(tài)最終帶來的是基于安卓的數(shù)百萬應(yīng)用及給開發(fā)者帶來的真金白銀和滿足數(shù)十億用戶的需求。 ? 基于此,我們認為,AI大模型的開放和開源與全球最大的移動生態(tài)安卓類似的發(fā)展模式,同樣會吸引眾多開發(fā)者加入其中,從而形成AI大模型的“安卓生態(tài)”,未來對于開發(fā)者和AIGC商業(yè)化落地的價值不可估量,而從加速AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化,賦能千行百業(yè)的高度,更會產(chǎn)生經(jīng)濟與社會效益兼?zhèn)涞摹按竽P汀毙?yīng)。 ?
智算時代加速到來,算法基建化勢在必行
? 除上述之外,當我們站在更高的產(chǎn)業(yè)維度去看當下ChatGPT的火爆,以及國內(nèi)AI大模型在AIGC領(lǐng)域的落地,一個不爭的事實呈現(xiàn)在我們眼前,即智算時代正在加速到來。 ? 而眾所周知的事實是,智算時代是算力時代,智算中心是領(lǐng)先形態(tài)的數(shù)據(jù)中心、智慧時代的必要基礎(chǔ)設(shè)施,就像水利之于農(nóng)業(yè)社會,電力之于工業(yè)社會,已經(jīng)成為當下數(shù)字經(jīng)濟發(fā)展中業(yè)內(nèi)的共識。不過,隨著數(shù)實融合的不斷深入,為滿足千行百業(yè)AI化和AI產(chǎn)業(yè)化的需求,未來的智算中心不應(yīng)只包含算力基礎(chǔ)設(shè)施,還要有算法基礎(chǔ)設(shè)施,才能讓更多的企業(yè)享受普適普惠的智算服務(wù)。 ? 基于此,如果說此前我們國內(nèi)在算力基礎(chǔ)設(shè)施上走在前列,那么基于開源的基礎(chǔ)模型開發(fā)者開發(fā)出的各種場景化商業(yè)應(yīng)用的大模型這種類“安卓生態(tài)”(基礎(chǔ)模型就是安卓系統(tǒng),開發(fā)者開發(fā)的場景應(yīng)用就是基于安卓系統(tǒng)之上的各種APP,二者相互協(xié)同,相互促進,不斷壯大)的發(fā)展模式的形成,無疑為我們國內(nèi)在加快算法基建化及最終實現(xiàn)算法基礎(chǔ)設(shè)施方面樹立了前行的標桿,未來可期。 ?
寫在最后:
眾所周知,未來的競爭是基于AI的競爭,而鑒于當下ChatGPT初期呈現(xiàn)出的其對于某些行業(yè)、產(chǎn)業(yè)及市場的顛覆性,大模型未來的重要性、潛能及影響更是不言而喻。但事實是,出于商業(yè)利益等因素的考量,ChatGPT并未在數(shù)據(jù)集和算法上開放和開源,也就是說在決定AI發(fā)展和應(yīng)用水平三要素的數(shù)據(jù)、算法和算力上,如果我們不能推出自己國產(chǎn)的AI中文大模型的話,在未來AI(兩個重要博弈點缺失)的競爭中將處于相當不利的地位,甚至可能出現(xiàn)被“卡脖子”的風險,進而延緩AI的發(fā)展和應(yīng)用。 ? 所以,在不確定性的市場和產(chǎn)業(yè)環(huán)境下,無論是對于當下具體應(yīng)用層面的AIGC,還是更高產(chǎn)業(yè)維度的數(shù)實融合,促進中國數(shù)字經(jīng)濟發(fā)展來說,都決定了我們必須走經(jīng)濟效益、社會效益及國家利益兼顧,符合中國國情、自主研發(fā)的中國版“ChatGPT”之路。