英偉達(dá)們之外,中國(guó)式半導(dǎo)體創(chuàng)新該如何發(fā)力?

作者/ IT時(shí)報(bào)記者 范昕茹
編輯/ 王昕 孫妍
今年世界人工智能大會(huì)(WAIC 2023),大模型成為最耀眼的存在。在經(jīng)歷了半年多的準(zhǔn)備期之后,國(guó)產(chǎn)大模型在WAIC上全面爆發(fā),堪稱“百模大戰(zhàn)”。正所謂“巧婦難為無(wú)米之炊”,“百模大戰(zhàn)”背后的國(guó)產(chǎn)芯片挑戰(zhàn)也隨之戰(zhàn)略升級(jí)。
7月6日,“從‘端’到‘云’,勇攀‘芯’高峰”主題芯片論壇在上海張江科學(xué)會(huì)堂舉行。面對(duì)大模型的狂飆,來(lái)自半導(dǎo)體業(yè)內(nèi)的專家和企業(yè)家仍然牢牢將目光聚焦于國(guó)產(chǎn)芯片產(chǎn)業(yè)鏈對(duì)國(guó)外廠商產(chǎn)品的替代話題。
01 新架構(gòu)+開(kāi)源破題“第二解”
AI的發(fā)展,讓行業(yè)見(jiàn)證了英偉達(dá)一次次創(chuàng)造歷史。
2020年7月9日,英偉達(dá)市值首次超越曾經(jīng)的半導(dǎo)體霸主英特爾。僅僅兩年之后,2022年下半年,ChatGPT的出現(xiàn),將英偉達(dá)的市值一路推高,直至超越萬(wàn)億美元,將其他所有芯片公司遠(yuǎn)遠(yuǎn)甩在了身后。
“一家芯片公司超越萬(wàn)億美元市值,這是半導(dǎo)體行業(yè)的里程碑。”燧原科技創(chuàng)始人、董事長(zhǎng)兼CEO趙立東說(shuō)。

英偉達(dá)成功的背后,既是算力需求瘋狂暴漲的托舉,也是英偉達(dá)押注GPU芯片賽道的一次勝利。多家機(jī)構(gòu)預(yù)測(cè),至2030年,全球半導(dǎo)體市場(chǎng)規(guī)模將超萬(wàn)億美元。
大模型背后龐大的算力市場(chǎng)讓不少企業(yè)將目光瞄準(zhǔn)GPU芯片。去年,多家國(guó)內(nèi)廠商涌入GPU芯片賽道。然而,隨著地緣政治因素的日益復(fù)雜,大模型蜂擁而至?xí)r,算力供不應(yīng)求,在這樣的節(jié)點(diǎn),英偉達(dá)是否仍是那個(gè)繞不過(guò)的答案?
“行業(yè)需要第二解。”在趙立東看來(lái),盡管第一波大模型的訓(xùn)練基本都依賴英偉達(dá)芯片,但市場(chǎng)對(duì)AI芯片的需求是高性能、高帶寬、高存儲(chǔ)、高通用性、高效分布式計(jì)算和集群互聯(lián)。趙立東解釋:“這已經(jīng)不是一個(gè)單芯片了,它實(shí)際上是在講系統(tǒng)集群的概念,在講分布式計(jì)算?!?strong>要解決這個(gè)問(wèn)題,必須在架構(gòu)、能耗和集群上突破。
盡管在大多數(shù)人的設(shè)想中,未來(lái)算力應(yīng)該如水電一般,人人都可取用自如,但想要實(shí)現(xiàn)上述場(chǎng)景的重要前提之一就是算力普惠——“普”意味著需要時(shí)可以獲取,“惠”則保證算力使用者負(fù)擔(dān)得起。趙立東坦言,如今算力既不普,也不惠。當(dāng)前算力領(lǐng)域存在用能耗換算力的現(xiàn)狀,市場(chǎng)缺乏多樣性導(dǎo)致運(yùn)算費(fèi)用昂貴,急需第二方案。
“如何實(shí)現(xiàn)算力普惠?燧原科技給出的答案是要以創(chuàng)新的架構(gòu)加開(kāi)源的生態(tài)。”趙立東解釋說(shuō),創(chuàng)新的架構(gòu)、開(kāi)源的生態(tài)可以促進(jìn)市場(chǎng)化競(jìng)爭(zhēng)和技術(shù)創(chuàng)新,以滿足市場(chǎng)的性價(jià)比、能效比等需求。
創(chuàng)新的架構(gòu)加開(kāi)源的生態(tài)還意味著可以用非GPU芯片來(lái)做AI加速?!盁o(wú)論你把它的名字叫做DSA,還是NPU,大家都對(duì)其通用性有質(zhì)疑,”趙立東說(shuō),“我覺(jué)得這是市場(chǎng)的誤解?!痹谒磥?lái),創(chuàng)新架構(gòu)、開(kāi)源生態(tài)的產(chǎn)品同樣具備通用性和易用性,能夠加速產(chǎn)業(yè)和各種應(yīng)用的落地,促進(jìn)產(chǎn)業(yè)發(fā)展,幫助標(biāo)準(zhǔn)形成,并構(gòu)建軟硬件生態(tài)的閉環(huán)。
02 未來(lái)60年將是集成系統(tǒng)的時(shí)代
盡管大模型的狂飆突進(jìn)、算力需求的激增給全球芯片產(chǎn)業(yè)極大地注入了活力,但芯片制造業(yè)仍然面對(duì)著摩爾定律衰退的難題。
在半導(dǎo)體產(chǎn)業(yè)近60年的發(fā)展歷程中,摩爾定律作為經(jīng)典范式,見(jiàn)證了行業(yè)的輝煌。然而近年來(lái),摩爾定律衰退也是事實(shí)。盡管關(guān)于摩爾定律是生是死仍未有定論。但在英特爾和英偉達(dá)的爭(zhēng)論背后,對(duì)應(yīng)了行業(yè)的兩種不同選擇:“延續(xù)摩爾定律法”或“繞道摩爾定律法”。
在中國(guó)科學(xué)院院士、深圳大學(xué)校長(zhǎng)毛軍發(fā)看來(lái),集成系統(tǒng)將是繞道摩爾定律的重要路徑之一。“如果說(shuō)過(guò)去60年是集成電路IC時(shí)代的話,”他說(shuō),“未來(lái)60年很可能就是集成系統(tǒng)IS的時(shí)代。”

所謂集成系統(tǒng),是從系統(tǒng)角度進(jìn)行一體化設(shè)計(jì)制作,將各種芯片、傳感器、元器件、天線、互連線等制作集成在一個(gè)基板上,形成具有預(yù)期功能的系統(tǒng)。相比于傳統(tǒng)的集成電路,所有芯片和元器件在結(jié)構(gòu)上組成一個(gè)整體,可以使系統(tǒng)高密度、小型化、強(qiáng)功能、低功耗、低成本、高可靠、易設(shè)計(jì)、易制作。當(dāng)前產(chǎn)業(yè)熟知的小芯片、無(wú)源元件、封裝天線和異質(zhì)異構(gòu)集成技術(shù)等都是集成系統(tǒng)的體現(xiàn)和雛形。
國(guó)際范圍內(nèi),各國(guó)產(chǎn)業(yè)界都對(duì)異質(zhì)異構(gòu)集成非常重視,美國(guó)、日本、新加坡、歐洲等都有相關(guān)的計(jì)劃,如聯(lián)合微電子計(jì)劃、電子復(fù)興計(jì)劃等。毛軍發(fā)說(shuō):“美國(guó)希望通過(guò)異質(zhì)異構(gòu)集成使得系統(tǒng)的能力再提高100倍,重量、體積、功耗下降到目前的1%,這相當(dāng)于摩爾定律還在往前走,效果是一樣的,只不過(guò)路徑不一樣?!?/p>
盡管集成系統(tǒng)需要跨尺度、跨材料、跨工藝、跨維度、跨物理進(jìn)行集成,難度較大,但對(duì)我國(guó)芯片產(chǎn)業(yè)而言,集成系統(tǒng)路徑本身就十分重要。由于集成系統(tǒng)是從系統(tǒng)層面進(jìn)行頂層規(guī)劃、協(xié)同設(shè)計(jì)、融合制造、一體化集成,它站得高、看得遠(yuǎn),可以使芯片制造效率大大提高,弱化芯片單體的作用。另一方面,用相同的工藝實(shí)現(xiàn)更高的性能,也可以弱化EUV光刻機(jī)等半導(dǎo)體設(shè)備對(duì)我國(guó)產(chǎn)業(yè)的限制。
“系統(tǒng)集成的思路不僅可以進(jìn)一步提高系統(tǒng)的設(shè)計(jì)效率和綜合性能,減少成本,增加其可靠性,更重要的是,它還能夠降低對(duì)芯片設(shè)計(jì)及設(shè)備的要求,”毛軍發(fā)說(shuō),“這對(duì)我國(guó),對(duì)上海而言,都是一個(gè)彎道超車的機(jī)會(huì)?!?/strong>
03 大模型算力的下一場(chǎng)從云到端
除了芯片設(shè)計(jì)、制造側(cè)的變革,在應(yīng)用端,隨著行業(yè)數(shù)字化轉(zhuǎn)型,大模型正逐漸從云上走向端側(cè)。
在今年世界移動(dòng)通信大會(huì)MWC上,高通在手機(jī)端實(shí)現(xiàn)了超10億參數(shù)大模型的推理演示,展示了大模型在端側(cè)的應(yīng)用,而在智能汽車、智能手表等終端上,越來(lái)越多的人工智能大模型開(kāi)始發(fā)揮更顯著的效用。
在高通全球副總裁兼高通AI研究負(fù)責(zé)人侯紀(jì)磊看來(lái),端側(cè)的人工智能正在變得越來(lái)越重要,這是因?yàn)槎藗?cè)AI有其明顯優(yōu)勢(shì)。侯紀(jì)磊解釋,相比在云端部署大模型和生成式AI應(yīng)用,端側(cè)具有更強(qiáng)的隱私性,也更利于成本攤平,有利于算力普惠的推進(jìn)。而在個(gè)性化方面,端側(cè)大模型的部署更有利于AI結(jié)合用戶個(gè)人特質(zhì),進(jìn)行個(gè)性化的微調(diào),能加速個(gè)人助理類應(yīng)用在端側(cè)的落地。

盡管敏捷連接、隱私保護(hù)方面的訴求推動(dòng)了人工智能的發(fā)展,但在英特爾(中國(guó))網(wǎng)絡(luò)與邊緣事業(yè)部CTO、英特爾高級(jí)首席AI工程師張宇看來(lái),邊緣人工智能目前絕大部分的應(yīng)用還處于邊緣推理階段。也就是說(shuō),在云端完成人工智能的訓(xùn)練,再將人工智能推送到端側(cè)去執(zhí)行推理,這是目前絕大部分邊緣端人工智能的使用模式。

從實(shí)際的市場(chǎng)需求來(lái)看,端側(cè)對(duì)大模型及人工智能相關(guān)應(yīng)用的要求顯然更高。張宇舉例,在自動(dòng)駕駛領(lǐng)域,一個(gè)好的自動(dòng)駕駛系統(tǒng)需要適應(yīng)復(fù)雜路況,并針對(duì)不同駕駛員的駕駛行為進(jìn)行調(diào)整,這就需要將人工智能訓(xùn)練集成到端側(cè),在不斷訓(xùn)練中自我優(yōu)化。
“因此人工智能發(fā)展的第二個(gè)階段應(yīng)該是邊緣訓(xùn)練階段?!辈贿^(guò),張宇并不認(rèn)為邊緣訓(xùn)練可以照搬數(shù)據(jù)中心的訓(xùn)練方式。由于端側(cè)往往沒(méi)有專門的標(biāo)注和訓(xùn)練人員,因而如果要實(shí)現(xiàn)邊緣訓(xùn)練,就需要有更加自動(dòng)化的手段和工具去完成從數(shù)據(jù)標(biāo)注到模型訓(xùn)練,再到模型部署這一整套開(kāi)發(fā)流程。這就要求企業(yè)在軟硬件各方面進(jìn)行全棧的創(chuàng)新和優(yōu)化。
“應(yīng)該說(shuō)推動(dòng)本輪人工智能發(fā)展最核心的要素,實(shí)際上是計(jì)算、通訊和存儲(chǔ)技術(shù)的不斷提升?!痹趶堄羁磥?lái),邊緣人工智能下一步的發(fā)展方向應(yīng)該是自主學(xué)習(xí)。到那時(shí),人工智能應(yīng)該能夠感知人的意圖,并根據(jù)人的意圖自主選擇合適的模型進(jìn)行訓(xùn)練,再把訓(xùn)練結(jié)果自主推送到前端去執(zhí)行相應(yīng)的推理操作,完成一整套自主化學(xué)習(xí)的成熟流程。
排版/ 季嘉穎
圖片/ WAIC
來(lái)源/《IT時(shí)報(bào)》公眾號(hào)vittimes