《科技觀察》085:新華三:算力網(wǎng)絡(luò)未來(lái)演進(jìn)之路,分布式算網(wǎng)大腦是關(guān)鍵
毫無(wú)疑問(wèn),今天以云計(jì)算為標(biāo)志的“普惠”算力已經(jīng)得到了非常廣泛的普及,如今的云計(jì)算更像是一個(gè)底座,無(wú)論是大數(shù)據(jù)、IoT、區(qū)塊鏈、AI,所有的新興技術(shù)都能夠融入云的底座,并基于云服務(wù)的形態(tài)提供任何一種技術(shù)服務(wù),而在應(yīng)用端則是“萬(wàn)物皆云”,無(wú)論是智慧城市、智慧醫(yī)療、智慧教育、智慧交通,所有服務(wù)于社會(huì)民生和企業(yè)的能力都能夠通過(guò)云來(lái)傳遞,這也推動(dòng)了整個(gè)社會(huì)對(duì)算力基礎(chǔ)設(shè)施更大的需求。
也正因此,國(guó)家高度重視算力產(chǎn)業(yè)的發(fā)展,為加速推進(jìn)算力布局,國(guó)家近期也發(fā)布了多項(xiàng)與算力有關(guān)的國(guó)家政策,特別是“東數(shù)西算”工程的啟動(dòng),作為一個(gè)覆蓋全國(guó)主要經(jīng)濟(jì)區(qū)域、橫跨東西部資源和應(yīng)用的算力網(wǎng)絡(luò)樞紐,“東數(shù)西算”不僅會(huì)帶來(lái)數(shù)據(jù)、算力跨域流動(dòng),同時(shí)也成為了實(shí)現(xiàn)產(chǎn)業(yè)躍升、平衡區(qū)域發(fā)展的重要基礎(chǔ)基礎(chǔ)設(shè)施,可以說(shuō)加快推進(jìn)算力網(wǎng)絡(luò)建設(shè),已成為全行業(yè)乃至全社會(huì)的共識(shí)。
但也要看到,目前算力網(wǎng)絡(luò)的發(fā)展仍面臨資源分布不均、算力利用效率較低、算力缺乏有效調(diào)度等挑戰(zhàn),而化解這些挑戰(zhàn),對(duì)推動(dòng)算力網(wǎng)絡(luò)的建設(shè),賦能企業(yè)和產(chǎn)業(yè)打造新服務(wù)、新模式和新業(yè)態(tài),無(wú)疑具有重要的戰(zhàn)略意義。

在此背景下,在日前舉辦的2022中國(guó)算力大會(huì)上,新華三集團(tuán)網(wǎng)絡(luò)產(chǎn)品線(xiàn)規(guī)劃與解決方案部總經(jīng)理汲哲指出:“建立各方認(rèn)可的統(tǒng)一算力評(píng)估標(biāo)準(zhǔn)平衡成本、效率和體驗(yàn),構(gòu)建分層分域管理的算網(wǎng)架構(gòu),實(shí)現(xiàn)客戶(hù)體驗(yàn)和社會(huì)總體效益的平衡,是未來(lái)高效調(diào)度管理算力的關(guān)鍵所在?!?/strong>
作為算力網(wǎng)絡(luò)發(fā)展的積極參與者和賦能者,新華三對(duì)算力評(píng)估體系和算力調(diào)度方法的全新思考與探索,對(duì)算力網(wǎng)絡(luò)未來(lái)的建設(shè)和演進(jìn)之路,乃至推動(dòng)算網(wǎng)融合在更廣范圍、更深程度、更高水平上融合創(chuàng)新無(wú)疑會(huì)起到更多的助推作用,而這背后也體現(xiàn)了新華三在“東數(shù)西算”工程和算力網(wǎng)絡(luò)建設(shè)中,不僅是具有前瞻性的,更是具有全局觀的,其價(jià)值可謂“不止于現(xiàn)在,更關(guān)乎未來(lái)”。
算力網(wǎng)絡(luò)建設(shè)的四重挑戰(zhàn)
可以看到,盡管我國(guó)算力基礎(chǔ)設(shè)施不斷發(fā)展完善,但是算力水平依然很難滿(mǎn)足數(shù)據(jù)量猛增帶來(lái)的巨大算力需求。此外,AI大模型的開(kāi)發(fā)需要強(qiáng)大的算力支撐,AI技術(shù)為企業(yè)生產(chǎn)提供切實(shí)可用的價(jià)值更需要算力支撐。因此無(wú)論是數(shù)據(jù)中心還是人工智能計(jì)算中心,均無(wú)法滿(mǎn)足全社會(huì)對(duì)算力的需求,因此通過(guò)算力網(wǎng)絡(luò)實(shí)現(xiàn)網(wǎng)絡(luò)互連、資源共享、協(xié)同調(diào)度將是大勢(shì)所趨。
對(duì)此,汲哲表示,算力網(wǎng)絡(luò)建設(shè)并不是“一蹴而就”的,特別是目前算力網(wǎng)絡(luò)仍然處在一個(gè)早期的階段,這也導(dǎo)致了其在未來(lái)的建設(shè)過(guò)程中會(huì)面臨著四個(gè)方面的挑戰(zhàn)。

一是,從共享角度看,國(guó)家實(shí)施“東數(shù)西算”工程,構(gòu)建全國(guó)算力網(wǎng)絡(luò)體系,本質(zhì)上就是希望提高跨區(qū)域的算力調(diào)度水平,因此就算算力網(wǎng)絡(luò)的規(guī)模再小,其依然還是跨區(qū)域的,這就會(huì)涉及到一個(gè)如何解決“共享性”的問(wèn)題。換句話(huà)說(shuō),未來(lái)唯有把長(zhǎng)三角、粵港澳大灣區(qū)、京津冀、成渝經(jīng)濟(jì)圈等區(qū)域的算力網(wǎng)絡(luò)實(shí)現(xiàn)互聯(lián)互通,由此構(gòu)建出一個(gè)能夠共享的、全國(guó)性的泛在算力網(wǎng)絡(luò),將是算力網(wǎng)絡(luò)建設(shè)中的核心目標(biāo)。
二是,從均衡角度看,由于歷史原因,我國(guó)數(shù)據(jù)中心的分布是存在一定程度的“失衡”現(xiàn)象的,具體表現(xiàn)在目前一線(xiàn)城市由于受到能耗指標(biāo)、土地、電力等資源的限制,整體的算力需求處于“供不應(yīng)求”的狀態(tài),但同時(shí)中西部的算力供給卻處于“供大于求”的狀態(tài),而從全國(guó)的均衡性考慮,這就需要國(guó)家層面去統(tǒng)一調(diào)配,但必須承認(rèn)的是,這種跨區(qū)域的算力調(diào)度水平本身就存在很大的難點(diǎn)。
三是,從安全角度看,無(wú)論是“東數(shù)西算”還是還是算力網(wǎng)絡(luò)建設(shè),其核心其實(shí)也是為了解決“數(shù)據(jù)”的跨區(qū)域的存儲(chǔ)和流通問(wèn)題,但在此過(guò)程中,算力網(wǎng)絡(luò)也將產(chǎn)生更多的資產(chǎn)暴露面和更高的連接頻次,遭受攻擊的概率也將大幅增加。如果將算力網(wǎng)絡(luò)比作木桶,那安全就是其底座,沒(méi)有底座就無(wú)法蓄水。因此,筑牢算力網(wǎng)絡(luò)的網(wǎng)絡(luò)安全體系同樣也“刻不容緩”。
四是,從低碳角度看,隨著全球和中國(guó)推進(jìn)“雙碳”戰(zhàn)略,如何降低數(shù)據(jù)中心能耗水平也正變得越來(lái)越急迫。以中國(guó)市場(chǎng)為例,預(yù)計(jì)2023年數(shù)據(jù)中心能耗將達(dá)到2600億千瓦時(shí),到2030年數(shù)據(jù)中心用電量將突破4000億千瓦時(shí),占全社會(huì)用電量的比重將升至3.7%。更為關(guān)鍵的是,目前數(shù)據(jù)中心的整體PUE值依然偏高,平均的PUE值為2.46,遠(yuǎn)遠(yuǎn)達(dá)不到國(guó)家規(guī)定的PUE值1.4以下的指標(biāo),因此進(jìn)一步降低數(shù)據(jù)中心能耗水平也就變得至關(guān)重要。
由此可見(jiàn),在未來(lái)算力網(wǎng)絡(luò)的建設(shè)中,如何實(shí)現(xiàn)“共享、均衡、安全和低碳”,如何更好地平衡成本、效率和體驗(yàn)、如何高效地調(diào)度、連通橫跨上千公里的算力基礎(chǔ)設(shè)施,構(gòu)建觸手可及的泛在算力網(wǎng)絡(luò),不僅是趨勢(shì)所在,更是迫在眉睫。
構(gòu)建算力評(píng)估體系是前提
我們知道,在算力網(wǎng)絡(luò)的建設(shè)中,算網(wǎng)融合無(wú)疑也是大勢(shì)所趨,因此算網(wǎng)融合不僅需要利用網(wǎng)絡(luò)實(shí)現(xiàn)多種算力的多層次互聯(lián),同時(shí)還需要實(shí)現(xiàn)算力資源的感知、調(diào)度,并根據(jù)用戶(hù)需求靈活供給。但與此同時(shí),由于整個(gè)算網(wǎng)融合的產(chǎn)業(yè)規(guī)模龐大且鏈條復(fù)雜交錯(cuò),加之算力網(wǎng)絡(luò)的建設(shè)剛剛起步,缺少標(biāo)準(zhǔn)體系的頂層設(shè)計(jì),因此未來(lái)如何打破算力信息互通和實(shí)現(xiàn)智能化調(diào)度,以及盡快構(gòu)建出算力網(wǎng)絡(luò)評(píng)價(jià)標(biāo)準(zhǔn)也就變得十分的重要。

在汲哲看來(lái),未來(lái)算力網(wǎng)絡(luò)要為百行百業(yè)的用戶(hù)提供算網(wǎng)一體化的體驗(yàn),那么大致上會(huì)經(jīng)歷以下的流程:即當(dāng)用戶(hù)向算力網(wǎng)絡(luò)運(yùn)營(yíng)方購(gòu)買(mǎi)算力服務(wù)時(shí),如一次視頻渲染服務(wù),用戶(hù)就需要先在運(yùn)營(yíng)商提供算力網(wǎng)絡(luò)商城中,選擇滿(mǎn)足用戶(hù)要求的服務(wù)或者APP,之后算網(wǎng)大腦會(huì)根據(jù)SaaS廠(chǎng)商提供的資源需求計(jì)算出這次業(yè)務(wù)需要的云計(jì)算資源,并且在云計(jì)算資源池中找到符合要求的節(jié)點(diǎn),之后會(huì)開(kāi)通應(yīng)用運(yùn)行環(huán)境,并安裝SaaS廠(chǎng)商提供的鏡像,完成之后,算網(wǎng)大腦還會(huì)計(jì)算到這個(gè)節(jié)點(diǎn)的最優(yōu)路徑,并下發(fā)到云專(zhuān)網(wǎng)中,并為客戶(hù)業(yè)務(wù)提供端到端的應(yīng)用加速、安全加固等功能。而在這一過(guò)程中,算網(wǎng)大腦就需要一個(gè)統(tǒng)一的算力評(píng)估體系,使不同參與方能夠協(xié)同工作。
“未來(lái)算力網(wǎng)絡(luò)提供的是一個(gè)泛在的算力,既包括傳統(tǒng)的算力,也包括網(wǎng)絡(luò)的能力,而算力最難的部分在于如何實(shí)現(xiàn)度量,背后的原因是由于算力網(wǎng)絡(luò)運(yùn)營(yíng)方可能會(huì)基于不同的處理器或者虛擬化軟件來(lái)對(duì)算力實(shí)現(xiàn)管理,這就可能到會(huì)導(dǎo)致對(duì)外提供的算力不一樣,因此沒(méi)有統(tǒng)一的算力度量衡,就沒(méi)辦法進(jìn)行交易。”汲哲說(shuō)。
為此,新華三基于前期與算力網(wǎng)絡(luò)運(yùn)營(yíng)方合作中的一些具體實(shí)踐以及深度的思考總結(jié),提出了算力評(píng)估體系中應(yīng)該重點(diǎn)關(guān)注的三大方向。
首先,是需要分階段構(gòu)建算力評(píng)估標(biāo)準(zhǔn)體系。算力評(píng)估體系應(yīng)分階段推進(jìn):第一階段基于用戶(hù)算力需求,綜合考慮算力因子、網(wǎng)絡(luò)因子以及成本因素,得出綜合評(píng)估結(jié)果;第二階段,算力評(píng)估需引入軟件服務(wù),建立統(tǒng)一的服務(wù)鏡像倉(cāng)庫(kù)和服務(wù)目錄,為客戶(hù)提供算力服務(wù)。
其次,算力評(píng)估既需關(guān)注功能,也要考慮服務(wù)的統(tǒng)一。例如,在關(guān)注基本功能實(shí)現(xiàn)的同時(shí),也需考慮安全、容災(zāi)備份等服務(wù)指標(biāo),建立統(tǒng)一的標(biāo)準(zhǔn);更為關(guān)鍵的是,算力評(píng)估中的重點(diǎn)應(yīng)聚焦應(yīng)用化、場(chǎng)景化,基于業(yè)務(wù)場(chǎng)景確定不同評(píng)估模型,滿(mǎn)足場(chǎng)景適配要求;同時(shí),還要將整網(wǎng)均衡情況、總體社會(huì)效益目標(biāo)納入算法,實(shí)現(xiàn)整網(wǎng)資源利用的最大化。
最后,統(tǒng)一標(biāo)準(zhǔn)后方能聚合生態(tài)合力。建立起統(tǒng)一的算力評(píng)估標(biāo)準(zhǔn)體系,才能強(qiáng)化產(chǎn)業(yè)鏈各方整體協(xié)同,形成算力網(wǎng)絡(luò)強(qiáng)大的生態(tài)合力,為百行百業(yè)提供易用易獲得,屏蔽廠(chǎng)商和地域差異的泛在算力服務(wù)。
客觀地說(shuō),算網(wǎng)融合的終點(diǎn),是希望算力能夠像日常使用中的“水和電”那樣,讓全行業(yè)和全社會(huì)都能更加便捷地獲取,但算力并不像水和電那樣是“有型”的,作為一個(gè)“無(wú)形”的數(shù)字化能力,算力網(wǎng)絡(luò)的建設(shè)無(wú)疑需要通過(guò)統(tǒng)一的算力評(píng)估體系,按照統(tǒng)一的路線(xiàn)實(shí)現(xiàn)融合創(chuàng)新,這樣才能夠進(jìn)一步加快推進(jìn)算網(wǎng)融合,為中國(guó)數(shù)字經(jīng)濟(jì)的高質(zhì)量發(fā)展奠定基礎(chǔ)。
而新華三前瞻性地提出的統(tǒng)一算力評(píng)估體系,可以說(shuō)對(duì)推動(dòng)算力網(wǎng)絡(luò)的建設(shè)有著十分重要的價(jià)值:一方面,通過(guò)建立統(tǒng)一的算力網(wǎng)絡(luò)評(píng)估標(biāo)準(zhǔn)體系,能夠使得算力網(wǎng)絡(luò)的所有參與者和運(yùn)營(yíng)者達(dá)成共識(shí),為算力網(wǎng)絡(luò)的建設(shè)提供了寶貴的參考依據(jù);另一方面,新華三提出的算力評(píng)估標(biāo)準(zhǔn)體系既是分層次,也是多維度的。如充分考慮到用戶(hù)對(duì)于功能和服務(wù)的關(guān)注,也考慮到了算力評(píng)估體系的應(yīng)用化、場(chǎng)景化、生態(tài)化的需求,是真正站在客戶(hù)需求視角的評(píng)估體系,這種方式既兼顧了統(tǒng)一性,也實(shí)現(xiàn)了“因地制宜”,相信能夠讓評(píng)估標(biāo)準(zhǔn)和結(jié)果更符合算力網(wǎng)絡(luò)建設(shè)的需求。
分層分域管理算網(wǎng)是關(guān)鍵
事實(shí)上,算力網(wǎng)絡(luò)建設(shè)中的難點(diǎn)還不于此,在統(tǒng)一算力評(píng)估標(biāo)準(zhǔn)體系之外,算力網(wǎng)絡(luò)中跨域管理,以及智能調(diào)度問(wèn)題同樣也十分的重要。汲哲認(rèn)為:“東數(shù)西算作為中國(guó)前所未有的算網(wǎng)融合工程,東西橫跨上千公里,且將接入全國(guó)各地的算力節(jié)點(diǎn),這也對(duì)背后的管理框架提出了全新的挑戰(zhàn)?!?/p>
“首當(dāng)其沖就是各地建設(shè)周期不同步,如此大的工程,不可能一夜之間完成,因此算網(wǎng)架構(gòu)必須考慮可逐步迭代、分級(jí)分區(qū)域演進(jìn);同時(shí),如此龐大的算網(wǎng)融合,對(duì)算力調(diào)度的計(jì)算和維護(hù)也是天量的,必須將計(jì)算和管理工作分層分解;此外,不同地區(qū)的云專(zhuān)網(wǎng)由不同廠(chǎng)商的設(shè)備組成,廠(chǎng)商之間接口不兼容,對(duì)算網(wǎng)統(tǒng)一調(diào)度的需求,必然需要投入大量工作完成不同廠(chǎng)商之間的對(duì)接測(cè)試,需要兼顧不同廠(chǎng)商的設(shè)備能力,提供一種對(duì)設(shè)備要求較低的互通方案等等。”他說(shuō)。
基于此,新華三也設(shè)計(jì)了分層算網(wǎng)大腦架構(gòu),通過(guò)系統(tǒng)分解、局部?jī)?yōu)化等方式,實(shí)現(xiàn)具備算力統(tǒng)籌和智能調(diào)度能力的算力網(wǎng)絡(luò),具體來(lái)看:
第一,專(zhuān)網(wǎng)構(gòu)建跨區(qū)域分布式算網(wǎng)大腦。分層算網(wǎng)大腦架構(gòu)通過(guò)在省內(nèi)部署區(qū)域中心算網(wǎng)大腦,實(shí)現(xiàn)區(qū)域的集中控制、本地優(yōu)先。同時(shí),在集團(tuán)總部部署總部中心算網(wǎng)大腦,分布式控制調(diào)配全網(wǎng)算力資源,降低綜合算力成本。各省與總部中心的算網(wǎng)大腦通過(guò)專(zhuān)用網(wǎng)絡(luò)實(shí)現(xiàn)算力協(xié)同,共同構(gòu)成覆蓋全國(guó)的超級(jí)分布式算網(wǎng)大腦。
第二,算力資源和算力管理要“雙管齊下”。全國(guó)范圍集中管控算力資源帶來(lái)巨大的計(jì)算量和消息通信,使得算力資源的集中評(píng)估至關(guān)重要,從算力資源和管理方面著手才是解決之道;在算力資源上,跨省資源建議只選擇“東數(shù)西算”樞紐資源,社會(huì)泛在算力資源僅在省內(nèi)調(diào)度,確??缡≌{(diào)度效益最大化;在管理方面,將路徑計(jì)算分成用戶(hù)所在省、全國(guó)骨干網(wǎng)、云資源所在省三段,算力評(píng)估時(shí)各自計(jì)算路徑,使計(jì)算分布式,提高效率、優(yōu)化管理流程。
第三,復(fù)用現(xiàn)有網(wǎng)絡(luò)協(xié)議為算網(wǎng)建設(shè)“降本增速”。不同廠(chǎng)商的網(wǎng)絡(luò)設(shè)備之間實(shí)現(xiàn)互通才能更好支持算力網(wǎng)絡(luò)需求。因此,新華三提出,應(yīng)盡可能復(fù)用現(xiàn)有的通用網(wǎng)絡(luò)協(xié)議,降低對(duì)路由器軟件的依賴(lài)和路由器本身性能要求,最小化地減少對(duì)路由器的改造,充分利舊,以便于在降低運(yùn)維成本同時(shí),加快算力網(wǎng)絡(luò)落地進(jìn)度。
據(jù)介紹,目前新華三也正以分布式算網(wǎng)大腦為核心,秉承“融合創(chuàng)新”的技術(shù)戰(zhàn)略,為運(yùn)營(yíng)商和政企客戶(hù)提供泛在的算網(wǎng)一體化服務(wù)。所謂“融合”指的是算網(wǎng)智用一體化,從而讓算力和智能實(shí)現(xiàn)無(wú)處不在;而“創(chuàng)新”指的是算力度量、分級(jí)分布式算網(wǎng)大腦架構(gòu)等技術(shù)創(chuàng)新,既適用于本地化區(qū)域中心控制運(yùn)維,也支持“東數(shù)西算”的宏觀調(diào)度。

展望未來(lái),汲哲最后也表示,相信算力網(wǎng)絡(luò)今后經(jīng)過(guò)三個(gè)階段的建設(shè),一定會(huì)成為推動(dòng)中國(guó)數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展的“新引擎”。其中,在起步階段,核心理念是“協(xié)同”,盡管目前算和網(wǎng)依然是兩個(gè)獨(dú)立的個(gè)體,各自編排調(diào)度,但算網(wǎng)開(kāi)始向布局協(xié)同、運(yùn)營(yíng)協(xié)同發(fā)展,通過(guò)協(xié)同算網(wǎng)服務(wù)入口,實(shí)現(xiàn)資源互調(diào),滿(mǎn)足用戶(hù)一站開(kāi)通需求;在發(fā)展階段,核心理念是“融合”,未來(lái)算與網(wǎng)逐步融合發(fā)展,但還是兩個(gè)身體,負(fù)責(zé)管理編排的“大腦”開(kāi)始融合統(tǒng)一,實(shí)現(xiàn)在算網(wǎng)資源層面的統(tǒng)一管理、編排和調(diào)度;在跨越階段,核心理念是“一體”,到時(shí)候算網(wǎng)的邊界將會(huì)被徹底打破,形成算網(wǎng)一體化基礎(chǔ)設(shè)施,為用戶(hù)提供融合多技術(shù)要素的一體化服務(wù)。而在此過(guò)程中,新華三愿意與運(yùn)營(yíng)商、云服務(wù)商、設(shè)備廠(chǎng)商一起,通過(guò)開(kāi)放合作、聯(lián)合創(chuàng)新,攜手共同推進(jìn)“東數(shù)西算”戰(zhàn)略的加速落地。
全文總結(jié),隨著“東數(shù)西算”工程大規(guī)模的建設(shè),未來(lái)算力網(wǎng)絡(luò)將會(huì)成為成為中國(guó)數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展的“底座”與支撐,而新華三提出的統(tǒng)一算力評(píng)估標(biāo)準(zhǔn)體系,以及分層分域管理算網(wǎng)的新理念和新方法,無(wú)疑將會(huì)在今后算力網(wǎng)絡(luò)的建設(shè)中貢獻(xiàn)出更高的價(jià)值,真正讓算力網(wǎng)絡(luò)為百行百業(yè)的數(shù)智化轉(zhuǎn)型升級(jí)提供新動(dòng)能,并驅(qū)動(dòng)和引領(lǐng)中國(guó)數(shù)字經(jīng)濟(jì)走向更為廣闊的新未來(lái)。