HPC走出全新路線:《開放架構HPC技術與生態(tài)白皮書》注解

文|智能相對論
作者|葉遠風
數(shù)字經(jīng)濟大時代,創(chuàng)新驅(qū)動大環(huán)境,HPC已不再是陽春白雪,而受到越來越多人的關注。
HPC,即High Performance Computing,高性能計算。對普通人來說,沒有聽過HPC,但肯定都聽過超級計算機,它就是HPC的主要實現(xiàn)方式之一。
對越來越需要高復雜度計算的學界與產(chǎn)業(yè)界來說,HPC的重要性不言而喻。
最近,2022 CCF全國高性能計算學術年會(CCF HPC China 2022)在線上舉辦,吸引了國內(nèi)外學界、產(chǎn)業(yè)界眾多專家、從業(yè)者參會。
CCF HPC China是HPC領域全球最有影響力的三大超算盛會,另外兩家分別是德國的ISC超算盛會、美國的SC超算盛會。
最前沿的學術成果匯聚與交流,為HPC的發(fā)展再添了一把火。
這次會上,《開放架構 HPC 技術與生態(tài)白皮書》(以下簡稱“白皮書”)發(fā)布,有關全球HPC最新發(fā)展狀況與發(fā)展動向被闡明。
值得注意的是,ARM指令集兼容架構登上HPC舞臺,展示出“皇冠上的明珠”般璀璨的光芒。
ARM指令集兼容的HPC進入全球大發(fā)展時代
從時間上看,HPC并不是新的字眼,畢竟超級計算機的發(fā)展已經(jīng)有數(shù)十年了。但HPC始終保持著旺盛的活力。
如今的HPC,在算力上已經(jīng)進入了E級時代。
這個時代與過去有著顯著的不同:
ARM 指令集兼容的架構成為HPC的主要路線之一,用于支撐起E級算力的要求。
HPC的計算芯片也從過去十幾年基于一種或幾種完全封閉的指令集,走向由不同廠家生產(chǎn)、但指令集能夠兼容的產(chǎn)品所構成。
“ARM”成為一種共同遵循的標準,而不具體指代某個下場參與HPC的產(chǎn)品。
HPC的參與者變得更加自主,HPC的實現(xiàn)方式也能夠創(chuàng)新頻出。
于是,指令集兼容、差異化實現(xiàn)、可自由演進,這種架構也就是白皮書提到的“開放架構”,能夠百花齊放,不斷適應市場需要。
如同生物界的進化,HPC這種走向“開放架構”的進化,也是“自然選擇”的結果。白皮書提到,廠家、生態(tài)及產(chǎn)業(yè)鏈伙伴持續(xù)多年的戰(zhàn)略定位、技術與投資,造就了ARM指令集兼容HPC的繁榮。

這背后的動因,是ARM 指令集在HPC方面相對傳統(tǒng)架構有明顯的優(yōu)勢。
芯片性能不斷提高且更多核心支持的特點更適合HPC大規(guī)模并行的發(fā)展趨勢,同樣的體積能部署更多的算力,魚和熊掌兼得;
完善的指令集在HPC的特殊工作負載上有優(yōu)勢,且加強了對矢量、矩陣計算等工作的支持;
訪存性能更強,計算足夠優(yōu)秀還不忘與其他配套設施打好配合;
……
當然,專門的安全模塊所帶來的安全性同樣十分重要。
全球主要算力高地,都在將ARM 指令集兼容架構融入到國家高性能計算建設戰(zhàn)略當中:
無論中國的高性能專項,還是日本 FLAGSHIP 2020 計劃,以及歐洲的EuroHPC計劃,都做了基于ARM指令集的超算系統(tǒng)。美國的Venado等超級計算機也宣告ARM指令集兼容成為美國超算建設的一個方向之一。
ARM指令集兼容的HPC,正在高歌猛進。
從技術、生態(tài)到產(chǎn)業(yè)落地,中國HPC再現(xiàn)全產(chǎn)業(yè)鏈優(yōu)勢
短短十年間,憑借全產(chǎn)業(yè)鏈優(yōu)勢,中國在很多前沿技術上由跟隨者變成了探索者。
在ARM指令集兼容的HPC這里,這一優(yōu)勢再度彰顯。
從白皮書來看,無論是技術創(chuàng)新、生態(tài)共建還是產(chǎn)業(yè)落地,中國在HPC的新發(fā)展方向上都表現(xiàn)出全面進發(fā)的態(tài)勢。
有底層的技術發(fā)展驅(qū)動力,有生態(tài)平臺推動枝繁葉茂,有產(chǎn)業(yè)落地讓價值坐實最終反饋到技術與生態(tài),全鏈條形成了一個不斷自增強的發(fā)展循環(huán)。
首先,在技術上,ARM 指令集兼容HPC所需要的多層次內(nèi)容已經(jīng)趨近完善,一個從行業(yè)宏觀視角看的“全?!奔夹g體系在走向成熟。
硬件方面,國內(nèi)基于 ARM 指令集兼容架構的服務器芯片廠商出現(xiàn)了包括華為的鯤鵬、飛騰、阿里平頭哥等在內(nèi)的典型廠商。
系統(tǒng)層,國內(nèi)擁有openEuler開源操作系統(tǒng)、銀河麒麟等操作系統(tǒng),對鯤鵬、飛騰芯片已經(jīng)實現(xiàn)了很好的適配,并在行業(yè)得到了廣泛應用。
編譯層,華為的畢昇編譯器面向鯤鵬處理器進行了深度優(yōu)化,實現(xiàn)了較高的性能,此外,國防科大編譯團隊的“天鷹編譯系統(tǒng)”則專門面向飛騰處理器進行了優(yōu)化。它們在能力上已經(jīng)能夠?qū)嗽趪鴥?nèi)外服務器領域應用廣泛的亞馬遜編譯器、Ampere 編譯器等。
平臺層,國內(nèi)目前代表產(chǎn)品有鯤鵬應用使能套件 Kunpeng BoostKit 和鯤鵬開發(fā)套件 Kunpeng DevKit,前者主要幫助開發(fā)者實現(xiàn)應用的極致性能,讓各種場景的開發(fā)者都能獲得特定的、與硬件性能匹配的增益;后者主要幫助開發(fā)者實現(xiàn)極簡開發(fā),開發(fā)出鯤鵬親和的高性能軟件,加速原生開發(fā)效率。
在最后的應用層,面向電磁仿真、材料計算、分子動力學、生物信息、計算物理、氣候氣象、金融分析等不同領域,不同的行業(yè)應用不斷產(chǎn)生。
例如,在氣候海洋領域,典型開源軟件WRF已經(jīng)在基于飛騰處理器的天河系統(tǒng)、基于鯤鵬處理器的HPC系統(tǒng)上運行,有效幫助氣候預測、規(guī)避氣象災害。
在醫(yī)學影像領域,鯤鵬平臺已適配常用圖像處理軟件,隨著醫(yī)學影像庫的數(shù)據(jù)規(guī)模達到 TB 級,HPC將發(fā)揮重要價值。

其次,在生態(tài)上,越來越多的產(chǎn)業(yè)伙伴在加入屬于中國的ARM指令集兼容HPC陣營當中,這反過來又推動HPC的新趨勢在中國加速落地。
目前華為、飛騰兩家廠商的產(chǎn)品已經(jīng)收獲了越來越多的合作伙伴,為開放架構HPC的廣泛應用做好了準備。
其中,基于鯤鵬芯片的TaiShan系列服務器就推出有專門面向HPC的高性能型,全球已經(jīng)有 10 家整機廠商基于鯤鵬芯片推出自由品牌服務器,應用在制造、交通、交通、金融等不同領域。
飛騰用于商業(yè) HPC 的服務器芯片達到了3款,背靠著企業(yè)本身超4500+生態(tài)伙伴與300余家集成商,在ARM 指令集兼容HPC領域同樣大有可為。
隨著華為將openEuler歐拉貢獻出去,更多的生態(tài)伙伴還在共同推動HPC基礎軟件的完善。
目前為止,面向企業(yè)級的開源操作系統(tǒng)歐拉已經(jīng)構建起擁有全球開發(fā)者積極參與的操作系統(tǒng)開源社區(qū),代碼倉庫逼近1萬,貢獻者超1.2萬,社區(qū)用戶已突破100萬。在這樣的基礎之上,歐拉累計裝機量達到245萬套,在服務器操作系統(tǒng)的新增市場份額不斷提升,為HPC的發(fā)展提供了更優(yōu)的操作系統(tǒng)選擇。
另外,麒麟軟件等數(shù)十家基礎軟硬件企業(yè)、非營利性組織、社團組織、高等院校、科研機構和個人開發(fā)者共同創(chuàng)立了開源社區(qū) OpenKyling,這個社區(qū)也正在推動其 ARM指令集兼容架構上的開放操作系統(tǒng)發(fā)布。
最后,是廣泛的市場讓ARM指令集兼容HPC能夠快速證明自己、產(chǎn)生價值,從而反哺技術與生態(tài),更好地前行。
白皮書顯示,在中國,ARM 指令集兼容架構已在多種類型的頭部客戶獲得深入成熟使用。
在高校,典型如上海交通大學上線了國內(nèi)高校首個基于鯤鵬的校級HPC系統(tǒng),采用雙路鯤鵬處理器作為節(jié)點,為用戶提供18 款常用的高性能計算軟件,覆蓋材料科學、生命科學、大氣科學和流體力學 4 大HPC應用領域,2021年4月開放至今服務了74 個課題組,計算作業(yè)數(shù)量超 100 萬個。
在超算中心方面,國家超級計算濟南中心、天津中心、長沙中心及武漢超算中心等都建設有基于鯤鵬處理的系統(tǒng)。
在制造業(yè),某制造企業(yè)借助華為鯤鵬高性能解決方案擴容 HPC 仿真系統(tǒng),滿足了業(yè)務高速擴展下的研發(fā)效率提升需求,縮短產(chǎn)品開發(fā)周期、提升產(chǎn)品質(zhì)量、降低設計成本。

在運營商賽道,浙江移動的大數(shù)據(jù)平臺充分發(fā)揮ARM 指令集兼容架構的鯤鵬優(yōu)勢,打破了數(shù)據(jù)分析耗時瓶頸,提升了整體性能。
此外,在金融業(yè),飛騰的ARM指令集兼容集群在金融業(yè)得到了廣泛應用,滿足了行業(yè)深刻的去IOE需要。
幾乎在所有需要計算的產(chǎn)業(yè)領域,都在出現(xiàn)ARM指令集兼容HPC的蹤跡,并以其實際價值獲得了廣泛認同。
ARM指令集兼容,讓HPC走出全新路線
ARM指令集兼容,是HPC技術的一次“變調(diào)”。前述所有內(nèi)容,都在表明HPC產(chǎn)業(yè)界在這方面已經(jīng)做好了充分的準備,只待更多玩家的加入。
對HPC領域的參與者來說,下一步,在生態(tài)開放、技術自主的理念下,加入到ARM指令集兼容HPC路徑上來,共同推動這一生態(tài)加速發(fā)展、實現(xiàn)共贏,將成為更好的選擇。
*本文圖片均來源于網(wǎng)絡
此內(nèi)容為【智能相對論】原創(chuàng),
僅代表個人觀點,未經(jīng)授權,任何人不得以任何方式使用,包括轉載、摘編、復制或建立鏡像。
部分圖片來自網(wǎng)絡,且未核實版權歸屬,不作為商業(yè)用途,如有侵犯,請作者與我們聯(lián)系。
?AI產(chǎn)業(yè)新媒體;
?澎湃新聞科技榜單月度top5;
?文章長期“霸占”鈦媒體熱門文章排行榜TOP10;
?著有《人工智能 十萬個為什么》
?【重點關注領域】智能家電(含白電、黑電、智能手機、無人機等AIoT設備)、智能駕駛、AI+醫(yī)療、機器人、物聯(lián)網(wǎng)、AI+金融、AI+教育、AR/VR、云計算、開發(fā)者以及背后的芯片、算法等。