華為盤古氣象大模型|登Nature
比傳統(tǒng)方法快1萬倍、只需要1.4秒就能完成24小時全球氣象預報——
它就是來自華為云的盤古氣象大模型。
今天,它登上了Nature,據(jù)稱還是近年來首篇以中國科技公司作為唯一署名單位發(fā)表的Nature正刊論文
那么,它究竟是如何被開發(fā)出來的?解決了哪些關鍵難題?又有何具體成效和應用?
順著這篇文章帶你一探究竟。
破解現(xiàn)有AI氣象預報模型精度不足問題
上世紀20年代以來,特別是近三十年隨著算力的迅速發(fā)展,傳統(tǒng)的數(shù)值天氣預報在每日天氣預報、極端災害預警、氣候變化預測等領域取得了巨大的成功。
但是隨著算力增長的趨緩和物理模型的逐漸復雜化,這一方式的瓶頸日益突出。
于是研究者們開始挖掘新的氣象預報范式如使用深度學習方法預測未來天氣。
華為云研發(fā)團隊于2年前開始這方面的研究。
他們發(fā)現(xiàn),在數(shù)值方法應用最廣泛的領域如中長期預報中,現(xiàn)有的AI預報方法精度仍然顯著低于數(shù)值預報方法,并受到可解釋性欠缺,極端天氣預測不準等問題的制約。
而造成AI氣象預報模型的精度不足主要有兩個原因:
第一,現(xiàn)有的AI氣象預報模型都是基于2D神經(jīng)網(wǎng)絡,無法很好地處理不均勻的3D氣象數(shù)據(jù);
第二,AI方法缺少數(shù)學物理機理約束,因此在迭代的過程中會不斷積累迭代誤差。
在此,華為云的研究人員提出了3D Earth-Specific Transformer(3DEST)來處理復雜的不均勻3D氣象數(shù)據(jù),從而打造了盤古氣象大模型。
其主要思想是使用一個視覺transformer的3D變種來處理復雜的不均勻的氣象要素,并且使用層次化時域聚合策略,訓練了4個不同預報間隔的模型(分別為1小時間隔、3小時間隔、6小時間隔、24小時間隔),使得預測特定時間氣象狀況的迭代次數(shù)最小,從而減少迭代誤差,也避免了由遞歸訓練帶來的訓練資源消耗。
為了訓練每個模型,研究人員使用1979-2021年的氣象數(shù)據(jù),以小時為單位采樣,訓練了100個epoch。
每個模型需要在192塊V100顯卡上訓練16天。事實上,即使經(jīng)歷100個epoch,這些模型依舊沒有完全收斂。
也就是說,在計算資源更加充足的情況下,AI預報的精度還能夠進一步提升。
最終推理時,盤古氣象大模型僅需在一張V100顯卡上運行1.4秒,即可完成24小時全球氣象預報,包括位勢、濕度、風速、溫度、海平面氣壓等,其中水平空間分辨率達到0.25°×0.25° ,時間分辨率為1小時,覆蓋13層垂直高度,可以精準地預測細粒度氣象特征。
而作為首個精度超過傳統(tǒng)數(shù)值預報方法的AI方法,它的計算速度相比傳統(tǒng)數(shù)值預報提升超過10000倍。
可直接應用多個下游場景
今年5月,臺風“瑪娃”走向受到廣泛關注。
中央氣象局表示,華為云盤古大模型在“瑪娃”的路徑預報中表現(xiàn)優(yōu)異,提前五天預報出其將在臺灣島東部海域轉(zhuǎn)向路徑。
在第19屆世界氣象大會上,歐洲氣象局也指出,華為云盤古氣象大模型在精度上有不可否認的能力,純數(shù)據(jù)驅(qū)動的AI天氣預報模型,展現(xiàn)出了可與歐洲中期天氣預報中心業(yè)務數(shù)值模式媲美的預報實力。
歐洲中期天氣預報中心主任弗洛倫斯·哈比耶詳細地展示了華為云盤古氣象大模型與歐洲中期天氣預報中心的實時運行檢驗對比情況:
為了探索AI捕獲極端天氣的能力,我們研究了今年2月芬蘭的一個案例,當時觀測到了-29℃的寒潮,我們發(fā)現(xiàn)盤古較早認識到了這一事件的嚴重性。
弗洛倫斯·哈比耶還強調(diào),AI預測方法資源消耗少,為發(fā)展中國家提供了重要機遇,因為它不再需要大規(guī)模的超算資源,還為提升全球預報能力提供了難得的機遇。
至于華為云選擇AI氣象預報領域作為一個“突破口”,一方面,氣象預報尤其是對極端天氣如暴雨、臺風、干旱、寒潮的精準預測關乎國際民生,另一方面,氣象預測問題非常復雜,AI可以從海量數(shù)據(jù)中挖掘出新的大氣演變規(guī)律,在精度和速度上具有巨大的提升潛力。
據(jù)了解,世界氣象組織(WMO)即將發(fā)布的WMO2024—2027年戰(zhàn)略計劃吸收了人工智能元素,使其成為推動氣象科技發(fā)展的重要力量。
WMO還將積極推動AI在臨近預報及數(shù)值天氣預報等領域的示范應用,創(chuàng)建人工智能產(chǎn)品應用國際比對平臺,制定AI氣象應用標準和指南,推動人工智能數(shù)據(jù)集共享等相關工作,探索并發(fā)揮AI在氣象領域的應用潛力,有效支撐全民早期預警倡議。
未來三大關鍵
最后,華為云盤古氣象大模型團隊如何看待AI氣象預報的未來?
答案是三大關鍵:
首先,大數(shù)據(jù)。龐大的氣象數(shù)據(jù)是AI模型的基石,當前盤古氣象大模型僅使用部分ERA5再分析數(shù)據(jù),未來的AI模型將基于海量的、更精細的全球觀測數(shù)據(jù)。
其次,大算力。氣象數(shù)據(jù)超高的分辨率對AI模型的訓練造成了巨大的挑戰(zhàn),盤古氣象大模型現(xiàn)在的輸入分辨率為1440×720×14×5,相比計算視覺任務常用的分辨率224×224×3大約500倍,隨著分辨率的進一步增加和模型的增大,需要的算力資源也會迅速增加。
最后,大模型。復雜的氣象規(guī)律,超高的分辨率與龐大的數(shù)據(jù)量都決定了AI氣象預報需要使用計算量極高的AI模型。
同時,想要不斷迭代領先的AI氣象預報模型,穩(wěn)定的云上環(huán)境、工作套件和對應的運維也是必不可少的。