散文網(wǎng) » 生活 »日常 » MD模擬的發(fā)展趨勢-1

MD模擬的發(fā)展趨勢-1

2022-08-11 17:12 作者:邱新龍分子模擬小破屋 0人讀過 | 我要投稿

總的來說，MD模擬的發(fā)展趨勢是以更高的效率、模擬更大的體系、實現(xiàn)更長的演化時間、取得更精確的模擬結(jié)果為目的。為了實現(xiàn)這些目標(biāo)，必須從計算技術(shù)、MD模擬算法、分子模型等多方面進(jìn)行廣泛而深入的研究。

1.3.1計算技術(shù)的發(fā)展方向

在經(jīng)歷了約半個世紀(jì)的指數(shù)式提高，計算機(jī)核心部件CPU的主頻在21世紀(jì) 初超過3GHz后，出現(xiàn)了停滯現(xiàn)象，失去了過去那種按Moore定律快速提高的趨勢。但是，CPU的制造技術(shù)并沒有達(dá)到發(fā)展極限，出現(xiàn)了雙核、四核、八核甚至十六核等多核CPU。因此，Moore定律繼續(xù)有效，只是發(fā)展模式從不斷提高CPU的主頻，轉(zhuǎn)化為提高單片CPU上集成的核芯數(shù)量。與CPU主頻被不斷提高的時代相比，這種新趨勢對算法的開發(fā)和軟件設(shè)計提出了新的挑戰(zhàn)。

在CPU主頻被不斷提高的時代，一個因速度緩慢而性能不佳的計算程序，只要等待新一代具有更高主頻的CPU的出現(xiàn)，就會有更出色的表現(xiàn)。現(xiàn)在，同樣因速度緩慢而表現(xiàn)不佳的計算程序，在新一代主頻幾乎不變、但具有更多核芯的CPU上，其表現(xiàn)不一定會得到改善。事實上，為了改進(jìn)計算程序的運算速度，必須改進(jìn)程序的算法，提高其并行運算速度。不過，提高計算程序的并行運算速度，不是簡單的工作，而是復(fù)雜的工程，必須發(fā)展適合并行運算的算法〔河。

衡量一個算法并行運算效果的指標(biāo)是加速比(speedup)。當(dāng)利用多個核芯進(jìn) 行并行運算時，一般只有算法的一部分能被并行加速，其他部分則不能被并行加速。因此，當(dāng)用個核芯進(jìn)行并行運算時，運算時間一般不會縮短到單個核芯串行運算時間的1/Np。因此，并行運算的加速比，就是利用單個核芯進(jìn)行串行運算所消耗的計算時間與利用多個核芯進(jìn)行并行計算所消耗的計算時間之比。也就是說，如果一算法在單個核芯上的運算時間為乃，在Np個核芯上的運算時間為，則算法的加速比為S% = T,/TWp。

根據(jù)Amdahl定律，如果一個算法中能夠被任意并行加速部分所占計算量為a,不能被并行加速部分所占計算量為1 —a ,則利用Np個核芯進(jìn)行并行計算時的加速比為S% = (1 —a + a/Np)7 ? 當(dāng)利用任意多個核芯進(jìn)行并行計算時，得到算法的最大加速比S唉=(1—a)T。如果算法可以被并行加速部分的比例a未知，可以利用Np個核芯并行運算時的實測加速比S%估計，a = (S疋一l)/(Nf — 1)。與加速比相關(guān)的另一指標(biāo)是并行計算的效率，定義為加速比與核芯數(shù)之比E% = Sn丿N-此外，在進(jìn)行并行運算時，各個進(jìn)程的調(diào)度、進(jìn)程之間的通信等，都需要消耗額外的時間，更降低了算法的加速比。

例如，某一作業(yè)，當(dāng)用1個核芯進(jìn)行計算時所消耗的計算時間為100,用2 個核芯進(jìn)行計算時所消耗的計算時間為60,則并行計算的加速比為1.667,算法中可以被并行加速部分所占比例a = 0. 8。當(dāng)用5個核芯進(jìn)行計算時，并行計算加速比為2.778,此時的并行效率為55.6%。事實上，這個作業(yè)的最大理論加速比為5,并行效果并不理想。

并行計算與三個和尚從山下往位于山頂?shù)乃聫R運水的故事相似。當(dāng)方丈覺得一個僧人運水的速度太慢時，他有兩種選擇：增加人力，多派一些僧人運水；或訓(xùn)練運水的僧人，提高僧人的運水效率。前者相當(dāng)于并行計算，通過利用更多的計算核芯，提高作業(yè)效率；后者相當(dāng)于提高計算核芯的主頻，通過提高單個計算核芯的運算速度來提高作業(yè)效率。方丈可以通過計算加速比，即在沒有采取任何措施以前往山上運一桶水需要消耗的時間，與采取改進(jìn)措施后運一桶水需要消耗的時間之比，來評估兩種方案的實際效果。

方丈肯定認(rèn)為，由于受生理條件的限制，提高一個僧人運水的加速比肯定有限，更好的方案還是多派僧人運水。并且，如果派出Np個僧人運水，可以將加速比提高到Np。但是，故事的結(jié)局已經(jīng)熟知，當(dāng)方丈派出兩個僧人運水時，運水作業(yè)的加速比沒有增加；當(dāng)方丈派出三個僧人運水后，加速比甚至降低為0。

如果方丈了解并行計算技術(shù)，他在派出更多的運水僧人前會考察從山下往山上運水的環(huán)境是否適合并行作業(yè)，或者說他的算法是否具有可擴(kuò)展性(scalability) o 曾經(jīng)參觀故事中寺廟的游客就會發(fā)現(xiàn)，僧人從山下往山上運水的山道，只能容納一個人上下山，不適合并行作業(yè)，不具有可擴(kuò)展性。因此，當(dāng)方丈派出三個僧人一起進(jìn)行運水作業(yè)時，山道阻塞，加速比降為0。懂得并行計算技術(shù)的濟(jì) 公，考察了從山下往山上運水的山道，發(fā)現(xiàn)山道環(huán)境條件不適合并行作業(yè)，作業(yè) 不具有可擴(kuò)展性。如果不顧作業(yè)環(huán)境而進(jìn)行并行作業(yè)，還會影響上山敬佛的香客，不利于吸引游客上山，發(fā)展旅游經(jīng)濟(jì)。因此，濟(jì)公改變了算法，讓僧人從井里往上提水。從井里往上提水的作業(yè)環(huán)境具有更大的空間，可以容納多人并行作業(yè)，具有可擴(kuò)展性。

雖然現(xiàn)代超級計算機(jī)可以模擬多達(dá)上千億個原子，實現(xiàn)納秒級的演化時間。例如，浮點運算峰值速度達(dá)IX10"次/s的超級計算機(jī)運行一天，可以實現(xiàn)的模擬量達(dá)到NT=2. 14原子?秒(N=2. 14X1O15個原子，實現(xiàn)演化時間T=1 X 10-6s)t5?o但是，大多數(shù)MD模擬工作者，難以得到這樣的超級計算機(jī)的計算服務(wù)，只能使用約每秒萬億次的中小型集群式計算系統(tǒng)。

目前，除傳統(tǒng)的CPU 計算系統(tǒng)外，MD模擬工作者的另一選項是GPU (graphical processing units) 計算系統(tǒng)。GPU計算系統(tǒng)的主要特點是并行性能優(yōu)越，性能價格比遠(yuǎn)高于CPU 計算系統(tǒng)。利用GPU計算系統(tǒng)，可以以小型集群式計算系統(tǒng)的成本，得到大型計算系統(tǒng)的浮點運算速度。例如，NVIDIA的M2090 GPU運算卡包含16個多處理器，每個多處理器又包含32個計算核芯，總共多達(dá)512個計算核芯。該 GPU運算卡的單精度浮點峰值運算速度達(dá)到每秒1-331萬億次以上，價格約2 萬元。因此，GPU計算系統(tǒng)正吸引越來越多的MD模擬工作者的使用酎麗。

GPU并不是一項新的發(fā)明，它早已被廣泛應(yīng)用于傳統(tǒng)的CPU計算機(jī)中，作為圖形處理器用于提高圖形處理速度。因此，GPU計算系統(tǒng)是MD模擬者容易得到或可以以低廉的價格得到的一種計算資源。GPU計算系統(tǒng)的缺點是難以與傳統(tǒng)CPU計算相互兼容，不能直接移植面向CPU設(shè)計的MD模擬程序。GPU 計算系統(tǒng)的更大缺點是不能直接使用MD模擬軟件編寫者熟悉的FORTRAN等程序設(shè)計語言。GPU計算系統(tǒng)通常使用一種與簡化版C語言相似的編程語言，稱為 CUDA (compute unified device architecture) o 因此，即使使用 C 語言編寫的MD程序，移植到GPU計算系統(tǒng)上運行時仍需要大量的改寫和調(diào)試工作［旳。與CPU計算不同.GPU計算擅長浮點運算，但不擅長邏輯運算密集的算法。因此，為了得到更好的效果，必須把CPU計算和GPU計算結(jié)合起來，利用CPU 進(jìn)行作業(yè)調(diào)度等邏輯運算.利用GPU進(jìn)行浮點運算。

標(biāo)簽：

MD模擬的發(fā)展趨勢-1的評論 (共條)

愛情散文傷感散文哲理散文優(yōu)美生活隨筆親情唯美句子傷感的句子現(xiàn)代詩歌空間日志經(jīng)典語句愛情句子作文大全

国产精品天干天干,亚洲毛片在线,日韩gay小鲜肉啪啪18禁,女同Gay自慰喷水

MD模擬的發(fā)展趨勢-1

MD模擬的發(fā)展趨勢-1的評論 (共條)

你可能也喜歡這些文章

最新發(fā)布的文章

国产精品天干天干,亚洲毛片在线,日韩gay小鲜肉啪啪18禁,女同Gay自慰喷水

MD模擬的發(fā)展趨勢-1

本文作者的其他文章

MD模擬的發(fā)展趨勢-1的評論 (共 條)

你可能也喜歡這些文章

最新發(fā)布的文章

MD模擬的發(fā)展趨勢-1的評論 (共條)