国产精品天干天干,亚洲毛片在线,日韩gay小鲜肉啪啪18禁,女同Gay自慰喷水

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

MD模擬的發(fā)展趨勢-1

2022-08-11 17:12 作者:邱新龍分子模擬小破屋  | 我要投稿

總的來說,MD模擬的發(fā)展趨勢是以更高的效率、模擬更大的體系、實現(xiàn)更 長的演化時間、取得更精確的模擬結(jié)果為目的。為了實現(xiàn)這些目標(biāo),必須從計算 技術(shù)、MD模擬算法、分子模型等多方面進(jìn)行廣泛而深入的研究。

1.3.1計算技術(shù)的發(fā)展方向

在經(jīng)歷了約半個世紀(jì)的指數(shù)式提高,計算機(jī)核心部件CPU的主頻在21世紀(jì) 初超過3GHz后,出現(xiàn)了停滯現(xiàn)象,失去了過去那種按Moore定律快速提高的 趨勢。但是,CPU的制造技術(shù)并沒有達(dá)到發(fā)展極限,出現(xiàn)了雙核、四核、八核 甚至十六核等多核CPU。因此,Moore定律繼續(xù)有效,只是發(fā)展模式從不斷提 高CPU的主頻,轉(zhuǎn)化為提高單片CPU上集成的核芯數(shù)量。與CPU主頻被不斷 提高的時代相比,這種新趨勢對算法的開發(fā)和軟件設(shè)計提出了新的挑戰(zhàn)。

在CPU主頻被不斷提高的時代,一個因速度緩慢而性能不佳的計算程序, 只要等待新一代具有更高主頻的CPU的出現(xiàn),就會有更出色的表現(xiàn)。現(xiàn)在,同 樣因速度緩慢而表現(xiàn)不佳的計算程序,在新一代主頻幾乎不變、但具有更多核芯 的CPU上,其表現(xiàn)不一定會得到改善。事實上,為了改進(jìn)計算程序的運算速 度,必須改進(jìn)程序的算法,提高其并行運算速度。不過,提高計算程序的并行運 算速度,不是簡單的工作,而是復(fù)雜的工程,必須發(fā)展適合并行運算的算法〔河。

衡量一個算法并行運算效果的指標(biāo)是加速比(speedup)。當(dāng)利用多個核芯進(jìn) 行并行運算時,一般只有算法的一部分能被并行加速,其他部分則不能被并行加 速。因此,當(dāng)用個核芯進(jìn)行并行運算時,運算時間一般不會縮短到單個核芯 串行運算時間的1/Np。因此,并行運算的加速比,就是利用單個核芯進(jìn)行串行 運算所消耗的計算時間與利用多個核芯進(jìn)行并行計算所消耗的計算時間之比。也 就是說,如果一算法在單個核芯上的運算時間為乃,在Np個核芯上的運算時 間為,則算法的加速比為S% = T,/TWp。

根據(jù)Amdahl定律,如果一個算 法中能夠被任意并行加速部分所占計算量為a,不能被并行加速部分所占計算量 為1 —a ,則利用Np個核芯進(jìn)行并行計算時的加速比為S% = (1 —a + a/Np)7 ? 當(dāng)利用任意多個核芯進(jìn)行并行計算時,得到算法的最大加速比S唉=(1—a)T。 如果算法可以被并行加速部分的比例a未知,可以利用Np個核芯并行運算時的 實測加速比S%估計,a = (S疋一l)/(Nf — 1)。與加速比相關(guān)的另一指標(biāo)是并 行計算的效率,定義為加速比與核芯數(shù)之比E% = Sn丿N-此外,在進(jìn)行并行 運算時,各個進(jìn)程的調(diào)度、進(jìn)程之間的通信等,都需要消耗額外的時間,更降低 了算法的加速比。

例如,某一作業(yè),當(dāng)用1個核芯進(jìn)行計算時所消耗的計算時間為100,用2 個核芯進(jìn)行計算時所消耗的計算時間為60,則并行計算的加速比為1.667,算法 中可以被并行加速部分所占比例a = 0. 8。當(dāng)用5個核芯進(jìn)行計算時,并行計算 加速比為2.778,此時的并行效率為55.6%。事實上,這個作業(yè)的最大理論加速 比為5,并行效果并不理想。

并行計算與三個和尚從山下往位于山頂?shù)乃聫R運水的故事相似。當(dāng)方丈覺得 一個僧人運水的速度太慢時,他有兩種選擇:增加人力,多派一些僧人運水;或 訓(xùn)練運水的僧人,提高僧人的運水效率。前者相當(dāng)于并行計算,通過利用更多的 計算核芯,提高作業(yè)效率;后者相當(dāng)于提高計算核芯的主頻,通過提高單個計算 核芯的運算速度來提高作業(yè)效率。方丈可以通過計算加速比,即在沒有采取任何 措施以前往山上運一桶水需要消耗的時間,與采取改進(jìn)措施后運一桶水需要消耗 的時間之比,來評估兩種方案的實際效果。

方丈肯定認(rèn)為,由于受生理條件的限 制,提高一個僧人運水的加速比肯定有限,更好的方案還是多派僧人運水。并 且,如果派出Np個僧人運水,可以將加速比提高到Np。但是,故事的結(jié)局已 經(jīng)熟知,當(dāng)方丈派出兩個僧人運水時,運水作業(yè)的加速比沒有增加;當(dāng)方丈派出 三個僧人運水后,加速比甚至降低為0。

如果方丈了解并行計算技術(shù),他在派出更多的運水僧人前會考察從山下往山 上運水的環(huán)境是否適合并行作業(yè),或者說他的算法是否具有可擴(kuò)展性(scalability) o 曾經(jīng)參觀故事中寺廟的游客就會發(fā)現(xiàn),僧人從山下往山上運水的山道,只 能容納一個人上下山,不適合并行作業(yè),不具有可擴(kuò)展性。因此,當(dāng)方丈派出三 個僧人一起進(jìn)行運水作業(yè)時,山道阻塞,加速比降為0。懂得并行計算技術(shù)的濟(jì) 公,考察了從山下往山上運水的山道,發(fā)現(xiàn)山道環(huán)境條件不適合并行作業(yè),作業(yè) 不具有可擴(kuò)展性。如果不顧作業(yè)環(huán)境而進(jìn)行并行作業(yè),還會影響上山敬佛的香 客,不利于吸引游客上山,發(fā)展旅游經(jīng)濟(jì)。因此,濟(jì)公改變了算法,讓僧人從井 里往上提水。從井里往上提水的作業(yè)環(huán)境具有更大的空間,可以容納多人并行作 業(yè),具有可擴(kuò)展性。

雖然現(xiàn)代超級計算機(jī)可以模擬多達(dá)上千億個原子,實現(xiàn)納秒級的演化時間。 例如,浮點運算峰值速度達(dá)IX10"次/s的超級計算機(jī)運行一天,可以實現(xiàn)的模 擬量達(dá)到NT=2. 14原子?秒(N=2. 14X1O15個原子,實現(xiàn)演化時間T=1 X 10-6s)t5?o但是,大多數(shù)MD模擬工作者,難以得到這樣的超級計算機(jī)的計算 服務(wù),只能使用約每秒萬億次的中小型集群式計算系統(tǒng)。

目前,除傳統(tǒng)的CPU 計算系統(tǒng)外,MD模擬工作者的另一選項是GPU (graphical processing units) 計算系統(tǒng)。GPU計算系統(tǒng)的主要特點是并行性能優(yōu)越,性能價格比遠(yuǎn)高于CPU 計算系統(tǒng)。利用GPU計算系統(tǒng),可以以小型集群式計算系統(tǒng)的成本,得到大型 計算系統(tǒng)的浮點運算速度。例如,NVIDIA的M2090 GPU運算卡包含16個多 處理器,每個多處理器又包含32個計算核芯,總共多達(dá)512個計算核芯。該 GPU運算卡的單精度浮點峰值運算速度達(dá)到每秒1-331萬億次以上,價格約2 萬元。因此,GPU計算系統(tǒng)正吸引越來越多的MD模擬工作者的使用酎麗。

GPU并不是一項新的發(fā)明,它早已被廣泛應(yīng)用于傳統(tǒng)的CPU計算機(jī)中,作 為圖形處理器用于提高圖形處理速度。因此,GPU計算系統(tǒng)是MD模擬者容易 得到或可以以低廉的價格得到的一種計算資源。GPU計算系統(tǒng)的缺點是難以與 傳統(tǒng)CPU計算相互兼容,不能直接移植面向CPU設(shè)計的MD模擬程序。GPU 計算系統(tǒng)的更大缺點是不能直接使用MD模擬軟件編寫者熟悉的FORTRAN等 程序設(shè)計語言。GPU計算系統(tǒng)通常使用一種與簡化版C語言相似的編程語言, 稱為 CUDA (compute unified device architecture) o 因此,即使使用 C 語言編寫 的MD程序,移植到GPU計算系統(tǒng)上運行時仍需要大量的改寫和調(diào)試工作[旳。 與CPU計算不同.GPU計算擅長浮點運算,但不擅長邏輯運算密集的算法。因 此,為了得到更好的效果,必須把CPU計算和GPU計算結(jié)合起來,利用CPU 進(jìn)行作業(yè)調(diào)度等邏輯運算.利用GPU進(jìn)行浮點運算。

MD模擬的發(fā)展趨勢-1的評論 (共 條)

分享到微博請遵守國家法律
五常市| 沂南县| 三穗县| 汉中市| 孟州市| 榆树市| 商城县| 张家口市| 江油市| 新民市| 芦山县| 锡林郭勒盟| 中宁县| 阜平县| 建瓯市| 溆浦县| 奎屯市| 绥棱县| 湘潭县| 华亭县| 临城县| 苏尼特右旗| 永兴县| 衡东县| 庐江县| 章丘市| 资源县| 会泽县| 镇康县| 和田市| 罗城| 平陆县| 孝义市| 和顺县| 古交市| 磐石市| 鄯善县| 枣庄市| 抚顺市| 津南区| 中卫市|