根據(jù)美光的發(fā)布,美光和AMD在奧斯汀建立了聯(lián)合服務器實驗室,以減少服務器內存驗證時間,并在產(chǎn)品驗證和發(fā)布期間聯(lián)合進行工作負載測試。
目前,美光面向數(shù)據(jù)中心的DDR5內存和第四代AMD EPYCTM處理器已經(jīng)出貨,并進行一些高性能計算工作負載的通用基準測試。
長期以來,超級計算機承擔著高性能計算的工作量如此大規(guī)模的數(shù)據(jù)密集型工作負載,需要運行百萬級并行運算的TB級數(shù)據(jù),才能解決人類世界的難題,比如天氣氣候預測,地震建模,化學,物理和生物分析等
伴隨著計算機體系結構的發(fā)展,這樣的工作負載通常被托管在非常大的橫向擴展高性能服務器集群中這些服務器集群需要最強大的計算能力,架構,內存和存儲基礎設施,以滿足關鍵工作負載的可擴展性,低延遲和高性能要求可是,伴隨著服務器CPU性能和吞吐量的不斷提高,DDR4無法提供足夠的內存帶寬來滿足不斷增加的高性能內核
為了緩解這一瓶頸,美光DDR5內存與采用Zen 4服務器架構的第四代AMD EPYC處理器相結合,使服務器CPU能夠更好地匹配內存產(chǎn)品,滿足數(shù)據(jù)密集型工作負載的性能和效率要求本站了解到,美光已經(jīng)進行了業(yè)界最新的AMD Zen 4 96核CPU和美光DDR5的基準測試,所有結果都顯示性能提升了2倍
STREAM1是一個常用的基準測試工具,用于測量高性能計算機的內存帶寬,捕捉高性能計算系統(tǒng)的內存帶寬峰值。
此工作負載使用的軟件堆棧
Alma 9 Linux內核5.14
STREAM.f,2021年11月29日發(fā)布
測試設置
采用第三代64核3.7 GHz AMD EPYC處理器的DDR4系統(tǒng),DDR4 3200 MHz系統(tǒng)2的RDIMM內存槽已滿,總計64GB。
DDR5系統(tǒng)搭載第四代96核3.7 GHz AMD EPYC處理器,DDR5 4800 MHz系統(tǒng)3的RDIMM內存槽已滿,共64GB。
試驗結果
DDR 5系統(tǒng)每槽內存帶寬翻倍至378GB/s。
這個結果意味著客戶可以運行更大規(guī)模的人工智能/機器學習項目,或者使用DDR5增加的內存帶寬來做更多的高性能計算。
本測試中使用的高性能計算工作負載代碼針對天氣和氣候WRF模型在一些支持高性能浮點處理,高內存帶寬,低延遲網(wǎng)絡等的傳統(tǒng)高性能計算架構中表現(xiàn)良好測試對象是美國大陸,水平分辨率為2.5公里
此工作負載使用的軟件堆棧
Alma 9 Linux內核5.14
WRF 2.3.5安培,4.3.3
打開MPI 4 . 1 . 1版
測試設置
采用第三代64核3.7 GHz AMD EPYC處理器的DDR4系統(tǒng),DDR4 3200 MHz系統(tǒng)2的RDIMM內存槽已滿,總計64GB。
DDR5系統(tǒng)搭載第四代96核3.7 GHz AMD EPYC處理器,DDR5 4800 MHz系統(tǒng)3的RDIMM內存槽已滿,共64GB。
試驗結果
采用第四代AMD EPYC處理器的Micron DDR5可以實現(xiàn)1.3567時間步/秒vs DDR 4系統(tǒng)的2.8533時間步/秒。
更快的速度意味著你可以使用更大的數(shù)據(jù)庫或運行更多的模型來預測天氣,從而提高預測的準確性。
OpenFOAM是計算流體力學的開源高性能計算工作負載,廣泛應用于多個行業(yè),有助于縮短開發(fā)時間,降低成本從消費產(chǎn)品設計到航空航天設計,OpenFOAM可以模擬不同應用中的物理交互,包括摩托車擋風玻璃湍流
在這個模擬中,OpenFOAM可以計算摩托車和騎手周圍的穩(wěn)定氣流OpenFOAM可以根據(jù)用戶指定的進程數(shù)量計算負載平衡,從而將網(wǎng)格劃分為多個部分,分配給不同的進程解決方案完成后,網(wǎng)格和解決方案被重新組裝到一個域中
此工作負載使用的軟件堆棧
OpenFOAM CFD軟件,其中摩托車網(wǎng)格尺寸為600 x 240 x 240。
Alma 9 Linux內核5.14
打開MPI 4 . 1 . 1版
測試設置
采用第三代64核3.7 GHz AMD EPYC處理器的DDR4系統(tǒng),DDR4 3200 MHz系統(tǒng)2的RDIMM內存槽已滿,總計64GB。
DDR5系統(tǒng)搭載第四代96核3.7 GHz AMD EPYC處理器,DDR5 4800 MHz系統(tǒng)3的RDIMM內存槽已滿,共64GB。
試驗結果
測試結果顯示,美光的DDR5產(chǎn)品組合將OpenFOAM的性能提高了2.4倍OpenFOAM是五大高性能計算軟件平臺之一,擁有龐大的開源社區(qū)這個軟件在大學和R&D中心被廣泛使用可以使用高帶寬內存和內核密集的高性能CPU,實現(xiàn)高并行運算
CP2K是一個開源的量子化學工具,適用于很多應用,包括固態(tài)生物系統(tǒng)模擬CP2K可以為不同的建模方法提供一個通用的框架測試對象是水的密度泛函理論模擬箱包含6144個原子
此工作負載使用的軟件堆棧
H2O密度泛函理論。NREP4和H2O密度泛函理論
Alma 9 Linux內核5.14
測試設置
采用第三代64核3.7 GHz AMD EPYC處理器的DDR4系統(tǒng),DDR4 3200 MHz系統(tǒng)2的RDIMM內存槽已滿,總計64GB。
DDR5系統(tǒng)搭載第四代96核3.7 GHz AMD EPYC處理器,DDR5 4800 MHz系統(tǒng)3的RDIMM內存槽已滿,共64GB。
試驗結果
結果表明,美光的DDR5產(chǎn)品組合將分子動力學性能提高了2.1倍伴隨著內核數(shù)量和內存帶寬的增加,這類工作負載的性能也會顯著提高
摘要
目前只測試了少量的高性能計算工作負載,所以以上結果只是初步的將高性能和高帶寬內存與最新的服務器處理器相結合,可以為高性能計算客戶創(chuàng)造新的可能性
在STREAM benchmark測試中配置了1個具有25億個向量的STREAM benchmark——它運行在單個AMD CPU系統(tǒng)上。
2AMD DDR4系統(tǒng)是64核AMD EPYC 7763處理器,DDR4—3200 MHz的RDIMM內存槽滿,總計64GB。
3AMD DDR5系統(tǒng)是96核AMD EPYC 9654處理器,DDR5—4800 MHz的RDIMM內存槽滿,總計64GB。
4水平分辨率為12.5km CONUS的WRF在DDR4系統(tǒng)上運行929秒,在DDR5系統(tǒng)上運行287秒本次測試中,WRF配置為2.5km CONUS,測試結果為1.3567時間步/秒,而DDR4的運行時間為2.8533時間步/秒
5對于OpenFOAM,運行了三種變體:
5a:1004040運行時,DDR4系統(tǒng)運行時間為1144秒,DDR5系統(tǒng)運行時間為478秒。
5b:1084646運行時,DDR4系統(tǒng)運行時間為1633秒,DDR5系統(tǒng)運行時間為698秒。
5c:1305252運行時,DDR4系統(tǒng)運行時間為2522秒,DDR5系統(tǒng)運行時間為1091秒。
分子動力學工作負載在DDR4系統(tǒng)上的運行時間為2519秒,在DDR5系統(tǒng)上的運行時間為1242秒。
鄭重聲明:此文內容為本網(wǎng)站轉載企業(yè)宣傳資訊,目的在于傳播更多信息,與本站立場無關。僅供讀者參考,并請自行核實相關內容。