国产毛片a精品毛-国产毛片黄片-国产毛片久久国产-国产毛片久久精品-青娱乐极品在线-青娱乐精品

美光 DDR5 內(nèi)存配合第四代 AMD EPYC 處理器,提升高性能計(jì)算工作負(fù)載

發(fā)布時(shí)間:2022-12-19 16:50    發(fā)布者:eechina
關(guān)鍵詞: DDR5 , EPYC , 高性能計(jì)算 , HPC
作者:Krishna Yalamanchi、Sudharshan Vazhkudai

美光與AMD聯(lián)手為客戶及數(shù)據(jù)中心平臺(tái)提供一流的用戶體驗(yàn)。雙方在奧斯汀建立聯(lián)合服務(wù)器實(shí)驗(yàn)室,以減少服務(wù)器內(nèi)存驗(yàn)證時(shí)間,在產(chǎn)品驗(yàn)證和發(fā)布期間共同進(jìn)行工作負(fù)載測(cè)試。目前美光適用于數(shù)據(jù)中心的 DDR5 內(nèi)存和第四代 AMD EPYCTMTM (霄龍)處理器均已出貨,我們對(duì)其進(jìn)行了一些常見的高性能計(jì)算(HPC)工作負(fù)載基準(zhǔn)測(cè)試。

長(zhǎng)期以來(lái),超級(jí)計(jì)算機(jī)承擔(dān)著高性能計(jì)算工作負(fù)載。此類大規(guī)模的數(shù)據(jù)密集型工作負(fù)載需要運(yùn)行TB 級(jí)的數(shù)據(jù)量以進(jìn)行數(shù)百萬(wàn)個(gè)并行操作,以解決人類世界的難題,如天氣和氣候預(yù)測(cè);地震建模;化學(xué)、物理和生物分析等。

隨著計(jì)算機(jī)架構(gòu)的進(jìn)步,此類工作負(fù)載往往托管在超大型“可橫向擴(kuò)展”的高性能服務(wù)器集群中。這些服務(wù)器集群需要集合最強(qiáng)大的算力、架構(gòu)、內(nèi)存和存儲(chǔ)基礎(chǔ)設(shè)施,以滿足關(guān)鍵工作負(fù)載對(duì)可擴(kuò)展性、低延遲和高性能的需求。然而隨著服務(wù)器 CPU 的性能和吞吐量不斷增長(zhǎng),DDR4 無(wú)法提供足夠的內(nèi)存帶寬,來(lái)滿足不斷增長(zhǎng)的高性能內(nèi)核。



為緩解這一瓶頸,美光 DDR5 內(nèi)存與采用了Zen 4 服務(wù)器架構(gòu)的第四代AMD EPYC 處理器強(qiáng)強(qiáng)聯(lián)合,使服務(wù)器 CPU 能夠更好地匹配內(nèi)存產(chǎn)品,滿足數(shù)據(jù)密集型工作負(fù)載對(duì)性能和效率的需求。美光DDR5 內(nèi)存可幫助企業(yè)從本地和云端數(shù)據(jù)中更快獲取洞察。我們對(duì)最新的 AMD Zen 4 96 核CPU和美光DDR5進(jìn)行了行業(yè)內(nèi)高性能計(jì)算工作負(fù)載基準(zhǔn)測(cè)試,所有結(jié)果均顯示性能提升了兩倍。

美光 DDR5 搭配第四代 AMD EPYC 處理器,在STREAM 測(cè)試中實(shí)現(xiàn)內(nèi)存帶寬翻倍

STREAM1 是常見的基準(zhǔn)測(cè)試工具,用于測(cè)量高性能計(jì)算機(jī)的內(nèi)存帶寬,可捕獲高性能計(jì)算系統(tǒng)的峰值內(nèi)存帶寬。

該工作負(fù)載使用的軟件堆棧

•        Alma 9 Linux kernel 5.14
•        STREAM.f,2021 年 11 月 29 日發(fā)布版本



測(cè)試設(shè)置

•        DDR4 系統(tǒng)搭配第三代 64 核3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統(tǒng)2的 RDIMM 內(nèi)存槽插滿,共 64GB
•        DDR5 系統(tǒng)搭配第四代 96 核3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統(tǒng)3的 RDIMM 內(nèi)存槽插滿,共 64GB

測(cè)試結(jié)果

•        DDR5 系統(tǒng)每插槽內(nèi)存帶寬翻倍,達(dá)到 378 GB/s
•        該結(jié)果意味著客戶能運(yùn)行更大規(guī)模的人工智能/機(jī)器學(xué)習(xí) (AI/ML)項(xiàng)目,或利用 DDR5 增加的內(nèi)存帶寬進(jìn)行更多高性能計(jì)算。



美光 DDR5, 助力天氣研究和預(yù)報(bào) (WRF)4 速度提升2倍

此次測(cè)試使用的高性能計(jì)算工作負(fù)載代碼針對(duì)天氣和氣候。WRF模型在一些支持高性能浮點(diǎn)處理、高內(nèi)存帶寬、低延遲網(wǎng)絡(luò)等傳統(tǒng)高性能計(jì)算架構(gòu)中表現(xiàn)良好,測(cè)試對(duì)象為橫向分辨率為 2.5 公里的美國(guó)大陸地區(qū) (CONUS)。

該工作負(fù)載使用的軟件堆棧

•        Alma 9 Linux kernel 5.14 
•        WRF 2.3.5 & 4.3.3 
•        Open MPI v4.1.1

測(cè)試設(shè)置

•        DDR4 系統(tǒng)搭配第三代64 核3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統(tǒng)2的 RDIMM 內(nèi)存槽插滿,共 64GB
•        DDR5 系統(tǒng)搭配第四代 96 核3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統(tǒng)3的 RDIMM 內(nèi)存槽插滿,共 64GB

測(cè)試結(jié)果

•        美光 DDR5 搭配第四代 AMD EPYC 處理器,可實(shí)現(xiàn) 1.3567 時(shí)間步/秒 VS DDR4 系統(tǒng)的2.8533 時(shí)間步/秒
•        速度更快意味著可使用更大的數(shù)據(jù)庫(kù)或運(yùn)行更多模型以進(jìn)行天氣預(yù)測(cè),進(jìn)而改善預(yù)測(cè)的準(zhǔn)確度。

美光 DDR5,助力OpenFOAM5 速度提升2倍

OpenFOAM 是一種計(jì)算流體動(dòng)力學(xué)(CFD)的開源高性能計(jì)算工作負(fù)載,廣泛應(yīng)用于多個(gè)行業(yè),有助于縮短開發(fā)時(shí)間并降低成本。從消費(fèi)類產(chǎn)品設(shè)計(jì)到航空航天設(shè)計(jì),OpenFOAM能夠模擬不同應(yīng)用中的物理互動(dòng),包括摩托車風(fēng)擋湍流。在該模擬中,OpenFOAM 能夠計(jì)算摩托車和騎手周圍的穩(wěn)定氣流。OpenFOAM 能夠根據(jù)用戶指定的進(jìn)程數(shù)進(jìn)行負(fù)載均衡計(jì)算,以此將網(wǎng)格分解成多個(gè)部分并分配給不同的進(jìn)程求解。求解完成后,再將網(wǎng)格和解重新組合為單個(gè)域。

該工作負(fù)載使用的軟件堆棧

•        OpenFOAM CFD 軟件(版本8),其中摩托車網(wǎng)格尺寸為:600 x 240 x 240
•        Alma 9 Linux kernel 5.14 
•        Open MPI v4.1.1

測(cè)試設(shè)置

•        DDR4 系統(tǒng)搭配第三代64 核3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統(tǒng)2的 RDIMM 內(nèi)存槽插滿,共 64GB
•        DDR5 系統(tǒng)搭配第四代 96 核3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統(tǒng)3的 RDIMM 內(nèi)存槽插滿,共 64GB

測(cè)試結(jié)果

測(cè)試結(jié)果表明美光DDR5 產(chǎn)品組合將OpenFOAM 性能提高了 2.4 倍。OpenFOAM 為五大高性能計(jì)算軟件平臺(tái)之一,擁有大型開源社區(qū)。該軟件廣泛應(yīng)用于大學(xué)和研發(fā)中心,可利用高帶寬內(nèi)存和擁有密集內(nèi)核的高性能CPU,實(shí)現(xiàn)高度的并行操作。

美光 DDR5 ,助力分子動(dòng)力學(xué)6 速度提升2倍

CP2K 是一款開源量子化學(xué)工具,適用于許多應(yīng)用,包括固態(tài)生物系統(tǒng)模擬。CP2K 能夠?yàn)椴煌慕7椒ㄌ峁┩ㄓ玫目蚣堋4舜螠y(cè)試對(duì)象為水(H2O)的密度泛函理論(DFT),模擬盒子中共包含 6,144 個(gè)原子(2,048 個(gè)水分子)。

該工作負(fù)載使用的軟件堆棧

•        H2O-DFT-LS.NREP4 及 H2O-DFT-LS
•        Alma 9 Linux kernel 5.14

測(cè)試設(shè)置

•        DDR4 系統(tǒng)搭配第三代64 核3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統(tǒng)2的 RDIMM 內(nèi)存槽插滿,共 64GB
•        DDR5 系統(tǒng)搭配第四代 96 核3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統(tǒng)3的 RDIMM 內(nèi)存槽插滿,共 64GB

測(cè)試結(jié)果
測(cè)試結(jié)果表明美光DDR5 產(chǎn)品組合將分子動(dòng)力學(xué)性能提高了2.1 倍。隨著內(nèi)核數(shù)和內(nèi)存帶寬增加,此類工作負(fù)載的性能也顯著提升。

總結(jié)

目前我們只針對(duì)少量高性能計(jì)算工作負(fù)載進(jìn)行了測(cè)試,因此以上只是我們的初步成果。將高性能高帶寬內(nèi)存與最新的服務(wù)器處理器(如第四代 AMD EPYC 處理器)相結(jié)合,可為高性能計(jì)算客戶創(chuàng)造新的可能。我們期待更多企業(yè)數(shù)據(jù)中心和云服務(wù)商,能夠在新平臺(tái)上應(yīng)用美光 DDR5 產(chǎn)品,解鎖更高的性能與能效。

________________________
1 我們?cè)?STREAM 基準(zhǔn)測(cè)試中配置了 25 億個(gè)向量的STREAM Benchmark——運(yùn)行在一臺(tái)單 AMD CPU 系統(tǒng)上
2 AMD DDR4 系統(tǒng)為一臺(tái) 64 核 AMD EPYC 7763 處理器, DDR4-3200 MHz 的RDIMM 內(nèi)存槽插滿,共 64GB
3 AMD DDR5 系統(tǒng)為一臺(tái) 96 核 AMD EPYC 9654 處理器, DDR5-4800 MHz 的RDIMM 內(nèi)存槽插滿,共 64GB
4  橫向分辨率為 12.5 公里CONUS 的 WRF 在 DDR4 系統(tǒng)上的運(yùn)行時(shí)間為 929 秒,在 DDR5 系統(tǒng)上的運(yùn)行時(shí)間為 287 秒(均包括存儲(chǔ)器的輸入/輸出時(shí)間)。該測(cè)試中 WRF 配置為 2.5 公里 CONUS,測(cè)試結(jié)果為 1.3567 時(shí)間步/ 秒, 相比之下DDR4 的運(yùn)行時(shí)間為2.8533時(shí)間步/秒。
5 針對(duì) OpenFOAM,我們運(yùn)行了三種變體:
5a:1004040 runtimes,DDR4 系統(tǒng)運(yùn)行時(shí)間為 1,144 秒,DDR5 系統(tǒng)運(yùn)行時(shí)間為 478 秒
5b:1084646 runtimes,DDR4 系統(tǒng)運(yùn)行時(shí)間為 1,633 秒,DDR5 系統(tǒng)運(yùn)行時(shí)間為 698 秒
5c:1305252 runtimes,DDR4 系統(tǒng)運(yùn)行時(shí)間為 2,522秒,DDR5 系統(tǒng)運(yùn)行時(shí)間為 1,091 秒
6 分子動(dòng)力學(xué)工作負(fù)載在 DDR4 系統(tǒng)上的運(yùn)行時(shí)間為 2,519 秒,在 DDR5 系統(tǒng)上的運(yùn)行時(shí)間為 1,242 秒

作者:

Krishna Yalamanchi
Krishna 擔(dān)任美光生態(tài)系統(tǒng)高級(jí)開發(fā)經(jīng)理,專注于研發(fā) DDR5 和 CXL 解決方案。他曾在英特爾 IT 部門任職,領(lǐng)導(dǎo) SAP HANA 的遷移工作,通過(guò)與SI、OEM和云服務(wù)提供商共同搭建的合作伙伴生態(tài)系統(tǒng),推出了用于SAP工作負(fù)載的第三代與第四代 Intel Xeon 處理器。


Sudharshan Vazhkudai
Sudharshan S. Vazhkudai 博士擔(dān)任美光系統(tǒng)架構(gòu)和工作負(fù)載分析總監(jiān)。他領(lǐng)導(dǎo)一支位于奧斯汀和印度海得拉巴的團(tuán)隊(duì),致力于研究?jī)?nèi)存和存儲(chǔ)(DDR、CXL、HBM 和 NVME)產(chǎn)品中層次結(jié)構(gòu)的可組合性,并優(yōu)化與數(shù)據(jù)中心工作負(fù)載相關(guān)的系統(tǒng)架構(gòu)。

本文地址:http://www.qingdxww.cn/thread-808151-1-1.html     【打印本頁(yè)】

本站部分文章為轉(zhuǎn)載或網(wǎng)友發(fā)布,目的在于傳遞和分享信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé);文章版權(quán)歸原作者及原出處所有,如涉及作品內(nèi)容、版權(quán)和其它問題,我們將根據(jù)著作權(quán)人的要求,第一時(shí)間更正或刪除。
您需要登錄后才可以發(fā)表評(píng)論 登錄 | 立即注冊(cè)

廠商推薦

  • Microchip視頻專區(qū)
  • 基于CEC1712實(shí)現(xiàn)的處理器SPI FLASH固件安全彈性方案培訓(xùn)教程
  • 想要避免發(fā)生災(zāi)難,就用MPLAB® SiC電源仿真器!
  • 5分鐘詳解定時(shí)器/計(jì)數(shù)器E和波形擴(kuò)展!
  • 無(wú)線充電基礎(chǔ)知識(shí)及應(yīng)用培訓(xùn)教程2
  • 貿(mào)澤電子(Mouser)專區(qū)
關(guān)于我們  -  服務(wù)條款  -  使用指南  -  站點(diǎn)地圖  -  友情鏈接  -  聯(lián)系我們
電子工程網(wǎng) © 版權(quán)所有   京ICP備16069177號(hào) | 京公網(wǎng)安備11010502021702
快速回復(fù) 返回頂部 返回列表
主站蜘蛛池模板: 久久性视频| 十八女下面流水不遮免费 | 国产高清一区二区三区 | 日日夜夜天天人人 | 99亚洲精品视频 | 麻豆视频免费网站 | 青青青激情视频在线最新 | 日产乱码卡1卡2卡三卡四在线 | 天天在线欧美精品免费看 | 欧美网址在线观看 | 精品日韩一区二区三区 | 国产黄色片在线免费观看 | 尹人香蕉久久99天天 | 九九热在线视频观看 | 亚洲女同在线 | 久久这里只有精品66 | 日韩黄a级成人毛片 | 国产爆操| 色综久久天天综合绕视看 | 人操人碰 | 国产欧美日本亚洲精品一4区 | 欧美影院在线 | 另类专区另类专区亚洲 | 91在线免费视频观看 | 国产精品视频免费视频 | 国产又色又爽又黄 | 亚洲区在线| 免费黄网页 | 久久久久久久久一级毛片 | 成年人黄视频在线观看 | 国产三级一区二区 | 日韩a在线看免费观看视频 日韩a在线观看 | 国产男女视频在线观看 | 久久久国产高清 | 国产日韩欧美综合在线 | 1024你懂的国产精品 | 五月婷婷俺来也 | 国内精品久久久久久久久久影视 | 久久这里只有精品国产 | 中文字幕在线观看91 | 亚洲免费a |