デザインツール
アプリケーション

Micron DDR5 128GBと第5世代AMD EPYCTMプロセッサーでデータセンターのパフォーマンスを向上

スダルシャン・S・ヴァジクダイ、サルタック・タッカー、ムクティカンタ・サー | 2024年11月

要点


Micron DDR5 128GBメモリと128コアの第5世代AMD EPYCTM CPUTMは、AIおよびデータベースインフラストラクチャの強力なソリューションとなります。このソリューションは、AI、機械学習、データ解析、IMDBアプリケーションに特有の複雑化した大規模なモデルサイズと膨大なデータセットの計算を効果的に処理します。

SVMが
1.3倍
AI/MLサポートベクターマシン(SVM)のパフォーマンスが1.3倍向上します。1、2

Micron® 128GB RDIMMのメモリクロック速度の向上と第5世代AMD EPYC™プロセッサーのコア数の増加により、帯域幅の使用率が1.3倍に増加します。1

IMDB REDISが
1.2倍
IMDB Redisのパフォーマンスが1.2倍向上し、set対getの比率が1対10になります。1、2

30%
平均レイテンシーが30%向上し、p99レイテンシーが60%向上します。1、2

SAP SD
ユーザー数201,000人
SAP Sales and Distribution(SAP SD)のベンチマークが向上します。メモリ容量が30%増加し、クロックが30%高速化するため、SAP SDのスコアは以前の6ソケットのパフォーマンススコアを上回ります。


1
第5世代AMD EPYC™プロセッサー(コードネーム「Turin」)とMicron® 128GB DDR5 RDIMMを組み合わせた場合。
2 Micron® 96GB DDR5 RDIMMと第4世代AMD EPYC™プロセッサー(96コア、コードネーム「Genoa」)の組み合わせと比較した場合。


最新のデータセンターでは、エンタープライズ人工知能(AI)や機械学習(ML)の取り組みをサポートするさまざまなワークロードを実行する必要があるため、大容量のメモリと高い処理能力が求められています。Micron® DDR5 128GB RDIMMを第5世代AMD EPYC™プロセッサーと組み合わせることで、大規模なクラウドベースのインフラストラクチャの駆動や要求の厳しいビジネスアプリケーションのホスティングなど、データセンターで実行されるさまざまなサーバーワークロードのパフォーマンスと能力が向上します。

このブログでは、AI/MLサポートベクターマシン(SVM)、Redisメモリ内データベース(IMDB)、SAP SDのベンチマークテストの結果を紹介します。比較したハードウェアのセットアップは以下のとおりです。

  • Micron DDR5 128GB DIMMと第5世代AMD EPYC™プロセッサー(コードネーム「Turin」)の組み合わせ
  • Micron DDR5 96GB DIMMと第4世代AMD EPYC™プロセッサー(コードネーム「Genoa」)の組み合わせ

テストの結果、Micron DDR5 RDIMMは容量が大きく(128GB)帯域幅(最大8000MT/秒)が高いことから、SVM、SAP SD、Redis IMDBのパフォーマンスが向上することが示されました。

ハードウェアとシステムのセットアップ


システムアーキテクチャーの詳細は次の表の通りです。このブログでは、2つのシステム(システムAおよびシステムBと表記)を比較しています。システムAは第4世代AMD EPYCプロセッサー(96コア)とMicron 96GB DDR5 DIMMで構成され、システムBでは第5世代AMD EPYCプロセッサー(128コア)とMicron 128GB DDR5 DIMMを組み合わせています。両システムともコア構成あたり12GBをサポートしており、128コアCPUは12メモリチャネルで128GB、96コアCPUは12メモリチャネルで96GBです。

 

  システムA システムB
ハードウェア 第4世代AMD EPYC™プロセッサー(コードネーム「Genoa」) 第5世代AMD EPYC™プロセッサー(コードネーム「Turin」)
メモリ

Micron 96GB DDR5:4800MT/秒

デュアルランク、12チャネル

Micron 128GB DDR5:6400MT/秒

デュアルランク、12チャネル

CPU デュアルソケットAMD EPYC 9654(96コア) デュアルソケットAMD EPYC(128コア)
ストレージ(SVM用) Micron 9400 8TB(3) Micron 9400 8TB(3)


AI/MLサポートベクターマシン(SVM)


SVMは機械学習アルゴリズムの一種で、クラウドで展開される多くのデータサイエンスサービスのデータセットの前処理によく使用されています。今回のテストでは、Intel Hi-BenchアーキテクチャーとSparkMLエンジンを使用し、2TBのデータセットのデータ処理を行いました。

実行時間が短縮

SVMの実行時間は、システムBではシステムAより30%短縮されました。これは主に、システムBでは128GBのメモリモジュールにより大容量と高帯域幅が実現していること、プロセッサーのコア数が多いこと、帯域幅が効果的に使用されたことが要因です。

システムA(96GB DDR5)とシステムB(128GB DDR5)の実行時間


帯域幅使用率が向上

システムBのSVMの帯域幅使用率はシステムAの1.3倍という結果が得られました。これは、メモリクロックがより高速(システムAの4800MT/秒と比べてシステムBは6400MT/秒)であることと、128コアを搭載した第5世代AMD EPYCプロセッサーによってZen5コアの数が増えていることが主な要因です。1
 

システムA(96GB DDR5)とシステムB(128GB DDR5)のメモリ帯域幅使用率


システムBの容量が大きい(システムAの96GBに比べて128GB)ことから、SVMはメモリにいちだんと多くのデータを保存でき、ストレージの入出力が最小限に抑えられます。どちらの構成でも、コアあたりのメモリ容量は一定(12GB/コア)に保ちました。このアプローチにより、ベースライン構成(システムA)に対するコンピューティング容量の増加とクロック速度(メモリ)の増加の影響を分離することができました。

Redis


Redisは、低レイテンシーを必要とするアプリケーションのデータの保存とアクセスに使用される、高速なメモリ内データベース(IMBD)です。Memtierは、マルチスレッドとマルチクライアントの実行モデルを模倣して、多数のset:getオペレーションでRedisを評価します。
 

システムA(96GB DDR5)とシステムB(128GB DDR5)のスループットのパフォーマンス


システムB(128GB、128コア)でRedisを実行したところ、速度が1.2倍向上しました2。さらに、これと同じ組み合わせで、平均レイテンシーが30%、p99レイテンシーが60%向上しました。旧世代のAMD EPYCプロセッサーと比較して、第5世代の128コアのようにコア数が多いほど、Micron 128GB DIMMの大容量や高帯域幅といった特長がより活かされることが明らかになりました。コアが増えることでスループットが向上し、エンタープライズデータセンターはより多くのユーザーに効果的にサービスを提供できるようになります。

システムA(96GB DDR5)とシステムB(128GB DDR5)の平均READおよびp99レイテンシー


SAP Sales and Distribution(SAP SD)


Systems Application and Products(SAP)は、エンタープライズリソース計画(ERP)で広く使用されているソフトウェアスイートであり、SAPエコシステムの一部として複数のサブコンポーネントで構成されています。SAP Sales and Distribution(SAP SD)のすべてのオペレーションとプロセスを含むコンポーネントを、Micron DDR5 128GB RDIMMと第5世代AMD EPYCプロセッサーを搭載したDell PowerEdge R6725サーバーで評価したところ、2ソケットシステムでのSAP SDベンチマークで201,000ユーザーという世界新記録のパフォーマンスを達成しました。これは、6ソケットの最高スコアを上回る記録です。このベンチマークユーザー数の多さは、マイクロンのメモリと第5世代AMD EPYCプロセッサーを搭載したDell PowerEdgeサーバーをデータベースのユースケースに使用した場合に、パフォーマンスが向上することを示しています。詳しくは、Dellのブログをご覧ください。


データセンターにおけるAI


データセンターインフラストラクチャでAI、機械学習、データ解析、IMDBアプリケーションに特徴的な複雑な計算、大規模なモデルサイズ、膨大なデータセットを効果的に処理するためには、高メモリ帯域幅や低レイテンシーだけでなく、大容量メモリが鍵となります。ワークロードの結果からもわかるように、このような環境でMicron DDR5 128GBメモリモジュールと第5世代AMD EPYCプロセッサーを組み合わせると、強力なソリューションが完成します。

エンタープライズ、AIインフラストラクチャ、HPC環境のアップグレードをお考えで、最適なDDR5構成をお探しの場合は、マイクロンのセールスネットワークまでお問い合わせください。

Fellow of Systems Design Engineering

Sudharshan Vazhkudai

Dr. Sudharshan S. Vazhkudai is a fellow of systems design engineering at Micron Technology. Here he established the Data Center & Client Workload Engineering team, which brings an end-to-end systems perspective in understanding how deep-memory hierarchy is used to create modern system architectures optimized for workloads. Prior to this, for over two decades, he worked at Oak Ridge National Lab, building data center solutions. Dr. Vazhkudai holds a Ph.D. in computer science from the University of Mississippi and has also served as a joint faculty at the University of Tennessee.

Sr. Systems Performance Engineer

Sarthak Thakkar

Sarthak Thakkar is a senior systems performance engineer at Micron, focusing on bottleneck analysis and fine-tuning of data center workloads for emerging memory technologies (high-capacity DIMMs, CXL and enterprise RDIMMs). His area of focus has been database architectures and HPC kernels.

Staff Systems Design Engineer

Muktikanta Sa

Dr. Muktikanta Sa is a staff systems design engineer at Micron Technology. He is focusing on system performance and workload engineering on high-capacity DIMMs, especially in Redis in-memory database and e-commerce spaces. Dr. Sa holds a Ph.D. in computer science and engineering from the Indian Institute of Technology, Hyderabad.