Micron 6500 ION NVMe SSDの発売に伴い、最近、第4世代AMD EPYC™ 9554ベース(64コア)のSupermicroプラットフォーム上でWEKA™ 1を使用した興味深いスケーリング研究を行う機会がありました。
WEKAは、高性能コンピューティング(HPC)や人工知能(AI)など、さまざまなユースケースの大規模ファイルストレージ実装で一般的に使用されている、高性能なNVMe™ベースのsoftware defined storageソリューションです。
AMD EPYC 9004シリーズプロセッサーをベースとし、Micron DDR5メモリと400GbE対応PCIe® Gen5ネットワーキングを搭載した6台のSupermicro AS-1115CS-TNR2シングルソケットサーバーのクラスターでテストを行いました。このサーバーは、高性能なZen 4コアとシンプルなシングルソケット設計により、WEKAによるクラスター化ストレージシステムの設計に適しています。これらのサーバーは、ノードあたり最大10台のNVMe SSDをサポートし、テストクラスターでは合計60台のドライブを使用できます。
この6ノードのWEKAストレージクラスターは12台のクライアントに接続され、各クライアントがさまざまなIO深度(キューの深さ)で32ジョブのフレキシブル入出力テスター(fio )3を実行しました。
このクラスターでの最初のテストでは、36ドライブ(6ノードあたり6ドライブ)を使用することに重点を置きましたが、その後60ドライブ(6ノードあたり10ドライブ)に拡張しました。その結果は、すでに十分実証されていると言えるでしょう。
シーケンシャルパフォーマンス
1MBのシーケンシャル読み取りワークロードでは、1ノードあたり6ドライブから10ドライブにすることで、読み取りは約164GB/秒から229GB/秒に向上しました。この結果は、シーケンシャル読み取りが約40%向上したことを示しています。128KBのシーケンシャル読み出しワークロードでは、6ドライブ構成のほぼ2倍のパフォーマンスが観測されました。
シーケンシャルワークロードの書き込みパフォーマンスは最大106GB/秒程度ですが、これはWEKAバックエンドの計算によって制限されます。
4KBランダムパフォーマンス
また、fioで小さなブロックのランダムIOテスト(4コーナー、4KB)を実施したところ、入出力操作毎秒(IOPs)が高いことに加え、10ドライブ構成では各操作でレイテンシーが低いことが確認されました。100%ランダム読み取りワークロードでは、10ドライブ構成では、平均読み取りレイテンシー0.59ミリ秒で1600万IOPs以上を達成することができました。また、100%ランダム書き込みワークロードでは、平均書き込みレイテンシー3.19ミリ秒で310万IOPs以上を達成しました。
まとめ
ノードあたり6台のドライブから10台のドライブに移行するにつれて、WEKAはほぼ直線的なパフォーマンススケーリングを提供することがわかりました。この結果は、コスト競争力のある30TBのMicron 6500 NVMe SSDを使用することで、第4世代AMD EPYC 9004シリーズプロセッサー上のWEKAの実装を容易に拡大できることを示しています。
- Wekaについての詳細は、https://www.weka.io/をご覧ください。
- Supermicro AS-115CS-TNSプラットフォームについての詳細は、https://www.supermicro.com/en/products/system/clouddc/1u/as-1115cs-tnrをご覧ください。
- FIOについての詳細は、https://fio.readthedocs.io/en/latest/fio_doc.htmlをご覧ください。