シーケンシャル読み取りおよび書き込みスループットや、ランダム読み取りおよび書き込みIOPSなどの従来の指標は、SSDを評価する際のベンチマークとして、多くの顧客システムベンダーが信頼している指標です。これらの指標は一部の比較においては有用ですが、私たちが今日運用しているワークロードの重要性を鑑みると、使用するストレージデバイスを別の角度から捉えることが求められます。このブログ記事では、特に特定のワークロードに関して、SSDパフォーマンスについて包括的に理解できるよう、さらなる指標について掘り下げます。
1ワットあたりのIOPS:効率性が重要
重要な指標ではあるものの見過ごされがちなのが、1ワットあたりのIOPSです。この指標では、SSDが1ワットの消費電力で実現できる入出力操作毎秒(IOPS)の数を測定します。エネルギー効率が最も重要な条件となるデータセンターでは、1ワットあたりのIOPSは非常に重要なファクターです。1ワットあたりのIOPSが高いということは、SSDが少ない電力消費でより高性能を達成できることを意味し、電力費用や冷却コストの面で大幅なコスト削減につながります。たとえば、グラフニューラルネットワーク(GNN)のトレーニングワークロードでは、IOPS/Wに関して、マイクロン9550 SSDは競合他社と比較して、ほぼ倍の消費電力効率を示しています。1
1テラバイトあたりのIOPS:ストレージ効率の最大化
他にも、重要な指標として1テラバイトあたりのIOPS(IOPS/TB)があります。この指標は、SSDをニアラインハードディスクと比較する際に特に重要です。ニアラインハードディスクは大容量ですが、パフォーマンスは低いストレージです。1テラバイトあたりのIOPSを評価することで、SSDがストレージ容量との相対的な数値においてどれだけ効率的にIOPSを処理できるかを知ることができます。これは、複数のハードディスクをより少ない数のSSDに統合することを検討している顧客にとって、非常に重要です。これにより、空間と運用コストの大幅な節減につながるからです。たとえば、マイクロン6500 ION SSDは、24TBのHDDよりも容量が28%大きいですが2、1テラバイトあたりのランダム読み取りIOPSは4,650倍という驚異的な数字を叩き出しています。
レイテンシーおよびサービス品質(QoS):安定性とスピード
レイテンシーとサービス品質(QoS)はSSDのパフォーマンスに大きな影響を与える重要な指標です。レイテンシーは、データリクエストが処理され戻されるまでにかかる時間を測定します。一方、QoSは、SSDのパフォーマンスの安定性を示す指標です。低いレイテンシーは、オンライン取引処理(OLTP)や高頻度のトレーディングなど、リアルタイムのデータ処理を必要とするアプリケーションに必要不可欠な条件です。QoSが高いということは、SSDのパフォーマンスが予測可能である、ということになります。これは、データベースや動画ストリーミングなど、パフォーマンスの安定性が最優先事項であるようなアプリケーションにとっては非常に重要になります。たとえば、マイクロン7500 SSDは、複合的でランダムなワークロードにおいて、99.9999%の確率で1ms未満のレイテンシーを実現します。これにより、安定性が高く、かつ迅速なデータ供給が可能になります。RocksDBのようにQoSが高い重要性を帯びるアプリケーションでは、マイクロン7500はクラス最高のパフォーマンスとQoSを達成しています。3
テラバイト書き込み:時間あたりのデータ容量
1日あたりのドライブ書き込み(DWPD)は、SSDが、その保証期間中を通して、1日あたり何回まで、その最大容量まで書き込むことができるかを測定する指標です。DWPDは、完全にランダムなワークロード(これは、書き込み効率(WAF)が低くなるため、ドライブにとって最悪の作業条件になります)を仮定して測定されます。4DWPDは、常に更新される一時的なデータによってワークロードを計算するために開発された指標で、これはすなわち、ドライブがその製品寿命期間中にわたって同じ速度で作業できるということを意味します。
ただし、ストレージにおいては、ワークロードは時間の経過にともなって変化することが多くあります。製品寿命がまだ多く残っている時期には、ドライブがフルに書き込まれるまでの時間は短くなりますが、時間がたつにつれて、アクセスと書き込みにかかる時間は長くなる傾向にあります。この場合、一定の使用条件を想定しているDWPDと、不規則な使用パターンとはうまく合致しません。DWPDは、高容量のドライブとっては良い指標とは言えません。なぜなら、特定のワークロードが、ドライブが対応できる書き込みの回数に著しく大きな影響を与えるからです。
ここで、マイクロン6500 IONの例を見てみましょう。容量は30.72TBで、DWPDのレーティングは0.3とすると、5年間で合計16,819テラバイトの書き込みに対応できるように思えます。しかし、顧客の多くはこうしたドライブをシーケンシャル書き込みワークロードに使用しているので、現実には、ドライブが対応可能なデータ書き込みは56,064テラバイトで、これはDWPDの評価の3倍以上に相当します。
重いログ書き込みのMySQL TempDBを保管するためなど、高容量なランダム書き込みドライブを必要としている場合、高容量のソリューションをマイクロンXTRのような耐久性に優れたソリューションと組み合わせている顧客もいます。このドライブは比較的小さい容量ですが(例:総容量は1TBまたは2TB)、100%の4Kランダムドライブ書き込みを1日あたり最大35回、5年間にわたって継続することができます。5
さらに、年間テラバイト書き込みを重視して、数多くのハードドライブをより少ない数の高容量SSDに統合する顧客も現れはじめています。この統合により、ドライブに対する書き込み圧力を測定するとともに、異なる総容量に対して正規化できるようになります。
フィルレート:再構築時間が重要
キャリアのはじめの頃、私はシステム管理者として、大きなデータベースに何年も時間を費やしていました。私が学んだ教訓は、ドライブは故障するということです。問題は、故障するかどうかではなく、いつ故障するかであり、その時に備える必要があるのです。1台のドライブが故障したくらいでは、悪夢のようなシナリオとは考えませんでした。最悪だったのは、複数のドライブが同時に故障したときでした。管理者は冗長性とフェイルオーバーについて計画を立てますが、ドライブが故障すると信頼性が低下することになります。2台のドライブが故障しても持ちこたえられますか? それが3台だったら? そこでフィルレートが重要になります。これは、SSDとハードディスクの再構築時間を比較するための指標です。RAID構成などの場合のように、データ復旧と再構築の時間がクリティカルであるような場合で特に重要になります。一般的にはSSDのほうがハードディスクよりもフィルレートが速いものですが、これは、故障が発生した場合にSSDのほうがより速やかに冗長性を再構築することができる、ということを意味します。これによりダウンタイムを削減し、システムのバックアップを確保し、迅速に運用できるようになります。たとえば、32.72TBのマイクロン6500 ION SSDは、シーケンシャル書き込み速度が毎秒5GBなので、たったの1.7時間でドライブの全書き込みを完了することができます。持続的転送速度が毎秒256MBである28TBのHDD6の場合だと、全書き込み完了までに29.4時間かかります。つまり、マイクロン6500 ION SSDは、容量がより大きいにもかかわらず、17.2倍のスピードで書き込みを完了できるのです。
まとめ
シーケンシャル読み取りおよび書き込みスループットやランダム読み取りおよび書き込みIOPSなどの従来の指標は重要ではあるものの、SSDのパフォーマンスの全体像を示すものではありません。1ワットあたりのIOPSや1テラバイトあたりのIOPS、レイテンシー、サービス品質、テラバイト書き込み、フィルレートなどの補足的な指標を利用できないか検討することによって、SSDの能力をさらに包括的に把握することが可能になります。こうした指標は個別のワークロードに対して適切なSSDを選択するうえで必要不可欠であり、それらによって最適なパフォーマンス、効率性、そして耐久性を確保することができます。
1 マイクロン9550 NVMe™ SSDおよびBaM技術解説書
3 マイクロン7500 NVMe™ SSD RocksDBパフォーマンス
4 このようなSSDの状況を解説しているJonmichael Handsによるブログ記事(https://ssdcentral.net/waf/)は、WAFの基礎知識として優れています。ぜひご覧ください。