サーバーで使用されるSSDにおいて、データ消失は控えめに言っても大問題です。こうしたデータ消失を防ぐために、SSDはDWPD(Drive Writes Per Day)で評価され、各SSDがどの程度の書き込みに対応するかが購入者に通知されます。このアプローチはシンプルに見えますが、DWPD値はワークロードによる影響を受けます。にもかかわらず、現実には非常に多くのワークロードがあるのです。
2010年、電子デバイス技術合同協議会(JEDEC)は「Solid-State Drive (SSD) Endurance Workloads(SSDの耐久性評価用ワークロード)」(JESD219)を発行しました。その目的は、標準化されたワークロードを定義することでワークロードの不確実性に対処し、SSDメーカーがこのワークロードに基づいてDWPDを宣伝できるようにすることでした。これで問題は解決したのでしょうか。
答えは「はい」でもあり「いいえ」でもあります。1つの基準ワークロードがあると、すべてのSSDがこのワークロードを基準値として使用できるため、優れています。問題は、運用環境とSSDが過去15年間で進化したことです。この進化を理由に、耐久性評価用ワークロードはどのようなものであるべきかという疑問が投げかけられています。
2010年と現在のエンタープライズワークロードの比較
2010年には、ほとんどのエンタープライズストレージワークロードがHDDを中心に構築されていました。SSDはまだ登場したばかりで、オペレーティングシステムとアプリケーションはHDDへのアクセスを念頭に設計されていました。ワークロードは、書き込みの大部分が4KBであり、大きいものだと64KBの書き込みもありましたが数は多くはなかったことから、4KB未満の大量のアクセスに対処する必要がありました。
下図は、現在見られる一般的なワークロードから測定した内容をまとめたものです。ご覧のとおり、4KB未満のアクセスはありません。ワークロードに応じて、大半の書き込みが以前よりも分散されています。また、いくつかのワークロードでは、64KBを超えるアクセスが多いことが示されています。
ファイルシステムも、SSDへのアクセスに対応するために時間と共に変化してきました。現在最も一般的なファイルシステムのデフォルトのブロックサイズは4KBです。EXT4、XFS、BTRFSはすべて、デフォルトで4KBです。Linuxで新しいファイルシステムが作成されると、ブロックサイズはデフォルトで4KBになります。
IUサイズとWAF
昨年、私の同僚であるルカ・バートは、今日の問題を取り上げたブログを書きました。SSDのDRAMとNANDの比率はSSDの制約となりつつあるため、非常に大容量のデバイスでは、間接単位(IU)サイズを増やすことが検討されています。ルカは分析の一環として、いくつかのワークロードにわたって異なるIUサイズが書き込み増幅率(WAF)に与える影響を示しました。また、特に高いIUサイズを考慮に入れると、JESD219に不具合が生じることにも言及しました。
SSDとタイヤ?
同僚と耐久性評価用ワークロードについて話していたとき、同僚がタイヤをたとえに挙げたので、私は少し掘り下げてみることにしました。米国では、タイヤメーカーは、米国運輸省によって定義された基準タイヤに対する試験ループに基づいてタイヤを評価します。しかし、主に通常の走行に使用されるタイヤがレース場や未舗装路で使用された場合はどうなるでしょうか。タイヤの評価は一般的な走行条件に基づいているため、タイヤはそれほど長持ちしない可能性が高いでしょう。SSDについても、同様のアプローチを検討する必要があります。つまり、古い使用条件や二次的な使用条件ではなく、より代表的な運用条件に基づいてワークロードを定義する必要があります。
今後の取り組み
標準に取り組むうえで難しい点は、標準を更新すべきか、現状を維持すべきか、廃止すべきかを決定することです。JESD219は古くなり、「一般的なワークロード」を代表しなくなってきています。
しかし、JESD219には、その目的、つまり、業界がSSDの耐久性を測定するために使用可能な一般的なワークロードを定めるという点では、依然として価値があります。その点を考慮すると、取るべき最善策は規格の改善です。次のような対応により、このエンタープライズワークロードに関する標準を改善できるでしょう。
- 4KB未満のトランザクションがペイロードの全体分布に占める割合を大幅に減らす必要がある。
- 耐久性評価用ワークロードは、IUサイズを考慮し、それに基づいて拡大縮小する必要がある。
- 最大ペイロードサイズは64KB以上に拡大する必要がある。
これら3つの対応を実施することで、すべてのワークロードについて100%の精度を確保できるわけではありません。しかし、今日のワークロードをより正確に代表するように指標を更新する必要があることを考えると、こうした更新は今後15年(またはそれ以上)にわたってSSDの消費者と生産者に確実に利益をもたらすでしょう。
*サンパス・ラスナムとジョン・マロニーが本ブログ記事の執筆に協力してくれました