マイクロンでの私の職務の醍醐味のひとつは、顧客と協働することで何に苦悩しているのかを理解することであり、最終的にはその課題を解決するために協力し、共にイノベーションを行う機会を見つけることです。データセンターの顧客は、膨大かつ急速に変化するデータセットと同時進行する(マルチテナント/ホスト)ワークロードを管理しており、そのすべてをビジネス価値に変える必要があります。このようなワークロードは、インフラストラクチャに大きな負荷をかけ、それはマイクロンのユニークなイノベーションの原動力となります。
Micron 7450 NVMe SSDに関する前回のブログでは、マイクロンは業界全体と密接な関係を築いていることから、データセンターのワークロードの課題やレイテンシーなどの要件を理解していると書きました。このブログでは、Micron 7450 NVMe SSDがどのように一貫した低レイテンシーでメリットをもたらすかを詳しく見ていきます。まず、最近のデータセンターのイノベーションの背景に何があり、マイクロンがどのようにそれを支えているかをお話しましょう。
データセンターストレージイノベーションの4つの原動力
マイクロンがストレージのイノベーションを推進している主な分野は以下の4つです。
- PCIeとNVMeへの移行の簡素化:私が話をしている顧客のほとんどは、すでに何らかの形でPCIe/NVMeを導入しています。NVMe SSDは、異なるフォームファクタ(ブートまたはメインデータストレージ用のM.2、メインデータストレージ用のE1.S、配備システム用のU.3)と耐久性レーティング(読み取り中心耐久性と混合用途耐久性)で、ブート、メインデータストレージ、アクセラレーションに対応しています。1
- ストレージ密度:(E1.S SSDの7.68TBのように、小型フォームファクタのSSD容量を増やすことで)ストレージ密度を高めると、データセンターのスペース利用が向上し、効率が上がります。2
- セキュリティ:データ量とその多様性が増すにつれ、業界では攻撃の数と巧妙さが増していることがわかっています。管理者はセキュリティ態勢の強化を求めていることから、SSDのハードウェア暗号化の採用が増加しており、これにはマイクロンのセキュリティイノベーションの利用が含まれることが多いのです3。
- 一貫した低レイテンシー:最大手のハイパースケーラーから新興のデータセンター事業者に至るまで、複数のワークロードを単一システム上でホスティングすること(仮想化またはコンテナ化)4は標準的な慣行となっています。これらのワークロードは、毎秒数百万のトランザクションの生成が可能で、その多くが同じ物理ストレージを共有しています。マイクロンは、その需要に応えるために7450 NVMe SSDを設計しました。Micron 7450は、こうした何百万ものトランザクションを管理するSSDであり、優れたサービス品質(QoS)と呼ばれることの多い、一貫した低レイテンシーを実現します。5
この4つの分野すべてが重要ですが、ここでは4つ目に焦点を当てたいと思います。一貫した低レイテンシーについて報じられることはあまりなく、SSDベンダーの多くは、このことについてあまり話題にしたがりません。
しかし、私たちにとっては重要です。
レイテンシーの影響を受けやすいワークロード
多くのデータセンターアプリケーションはリアルタイムで運用され、迅速かつ一貫して配信されなければならないデータを使用し、処理し、応答していることを忘れてはなりません。データ配信の遅延や中断は、ワークロードの多くに悪影響を及ぼす可能性があります。
レイテンシーの影響を受けやすいワークロードの例のひとつに、ライブストリーミングがあります。ライブイベントをストリーミングする際の最高のユーザー体験は、一貫した低レイテンシーストリームを提供することにかかっています。それができなければ、ストリームの品質に悪影響を与えかねず、ストリームが遅れたり、バッファリング遅延が発生したり、フレームが失われたりする可能性があります。ライブスポーツを例に考えてみてください ストリーミングが低レイテンシーであれば、ストリーミングされたイベントをよりリアルに、まるでその場にいるかのように感じられます6。レイテンシーの影響を受けやすいデータセンターワークロードは、ライブストリーミングだけではありません。より「裏方的な」ワークロードもあります。そうしたワークロードも、高速で一貫性のあるデータ配信に依存しています。
リアルタイムアナリティクスとは、データからインサイトを引き出し、より効果的でタイムリーな意思決定を行うことであり、データの遅延はその効果を制限してしまいかねません。データが複数のソースから収集される場合、アナリティクスは、それが1台のサーバーであれラックであれ、最も遅いソースを待たなければならないかもしれません。ストレージが迅速かつ一貫した応答をすると、待ち時間は最小限に抑えられ、インサイトはより速やかに提供されます。現代のデータセンターは、ベアメタルサーバー上で実行される単一のワークロードからコンテナ化や仮想化の導入へと移行しています。そこでは、1台のサーバーが複数のアプリケーションとワークロードをホストし、同じ物理サーバーリソースを共有しています。
このようなクラウドや仮想化(マルチテナント)ワークロードも、一貫した低レイテンシーに依存しています。これらは、高度に並列なマルチテナント型ワークロードであり、同じ基礎的な物理リソース(ストレージ、CPU、メモリ、ネットワーク)を共有しています。ストレージが迅速に、一貫して応答することで、より予測可能なパフォーマンスパターンを提供しながら、CPUリソースの待機時間が短縮され、より多くのワークロードをホストしたり、より多くの仮想マシンをサポートしたりすることが可能になります。ストレージのスループットの重要性は明らかですが、データセンターがパフォーマンス目標とサービスレベルの合意を守るには、高いスループットを維持しながら低速で一貫したアクセスを行うことが不可欠です。
レイテンシーの基礎と影響
サービス品質(QoS)とは、SSDにおけるアプリケーションのレイテンシーの一貫性を表す指標です。QoSの測定には、以下のしきい値、(IOの)割合、IOタイプという3つの重要な要素があります。
- しきい値:各アクセスに必要な応答時間(レイテンシー、ミリ秒単位で測定されることが多い)のことです。
- 割合:全アクセスのうち、しきい値以下のアクセスの割合を指します。これは、99.9999%のように、全IOのパーセンテージで表され、
多くの場合、99.99%は「フォーナイン」、99.9999%は「シックスナイン」のように表示されます。 - IOタイプ:測定されるIOデータタイプです。IOは読み取り、書き込み、あるいはその2つの組み合わせであることもあります。
- データセンター用SSDの優れたQoSとは、ストレージアクセス操作の多くの割合がしきい値内で一貫して発生していることを意味します。
優れたQoSはデータセンターのワークロードに不可欠
データセンターやクラウドのワークロードには、高速で一貫性のある読み取り性能に対する飽くなき需要があります。たとえば、2021年のブラックフライデーでは、8800万人の購入者が89億ドル(総額)をオンラインショッピングで使い、アマゾンはその17.7%を占めました7。このように、オンラインで買い物をする人々は、迅速かつ一貫性のあるトランザクションの完了(優れたQoS)を期待しています。誰もが速やかに次の「やること」リストに取り掛かりたいのです。
Micron 7450 SSDは、業界をリードする99.9999%の混合ワークロードの読み取りレイテンシーを2ミリ秒(ms)未満に抑えながら、数10万IOPSを実現することで、QoSのニーズに対応します8。読み取り中心のワークロードでは、最大100万IOPSの実現が可能です(完全な性能情報は、Micron 7450 SSD Product Briefをご覧ください)。後ほどご説明しますが、この低レイテンシーによって、ラックスケールのアプリケーションは、現在利用可能な他の多くのドライブを使用する場合より多くの仕事をこなすことができます。
Micron 7450 NVMe SSDは優れたQoSを実現
こうしたアプリケーションの要求を満たすのは容易ではありません。複雑でスケーラブルな環境で、一貫した低レイテンシーのワークロードを達成するという現実的な課題があるからです。この課題を解決することは、Micron 7450 NVMe SSDの開発において大きな焦点でした。
99.9999%の混合型のランダムワークロードにおけるSSD読み取りレイテンシーは2ミリ秒未満
素晴らしいQoSとはどのようなものか見てみましょう。以下の図1は、混合ワークロード(転送サイズ4KB、読み込み90%と書き込み10%の100%ランダム配置)をMicron 7450 SSDで実行し、読み込みレイテンシーをシックスナイン(99.9999%)にしたものです。図2は、書き込み部分を30%に増やした場合の同様の結果を示しています。図1と2が混合ワークロードでの読み取りレイテンシーを示しているのは、書き込みレイテンシーはオペレーティングシステム、ファイルシステム、あるいはアプリケーションレイヤーで書き込みの連結、分岐、およびキャッシュによって影響を受ける可能性があるためです(SNIAプレゼンテーションのセクション4で言及されています)。
これは素晴らしい成果です。過去の多くのSSDとは異なり、Micron 7450 SSDは、混合型のランダムなワークロードや一般的なキュー深度(QD)において、99.9999%のレイテンシーで2ミリ秒未満の読み取りレイテンシーを実現し、その状態を維持しています9。マイクロンのラボで行ったテストによると、この一貫性のある低レイテンシーは、Microsoft SQL Server、Oracle、MySQL、RocksDB(クラウドワークロードの代表格)、Cassandra、Aerospikeなどのデータベースのパフォーマンスを向上させることができます。
優れたQoSで何が起こるか
データセンターのSSDが低いしきい値で優れたQoSを示したとき、その結果は明らかで、より多くの読み取り要求がしきい値を下回ることを意味します。
アプリケーションレベルでのメリット
優れたQoSのアプリケーションレベルでのメリットを示すため、Micron 7450 NVMe SSDと他の主流のNVMe SSDを比較しました。私たちは、パフォーマンス重視のキーバリューストアであるRocksDB(視聴履歴の保存やスパム検出など、レイテンシーの影響を受けやすいユーザー向けのアプリケーションでよく使用されている)を使用しました。一般的なアプリケーション配信のしきい値を設定したとき、Micron 7450 SSDのパフォーマンスは95%向上することがわかりました。
ラックスケールのメリット
ラックスケールの優れたQoSを見ると、そのメリットは、SSD1台のQoSデータを見るよりもはるかに明らかです。では、どの程度優れているのでしょうか? たとえば、サーバーのラックを見たとき、99.9999%(シックスナイン)と99%(ツーナイン)の間にそれほどの違いがあるのでしょうか? あるのです。その影響を計算することもできます。
まず、E1.S Micron 7450 NVMe SSDをラックいっぱいに搭載した場合の読み取りIOPS数を見てみましょう。次に、このIOPSのうち、2ミリ秒のしきい値の範囲外にあるIOPS数を、異なる「ナイン」で見ていきます。
1Uサーバー10に32台のSSDを取り付け、ラックに38台のサーバーを搭載します11。E1.S Micron 7450 NVMe SSDは、100万の4Kランダム読み取りIOPSを生成できます。このSSDを1サーバーあたり32台搭載し、1ラックあたり38台のサーバーに負荷をかけた場合、最大IOPS数は1サーバーあたり約32,000,000(または1ラックあたり約1,200,000,000、つまりSSDあたり100万IOPS×サーバーあたり32台のSSD×ラックあたり38台のサーバー)となることが想定されます。
99%(ツーナイン)2ミリ秒のQoS読み取りレイテンシーでラックスケールの議論を始めると、サーバーのラックには、2ミリ秒のしきい値から外れた読み取りが約1200万件表示されます(読み取りの1%が2ミリ秒から外れます)。しかし、シックスナイン(99.9999%)の場合、2ミリ秒のしきい値から外れた読み取りの平均は1,200近くになり、大幅に減少します。
SSDあたりの読み取りIOPS | サーバーあたりのSSD | ラックあたりのサーバー | 2ミリ秒QoS %バリュー | 2ミリ秒のしきい値から外れた読み取り |
---|---|---|---|---|
100万 | 32 | 38 | 99% (ツーナイン) |
12,000,000 |
99.9999% (シックスナイン) |
1,200 |
ラックスケールはかなりの違いがあります。QoSが2ミリ秒のしきい値の場合、しきい値外の読み取りは1,200万(ツーナイン)なのか、それとも1,200(シックスナイン)なのでしょうか。これは理論上の一例であり、実際のワークロードレベルにはさまざまな違いがあります。しかし、一貫した低レイテンシーは、ほとんどのデータセンターのワークロードに恩恵をもたらし、特にレイテンシーから影響を受けやすいワークロードには不可欠です。
Micron 7450 SSDは、これらのニーズに真正面から対応し、一貫した低レイテンシーを実現する
マイクロンは、今日、世界で最先端の量産NANDである176層NANDを7450 SSDに搭載し、先進的なコントローラとファームウェアを組み合わせて、優れた成果を実現しました12。
一方で最大の強みは、こうした革新的テクノロジーをSSDに迅速に統合することのできるマイクロンの能力であり、それが可能であるからこそ、より多くのユーザーがこのような革新的テクノロジーに迅速にアクセスすることができます。
詳細を確認するには…
Micron 7450 SSDの性能は、さまざまなデータセンターのワークロードに優れたQoSを提供するよう設計されており、複雑なワークロードに対して大きなメリットがあることがわかります。
詳細については、7450製品ページをご覧ください。また、営業担当者にお問い合わせいただければ、お客様のラボにお届けします。その後、本格稼働をご検討ください。
1. Micron 7450 SSDは、M.2、E1.S、およびU.3フォームファクタで、主に読み取りのデザインと混合ユースデザインで利用可能です。これにより、単一のSSDアーキテクチャーでブート、メインデータストレージ、アクセラレーション(キャッシュ)を満たすことができ、システム設計が簡素化されます。
2. SSDの容量が増えるということは、同じ量のデータを保存するために必要なSSDの数が減るということです。同じフォームファクタのSSDの数が少なければ、SSDを搭載するサーバーの数も少なくなり、サーバーを設置するスペースも少なくて済みます。E1.Sフォームファクタについての詳細は、https://www.snia.org/forums/cmsi/knowledge/formfactorsをご覧ください。注:すべての容量表記について、フォーマット容量は表記されているより少なくなります。
3. あらゆる状況で絶対的なセキュリティを提供できるハードウェア、ソフトウェア、システムは存在しません。マイクロンは、セキュリティ機能を搭載した製品の場合を含め、マイクロン製品の使用によって生じたデータの喪失、盗難、破損について責任を負いません。
4. https://www.gartner.com/en/information-technology/glossary/virtualization for additional detailsをご覧ください。
5. https://www.snia.org/educational-library/storage-quality-service-enterprise-workloads-2014 for additional background on applying qualify of service to storageをご覧ください。
6. 詳細については、こちらをご覧ください https://www.dacast.com/blog/best-low-latency-video-streaming-solution/#:~:text=Low%20latency%20streaming%20is%20especially%20important%20for%20certain,thing%20to%20attending%20your%20event%20in%20real%20life
7. https://www.emarketer.com/content/black-friday-2021-illustrates-changing-consumer-behaviors
8. 2ミリ秒のレイテンシーは、一般的なデータセンターのワークロードのレイテンシー要件です。
Microsoftは、Azure SQL DatabaseとAzure SQL Managed Instancesについて、「...ストレージ層からの高速の応答(平均1~2ミリ秒)を必要とするワークロードは、Business Critical層を使用する必要がある」と指摘しています。https://docs.microsoft.com/en-us/azure/azure-sql/database/service-tier-business-critical?view=azuresql
IBMも、以下の高可用性要件の中で、2ミリ秒のハートビート要件について言及しています:https://www.ibm.com/docs/en/qsip/7.4?topic=planning-link-bandwidth-latency
9. マイクロンエンジニアリングが収集したワークロードデータでは、4KB、100%ランダム、70%読み取りのワークロードではキュー深度は32までとなります。
10. サーバー例は、https://www.supermicro.com/en/products/system/1U/1029/SSG-1029P-NES32R.cfmをご覧ください。
11. 一般的なサーバーラックには、最大42台の1Uサーバーの収納が可能です(https://www.tripplite.com/42u-smartrack-standard-depth-server-rack-enclosure-cabinet-doors-side-panels~SR42UB)。この他に、スイッチやその他のデバイスを収納するラックスペースが追加されます。
12. 同様の用途で使用するNVMe SSDは、本文書の発行時点で発売されていました。Micron 7450 SSDは、業界をリードするMicron 176層NANDと組み合わせて、より幅広いフォームファクタを提供します。