感謝祭の時期になると、私たちは人生の中で感謝すべきことに思いを巡らせるものです。家族、友人、キャリア、そして成長などに感謝の気持ちを抱く時でもあります。
今年の感謝祭は、ストレージの分野で培った自分のキャリアと、キャリアを歩む中で起こった重要なテクノロジーの進歩のすべてを振り返ってみようと思います。現状に課題があって、急速な進化が起こり、そして最終的には仕事に最適な製品とテクノロジーが勝つ、という単純な物語です。これは生物の進化と似ており、そのペースがはるかに速いだけです。
物語は1980年代初期に始まります。私が初めて携わったストレージ製品はIBM Model 3380で、コントローラとストレージメディアを組み合わせたダイレクトアクセスストレージデバイス(DASD)でした。1985年の時点でこの製品は、それぞれ重さ約77キログラムの2つのヘッドディスクアセンブリ(HDA)に5.04GBのストレージを備え、1スピンドルあたり2つの独立アクチュエーターが使われていました(アクチュエーター1個につき1.26GB)。データスループットは3MB/s、平均シーク時間は16ミリ秒でした。14インチディスクの重量に耐えるため、トラック用に設計された頑丈なボールベアリングがスピンドルに使用されていました。
将来のモデルにおいて容量の増加を考えると、主な懸案事項はパフォーマンスでした。エンジニアたちは、アクチュエーター1個で対応できるファイルシステムの容量について意見を交わしました。当時、一部のエンジニアは、アクチュエーターあたり1GBが限界だろうと感じていました。スケーリングを実現するには、何かを変える必要がありました。実際には、この数字以上の結果が得られることとなりました。
1990年代になると、大容量の高価な単一ディスク(SLED)に代わって、小容量の安価な(独立)ディスクの冗長アレイ(RAID)が出現しました。RAIDによって、直径14インチの大型ディスクスタック2つで構成されるラックが、3.5インチの標準的なハードディスクドライブ(HDD)のアレイに置き換えられました。この変化は次に挙げる改善につながり、過去十年にわたるパフォーマンス上の懸案事項が払拭されました。
- ラック内のストレージの体積密度が大幅に向上
- 故障したドライブをその場で再構築するための冗長性により、信頼性が向上
- ギガバイトあたりのアクチュエーター数の増加(ディスク直径が小さくなったことによる)
- アクチュエーターの小型・軽量化によるシークパフォーマンスの高速化
- 多数のドライブを使用したデータの並行ストライピングによる帯域幅の拡大
その後、1990年代後期から2000年代初期にかけて、HDDテクノロジーの進歩により面密度とドライブ容量は飛躍的に増加し、ピーク時には1年で倍増しました。この成功により、パフォーマンスのさらなる向上が新たな目標となりました。帯域幅を拡張してシーク時間を短縮するため、10,000RPM(毎分回転数)のさらに小さいディスク(65mm)のスタックが導入され、その後、15,000RPMのいちだんと小さいディスク(48mm)が登場しました。
しかし、このようなパフォーマンスの強化とともに、ビットあたりのコストも従来の基準値と比べて上昇しました。2000年代中盤には、回転速度10,000RPMの2.5インチHDDがエンタープライズ向けストレージシステムの標準になりました。2000年代後期になると、ニアラインまたは大容量と呼ばれる、3.5インチディスクを使用した新しいクラスのHDDが登場しました。このディスクは当初、1スピンドルあたり6枚のプラッターを備え、回転速度は5,400RPMでした。ヘリウム密封テクノロジーの出現により、最新のHDDは最大11枚のプラッターに対応し、回転速度は7,200RPMに達します。
2007年ごろには、エンタープライズデータストレージ用のNANDフラッシュテクノロジーの活用が模索され始めました。これらのソリッドステートディスク(SSD)は、機械式ディスクの代わりに不揮発性メモリチップを採用しているため、HDDより高速ですが、コストが高くなります。SSDは、HDDアレイにおける書き込みバッファなど、ある種の重要なストレージシナリオで求められる、高速アクセスおよび極度の低レイテンシーというニーズを満たしました。2010年、私が発売に携わった初のエンタープライズクラスSSDは、HGSTとIntelの共同開発による100GB SLC SASインターフェイスSSDでした。
2010年代の中盤から後半になると、SSDのビットあたりのコストが下がり、SSDの高速性を活かすようシステムアーキテクチャーとソフトウェアが進化した結果、高性能が求められるユースケースでは、15,000RPMのHDD、続いて10,000RPMのHDDに代わってSSDが使用されるようになりました。エンタープライズHDDの主流は、ニアライン、3.5インチ、7,200RPMのドライブに移行し、今ではエンタープライズデータの85~90%がこのタイプのドライブで保存されています。ただし高性能アプリケーションに関しては、SSDに主流の座を譲っています。
ストレージテクノロジーは進化し続けています。NANDフラッシュはコストが下がりつつありますが、HDDは磁気スケールの限界から、面密度の向上に関して課題を抱えており、エネルギーアシスト記録や熱アシスト記録といった革新的なテクノロジーが必要になっています。また、ドライブの機械構造による制約からHDDのパフォーマンスも向上していません。その一方で、生成AIおよびGPUによるストレージワークロードの需要が増加しており、より高度なパフォーマンスが求められています。ストレージソフトウェアが進歩し、HDDのテラバイトあたりのパフォーマンス低下に対処できるようになっていますが、その能力には限界があります。HDDサプライヤー各社はパフォーマンス向上のため、スピンドルあたりのアクチュエーター数を増やすなど、旧来のテクノロジーを再検討しています。
相対的なコストの低下とパフォーマンスニーズの増大というトレンドを背景に、ストレージアレイにおいて超大容量のSSDを活用する方法が注目されています。SLEDからRAIDへの移行と同じように、ストレージ密度を高めることで、、ドライブのコストだけでなくシステム全体のコストを削減できます。大容量SSDを使用して構築されたシステムは、エネルギー効率にも優れており、1ワットあたりのスループットはHDDと比べて最大7.5倍、1ワットあたりの容量は最大3倍です。
たとえば、最近発表されたMicron 6550 ION SSDは、市販されている60TBデータセンター向けSSDの中で、比類ない高速性とエネルギー効率を実現しています。データセンターでさらに多くのGPUが使用されるようになり、電力の制約が問題になりつつある現在、大容量SSDシステムは、コスト面でもエネルギー面でも、HDDシステムと比べてより効率的です。2020年代が終わる頃には、標準的な2RUシャーシに幅40でフィットし、ラック1台で100PB以上を提供する250TB SSD、さらには500TB SSDが実現する可能性があります。
ストレージは、常に進化し続けています。容量、コスト、パフォーマンス、電力に関する顧客のニーズに対応するために、新しいデザイン、アーキテクチャー、テクノロジーが常に現れています。ストリーミングや検索など、中程度のパフォーマンスで十分な長期データ保存に関しては、コスト面からHDDが今後も主流となるでしょう。これに対し、大容量SSDは今後ますます普及し、 データセンターのストレージはHDDからSSDに置き換えられていくでしょう。
テクノロジーが進化しただけでなく、その変革の一端を担えたことを誇りに思います。自分のキャリアを通して、ラック1台あたり5GBから100PBへ、3MB/sから行く行くは1TB/sへと進化する様子を垣間見てきました。この前進を後押しするのは、ますます増大するデータ保存に対するニーズです。長年にわたり共に働いた多くの優秀な人々のおかげで、こうしたイノベーションを実現することができたのです。物語はこれからも続きます。