データの速度

高速データの黄金の可能性

データの仕分けとは一体どのようなものなのでしょうか?マイクロンのビジネス開発マネージャーであるEric Caward氏がデータの集合と言われて想像するのは、土や岩の一つひとつが情報を含んでいるような山です。一見、この山はビッグデータの小山のように見えるかもしれません。一部の人には、ただの土の山のような可能性です。しかし、精通した採掘者は、山によっては金の断片が含まれていることを知っています。

データの山では、これらの断片が、さらに深い洞察を得るための貴重な情報を含んでいます。各家庭の室内温度の計測結果を集めたデータは、一見、興味深いビッグデータには見えないかもしれませんが、ここに含まれる傾向には、信じられないほど有用性があることもあります。一日の中の特定の時間に暑くなりすぎる傾向があるとすれば、その傾向を追跡することで、住宅所有者が暖房装置を最適化してエネルギー消費にかかる費用を削減することができるかもしれません。

金が遊離した物質に積もり、それを抽出するには水を必要とする砂鉱床採掘において、採掘者は金を見つけるために砂利を選鉱鍋で洗うようになりました。しかし、これは簡単な技法である一方で、(ビッグデータの山から求める一つの情報を見つけ出すのと同じように)大きな山の場合は一番の方法とは言えません。だからこそ、効率的な採掘者は、宝を探し当てるため大きな山をより速く処理できるスルースボックスやスクリーニングプラントに移行したのです。

腕のある採掘者として、効果的に山あるいはビッグデータをふるいにかけて金塊を探し当てられるコンピュータに、どうすればなれるのでしょう?重要な情報を効果的に抽出するには、高速のデータ分析が必要となります。クラウド上の計測温度の一覧は、額面価値としては無価値同然ですが、コンピュータシステムでそれをスキャンし、中に存在する傾向を特定してソリューションを量産することができれば、金塊を見つけたも同然です。見つかった!

この高速データを最善の方法で処理するには、コンピュータシステムには、遅延を最小限に抑えた高効率のメモリが必要となります。このような傾向をただ土の中に埋もれたままにしておいて、いいことはありません。幸運なことに、超速ダイナミック・ランダム・アクセス・メモリ(DRAM)ほどシステム中のデータを高速で移動させられるものは他にありません。

ビッグデータで高速データを通知

Entrepreneur誌の2016年の記事によれば、データ収集は信じられないほどの速さで増加しています。2020年までに、オンラインの一人ひとりが毎秒1.7メガバイトの新規データを作成するようになり、その頃には存在するであろう44ゼタバイトの既存データにこれが加算されることになります。

心拍数や睡眠パターンといった項目を検知する小型のウェアラブルデバイスであれ、血糖値や血圧を監視する医療革新であれ、人間の体のバイタルを毎日監視する能力においてテクノロジーが進化すれば、医療組織は、革新的な方法で、予防医学を支援することができるようになります。IoTデバイス(ネットワークに無線で接続し、データを送信できる、非標準的計算装置)が人気を博し、患者のさまざまな健康要素を追跡するツールが増えるに伴い、作成されるビッグデータの量も増えます。

広告会社が、ユーザーのソーシャルメディアのニュースフィードにどのスポンサー提供の投稿を載せるかを判断する際、広告会社は、利用可能なすべてのデータをふるいにかけて、そのユーザーに効果的に訴えかけられる関連項目を見つけ出す必要があります。それが正しく行えれば、その選択により、広告主には金塊が入ります。

人工知能(AI)が個人のプロフィールを見る際に確認するのは、Amazonの閲覧履歴、YouTubeのチャンネル登録、Google検索といった、閲覧データの断片です。高速データなら、これらの情報を素早くつなぎ合わせ、自動車商品をオンラインの買い物かごに入れたり、以前閲覧した「2012年式フォード エクスプローラーのブレーキパッドの交換方法」のYouTube動画を記録したり、DIYプロジェクトに関する記事を一貫して登録したりできます。この場合、プログラムが現地の自動車部品店舗の広告を量産するのは簡単です。AIが賢くなり、データが高速になれば、ブレーキパッドは既に購入したので、今度は、あなたが恐らく実施するであろう作業に必要なラグレンチやジャッキスタンドの広告を重点的に出すようになります。

「プログラムが、データを即座に傍受・解釈するための非常に高速のメモリシステムを使い、関連性のある広告を即座にウェブサイトに押し出すことができれば、クリックスルーと販売に繋がり得ます」とCaward氏は述べています。

このデータの集まりを十分な速度で傍受するためには、これらのAIや機械学習プログラムを実行するユニットに、特定のソーシャルメディア・プロフィールや閲覧履歴のクラウドに保管されているビッグデータを全て対象にし、大切な金のかけらを特定し、処理ユニットの周辺で分析するのに十分な帯域幅がなければなりません。「通常ホットデータと呼ばれる」この大切な情報が処理ユニットに近ければ近いほど、ユーザーへのリターンは大きいものになるとCaward氏は述べています。マイクロンが、より高速で高効率のメモリソリューションに多大な力を注いでいるのは、このためです。

ハードドライブからソリッドステートドライブ、モノの高速化へ

システム内でデータの動きを速くするのは信頼性の高いDRAMだけではありません。従来のハードディスク(HDD)からソリッドステートドライブ(SSD)へと移行することでも、貴重な数ミリ秒を得ることはできます。標準的なハードドライブには、情報を得るためより技術的な動きが必要で、それからデータを読み取るために物理的に回転して貴重な時間を費やします。

Caward氏によれば、フラッシュ(SSD)メモリに移行すると、「物理的には何も動いていないので、断然早くデータにアクセスできるようになります。」

今日のプロセッサは、速度枠を3~4ギガヘルツから4.5~5ギガヘルツにまで押し上げています。Caward氏曰く、「もし、データ処理をナノ秒で実行していて、マイクロ秒ではなくミリ秒でデータを取得しているなら、そのCPUは、その差の時間、何もしていないことになります。」結果を取得するまでのこの無駄な時間を省くための努力として、メモリが実際に処理ユニットのより近くに設定されるようになり、GDDR5、GDDR5X、GDDR6メモリといった形でより高性能の計算用に設計されています。

待ち時間を少なく高い帯域幅で可能な限り速くデータを移動させるため、メモリは「実際、計算ユニットの隣にはんだ付けされています。」とCaward氏は説明しています。

高速データを今日のテクノロジーに応用する

より高速のメモリソリューションが既に利用可能となり、日々進化する中で、Caward氏が今世代の聖杯と呼ぶ自動運転車も含め、機械学習とAIには無限の応用性があります。これらの車両に搭載されるセンサーは、交通信号、位置関係の認識、他の物体との距離(特に車や人)といったインプットを常に監視し、与えられた状況に対し何を応用し実行すべきかを分析しています。

「ここで行われているのは、基本的には、単に、大量の情報を車載のスーパーコンピュータに取り入れて、そのデータを処理している、ということです」と、Caward氏は述べています。「有用で内データを引き出してもう少し扱いやすいようにしているのです。一部、内部処理も伴います。様々なネットワークを通して恐らくはクラウドに接続し、さらに処理を行い、それに応じて反応することで、目的地に安全に到着できるようにします。」

高速データは、病院でも素晴らしい成果を上げてくれます。CATスキャンを3,000人の医師に送ってそれぞれに細胞を分析してもらう代わりに、1件のCATスキャンを、良性/悪性細胞に関する何年にもわたる分析により悪性細胞の特定方法を学習したニューラルネットワークに提出することができます。

「これらの検知率は、はるかに伸びるでしょう」とCaward氏は述べています。「コンピュータに入力して、高速データがあれば、後は自動操縦で実行してくれます。」

マイクロンはデータの処理速度を速くする製品を前進させているので、この種の利用用途を拡大させることができます。プロセッサは高速化が進み、より多くの情報を計算できるようになっています。しかし、26コアのプロセッサに、1コアしか要さないようなデータを与えた場合、残りのコアには何もすることがありません。ビッグデータや高速データには魅力がたくさんありますが、それも、最大限に活用されて初めて発揮できます。

「ロジックを処理するこのシリコンチップを入手し、ちゃんと機能しているとします」とCaward氏は続けます。「しかし、データの移動をできるだけ早く行わないといけないような速度で移動しているとします。でなければ、潜在能力は生かせません。」

マイクロン製DRAMとSSDを使ってこのデータをCPUへ速く動かすことで、先の潜在能力を無駄にせずに済みます。システムで隠れた黄金のデータのかけらを探し当てるため、ビッグデータの山をかき分けて調べることで、新たな結論と洞察が生まれます。

+