デザインツール

入力が無効です。特殊文字には対応していません。

AI

エッジAIを加速するには、適切なプロセッサーとメモリの選択が重要

ウィル・フロレンティーノ | 2025年7月

AIは今や流行語となり、多くの場合、データセンターや大規模言語モデル(LLM)を支える強力なコンピューティングプラットフォームの必要性と結び付けられています。GPUは、データセンターレベルでのAIのスケーリング(学習)において重要な役割を果たしてきましたが、IoTデバイスやビデオ監視カメラ、エッジコンピューティングシステムなど、電力制約のある環境でAIを展開するには、別のアプローチが求められます。業界は現在、分散型かつ低消費電力のアプリケーションに特化した、より効率的な計算アーキテクチャーやAIモデルへとシフトしつつあります。

今後は、数百万台、あるいは数十億台にのぼるエンドポイントが、AI処理のためだけにクラウドへ接続する存在にとどまらず、今後どのように進化すべきかを改めて見直す必要があります。これらのデバイスは、オンデバイスでの推論処理を、1ワットあたりの演算性能(TOPS/W)という観点で最大限効率的に実行できる、真のAI搭載エッジシステムへと進化する必要があります。

リアルタイムAIコンピューティングの課題

AIの基盤モデルが大規模化するにつれ、インフラコストやエネルギー消費も急激に増加しています。この理由から、増大する生成AIの需要を支えるために、データセンターが備えるべき性能に注目が集まっています。一方で、リアルタイムでの推論をエッジで行うためには、データが生成される場所、つまりデバイスそのものにAI処理を近づける必要があるという考えが根強くあります。

エッジでAIを運用することには、新たな課題が伴います。もはや、1秒あたりの演算性能(TOPS)といった演算能力を単に確保するだけでは十分ではないのです。各ユースケースにおける消費電力やコストの厳しい制約の中で、メモリパフォーマンスも同じく考慮する必要があります。こうした制約から、有効なAIエッジソリューションでは、コンピューティングとメモリが同じくらい重要な構成要素になりつつあるという、新たな現実が浮かび上がります。

より多くの入力とタスクを処理できる高度化したAIモデルが開発されるとともに、モデルのサイズと複雑性も高まり、大量のコンピューティングパワーが要求されるようになっています。TPUとGPUはこの成長に歩調を合わせてきましたが、メモリ帯域幅とパフォーマンスはそれほどの速度では進化していません。そのため、ボトルネックが生じます。より大量のデータをGPUが処理できたとしても、メモリシステムによる供給が追い付かないためです。この課題は、AIシステム設計において計算処理とメモリ性能の両立がいかに重要かを浮き彫りにしています。

Hailoのグラフ

組み込みAIの普及とともに、メモリが極めて重要な考慮事項になっています。

倉庫内のロボット

産業用コンピューティングへの生成AIの統合がますます進んでいます。

モデルの複雑化やコンピューティングパワーが向上しているにもかかわらず、組み込みのエッジAIシステムではメモリ帯域幅がボトルネックとなり、パフォーマンスが制限されています。

もう1つの重要な考慮事項は、推論には移動中のデータが関与することです。つまり、前処理されたキュレーション済みのデータを、ニューラルネットワーク(NN)に取り込む必要があります。同様に、量子化とアクティベーションがNNを通過した後は、AIパイプライン全体の中で、後処理も重要な工程となります。自動車に500馬力のエンジンが搭載されているにもかかわらず、燃料には低オクタン価ガソリンを使用し、タイヤをスペアタイヤにしているようなものです。どんなにエンジンが強力でも、自動車全体のパフォーマンスは、システムの中で最も貧弱なコンポーネントによって制限されてしまいます。

3つ目の考慮事項は、SoCにNPUやアクセラレーター機能が搭載されており、サンドボックス領域として小規模なRAMキャッシュが追加されていたとしても、こうしたマルチドメインプロセッサーの導入は部品表(BOM)のコストを押し上げる要因となり、柔軟性を制限してしまうという点です。

最適化された専用のASICアクセラレーターの価値は、どんなに強調してもしすぎることはありません。これらのアクセラレーターは、ニューラルネットワークの効率性を高めるだけでなく、広範囲のAIモデルへの対応にも柔軟性をもたらします。ASICアクセラレーターのもう1つのメリットは、最適なTOPS/Wを発揮するよう設計されている点で、低い消費電力、優れた熱特性、幅広い用途(自律型の農業機器、ビデオ監視カメラ、自律型の倉庫用モバイルロボットなど)への対応が求められるエッジアプリケーションにより適しています。

コンピューティングとメモリの相乗効果

エッジプラットフォームと統合したコプロセッサーのおかげで、リアルタイムでの深層学習推論タスクを低い消費電力と高いコスト効率で実行できるようになります。このため、広範囲のニューラルネットワーク、ビジョン変換モデル、LLMが可能となります。

こうしたテクノロジーの相乗効果の代表例が、HailoのエッジAIアクセラレータープロセッサーと、マイクロンの低消費電力DDR(LPDDR)メモリの組み合わせです。コンピューティングとメモリを適切に組み合わせた、厳しい制限のあるエネルギーやコストの予算の範囲内に収まる、バランスの取れたソリューションであり、エッジAIアプリケーションに最適です。

メモリおよびストレージソリューションにおいて業界をリードするプロバイダーのマイクロンが提供するLPDDRテクノロジーは、電力効率を犠牲にすることなく、高速・高帯域幅のデータ転送を実現し、リアルタイムデータ処理におけるボトルネックを排除します。LPDDRは、スマートフォン、ノートパソコン、車載システム、産業用機器などで広く利用されています。特に、高いI/O帯域幅と高速なピン速度が求められる組み込みAIアプリケーションにおいて、最新のAIアクセラレータに対応できるため、非常に適しています。

たとえば、LPDDR4/4X(低消費電力DDR4 DRAM)およびLPDDR5/5X(低消費電力DDR5 DRAM)は、前世代と比べて極めて高いパフォーマンスを提供します。LPDDR4は、最大x64のバス幅で1ピンあたり最大4.2 Gbits/秒の速度に対応します。マイクロンの1ベータLPDDR5Xでは、このパフォーマンスが2倍になり(1ピンあたり最大9.6 Gbits/秒)、電力効率はLPDDR4Xと比べて20%向上しています。こうした進歩は、需要が高まりつつあるエッジAIに対応するうえで極めて重要です。なぜならエッジAIには、速度とエネルギー効率の両立が欠かせないからです。

マイクロンがコラボレーションを行っている有力なAIシリコンプロバイダーの1社がHailoです。Hailoは、エッジデバイス上で高性能な深層学習アプリケーションを実現する、独自設計の画期的なAIプロセッサーを提供しています。Hailoプロセッサーは、エッジにおける新時代の生成AIだけでなく、幅広いAIアクセラレーターとビジョンプロセッサーにより、認知機能やビデオ拡張にも対応します。

青い回路基板上のHailo 10チップ

たとえば、最大40 TOPSで動作するHailo-10H AIプロセッサーは、極めて多くの用途に対応できるAIエッジプロセッサーです。Hailoによると、Hailo-10H独自の強力かつスケーラブルな構造を重視したデータフローアーキテクチャーは、ニューラルネットワークのコア特性を最大限に活用しています。そのため、大幅にコストを削減しながら、従来のソリューションよりも効率的かつ効果的に、エッジデバイス上で深層学習アプリケーションをフルスケールで実行できます。

ソリューションの運用

AIで生成されるコンテンツは正確ではない場合があります。[画像] AIビジョンプロセッサーは、スマートカメラに最適です。Hailo-15 VPUシステムオンチップ(SoC)は、HailoのAI推論機能と革新的なコンピュータービジョンエンジンの組み合わせにより、優れた画像品質と高度なビデオアナリティクスを生成します。このビジョン処理ユニットのAI能力を活用して、AI駆動の画像強調と、複数の複雑な深層学習AIアプリケーションをフルスケールで効率的に実行することができます。

LPDDR4

マイクロンの幅広い用途に対して厳格なテストを実施した低消費電力DRAM(LPDDR4X)と、HailoのAIプロセッサーを組み合わせることで、多様なアプリケーションへの対応が可能になります。温度やパフォーマンスにおいて過酷な条件が要求される産業用および車載用アプリケーションから、エンタープライズシステムの厳密な仕様まで。マイクロンのLPDDR4Xは、電力効率を犠牲にせずに高性能・高帯域幅データレートを提供し、HailoのVPUに最適です。

最強の組み合わせ

AI搭載デバイスを利用する機会が増えるとともに、何百万台もの(さらには、何十億台もの)エンドポイントを、単なるクラウドエージェントではなく、限りになく低いTOPS/Wでオンプレミス推論に対応できる、真のAI対応エッジデバイスとしていかに進化すべきかを開発者が検討する必要に迫られています。エッジAIを加速するためにゼロから設計されたプロセッサーと、低消費電力で信頼性の高い高性能LPDRAMがあれば、エッジAIはますます多くのアプリケーションで開発できるようになるでしょう。

上級セグメントマーケティングマネージャー

Wil Florentino

ウィル・フロレンティノは、マイクロンテクノロジーの産業ビジネスユニットの上級セグメントマーケティングマネージャーです。ウィルの担当業務には、今後の製品ロードマップでメモリソリューションの支えとなる、IIoTや産業用エッジコンピューティングなどの産業用セグメントにおける市場インテリジェンスや分野別ノウハウの提供が含まれます。SoC、FPGA、マイクロコントローラ、メモリなどの埋め込み型半導体テクノロジーで、産業用アプリケーションを中心に20年以上の経験があります。