メモリチップメーカーであるマイクロンテクノロジーは、人工知能が産業界にもたらす多くの利点について、ただ語るだけではありません。マイクロンは、データ解析とAIを自社の製造プロセスに活用することで、文字通り口先だけではなく、次世代メモリストレージとプロセッシングソリューションで実現するテクノロジーが事業にもたらす価値を実証しています。歩留まりの向上、より安全な作業環境、効率の改善など、そのメリットは多岐にわたります。
マイクロンの製造所では、非常に複雑で精密な工程を経て、シリコンウエハー上のメモリテクノロジーを生み出しています。エラーや無駄が発生する潜在的可能性は高いですが、データとAIでその可能性を低下させています。欠陥や機械的な問題、その他トラブル箇所の可能性を特定し追跡することを人間の判断に頼っていた頃は、それが金銭的な損失につながりました。これは、今日の洗練されたテクノロジーで回避できるであろう損失です。
製造プロセス
コンピューターチップの基板として使われるシリコンウエハーは、砂の一種であるシリカから作られ、純度99.999パーセントまで濾過・精製する作業が必要です。この電子グレードのシリコンを溶かし、圧縮してインゴットにし、それを厚さ0.67mmという非常に薄いウエハーにスライスします。
このウエハーを研磨して切断痕を取り除き、薄いフォトレジスト材料でコーティングし、写真と似たプロセスで回路パターンをエッチングします。回路が複雑であればあるほど、より多くのパターンがウエハーに転写されることになります。それぞれの層を個別に処理し、たとえば、「ドーピング」と呼ばれるイオン注入工程(金属浴)などを施します。
完成したウエハーを薄い保護膜でコーティングした後、意図したとおりに動作するかどうかをテスト(「プローブ」)します。
製造プロセス全体は約1,500もの手順を含むことがあり、わずかなホコリもウエハーに付着しないように設計された無菌のクリーンな製造室で行われます。しかしそれでも、問題は起こります。繊細なウエハーにキズがついたり、穴があいたり、保護膜の下に気泡ができたりするのです。
多くの場合、こうしたキズは肉眼ではまったく見えないほどの微細なものです。また、目視で確認できる場合でも、画像処理プロセスで各ウエハーの30~40枚の画像を読み込む際に、目の疲れや一瞬の不注意で欠陥を見落としてしまうことがあります。まばたき1つで見逃してしまうのです。
「プローブ」の段階まで問題が発見されない場合、すでに多くの時間と費用が無駄になっています。欠陥を引き起こしている問題が1枚だけではなく、場合によっては何千枚ものウエハーに影響を及ぼしている可能性もあります。
その他にも、製造にはさまざまな問題が起こり得ます。たとえば、部品の摩耗や配管からの漏れ、あるいは有害な化学物質が製品や人にかかるといったことが挙げられます。これらの問題を早期に発見し、修正することが不可欠です。マイクロンの専門家によると、シャットダウンには1時間あたり平均25万ドルという高額なコストがかかります。また、半導体製造の複雑さを考えると、復旧には多くの時間が費やされることから、真のコストは数百万ドルに達するでしょう。さらに、作業員の負傷に関連するリスクも多岐にわたります。
製品や機械の問題を検出することは、製造の効率性、有効性、安全性にとって極めて重要です。しかし残念なことに、人間にはミスがつきものです。どんなに高度な訓練を受けた人であっても、何かがおかしいという非常に微細で微妙な兆候を確実に見たり、聞いたり、感じたりできるわけではないのです。
一方で人工知能テクノロジーは、これらのタスクをレーザーで鋭く正確に、しかもわずかな時間で実行することができます。マイクロンでは、世界各地の8,000を超えるソースと500を超えるサーバーからペタバイトの社内製造データを収集し、その情報をApache Hadoopの2種類の環境マップに追加してデータマイニングを行っています。これらの製造ネットワーク全体に存在するデータサイエンティストがそのデータを精査し、得られたインサイトで、AIや機械学習のモデルを開発し、製造所のプロセスを改善・強化することになります。
私たちの視覚、聴覚、触覚を模倣したその結果は目覚ましいもので、それによって2018年、マイクロンは栄誉あるCIO 100アワードを受賞し、ITリーダーシップを称えられました。
視覚:ウエハーの画像処理
ウエハーの欠陥にはさまざまなものがあります。とはいえ、大部分は、ウエハーのエッジ付近の小さな穴、外膜の傷や気泡などといった、一般的なカテゴリのいずれかに分類されます。マイクロンのAIシステムは、製造工程でウエハーに回路をエッチングする際にフォトリソグラフィカメラが捉える画像から、これらの欠陥を発見する「コンピュータービジョン」テクノロジーを活用しています。
エンジニアは、たとえばウエハーのエッジにある小さなドット(穴)、連続した線やわずかに切れた線(キズ)をスキャンするようシステムに指示することもあれば、濃淡のスポットやパターンにつながる色の変化を検出するよう指示することもあります。こうした欠陥の中には、画像撮影後10秒以内にシステムがアラートを鳴らすなど、ほぼリアルタイムで発見できるものもあります。また、画像が保存されてから15分後の二次スキャンで欠陥が発見される場合もあります。こうしたプロセスはすべて、比較対照のためにHadoop環境に保存された200万枚の画像を使用するAIシステムに依存しています。
マイクロンのITディレクター、ティム・ロングによると、その結果は、エンジニアによる評価よりもはるかに正確であることがわかっています。
「コンピュータービジョンは精度が高く、高効率です。おかげでエンジニアの能力をもっと高次の対処に向けることができるようになりました。エンジニアは問題に集中し、データ収集に専念できます」
マイクロンのAI自動欠陥分類(ADC)システムにより、技術者やエンジニアはウエハー欠陥をHadoopで手動で分類する必要がなくなりました。代わりにAI-ADCがディープラーニング(深層学習)を使用して、毎年何百万もの欠陥を選別・分類します。マイクロンはこのシステムを、現在利用可能な最新の画像処理技術を駆使して開発しました。この技術には、観察データからコンピューターが学習することを可能にする、生物学に着想を得たプログラミングパラダイムと言われるニューラルネットワークが含まれます。
この種の機械学習では、画像を欠陥に応じて分類し、個別のHadoop「クラスター」に配置します。このプロセスにより、エンジニアが製造中に問題を発見して早期に修正し、さらなる欠陥を回避するのに有効なだけではなく、AIシステムが自ら欠陥を発見し、反復するたびに結果を改善することも可能になります。
マイクロンのファブデータサイエンスマネージャーであるテッド・ドロスは、次のように述べています。「どこを見ればいいのか、何を探せばいいのかをシステムに指示する必要はありません。いくつかの例を与えて、ニューラルネットに『これを見つけてください』と指示するだけです。
このプロセスでは、手法を微調整することで歩留まりを改善します。調整が進めば進むほど、問題は減っていきます」
聴覚:音響リスニング
車が機械故障を抱えていることを示す最初の兆候は何でしょう。多くの場合、ボンネットの下から聞こえる異音です。これは製造所でも同様で、異常と思われる音は部品の摩耗や故障の兆候である可能性があります。
ただし、製造プラントでは大きな音がしていることがあるため、異常音が騒音に紛れてしまいます。または、何が「正常」で何がそうでないのかを識別できるほど長い時間、作業員が同じ場所にいない場合もあります。
マイクロンのAIシステムは、ロボット駆動装置の近くやポンプの近くに取り付けた音声センサーによって、製造所の機械の異常を聞き分けています。こうしたマイクは数週間にわたって正常な活動を録音し、検出された周波数をソフトウェアがグラフやチャートに変換して、音を視覚的なデータとして描き出します。新しいピッチや周波数が検出されると、システムは警告を発します。また多くの場合、異常の原因を特定することも可能です。
ドロスは、さまざまな音を出す製造所をオーケストラに例え、音響リスニングを可能にする機械を指揮者に例えています。
「さまざまな楽器が演奏されているとしましょう。ライン内の化学物質の蓄積に微妙な変化が生じるのは、たとえば、フレンチホルンで演奏者がバルブを少し開けると、ピッチが変わり、音全体が変わるのと同じことです」 聴衆はその変化に気づかないかもしれませんが、指揮者は気づきます。
この「音響リスニング」のAIシステムをセットアップするために、マイクロンのエンジニアは最初のモニタリング段階で収集したデータを使って、Hadoopでベースラインを設定しました。次に、異常音のファイルをスキャンし、原因に従って分類し、個別のグループ(「クラスター」)に分類しました。たくさんのファイルを収集し、検討し、分類すればするほど、より正確な結果を得ることができ、システムが異常音とその原因を検出・診断できるようになります。
こうした膨大なデータベースの検索には時間を要します。しかし機械が故障の危機に陥った場合、プラント管理者は瞬時に知る必要があります。
マイクロンのメモリとストレージを搭載したGPUシステム(48,000個の処理コアとテラバイトのメモリ)にデータを送信することで、CPUベースのシステムよりもはるかに迅速に、高速でインテリジェントな結果を得ることができます。これらすべてのGPUコアとメモリが同時かつ相乗的に動作することで、人間がほとんど介在することなく、瞬く間に結果を改良し、人間の脳の働きと同じように、繰り返すたびに診断結果を改善することができます。
「GPUの主な利点の1つを考えてみましょう。CPUは1つのチップに2個か4個のプロセッサーコアを搭載し、各コアは一度に1つのことしかできません。GPUは、何千個ものコアを搭載します。何千ものことを並行して処理できるのです」とマイクロンのシニアフェロー、マーク・ヘルムは述べています。「AIのワークロードに求められるのは、まさにそれです。
CPUにとても複雑な機械学習アルゴリズムを処理させたいとは思わないでしょう。GPUはそのアルゴリズムを非常に小さな断片に分割し、数万個のコアそれぞれが同時に動作することで、すべてを並列処理します。GPU処理は、意思決定の実行にかかる時間の面で、とても大きな利点があるのです」
赤外線画像処理:熱を感じる
すべての故障が音を発するわけではなく、製造環境では静寂が命取りになることもあります。多くの場合、音がする代わりに温度変化が起こります。機械が熱くなったり、漏れが発生した箇所で蒸発冷却によって熱が奪われ、ポンプや配管が冷やされたりします。
最近まで、温度の急上昇を検知する唯一の方法は、赤い光、火花、煙を目で確かめることでした。こうした現象が現れる頃には、問題はすでに危険領域に入っており、プラントでは作業員を避難させる必要がありました。すでに述べたように、シャットダウンには巨額のコストがかかりますが、人の安全を危険にさらすよりはましです。
クールスポットもトラブルを示す場合がありますが、これは目に見える兆候ではありません。また、熱の変化を手で感じとることは、危険であるだけでなく、非現実的です。
ただし、最近では、人工知能が製造所環境の「ヒートマップ」を示す赤外線写真を分析することで、温度異常を発見できるようになってきています。マイクロンでは、通常の作業条件で作成した画像を、ファブのデジタルツイン(プラントの仮想レプリカ)に重ね合わせます。こうしたマップはAIシステムに赤外線画像を比較するためのベースラインを与えます。偏差を検出すると、システムはアラームを鳴らします。
マイクロンの赤外線画像処理はまだ初期段階にありますが、機械の故障や深刻な損傷が発生する前の早期に異常の兆候を発見できるため、コスト削減の大きな可能性があります。早期発見は簡単な修理か、高価な機器を丸ごと交換するかという違いにつながります。
さらに、マイクロンの優先事項である作業員の保護に関して重要な役割を果たします。マイクロンは利益よりもチームメンバーの安全を重視しています。危険な状況になる前の問題検出向上を目的としたテクノロジーに多額の投資を続けているのは、それが主な理由です。
「このポンプが熱暴走を起こしたり、火花が出たりした場合、『ここにあるポンプは危険性が高い』と表示されたら、私はすぐにそれを知って、そのエリアにいる人に避難を呼びかけたいと思うでしょう」とドロスは言います。機械的な問題の早期発見が赤外線画像処理の第一目標ですが、マイクロンではこのテクノロジーを活用して、製造システムやプロセスの最適化も行っています。ドロスによると、システムの可用性は、マイクロンがウエハー生産で負担する最大のコストの1つです。システムがシャットダウンすると、ウエハー製造に使用できるツールが少なくなります。ウエハーの生産枚数が減ると、ファブの総合的な運営コストが上昇します。また、ツールの故障が検出されないと、ウエハー損傷の原因となる可能性があり、これもコスト増につながります。
ドロスによると、マイクロンが理想とするのは、すべてのファブのすべてのツールの熱画像を作成し、温度が高すぎたり低すぎたりする場所をリアルタイムで見つけることです。それに続く微調整で歩留まりが向上し、結果としてウエハー1枚当たりの生産コストが下がる可能性が高いでしょう。
たくさんのメリット
マイクロンでは、AIを使用して製造所で見たり、聞いたり、感じたりすることで、これまでに次のような素晴らしい結果を出しています。
- 歩留まりの成熟までの期間を25%短縮
- 生産量が10%増加
- 品質事象が35%減少
そしてデータ解析とAIのメリットは、ファブだけではなく、セールスやマーケティング、人材、事業運営、研究開発など、マイクロンのあらゆる業務に及んでいます。
「これは製造現場だけではなく、企業そのものを変革するものです。こうした技術や手法は、社内のすべての事業プロセスに導入することが可能です」とドロスは述べています。
たとえば、ディープラーニングは、製品需要に関する予測を大幅に改善し、精度を10~20パーセント向上させたとドロスは言います。
ただし、マイクロンが人工知能とデータ解析に関して力点を置いているのは産業プロセスであり、ファブが人間の介在を最小限に抑えた、真に「スマート」なサイバーフィジカルシステムとして稼働することです。
5Gセルラーネットワーク、仮想現実・拡張現実、モノのインターネット(IoT)、AIやデータ解析などのテクノロジーがますます急速に進歩(マイクロンのメモリとストレージソリューションがその発展に貢献)する中で、その約束はますます実現に近づいています。
ロングはこう述べています。「AIはさまざまなことを包含しています。実際、AIは診断能力を記述し、私たちが機械学習アルゴリズムを使って診断能力を生み出す方法を記述します。私たちはアルゴリズムにデータを与え、過去のことをコンテキストとしてシステムに教えることで、人間の感覚(聴覚、触覚、視覚)を再現しています。そして、マシンはパターンを観察し、学習することで、自ら結論を出せるようになります」