技術開発ニュース No.169

- ページ: 37
-
研 究 成 果
Results of Research Activities
生成 AIを用いた異常画像生成技術
Data Augmentation Method Using Generative AI
画像 AI 学習のための画像オーグメンテーション手法
様々な領域でディープラーニングを用いた機械学習や AI の実用化が進んでいる。AI モ
デルを学習するためには一定量のデータが必要となるが、学習データの希少性が原因で
十分な AI モデルの学習ができない事例は多い。本稿では、画像生成 AI と幾何学模様のマ
スク画像を組み合わせ、少ない画像から AI 学習用のデータを拡張する方法について紹介
する。
執筆者
先端技術応用研究所
情報技術グループ
追良瀬 利也
1
はじめに
ディープラーニングを用いた AI 技術の進化に伴い、さま
(1) 幾何学模様マスク画像の準備
オリジナル画像をマスキングするためのマスク画像を
用意する。図 1 では市松模様を例に示している。
(2) オリジナル画像の選択
ざまな産業で AI の活用が進んでいる。特にインフラや製造
拡張対象とするオリジナル画像、マスク画像を 1 枚選
業では、カメラ画像を入力として AI に画像内の異常を認識
択する。
させる試みが盛んである。しかし、AI モデルを学習させる
(3) 出力制限と画像生成
ためには一定量のデータが必要であり、長期間の劣化によ
(1)(2) の マ ス ク 画 像 と オ リ ジ ナ ル 画 像 の 組 合 せ
る異常を画像で判別する場合などでは、十分な学習データ
で、Inpaint と呼ばれる手法によりオリジナル画像にマ
を入手することが困難である。このようにデータが十分に
スキングを行う。この情報を画像生成モデルに入力し画
得られない場合、少ないデータで学習を行うためにデータ
像生成を行う。この際、生成画像が崩壊しないよう、
拡張と呼ばれる、データに加工を加えて水増しする方法が
ControlNet[1] と呼ばれる手法を用いて出力の制限を
よく用いられる。
行う。
データ拡張方法には、画像の回転や反転、明度の変更な
この手法のポイントは、同じオリジナル画像に対して
どがあるが、異常検出のようなタスクでは、現実世界の多
も、幾何学模様のマスクを変更することで、隠される部
様なパターンを網羅することが求められるため、これらの
分・隠されない部分が変化し、画像生成時の条件が容易に
方法だけでは十分な判別精度を達成することが難しい。そ
変更できることにある。これにより、1 枚のオリジナル画
こで近年発達の著しい画像生成 AI を用いて、AI の学習の
像から、その特徴を持たせたまま「別の異常画像」をいく
ための画像データを生成する手法を研究している。本稿で
つも生成することが可能となる。
は、その概要について紹介していく。
2
提案手法概要
3
評価実験
(1) 実験概要
手法の概要を図 1 に示す。当該手法は、ある画像をもと
提案手法を用いて画像を生成し、その結果が画像判別
に新たな画像を生成する、img2img と呼ばれる画像生成
モデルにどのような影響を及ぼすかを確認するため、実
手法と、幾何学模様によるマスクを核として構成されてい
験を行った。この実験では、Kaggle のトマトの葉の病
る。幾何学模様によりオリジナル画像をマスクし、マスク
変分類データセット [2] から、Septoria leaf spot(白星
されていない部分を考慮しながら、マスキングされた部分
病)および Early blight(輪紋病)クラスのデータを使用
を中心に画像を再構成(生成)することにより新たな画像
した。
を作成する。生成までの流れを以下に示す。
本研究で目的とするのはデータ数が限られた場合での
AI 精度向上であることから、元の訓練データセット(各
クラス 1000 枚)から、それぞれ 5, 10, 15, 20, 25 枚を
無作為抽出した実験用データセットを作成した。この実
験用データセットに対して、①そのままのデータでモデ
ルを訓練した場合②既存のデータ拡張手法により水増し
した上でモデルを訓練した場合③提案手法によりデータ
第 1 図 手法の概要図
37
技術開発ニュース 2025.03/No.169
- ▲TOP