高精度のモデルを得るため¶
本節では、最もモデルの品質に影響を与えるいくつかの要因および高品質なモデルをトレーニングする方法について紹介していきます。
画像の品質を確保する¶
画像の 露出過度、暗すぎること、色ずれ、ぼやけ、遮蔽 を回避します。これらが発生したら、ディープラーニングモデルが依存する画像の特徴が失われ、モデル学習の効果に影響を与える可能性があります。
取得したデータの 背景、視野、高さ は現場のシーンと一致することを確認します。一致しなければモデルの精度が出なくなり、データを再取得しなければならなくなることもあるので、必ず確認してください。
データセットの品質を確保する¶
「画像分類」モジュールは、既存の画像から特徴を学習し、実際のシーンに応用可能なモデルを導き出します。高品質なモデルをトレーニングするために、取得、選択したデータセットは実際のシーンと一致することが重要です。
データセットを取得する¶
ワークの様々な置き方を考える必要があります。 例えば、生産プロセスでは、横置きと縦置きのワークがあり、単に横置きのワークのデータを用いてトレーニングすると、縦置きのワークに対する分類の効果を確保することはできません。そのため、データ取得する際に、 全ての実際のシーンを考慮したデータを取得する必要があります 。具体的に以下のデータが必要です。
実際の応用に分類する対象物が持っている 角度 の特徴。
実際の応用に分類必要な対象物が持っている 位置 の特徴。
角度
位置
データの取得例¶
弁管プロジェクトでは、弁管の裏表を判別します。弁管の位置変動の幅が小さくて、表と裏の画像をそれぞれ15枚取得します。
エンジンバルブの組み立てプロジェクトでは、対象物が一種だけあります。ワークがスロット内に正しく配置されているかどうかを判断します。 スロット外に配置されたエンジンバルブはさまざまな姿勢が考えられるため、さまざまな位置や角度のエンジンバルブの画像を 20 枚程度取得します。スロット内に放置された場合は、位置だけが異なるので 10 枚程度の画像を取得すれば十分です。
金属板のプロジェクトでは、2 種類の対象物があり、ワークのサイズにっよて分別します。異なる位置や異なる角度を考えて裏と表の画像をそれぞれ 20 枚取得します。
データセットを選択する¶
画像枚数を控える
「画像分類」モジュールの初回モデリングには、30 枚の画像を使用することを推奨します。 データの量が多いほど効果が良くなるわけでなく、余計なデータを使用したら後続のモデル改善を妨げ、トレーニング時間も長くなります。
データの多様性を確保する
データセット画像は、検出する対象物の照明環境、色、サイズなどの情報を含んでいる必要があります。
照明環境:実際の使用シーンでは、照明環境が変化するので、トレーニングセットに異なる照明環境下で取得した画像が含まれている必要があります。
色:ワークの色が異なるので、トレーニングセットに全ての色の画像が含まれている必要があります。
サイズ:ワークのサイズが異なるので、トレーニングセットに全てのサイズのワークの画像が含まれている必要があります。
注意
現場のあらゆる状況がトレーニングセットに含まれるように、データ拡張トレーニングのパラメータを調整することでデータセットを補完し、現場でのすべての状況をカバーします。
各種類のデータを均等な割合で使用する
トレーニングセットに含まれる異なるカテゴリーの画像を均等な割合で使用する必要があります。あるカテゴリーの対象物の画像を20 枚、別のカテゴリーの画像を 3 枚使用したりしてはいけません。
トレーニングセットが使用シーンと一致する
照明環境、ワークの特徴、検査時の背景、視野の広さなど、現場のシーンと一致する背景の画像を使用します。