高精度なモデルを得るため
本節では、最もモデルの品質に影響を与えるいくつかの要因および高品質なモデルをトレーニングする方法について紹介していきます。
画像の品質を確保する
-
画像の対象物の位置、形状、サイズが一致しない、背景がバラバラなデータを使用しないでください。このようなデータはモデルの効果に影響します。モデルの効果を確保するために、差が小さい OK 画像を使用してください。
多数の画像 | NG の例 | ||
---|---|---|---|
画像に不要な背景がある場合、「教師なしセグメンテーション」モジュールの前に「対象物検出」モジュールを接続してください。画像の対象物の向きがバラバラな場合、「素早く位置決め」モジュールを接続してください。モジュールの接続についてはモジュールの接続をお読みください。 |
適切な関心領域(ROI)を設定する
ROI を設定することで、背景による干渉を抑えられます。ROI の境界は、なるべく対象物の外縁に近づかせます。
ROI 設定はすべての画像に適用されます。そのため、すべての画像にある対象物が ROI 内にあることを確認してください。 |
適切な OK/NG 結果のしきい値を設定する
「教師なしセグメンテーション」モジュールは、欠陥度グラフに対して設定したしきい値によって OK、NG、Unknown を判断します。また、OK 結果のしきい値が高いほどより狭い領域の欠陥が検出され、モデルの効果を確保します。
元画像 | OK 結果のしきい値:0.10 | OK 結果のしきい値:0.20 |
---|---|---|
欠陥度グラフでは、緑の線の縦軸は、欠陥度が OK しきい値より低い OK 画像の割合を示し、赤の線の縦軸は、欠陥度が NG しきい値より高い NG 画像の割合を示しています。赤の線と緑の線が交差しない場合、OK 画像と NG 画像はしきい値によって完全に分けられます。2つの交差しない領域が大きいほどモデル効果は高くなります。
効果がいい | 効果が悪い |
---|---|
適切なデータセットを選択する
-
画像枚数を控える
初めて「教師なしセグメンテーション」モジュールを使用するとき、30~50 枚の OK 画像を使用することをお勧めします。検証の結果によって増やしたり減らしたりしてください。
-
トレーニングセットの OK 画像の多様性を確保する
OK 画像には様々な状況がある場合、トレーニングセットの OK 画像も様々な状況を収めるようにしてください。
-
検証セットに NG 画像が必要
「教師なしセグメンテーション」モジュールを使用する時、検証セットに NG 画像を追加することを推奨します。これによりモデルの効果の改善に役立ちます。
-
無効データを回避する
類似している画像、同じ画像をインポートしないでください。