高精度モデルを得るため¶
本節では、最もモデルの品質に影響を与えるいくつかの要因および高品質なモデルをトレーニングする方法について紹介していきます。
画像の品質を確保する¶
画像の 露出過度、暗すぎること、色ずれ、ぼやけ、遮蔽 を回避します。これらが発生したら、ディープラーニングモデルが依存する画像の特徴が失われ、モデル学習の効果に影響を与える可能性があります。
取得したデータの 背景、視野、高さ が現場のシーンと一致することを確認します。一致しなければモデルの精度が出なくなり、データを再取得しなければならなくなることもあるので、必ず確認してください。
データセットの品質を確保する¶
対象物検出モジュールは、画像から対象物の特徴を抽出して学習を行うことでモデルを生成し、現場に適用するため、取得する画像は現場の環境と一致しなければなりません。
データセットを取得する¶
様々な配置状況を考慮して取得します。例えば、前工程から供給される対象物は、横向き、縦向き、積み重ねなどがあります。横向き、縦向きの画像のみを取得したら、積み重ねの対象物に対する認識効果は保証できません。つまり、データ取得は 現場のあらゆる可能性を考慮 した方針で行います。詳しくは:
現場の応用であらゆる 対象物の向き を全部入れること。
現場の応用であらゆる 対象物の位置 を全部入れること。
現場の応用であらゆる 対象物同士の関係 を全部入れること。
注意
いずれかの配置状況のデータが欠けたら、その状況を学習できず、精度も保証できません。したがって、誤差を低減するために必ずデータの本数と多様性を確保してください。
対象物の向き
対象物の位置
対象物同士の関係
データの取得例¶
バラ積みで単一種類のローターを検査するプロジェクトでは、すべてのローターを見つけてそれぞれの位置を正確に検出します。画像を30枚取得します。
対象物の位置 について、ローターが箱内のあり得る位置を考慮します。また、ローター数が多い場合と少ない場合も考えなければなりません。
対象物同士の関係 について、バラ積みと整列した状態を考えます。
鉄筋カウントプロジェクトでは、鉄筋の本数を正確にカウントします。20の画像を取得します。
鉄筋の特徴が似ているので、ここでは 対象物の位置 だけを考えます。現場応用時に鉄筋がカメラ視野内のあり得る位置の画像を全部取得します。
適切なデータセットを選択する¶
画像枚数を控える
初めて対象物検出のモデルをトレーニングするには、画像を20枚使用することを推奨します。データ量が多すぎると、トレーニングの時間が長くなり、また後続の改善の妨げになることもあります。
データの多様性を確保する
データセット画像は、検出する対象物の照明環境、色、サイズなどの情報を含んでいる必要があります。
照明環境 :現場では照明が変化するので、データセットに異なる照明下で取得した画像が含まれている必要があります。
色 :ワークの色が異なるので、データセットに異なる色の画像が含まれている必要があります。
サイズ :ワークのサイズが異なるので、データセットにサイズが異なるワークの画像が含まれている必要があります。
注意
現場のあらゆる状況がトレーニングセットに含まれるように、データ拡張トレーニングのパラメータを調整することでデータセットを補完し、現場でのすべての状況をデータセットに入れます。
各種類のデータを均等な割合で使用する
トレーニングセットに、各カテゴリーや配置状況 の画像を均等な割合で使用する必要があります。あるカテゴリーの対象物の画像を20枚、別のカテゴリーの画像を3枚使用したりしてはいけません。また、整列した物の画像を40枚、バラ積みの物を5枚使用したりしてもいけません。
トレーニングセットが使用シーンと一致する
照明環境、ワークの特徴、検査時の背景、視野の広さなど、現場のシーンと一致する背景の画像を使用します。
ラベル付けの品質を確保する¶
ラベル付けの品質は、完全性、精確性から考えます。
完全性: 条件に満たすすべての対象物にラベルを付けます。
精確性: ラベル付けに描く長方形が対象の輪郭にピッタリ沿うようにします。