高精度なモデルを得るため

本節では、最もモデルの品質に影響を与えるいくつかの要因および高品質なモデルをトレーニングする方法について紹介していきます。

画像の品質を確保する

画像の 露出過度、露出不足、ぼやけ、遮蔽 を回避します。これらが発生したら、ディープラーニングモデルが依存する画像の特徴が失われ、モデル学習の効果に影響を与える可能性があります。

画像品質低下:テキスト領域に遮蔽があるため検出の邪魔になり、そのあとのテキスト認識段階で正確に認識できない恐れがあります。

improve model accuracy occlusion 1

improve model accuracy occlusion 2

改善案:テキスト領域に遮蔽がないようにします。

画像品質低下:露出過度 画像品質低下:露出不足

improve model accuracy overexposure

improve model accuracy underexposure

改善案:遮光・補光を行います。

データセットの品質を確保する

「テキスト検出」モジュールは、画像のテキスト領域を検出します。実際の応用シーンでは、テキスト領域は画像のほんの少しの一部分です。データを収集する時、安定したモデルトレーニングを実行するためにカメラ設定・設置または照明設定を一定にしてください。

データを選択する

様々な角度のテキスト

実際にありうる全ての角度の画像をカバーします。横よ縦の画像だけ使用すれば、傾斜した画像の検出はできません。

いずれかの配置状況のデータが欠けたら、その状況を学習できず、精度も保証できません。したがって、誤差を低減するために必ずデータの本数と多様性を確保してください。
improve model accuracy orientation

適切なデータセットを選択する

  • 画像枚数を控える

    初めて「テキスト検出」モジュールを使用するとき、30~50 枚の画像を使用することをお勧めします。検証の結果によって増やしたり減らしたりしてください。

  • 各種類のデータを均等な割合で使用する

    トレーニングセットの様々な角度のテキスト画像の割合を均等にしてください。これは、モデルの効果を確保するためです。

  • 無効データを回避する

    質の高い画像を使用してください。質の低い画像を使用すれば、モデルトレーニングに悪い影響を与えます。

データ量が多すぎると、トレーニングの時間が長くなり、また後続の改善の妨げになることもあります。

ラベル付けの品質を確保する

正確性が大事です。ラベル付けを実行するとき、目標領域の端に近づけ、不要な背景がなくて対象領域が完全に収まるようにしてください。

正確ではない 正確

improve model accuracy fit 0

improve model accuracy fit 1

improve model accuracy fit 2

Mech-Mindは、お客様のプライバシーを重視しています

このサイトでは最高の体験を提供するために Cookie を使用しています。サイトの閲覧を続ける場合、Cookie の使用に同意したことになります。「拒否する」を選択すると、このサイトを訪れた際に追跡や記憶が行われないように単独の Cookie が使用されます。