高精度なモデルを得るため

本節では、最もモデルの品質に影響を与えるいくつかの要因および高品質なモデルをトレーニングする方法について紹介していきます。

画像の品質を確保する

単体モデル

「テキスト認識」モジュールだけを使用する場合、モデルの品質を確保するために、以下のようにしてください。

  • 画像の 露出過度、露出不足、ぼやけ、遮蔽 を回避します。これらが発生したら、ディープラーニングモデルが依存する画像の特徴が失われ、モデル学習の効果に影響を与える可能性があります。

    画像品質低下:テキスト領域に遮蔽があり、認識の邪魔になります。

    improve model accuracy occlusion 1

    improve model accuracy occlusion 2

    改善案:テキスト領域に遮蔽がないようにします。

    画像品質低下:露出過度 画像品質低下:露出不足

    improve model accuracy overexposure

    improve model accuracy underexposure

    改善案:遮光・補光を行います。

  • テキスト方向が前向き(0°)の画像をインポートしてください。テキストの向きがバラバラな場合、「テキスト検出」モジュールを使用して画像を処理しておいてください。その後インポート  前のモジュールからインポートをクリックし、「画像補正」機能がオンになっていることを確認します。

モジュールの接続

「テキスト認識」モジュールの前に「テキスト検出」または「対象物検出」モジュールを使用し、モデルの効果を向上させることができます。ただ、「テキスト認識」のあとに別のモジュールを接続できません。

  • 「テキスト検出」モジュールを前に接続する場合、インポート  前のモジュールからインポートをクリックし、「画像補正」機能がオンになっていることを確認してください(デフォルトではオンになっている)。

    普通、「画像補正」機能は画像を上向き(0°)にしますが上向き画像を180°回転することもあります。実際に応じて使用してください。
    補正前 補正後

    rectify image before

    rectify image after

データセットの品質を確保する

「テキスト認識」はラベル付けられた領域のテキストを認識して結果を生成します。最後に手動で確認します。品質の高いモデルをトレーニングするために実際と一致している画像を使用してください。

適切なデータセットを選択する

  • 画像枚数を控える

    初めて「テキスト認識」モジュールを使用するとき、20~30 枚の画像を使用することをお勧めします。検証の結果によって増やしたり減らしたりしてください。

  • 各種類のデータを均等な割合で使用する

    トレーニングセットの画像の割合を均等にしてください。これは、モデルの効果を確保するためです。

    improve model accuracy diversity
  • 無効データを回避する

    質の高い画像を使用してください。質の低い画像を使用すれば、モデルトレーニングに悪い影響を与えます。

データ量が多すぎると、トレーニングの時間が長くなり、また後続の改善の妨げになることもあります。

ラベル付けの品質を確保する

「テキスト認識ツール」を使用してテキスト領域を選択すると認識結果が自動的に生成されます。その後手動で確認します。このように、正確なラベル付けと結果の確認は大事です。

正確なラベル付け

不完全な領域選択はモデルの効果に影響します。テキスト領域を全部納めてください。

不正確なラベル付け 正確なラベル付け

bad example 1

good example 1

結果の確認

自動認識の結果は全部正確なわけではありません。手動で確認する必要があります。間違った結果を使用したらモデルの効果に影響します。

不正確なラベル付け 正確なラベル付け

bad example 2

good example 2

Mech-Mindは、お客様のプライバシーを重視しています

このサイトでは最高の体験を提供するために Cookie を使用しています。サイトの閲覧を続ける場合、Cookie の使用に同意したことになります。「拒否する」を選択すると、このサイトを訪れた際に追跡や記憶が行われないように単独の Cookie が使用されます。