テキスト検出モジュールの使用例
識別コードのデータ(ダウンロード先)を例に、「テキスト検出」モジュールの使用方法を説明します。「テキスト認識」モジュールと合わせて使用することで画像のテキスト(文字、数字、記号)を検出してエクスポートします。
また、お手元のデータも使用できます。ラベル付けの段階に多少異なりますが、全体の操作はほぼ同じです。 |
使用手順
-
プロジェクトを新規作成して「テキスト検出」モジュールを追加:ホーム画面の プロジェクトを新規作成 をクリックし、プロジェクトディレクトリを選択してプロジェクト名を入力し、新しいプロジェクトを作成します。右上のをクリックし、「テキスト検出」モジュールを選択します。
-
ワーク画像データをインポート:ダウンロードした圧縮フォルダを解凍し、左上の インポート/エクスポートをクリックし、フォルダをインポートを選択して、ダウンロードした画像データをインポートすることができます。
データセットをインポートを選択すると、DLKDB 形式(.dlkd)のデータセット、すなわち Mech-DLK からエクスポートされたデータセットにのみ対応できます。 -
ROI を設定:ROI ツールをクリックし、画像のテキストを納める領域を設定し、画像の上のをクリックして適用します。ROI を選択するのは、不要な背景の情報を除去するためです。
-
トレーニングセットと検証セットを分ける:ソフトウェアでは、デフォルトの設定として、データセットの 80% をトレーニングセット、残りの 20% を検証セットに分けます。 をクリックし、スライダをドラッグしてその割合を調整することができます。トレーニングセットも検証セットもすべてのカテゴリーのテキスト画像が含まれることを確認してください。トレーニングセットの向きが異なるテキストの画像の数は大きな差がないようにしてください。そうでなければ画像の名前を右クリックして「トレーニングセットに移動」あるいは「検証セットに移動」をクリックして画像のカテゴリーを変更することができます。
-
画像のラベル付け:画像の左側のツールバーからツールを選択してラベルを付けます。ラベル付けを実行するとき、目標領域の端に近づけ、不要な背景がなくて対象領域が完全に収まるようにしてください。
-
モデルトレーニング:デフォルトのパラメータを使って、トレーニングをクリックしてモデルのトレーニングを開始します。
-
モデル検証:モデルトレーニング終了後、検証 をクリックして結果を確認します。
モデルを検証した後、新しい画像をモジュールにインポートして事前トレーニングラベル付け機能を使用して自動ラベル付けを実行できます。詳細は、事前トレーニングラベル付け機能をお読みください。
-
モデルをエクスポート:モデルをエクスポートをクリックします。表示されたウィンドウで「入力画像のサイズ」を設定してからモデルをエクスポートをクリックします。保存パスを指定してください。
デフォルトでは、「入力画像のサイズ」は検証時と一致します。検証時に推論の速度と精度は要件を満たした場合にデフォルトのままで使用してください。
エクスポートされたモデルは Mech-DLK SDK に使用できます。クリックして詳細な説明を確認します。