テキスト検出モジュールの使用例
識別コードのデータ(ダウンロード先)を例に、「テキスト検出」モジュールの使用方法を説明します。「テキスト認識」モジュールと合わせて使用することで画像のテキスト(文字、数字、記号)を検出してエクスポートします。
また、お手元のデータも使用できます。ラベル付けの段階に多少異なりますが、全体の操作はほぼ同じです。 |
使用手順
-
プロジェクトを新規作成して「テキスト検出」モジュールを追加:ホーム画面の プロジェクトを新規作成 をクリックし、プロジェクトディレクトリを選択してプロジェクト名を入力し、新しいプロジェクトを作成します。右上の
をクリックし、「テキスト検出」モジュールを選択します。
-
ワーク画像データをインポート:ダウンロードした圧縮フォルダを解凍し、左上の インポート/エクスポートをクリックし、フォルダをインポートを選択して、ダウンロードした画像データをインポートすることができます。
データセットをインポートを選択すると、DLKDB 形式(.dlkd)のデータセット、すなわち Mech-DLK からエクスポートされたデータセットにのみ対応できます。 -
ROI を設定:ROI ツール
をクリックし、画像のテキストを納める領域を設定し、画像の上の
をクリックして適用します。ROI を選択するのは、不要な背景の情報を除去するためです。
-
トレーニングセットと検証セットを分ける:ソフトウェアでは、デフォルトの設定として、データセットの 80% をトレーニングセット、残りの 20% を検証セットに分けます。
をクリックし、スライダをドラッグしてその割合を調整することができます。トレーニングセットも検証セットもすべてのカテゴリーのテキスト画像が含まれることを確認してください。トレーニングセットの向きが異なるテキストの画像の数は大きな差がないようにしてください。そうでなければ画像の名前を右クリックして「トレーニングセットに移動」あるいは「検証セットに移動」をクリックして画像のカテゴリーを変更することができます。
-
画像のラベル付け:画像の左側のツールバーからツールを選択してラベルを付けます。ラベル付けを実行するとき、目標領域の端に近づけ、不要な背景がなくて対象領域が完全に収まるようにしてください。
-
ラベル付けに、事前トレーニングラベル付けまたはVFMラベル付けボタンをクリックして自動ラベル付けを実行できます。その後、手動で微調整すればいいです。
-
VFMラベル付け(視覚基礎モデルを用いたラベル付け)の結果を調整したい場合、以下の手順に従ってください。
-
を右クリックし、VFM ラベル付けツールを選択します。
-
画像編集エリアの上方の
をクリックします。
-
VFM ラベル付け設定ウィンドウでフィルタリング項目を追加してラベル付け結果を修正できます。
-
-
-
モデルトレーニング:デフォルトのパラメータを使って、トレーニングをクリックしてモデルのトレーニングを開始します。
-
モデル検証:モデルトレーニング終了後、検証 をクリックして結果を確認します。
モデルを検証した後、新しい画像をモジュールにインポートして事前トレーニングラベル付け機能を使用して自動ラベル付けを実行できます。詳細は、事前トレーニングラベル付け機能をお読みください。
検証の結果を修正したい場合、以下の手順に従ってください。
-
検証パラメータパネルでフィルタリングルール設定を実行します。
-
フィルタリングルール設定ウィンドウを開き、ルールを追加します。
-
-
モデルをエクスポート:モデルをエクスポートをクリックします。表示されたウィンドウでモデルをエクスポートをクリックします。保存パスを指定してください。
エクスポートされたモデルは Mech-DLK SDK に使用できます。クリックして詳細な説明を確認します。