テキスト検出モジュールの使用例

現在ご覧いただいているのは2.5.3 バージョンの内容です。異なるバージョンを参照する場合は、画面右上のボタンから切り替えが可能です。

■ 最新版をご利用される場合は、弊社ホームページよりダウンロードが可能です。ダウンロードにはパスワードが必要となりますので、サポート窓口までお問い合わせください。

■ ご利用中のバージョンが分からない場合はお気軽にサポート窓口までご連絡ください。

識別コードのデータ（ダウンロード先）を例に、「テキスト検出」モジュールの使用方法を説明します。「テキスト認識」モジュールと合わせて使用することで画像のテキスト（文字、数字、記号）を検出してエクスポートします。

また、お手元のデータも使用できます。ラベル付けの段階に多少異なりますが、全体の操作はほぼ同じです。

使用手順

プロジェクトを新規作成して「テキスト検出」モジュールを追加：ホーム画面の プロジェクトを新規作成 をクリックし、プロジェクトディレクトリを選択してプロジェクト名を入力し、新しいプロジェクトを作成します。右上のをクリックし、「テキスト検出」モジュールを選択します。

ワーク画像データをインポート：ダウンロードした圧縮フォルダを解凍し、左上の インポート/エクスポートをクリックし、フォルダをインポートを選択して、ダウンロードした画像データをインポートすることができます。

データセットをインポートを選択すると、DLKDB 形式（.dlkd）のデータセット、すなわち Mech-DLK からエクスポートされたデータセットにのみ対応できます。

ROI を設定：ROI ツールをクリックし、画像のテキストを納める領域を設定し、画像の上のをクリックして適用します。ROI を選択するのは、不要な背景の情報を除去するためです。
トレーニングセットと検証セットを分ける：ソフトウェアでは、デフォルトの設定として、データセットの 80％をトレーニングセット、残りの 20％を検証セットに分けます。をクリックし、スライダをドラッグしてその割合を調整することができます。トレーニングセットも検証セットもすべてのカテゴリーのテキスト画像が含まれることを確認してください。トレーニングセットの向きが異なるテキストの画像の数は大きな差がないようにしてください。そうでなければ画像の名前を右クリックして「トレーニングセットに移動」あるいは「検証セットに移動」をクリックして画像のカテゴリーを変更することができます。
画像のラベル付け：画像の左側のツールバーからツールを選択してラベルを付けます。ラベル付けを実行するとき、目標領域の端に近づけ、不要な背景がなくて対象領域が完全に収まるようにしてください。
モデルトレーニング：デフォルトのパラメータを使って、トレーニングをクリックしてモデルのトレーニングを開始します。
モデル検証：モデルトレーニング終了後、検証をクリックして結果を確認します。

モデルを検証した後、新しい画像をモジュールにインポートして事前ラベル付けツールを使用して自動ラベル付けを実行できます。詳細は、事前ラベル付け機能をお読みください。