テキスト認識モジュールの使用例

現在ご覧いただいているのは最新版の内容です（V3.0.0）。異なるバージョンを参照する場合は、画面右上のボタンから切り替えが可能です。

■ ご利用中のバージョンが分からない場合や、サポートが必要な場合はお気軽にサポート窓口までご連絡ください。

識別コードのデータ（ダウンロード先）を例に、テキスト認識モジュールの使用方法を説明します。画像のテキスト（文字、数字、記号）を認識してエクスポートします。

また、お手元のデータも使用できます。ラベル付けの段階に多少異なりますが、全体の操作はほぼ同じです。

事前準備

プロジェクトを新規作成してテキスト認識モジュールを追加：Mech-DLK を起動し、ホーム画面のプロジェクトを新規作成をクリックします。保存パスを選択し、プロジェクト名を入力して新しいプロジェクトを作成します。メイン画面の右上にあるモジュールバーで、入力モジュール下の + ボタンをクリックし、モジュール追加ウィンドウでテキスト認識モジュールを選択します。

画像をインポート：取得した画像データをインポートするか、前述のデータ圧縮ファイルを解凍して使用します。以下の方法で画像をインポートしてください。

方法 1

画像またはフォルダを画像リストにドラッグします。ドラッグによるデータセットのインポートには対応していません。

方法 2

画像リストの上のインポート/エクスポートボタンをクリックします。データの種類に応じてインポートオプションを選択します。

前のモジュールからインポート：前のモジュールの画像をインポートします。
画像をインポート：一枚または複数枚の画像をインポートします。
フォルダをインポート：フォルダにある全ての画像をインポートします（サブフォルダー内の画像を除く）。

データセットをインポート：Mech-DLK からエクスポートしたDLKDB 形式（.dlkd）のデータセットをインポートします。

テキスト方向が前向き（0°）の画像をインポートしてください。
テキスト認識モジュールの前にテキスト検出または対象物検出モジュールを使用し、モデルの効果を向上させることができます。ただ、インポート モジュールからインポートを選択してください。
- テキスト検出モジュールを前に接続する場合、インポートする時は、画像補正機能がオンになっていることを確認してください（デフォルトではオンになっている）。普通、画像補正機能は画像を上向き（0°）にしますが上向き画像を180°回転することもあります。実際に応じて使用してください。

ROI 設定：ROI ツールのアイコンをクリックして、画像のテキストを納める範囲を ROI としてドラッグで指定します。その後、ROI 枠の右下にある確定アイコンをクリックして適用します。これは不要な背景による干渉を削減するためです。
トレーニングセットと検証セットを分ける：トレーニングセット/検証セット分割アイコンをクリックし、スライダをドラッグしてその割合を調整することができます。トレーニングセットと検証セットにはすべてのカテゴリーのテキスト画像が含まれることを確認してください。デフォルトのデータ分配が上記の条件を満たさない場合、画像名を右クリックし、トレーニングセットに移動または検証セットに移動を選択して画像の所属を変更することができます。

データのラベル付け

画像の左側のツールバーからテキスト認識ツールを選択してラベルを付けます。テキスト認識ツールを使用してテキスト領域を選択すると認識結果が自動的に生成されます。その後手動で確認します。このように、正確なラベル付けと結果の確認は大事です。

ラベル付けに、事前トレーニングラベル付けまたはVFMラベル付けボタンをクリックして自動ラベル付けを実行できます。その後、手動で微調整すればいいです。
VFMラベル付け（視覚基礎モデルを用いたラベル付け）の結果を調整したい場合、以下の手順に従ってください。
1. を右クリックし、VFM ラベル付けツールを選択します。
2. 画像編集エリアの上方のをクリックします。
3. VFM ラベル付け設定ウィンドウでフィルタリング項目を追加してラベル付け結果を修正できます。

手動で画像にラベルを付ける時、テキストテンプレート機能が利用できます。テキストテンプレート機能は、ラベルを置換できます。以下の手順を実行します：

ソフトウェアのメイン画面で「ラベル付け」タブのテキストテンプレートをクリックします。
テキストテンプレートパネルの右上の +新規作成をクリックします。
テキストテンプレートを新規作成ウィンドウにテキストを入力してから OK ボタンをクリックします。
それから画像リストから画像を 1 枚選択します。右の適用をクリックします。すると新規作成したテンプレートは、選択した画像に有効になります。

モデルのトレーニング

モデルトレーニング：デフォルトのパラメータを使って、トレーニング をクリックしてモデルのトレーニングを開始します。
トレーニング状況確認：トレーニングパネルからモデルのトレーニング状況をリアルタイムで確認できます。
「トレーニングチャート」から状況確認：トレーニングタブのチャートを表示ボタンをクリックしてトレーニングチャートを表示して、曲線の変化から精度の推移を把握します。正確度曲線が全体的に上昇傾向、損失曲線が全体的に低下傾向になると、トレーニングが正常に進行していることになります。

実際の状況に応じてトレーニングを中止（オプション）：モデルの正確度が要求水準に達した場合、時間節約のため「トレーニングセンター」ボタンをクリックし、タスクリストから対象プロジェクトを選択して stop trainig をクリックすると、トレーニングが中止されます。また、トレーニングの完了まで待ち、正確度の推移を観測して初歩的にモデルの効果を評価することもできます。

エポックを重ねても正確度曲線に上昇傾向が見られない場合は、トレーニングに問題がある可能性があります。トレニンーグを中止し、各パラメータ設定を確認した上で、データセットにおけるラベル抜けや誤りの有無をチェックし、修正後にトレニンーグを再開してください。

モデルの検証

モデル検証：モデルトレーニング終了後、検証をクリックして結果を確認します。
トレーニングセットにあるモデルの検証結果をチェック：検証完了後、検証タブの検証統計エリアから検証結果の統計情報を確認できます。詳細レポートボタンをクリックし、詳細レポートウィンドウが表示され、検証統計の詳しい結果を確認できます。

モデル効果を改善するには、付けたラベルをチェックしてトレーニングパラメータを調整した後再度トレーニングしてください。 詳細レポートウィンドウの右下にあるレポートをエクスポートボタンをクリックしてエクスポートすることができます。
再トレーニング：新たにラベル付けした画像をトレーニングセットに追加してから、トレーニングボタンをクリックして、再トレーニングを開始します。
モデル検証結果の再チェック：再トレニンーグ終了後、再び検証ボタンをクリックしてモデルの検証を行い、各データセットにおけるモデルの検証結果を確認します。
モデルの微調整（オプション）：開発者モードをオンにしてトレーニングパラメータ設定でモデルを微調整することが可能です。詳細な説明は、モデルの追加学習をご参照ください。

モデルの最適化：モデルが使用要件を満たすまで上記の手順を繰り返します。

検証の結果を修正したい場合、以下の手順に従ってください。

検証タブでフィルタリングルール設定を実行します。
フィルタリングルール設定ウィンドウを開き、ルールを追加します。

モデルのエクスポート

モデルをエクスポートをクリックして保存場所を指定してからモデルをエクスポートします。

エクスポートされたモデルは Mech-DLK SDK に使用できます。クリックして詳細な説明を確認します。

この情報は役に立ちましたか？

フィードバックを送信

ありがとうございます！

ご意見・ご要望がございましたら、以下よりお寄せください：

Mech-Mindは、お客様のプライバシーを重視しています

このサイトでは最高の体験を提供するために Cookie を使用しています。サイトの閲覧を続ける場合、Cookie の使用に同意したことになります。「拒否する」を選択すると、このサイトを訪れた際に追跡や記憶が行われないように単独の Cookie が使用されます。

同意する

拒否する