テキスト認識

現在ご覧いただいているのは最新版の内容です（V2.2.1）。異なるバージョンを参照する場合は、画面右上のボタンから切り替えが可能です。

■ ご利用中のバージョンが分からない場合や、サポートが必要な場合はお気軽にサポート窓口までご連絡ください。

機能

テキスト認識モデルパッケージを使用して入力画像に対して推論を行い、画像内の文字を認識できます。現在、以下の文字、数字、および一部の特殊記号の認識に対応しています。

文字：abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ
数字：0123456789
特殊記号：!"#$%&'()*+,-./:;>=<?@[\]_`~

3C 電子、自動車、包装などの業界において、文字、ラベル、シリアル番号などの情報検出に適しています。

入力と出力

ディープラーニングモデルパッケージを推論 ステップでこのモデルパッケージをインポートすると、以下の入力・出力ポートが表示されます。

入力

入力ポート	データ型	説明
画像	Image/Color	このポートに入力された画像がディープラーニングデルパッケージ推論に使用されます。入力データタイプが 2D画像の場合に、このポートが表示されます。
サーフェスデータ	Surface	このポートに入力されたサーフェスデータがディープラーニングデルパッケージ推論に使用されます。入力データタイプがサーフェスデータの場合に、このポートが表示されます。

入力ポート

データ型

説明

画像

Image/Color

このポートに入力された画像がディープラーニングデルパッケージ推論に使用されます。入力データタイプ が 2D画像 の場合に、このポートが表示されます。

サーフェスデータ

Surface

このポートに入力されたサーフェスデータがディープラーニングデルパッケージ推論に使用されます。入力データタイプ が サーフェスデータ の場合に、このポートが表示されます。

出力

出力ポート	データ型	説明
可視化出力	Image/Color	可視化された結果。
テキスト認識結果	String	テキスト認識の結果。

出力ポート

データ型

説明

可視化出力

Image/Color

可視化された結果。

テキスト認識結果

String

テキスト認識の結果。

パラメータ説明

テキスト認識のモデルパッケージをインポートする場合、以下のパラメータを設定する必要があります。

モデルパッケージ設定

パラメータ	説明
モデルパッケージ管理ツール	パラメータ説明：ディープラーニングモデルパッケージ管理ツールを開き、ディープラーニングモデルパッケージをインポートするために使用されます。モデルパッケージファイルとは、Mech-DLKによってエクスポートされた「.dlkpack」を指します。調整説明：ディープラーニングモデルパッケージ管理ツールの使用方法については、ディープラーニングモデルパッケージ管理ツールをご参照ください。
モデルパッケージ名	パラメータ説明：このパラメータは、ディープラーニングモデルパッケージをインポートした後、インポートしたモデルパッケージを選択するために使用されます。調整説明：モデルパッケージ管理ツールを使用してディープラーニングモデルをインポートした後、ここでドロップダウンリストから対応するモデルパッケージ名を選択します。
モデルパッケージ切替後に元のモデルを解放	パラメータ説明：モデルを切り替える際に、元のモデルパッケージが使用していたリソースを即時に解放するかどうかを制御します。初期値：チェックを入れる調整説明：チェックを入れると、他ステップで使用中であっても、別モデルへ切り替えると即座に元モデルリソースを解放します。チェックを入れない場合は、元モデルがどのステップからも使用されなくなった場合にのみ自動解放されます。
モデルパッケージのタイプ	パラメータ説明：モデルパッケージ名を選択すると、モデルパッケージのタイプが自動的に記入されます。
入力画像バッチサイズ	パラメータ説明：各推論時に処理する画像の枚数です。
GPU ID	パラメータ説明：このパラメータは、モデルパッケージ推論に使用するGPUのデバイスIDを設定するために使用されます。調整説明：モデルパッケージ名を選択した後、ここでドロップダウンリストからモデルパッケージ推論に使用するGPUのデバイスIDを選択する必要があります。
入力データタイプ	パラメータ説明：入力データの種類を指定します。選択後、対応する入力ポートが表示されます。2D画像またはサーフェスデータ入力をサポートします。

パラメータ

説明

モデルパッケージ管理ツール

パラメータ説明：ディープラーニングモデルパッケージ管理ツールを開き、ディープラーニングモデルパッケージをインポートするために使用されます。モデルパッケージファイルとは、Mech-DLKによってエクスポートされた「.dlkpack」を指します。
調整説明：ディープラーニングモデルパッケージ管理ツールの使用方法については、ディープラーニングモデルパッケージ管理ツールをご参照ください。

モデルパッケージ名

パラメータ説明：このパラメータは、ディープラーニングモデルパッケージをインポートした後、インポートしたモデルパッケージを選択するために使用されます。
調整説明：モデルパッケージ管理ツールを使用してディープラーニングモデルをインポートした後、ここでドロップダウンリストから対応するモデルパッケージ名を選択します。

モデルパッケージ切替後に元のモデルを解放

パラメータ説明：モデルを切り替える際に、元のモデルパッケージが使用していたリソースを即時に解放するかどうかを制御します。
初期値：チェックを入れる
調整説明：チェックを入れると、他ステップで使用中であっても、別モデルへ切り替えると即座に元モデルリソースを解放します。チェックを入れない場合は、元モデルがどのステップからも使用されなくなった場合にのみ自動解放されます。

モデルパッケージのタイプ

パラメータ説明： モデルパッケージ名 を選択すると、モデルパッケージのタイプ が自動的に記入されます。

入力画像バッチサイズ

パラメータ説明：各推論時に処理する画像の枚数です。

GPU ID

パラメータ説明：このパラメータは、モデルパッケージ推論に使用するGPUのデバイスIDを設定するために使用されます。
調整説明：モデルパッケージ名を選択した後、ここでドロップダウンリストからモデルパッケージ推論に使用するGPUのデバイスIDを選択する必要があります。

入力データタイプ

パラメータ説明：入力データの種類を指定します。選択後、対応する入力ポートが表示されます。2D画像またはサーフェスデータ入力をサポートします。

前処理

パラメータ

説明

ROIファイル

パラメータ説明：入力画像のROIを設定または変更します。

調整説明：初期状態ではデフォルトROI設定が存在します。ROIを変更するには、エディタを開く をクリックします。設定画面が表示されるので、ROIを設定し、ROI名を入力します。

ROI設定方法：画像表示エリアで左クリックし、ドラッグしてROIを選択します。再度左クリックすると、ROI選択が完了します。ROIを再設定する場合は、再び左クリックして選択し直します。選択したROI座標範囲がROIのパラメータで表示されます。確認をクリックすると、設定が保存され、設定画面が閉じます。

論の前に、ここで設定されたROIがMech-DLKで設定されたROIと一致しているかを確認してください。一致していない場合、認識結果に影響を与える 可能性があります。

推論プロセスでは、通常モデルのトレーニング時に設定されたROI（デフォルトROI）が使用されます。カメラ視野内の対象物の位置が変わった場合は、ROIを調整する必要があります。

ROI設定後、初期のROIを使用するには、エディタを開く ボタンの下のROIファイル名を削除します。

後処理

パラメータ	説明
推論設定	パラメータ説明：このパラメータは、テキスト認識のモデルパッケージ推論に関するパラメータを設定するために使用されます。推論設定ツールを開くには、エディタを開くをクリックします。調整説明：詳細については、推論設定ツールをご参照ください。

可視化設定

パラメータ	説明
検出結果の可視化	パラメータ説明：有効にすると、画像上に検出結果を表示します。初期値：チェックを入れない調整アドバイス：実際の状況に応じて設定してくだい。
カスタムフォントサイズを使用	パラメータ説明：可視化出力結果内のテキストフォントサイズをカスタマイズするかを指定します。チェックを入れた後、フォントサイズを設定する必要があります。初期値は1.5です。初期値：チェックを入れない調整アドバイス：実際の状況に応じて設定してくだい。

パラメータ

説明

検出結果の可視化

パラメータ説明：有効にすると、画像上に検出結果を表示します。
初期値：チェックを入れない
調整アドバイス：実際の状況に応じて設定してくだい。

カスタムフォントサイズを使用

パラメータ説明：可視化出力結果内のテキストフォントサイズをカスタマイズするかを指定します。チェックを入れた後、フォントサイズ を設定する必要があります。初期値は1.5です。
初期値：チェックを入れない
調整アドバイス：実際の状況に応じて設定してくだい。

この情報は役に立ちましたか？

フィードバックを送信

テキスト認識

機能

入力と出力

入力

出力

パラメータ説明

モデルパッケージ設定

前処理

後処理

可視化設定

この情報は役に立ちましたか？

ありがとうございます！

ご意見・ご要望がございましたら、以下よりお寄せください：

Mech-Mindは、お客様のプライバシーを重視しています