テキスト認識

現在ご覧いただいているのは最新版の内容です（V2.2.1）。異なるバージョンを参照する場合は、画面右上のボタンから切り替えが可能です。

■ ご利用中のバージョンが分からない場合や、サポートが必要な場合はお気軽にサポート窓口までご連絡ください。

機能

テキスト認識モデルパッケージを使用して入力画像に対して推論を行い、画像内の文字を認識できます。現在、以下の文字、数字、および一部の特殊記号の認識に対応しています。

文字：abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ
数字：0123456789
特殊記号：!"#$%&'()*+,-./:;>=<?@[\]_`~

3C 電子、自動車、包装などの業界において、文字、ラベル、シリアル番号などの情報検出に適しています。

入力と出力

「ディープラーニングモデルパッケージを推論」ステップでこのモデルパッケージをインポートすると、以下の入力・出力ポートが表示されます。

入力

入力ポート	データ型	説明
画像	Image/Color	このポートに入力された画像がディープラーニングモデルパッケージ推論に使用されます。

入力ポート

データ型

説明

画像

Image/Color

このポートに入力された画像がディープラーニングモデルパッケージ推論に使用されます。

出力

出力ポート	データ型	説明
可視化出力	Image/Color	可視化された結果。
テキスト認識結果	String	テキスト認識の結果。

出力ポート

データ型

説明

可視化出力

Image/Color

可視化された結果。

テキスト認識結果

String

テキスト認識の結果。

パラメータ説明

テキスト認識のモデルパッケージをインポートする場合、以下のパラメータを設定する必要があります。

モデルパッケージの設定

パラメータ	説明
モデルパッケージ管理ツール	パラメータ説明：ディープラーニングモデルパッケージ管理ツールを開き、ディープラーニングモデルパッケージをインポートするために使用されます。モデルパッケージファイルとは、Mech-DLKによってエクスポートされた「.dlkpack」を指します。調整説明：ディープラーニングモデルパッケージ管理ツールの使用方法については、ディープラーニングモデルパッケージ管理ツールをご参照ください。
モデルパッケージ名	パラメータ説明：このパラメータは、ディープラーニングモデルパッケージをインポートした後、インポートしたモデルパッケージを選択するために使用されます。調整説明：モデルパッケージ管理ツールを使用してディープラーニングモデルをインポートした後、ここでドロップダウンリストから対応するモデルパッケージ名を選択します。
モデルパッケージ切替後に元のモデルを解放	パラメータ説明：モデルを切り替える際に、元のモデルパッケージが使用していたリソースを即時に解放するかどうかを制御します。初期値：チェックを入れる調整説明：チェックを入れると、他ステップで使用中であっても、別モデルへ切り替えると即座に元モデルリソースを解放します。チェックを入れない場合は、元モデルがどのステップからも使用されなくなった場合にのみ自動解放されます。
モデルパッケージのタイプ	パラメータ説明：モデルパッケージ名を選択すると、モデルパッケージのタイプが自動的に記入されます。
入力画像バッチサイズ	パラメータ説明：各推論時に処理する画像の枚数です。
GPU ID	パラメータ説明：このパラメータは、モデルパッケージ推論に使用するGPUのデバイスIDを設定するために使用されます。調整説明：モデルパッケージ名を選択した後、ここでドロップダウンリストからモデルパッケージ推論に使用するGPUのデバイスIDを選択する必要があります。

パラメータ

説明

モデルパッケージ管理ツール

パラメータ説明：ディープラーニングモデルパッケージ管理ツールを開き、ディープラーニングモデルパッケージをインポートするために使用されます。モデルパッケージファイルとは、Mech-DLKによってエクスポートされた「.dlkpack」を指します。
調整説明：ディープラーニングモデルパッケージ管理ツールの使用方法については、ディープラーニングモデルパッケージ管理ツールをご参照ください。

モデルパッケージ名

パラメータ説明：このパラメータは、ディープラーニングモデルパッケージをインポートした後、インポートしたモデルパッケージを選択するために使用されます。
調整説明：モデルパッケージ管理ツールを使用してディープラーニングモデルをインポートした後、ここでドロップダウンリストから対応するモデルパッケージ名を選択します。

モデルパッケージ切替後に元のモデルを解放

パラメータ説明：モデルを切り替える際に、元のモデルパッケージが使用していたリソースを即時に解放するかどうかを制御します。
初期値：チェックを入れる
調整説明：チェックを入れると、他ステップで使用中であっても、別モデルへ切り替えると即座に元モデルリソースを解放します。チェックを入れない場合は、元モデルがどのステップからも使用されなくなった場合にのみ自動解放されます。

モデルパッケージのタイプ

パラメータ説明： モデルパッケージ名 を選択すると、モデルパッケージのタイプ が自動的に記入されます。

入力画像バッチサイズ

パラメータ説明：各推論時に処理する画像の枚数です。

GPU ID

パラメータ説明：このパラメータは、モデルパッケージ推論に使用するGPUのデバイスIDを設定するために使用されます。
調整説明：モデルパッケージ名を選択した後、ここでドロップダウンリストからモデルパッケージ推論に使用するGPUのデバイスIDを選択する必要があります。

前処理

パラメータ

説明

ROIファイル

パラメータ説明：入力画像のROIを設定または変更します。

調整説明：初期状態ではデフォルトのROI設定が既に存在します。ROI設定を変更するには、ROIファイルを設定 をクリックします。次に、表示された画面で ROI 設定を行い、ROI名を入力します。

推論の前に、ここで設定されたROIがMech-DLKで設定されたROIと一致しているかを確認してください。一致していない場合、認識結果に影響を与える 可能性があります。

推論プロセスでは、通常モデルのトレーニング時に設定されたROI（デフォルトROI）が使用されます。カメラ視野内の対象物の位置が変わった場合は、ROIを調整する必要があります。

ROI設定後、初期のROIを使用するには、エディタを開くの下のROIを削除します。

後処理

パラメータ	説明
推論設定	パラメータ説明：このパラメータは、テキスト認識のモデルパッケージ推論に関するパラメータを設定するために使用されます。推論設定ツールを開くには、エディタを開くをクリックします。調整説明：詳細については、推論設定ツールをご参照ください。

可視化設定

パラメータ	説明
検出結果を可視化	パラメータ説明：有効にすると、画像上に検出結果を表示します。初期値：オフ調整アドバイス：実際の状況に応じて設定してください。
カスタムフォントサイズを使用	パラメータ説明：このパラメータは、可視化出力結果のフォントサイズをカスタマイズするかどうかを設定するために使用されます。チェックを入れた後、フォントサイズを設定する必要があります。初期値：オフ調整アドバイス：実際の状況に応じて設定してください。
フォントサイズ	パラメータ説明：このパラメータは、可視化出力結果のフォントサイズを設定するために使用されます。初期値：1.5 調整アドバイス：実際の状況に応じて設定してください。

パラメータ

説明

検出結果を可視化

パラメータ説明：有効にすると、画像上に検出結果を表示します。
初期値：オフ
調整アドバイス：実際の状況に応じて設定してください。

カスタムフォントサイズを使用

パラメータ説明：このパラメータは、可視化出力結果のフォントサイズをカスタマイズするかどうかを設定するために使用されます。チェックを入れた後、フォントサイズ を設定する必要があります。
初期値：オフ
調整アドバイス：実際の状況に応じて設定してください。

フォントサイズ

パラメータ説明：このパラメータは、可視化出力結果のフォントサイズを設定するために使用されます。
初期値：1.5
調整アドバイス：実際の状況に応じて設定してください。

この情報は役に立ちましたか？

フィードバックを送信

ありがとうございます！

ご意見・ご要望がございましたら、以下よりお寄せください：

Mech-Mindは、お客様のプライバシーを重視しています

このサイトでは最高の体験を提供するために Cookie を使用しています。サイトの閲覧を続ける場合、Cookie の使用に同意したことになります。「拒否する」を選択すると、このサイトを訪れた際に追跡や記憶が行われないように単独の Cookie が使用されます。

同意する

拒否する