テキスト認識
機能
テキスト認識モデルパッケージを使用して入力画像に対して推論を行い、画像内の文字を認識できます。現在、以下の文字、数字、および一部の特殊記号の認識に対応しています。
-
文字:abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ
-
数字:0123456789
-
特殊記号:!"#$%&'()*+,-./:;>=<?@[\]_`~
3C 電子、自動車、包装などの業界において、文字、ラベル、シリアル番号などの情報検出に適しています。
入力と出力
パラメータ説明
テキスト認識のモデルパッケージをインポートする場合、以下のパラメータを設定する必要があります。
モデルパッケージ設定
| パラメータ | 説明 |
|---|---|
モデルパッケージ管理ツール |
パラメータ説明:ディープラーニングモデルパッケージ管理ツールを開き、ディープラーニングモデルパッケージをインポートするために使用されます。モデルパッケージファイルとは、Mech-DLKによってエクスポートされた「.dlkpack」を指します。
|
モデルパッケージ名 |
パラメータ説明:このパラメータは、ディープラーニングモデルパッケージをインポートした後、インポートしたモデルパッケージを選択するために使用されます。
|
モデルパッケージ切替後に元のモデルを解放 |
パラメータ説明:モデルを切り替える際に、元のモデルパッケージが使用していたリソースを即時に解放するかどうかを制御します。
|
モデルパッケージのタイプ |
パラメータ説明: モデルパッケージ名 を選択すると、モデルパッケージのタイプ が自動的に記入されます。 |
入力画像バッチサイズ |
パラメータ説明:各推論時に処理する画像の枚数です。 |
GPU ID |
パラメータ説明:このパラメータは、モデルパッケージ推論に使用するGPUのデバイスIDを設定するために使用されます。
|
入力データタイプ |
パラメータ説明: 入力データの種類を指定します。選択後、対応する入力ポートが表示されます。2D画像またはサーフェスデータ入力をサポートします。 |
前処理
| パラメータ | 説明 | ||||
|---|---|---|---|---|---|
ROIファイル |
パラメータ説明:入力画像のROIを設定または変更します。 調整説明:初期状態ではデフォルトROI設定が存在します。ROIを変更するには、エディタを開く をクリックします。設定画面が表示されるので、ROIを設定し、ROI名を入力します。 ROI設定方法:画像表示エリアで左クリックし、ドラッグしてROIを選択します。再度左クリックすると、ROI選択が完了します。ROIを再設定する場合は、再び左クリックして選択し直します。選択したROI座標範囲がROIのパラメータで表示されます。確認 をクリックすると、設定が保存され、設定画面が閉じます。
|
後処理
| パラメータ | 説明 |
|---|---|
推論設定 |
パラメータ説明:このパラメータは、テキスト認識のモデルパッケージ推論に関するパラメータを設定するために使用されます。推論設定ツールを開くには、エディタを開く をクリックします。
|