テキスト検出
機能
テキスト検出モデルパッケージを使用して入力画像に対して推論を行い、画像内のテキスト領域を検出できます。通常はテキスト認識モデルと組み合わせて使用されます。
3C 電子、自動車、包装などの業界において、文字、ラベル、シリアル番号などの情報検出に適しています。
パラメータ説明
テキスト検出のモデルパッケージをインポートする場合、以下のパラメータを設定する必要があります。
モデルパッケージの設定
| パラメータ | 説明 |
|---|---|
モデルパッケージ管理ツール |
パラメータ説明:ディープラーニングモデルパッケージ管理ツールを開き、ディープラーニングモデルパッケージをインポートするために使用されます。モデルパッケージファイルとは、Mech-DLKによってエクスポートされた「.dlkpack」を指します。
|
モデルパッケージ名 |
パラメータ説明:このパラメータは、ディープラーニングモデルパッケージをインポートした後、インポートしたモデルパッケージを選択するために使用されます。
|
モデルパッケージ切替後に元のモデルを解放 |
パラメータ説明:モデルを切り替える際に、元のモデルパッケージが使用していたリソースを即時に解放するかどうかを制御します。
|
モデルパッケージのタイプ |
パラメータ説明: モデルパッケージ名 を選択すると、モデルパッケージのタイプ が自動的に記入されます。 |
入力画像バッチサイズ |
パラメータ説明:各推論時に処理する画像の枚数です。 |
GPU ID |
パラメータ説明:このパラメータは、モデルパッケージ推論に使用するGPUのデバイスIDを設定するために使用されます。
|
前処理
| パラメータ | 説明 | ||||
|---|---|---|---|---|---|
ROIファイル |
パラメータ説明:入力画像のROIを設定または変更します。 調整説明:初期状態ではデフォルトのROI設定が既に存在します。ROI設定を変更するには、ROIファイルを設定 をクリックします。次に、表示された画面で ROI 設定 を行い、ROI名を入力します。
|
後処理
| パラメータ | 説明 |
|---|---|
推論設定 |
パラメータ説明:このパラメータは、テキスト検出のモデルパッケージ推論に関するパラメータを設定するために使用されます。推論設定ツールを開くには、エディタを開く をクリックします。
|
可視化設定
| パラメータ | 説明 |
|---|---|
検出結果を可視化 |
パラメータ説明:有効にすると、画像上に検出結果を表示します。
|
カスタムフォントサイズを使用 |
パラメータ説明:このパラメータは、可視化出力結果のフォントサイズをカスタマイズするかどうかを設定するために使用されます。チェックを入れた後、フォントサイズ を設定する必要があります。
|
フォントサイズ |
パラメータ説明:このパラメータは、可視化出力結果のフォントサイズを設定するために使用されます。
|