文本识别

您正在查看最新版本（V2.2.1）的文档。如果您想查阅其他版本的文档，可以点击页面右上角“切换版本”按钮进行切换。

■ 如果您不确定当前使用的产品是哪个版本，请随时联系梅卡曼德技术支持。

功能介绍

使用文本识别模型包对输入图像进行推理，可识别图像中的字符。目前支持以下字母、数字以及部分特殊符号的识别：

字母：abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ
数字：0123456789
特殊符号：!"#$%&'()*+,-./:;>=<?@[\]_`~

适用于3C电子、汽车、包装等行业中，检测字符、标签、序列号等信息。

输入与输出

在深度学习模型包推理步骤中导入该模型包后，将显示以下输入与输出端口。

输入

输入端口	数据类型	说明
图像	Image/Color	此端口输入的图像将用于深度学习模型包推理。当输入数据类型为2D图像时显示。
表面数据	Surface	此端口输入的表面数据将用于深度学习模型包推理。当输入数据类型为表面数据时显示。

输入端口

数据类型

说明

图像

Image/Color

此端口输入的图像将用于深度学习模型包推理。当输入数据类型为2D图像时显示。

表面数据

Surface

此端口输入的表面数据将用于深度学习模型包推理。当输入数据类型为表面数据时显示。

输出

输出端口	数据类型	说明
可视化输出	Image/Color	可视化结果。
文本识别结果	String	文本识别结果。

输出端口

数据类型

说明

可视化输出

Image/Color

可视化结果。

文本识别结果

String

文本识别结果。

参数说明

当导入文本识别模型包时，该步骤需调节以下参数。

模型包设置

参数	解释
模型包管理工具	参数解释：该参数用于打开深度学习模型包管理工具，导入深度学习模型包。模型包文件是 Mech-DLK 导出的 “.dlkpack”文件。调节说明：深度学习模型包管理工具的使用方法可参考深度学习模型包管理工具。
模型包名称	参数解释：导入深度学习模型包后，该参数用于为该步骤选择已导入的模型包。调节说明：使用深度学习模型包管理工具导入深度学习模型后，在该处的下拉列表中选择对应的模型包名称。
切换模型包后释放原模型包	参数解释：控制切换模型包时是否立即释放原模型包所占用的资源。默认值：勾选。调节说明：勾选后，当步骤切换到其他模型包时，系统将立即释放原模型包资源，即使该模型包仍被其他步骤使用。未勾选时，仅当原模型包不再被任何步骤使用时，系统才会自动释放其资源。
模型包类型	参数解释：选择模型包名称后，将自动填充模型包类型。
输入图像批量大小	参数解释：每次推理时处理的图像数量。
GPU ID	参数解释：该参数用于指定用于模型包推理的 GPU 设备 ID。调节说明：选择模型包名称后，需在该参数下拉栏中选择用于模型包推理的 GPU 设备 ID。
输入数据类型	参数解释：该参数用于指定输入数据的类型，选择后将显示对应的输入端口。支持输入2D图像或表面数据。

参数

解释

模型包管理工具

参数解释：该参数用于打开深度学习模型包管理工具，导入深度学习模型包。模型包文件是 Mech-DLK 导出的 “.dlkpack”文件。

调节说明：深度学习模型包管理工具的使用方法可参考深度学习模型包管理工具。

模型包名称

参数解释：导入深度学习模型包后，该参数用于为该步骤选择已导入的模型包。

调节说明：使用深度学习模型包管理工具导入深度学习模型后，在该处的下拉列表中选择对应的模型包名称。

切换模型包后释放原模型包

参数解释：控制切换模型包时是否立即释放原模型包所占用的资源。

默认值：勾选。

调节说明：勾选后，当步骤切换到其他模型包时，系统将立即释放原模型包资源，即使该模型包仍被其他步骤使用。未勾选时，仅当原模型包不再被任何步骤使用时，系统才会自动释放其资源。

模型包类型

参数解释：选择模型包名称后，将自动填充模型包类型。

输入图像批量大小

参数解释：每次推理时处理的图像数量。

GPU ID

参数解释：该参数用于指定用于模型包推理的 GPU 设备 ID。

调节说明：选择模型包名称后，需在该参数下拉栏中选择用于模型包推理的 GPU 设备 ID。

输入数据类型

参数解释：该参数用于指定输入数据的类型，选择后将显示对应的输入端口。支持输入2D图像或表面数据。

预处理

参数

解释

ROI 文件

参数解释：该参数用于设置或修改输入图像的 ROI。

调节说明：在初始状态下时，已存在默认的ROI设置。如需修改ROI设置，可单击打开编辑器按钮。然后在弹出的设置目标区域窗口中设置ROI，并填写ROI名称。

设置ROI流程：在图片显示区域，单击鼠标左键，拖动鼠标框选ROI，再次单击鼠标左键完成框选。若需重新框选ROI，再次单击鼠标左键进行框选即可。所框选的ROI坐标范围会显示在目标区域属性中，单击确定按钮后将会保存并退出。

推理前，请检查此处设置的 ROI 与Mech-DLK中设置的 ROI 是否一致。若不一致，可能影响识别效果。

推理过程中，一般使用模型训练时设置的 ROI，即默认 ROI。如果物体在相机视野内的位置发生改变，需调整 ROI。

当设置好 ROI 后，如需使用默认 ROI，将打开编辑器按钮下方的 ROI 名称删除即可。

后处理

参数	解释
推理配置	参数解释：用于对文本识别模型包推理时的相关参数进行配置，单击打开编辑器可打开推理配置窗口。调节说明：相关参数说明见推理配置工具。

可视化设置

参数	解释
可视化检测结果	参数解释：开启后，将在图像上显示检测结果。默认值：关闭。调节建议：根据实际需求设置该参数。
使用自定义字体大小	参数解释：该参数用于决定是否对可视化输出结果中的文本字体大小实现自定义。启用该参数后，需设置字体大小（0~10），默认为1.5。默认值：关闭。调节建议：根据实际需求设置该参数。

参数

解释

可视化检测结果

参数解释：开启后，将在图像上显示检测结果。

默认值：关闭。

调节建议：根据实际需求设置该参数。

使用自定义字体大小

参数解释：该参数用于决定是否对可视化输出结果中的文本字体大小实现自定义。启用该参数后，需设置字体大小（0~10），默认为1.5。

默认值：关闭。

调节建议：根据实际需求设置该参数。

该页面是否有帮助？

我要反馈

文本识别

功能介绍

输入与输出

输入

输出

参数说明

模型包设置

预处理

后处理

可视化设置

该页面是否有帮助？

感谢您的支持！

可以通过以下方式反馈意见：

我们重视您的隐私