使用文本检测模块

您正在查看最新版本（V2.6.1）的文档。如果您想查阅其他版本的文档，可以点击页面右上角“切换版本”按钮进行切换。

■ 如果您不确定当前使用的产品是哪个版本，请随时联系梅卡曼德技术支持。

以LED屏幕数据（单击下载）为例，本文将展示如何使用“文本检测”模块训练可检测图像中文本区域的模型，以配合“文本识别”模块使用，输出图像中的数字、字母以及部分特殊符号等字符。

用户可使用自己准备的数据。整体使用流程一致，标注环节存在差异。

使用流程

新建工程并添加“文本检测”模块：单击初始页面上的新建工程按钮，选择工程路径并输入工程名称以新建一个工程。然后，单击右上角的，选择“文本检测”模块。
导入图像数据：解压缩下载的压缩包，单击左上方的导入/导出按钮，选择 导入文件夹 导入下载的识别码图像数据。

选择导入数据集选项时，此模块仅支持导入 DLKDB 格式（.dlkdb）的数据集，即仅限于从 Mech-DLK 中导出的数据集。
截取 ROI：单击 ROI 工具，框选能涵盖所有图像中文本区域的部分作为感兴趣区域，并单击 ROI 边框右下角的应用当前ROI。截取 ROI 的目的是减少无关背景信息的干扰。
划分训练集与验证集：软件默认将数据集的 80% 划分为训练集，20% 为验证集，可以单击拖动滑块调整图像占比。需要确保划分后的训练集和验证集中涵盖所有需要检测的文本区域类型，训练集中 不同文本朝向 的图像比例要均衡，如果默认划分的数据集不满足这一条件，右键单击图像名称后选择“移到训练集”或“移到验证集”调整图像所属集合。

标注图像：在图像左侧标注工具栏选择对应的工具进行标注。标注时，绘制的标注框应尽量贴合目标文本边缘以减少干扰，禁止出现标注不完全或标注框过大的情况。

标注图像时，用户可点击预训练标注或视觉大模型标注进行自动标注。自动标注结束后，再手动微调标注结果。
如需调整视觉大模型标注设置，可按如下方式操作：
1. 右键单击，选择视觉大模型标注工具。
2. 在图像处理区域上方，点击。
3. 在视觉大模型标注设置窗口，通过添加修改项修改视觉大模型的标注结果。

训练模型：使用默认参数设定，单击训练开始训练模型。
验证模型：训练结束后，单击验证可以验证并查看模型识别效果。

验证完模型后，可导入新的图像数据至当前模块，使用预训练标注功能在该模型的基础上进行自动标注。详细介绍请查看预训练标注功能说明。
如需调整验证结果，可按如下步骤操作：

在验证参数栏进行筛选规则设置。

在筛选规则设置窗口，通过添加修改项修改模型验证结果。
导出模型：单击导出模型。在弹出的对话框中，选择存放路径，然后单击导出，即可导出模型。