使用文本检测模块

您正在查看最新版本(V2.6.2)的文档。如果您想查阅其他版本的文档,可以点击页面右上角“切换版本”按钮进行切换。

■ 如果您不确定当前使用的产品是哪个版本,请随时联系梅卡曼德技术支持

以LED屏幕数据(单击下载)为例,本文将展示如何使用文本检测模块训练可检测图像中文本区域的模型,以配合文本识别模块使用,输出图像中的数字、字母以及部分特殊符号等字符。

用户可使用自己准备的数据。整体使用流程一致,标注环节存在差异。

准备工作

  1. 新建工程并添加文本检测模块:单击初始页面上的新建工程按钮,选择工程路径并输入工程名称以新建一个工程。然后,单击右上角的 example projects icon create,选择文本检测模块。

    example projects add project
  2. 导入图像数据:解压缩下载的压缩包,单击左上方的导入/导出按钮,选择 导入文件夹 导入下载的识别码图像数据。

    example projects import images

    若图像数据中有重复图片,可在弹出的导入图像 对话框中选择跳过或导入、设置标记。由于每张图片只支持一个标记,因此对已有标记的图像添加新标记后,新标记会覆盖旧标记。若导入数据集,可选择是否替换重复图像。

    • 选择导入图像、导入文件夹方式时的对话框:

      example projects duplicate1
    • 选择导入数据集方式时的对话框:

      example projects duplicate2
      选择导入数据集选项时,此模块仅支持导入 DLKDB 格式(.dlkdb)的数据集,即仅限于从 Mech-DLK 中导出的数据集。
  3. 截取 ROI:单击 ROI 工具 example projects icon roi,框选能涵盖所有图像中文本区域的部分作为感兴趣区域,并单击 ROI 边框右下角的 tools introduction OK 应用当前ROI。截取 ROI 的目的是减少无关背景信息的干扰。

    example projects roi
  4. 划分训练集与验证集:软件默认将数据集的 80% 划分为训练集,20% 为验证集,可以单击 example projects icon slider 拖动滑块调整图像占比。需要确保划分后的训练集和验证集中涵盖所有需要检测的文本区域类型,训练集中 不同文本朝向 的图像比例要均衡,如果默认划分的数据集不满足这一条件,右键单击图像名称后选择移到训练集移到验证集调整图像所属集合。

    example projects move image

数据标注

在图像左侧标注工具栏选择对应的工具进行标注。标注时,绘制的标注框应尽量贴合目标文本边缘以减少干扰,禁止出现标注不完全或标注框过大的情况。

example projects labeling
  • 标注图像时,用户可点击预训练标注视觉大模型标注进行自动标注。自动标注结束后,再手动微调标注结果。

  • 如需调整视觉大模型标注设置,可按如下方式操作:

    1. 右键单击 tools super labeling tool icon,选择视觉大模型标注工具

    2. 在图像处理区域上方,点击 labelling settings

    3. 视觉大模型标注设置窗口,通过添加修改项修改视觉大模型的标注结果。

训练模型

  1. 训练模型:使用默认参数设定,单击训练开始训练模型。

    example projects training chart
  2. 通过训练信息观察训练情况:在训练选项卡下的训练信息栏,可实时查看模型训练信。

    example projects view training info
  3. 通过训练图表窗口查看训练情况:单击训练选项卡下的显示图表按钮,即可在模型训练过程中实时查看模型精度曲线和损失曲线变化情况。精度曲线整体呈现上升趋势、损失曲线整体呈现下降趋势表明当前训练正常运行。

    example projects view training chart
  4. 根据实际情况,提前中止训练(可选):当模型精度已经达到要求时,为节约时间,用户可单击训练中心按钮,在任务列表中选则工程后单击 stop trainig 中止训练。用户也可等待模型训练结束,观察最高精度等参数,初步判断模型训练效果。

    若精度曲线在经过较多轮次后仍无上升趋势,表明当前模型训练可能存在问题。请中止模型训练流程,检查各参数设置,检查训练集中是否出现漏标错标,修改后重新启动训练。

验证模型

  1. 验证模型:训练结束后,单击验证可以验证并查看模型识别效果。

  2. 检查训练集中模型的验证结果:验证结束后,可在验证选项卡的验证统计中查看验证结果数量统计;点击详细报表按钮可打开详细报表窗口,查看更具体的验证统计结果。报表中的标注结果匹配矩阵显示模型推理结果与人工标注之间的对应关系,可以此判断模型中各类别的匹配情况。矩阵纵向为人工标注数据,横向为推理结果;矩阵中蓝色单元格表示推理结果与人工标注一致,其余单元格表示存在误差,可用于模型优化参考为待优化的结果。点击矩阵里的数值,软件主界面图像列表将自动筛选,只显示点击数值对应的图像。

    example projects detail report

    若验证结果在训练集中存在漏检、错检,则说明模型训练效果不佳,请检查标注,调整训练参数,重新开始训练。 用户也可以点击详细报表窗口右下角的导出报表选择导出缩略图报表或原图报表。

    example projects export report
    不需要把测试集中所有存在漏检或错检的图像都标注后划分为训练集。可补充标注一部分图像,加入训练集,重新训练和验证模型,将剩余图像作为参考,观察验证结果,检验模型迭代效果。
  3. 重新开始训练:将新标注的图像加入训练集后,单击训练按钮,重新开始训练。

  4. 重新检查模型验证结果:训练结束后,再次点击验证按钮验证模型,重新检查模型在各数据集上的验证结果。

  5. 模型微调(可选):用户可启用开发者模式,在训练参数设置中启用模型微调。具体操作请参阅迭代模型

  6. 不断优化模型:重复以上步骤,不断优化模型性能,直至模型达到使用要求。

    如需调整验证结果,可按如下步骤操作:在验证参数栏进行筛选规则设置;在筛选规则设置窗口,通过添加修改项修改模型验证结果。

导出模型

单击导出模型。在弹出的导出对话框中选择存放路径和导出参数。对于图像中多行文本的情况,导出参数中的结果排序方式参数可以指定导出模型时文本的排列顺序,模型会根据排序设置输出结果到下一模块,以便后续字符拼接。单击导出,即可导出模型。

example projects model files

导出后的模型可在 Mech-DLK SDK 中使用,单击此处查看详细说明。

该页面是否有帮助?

可以通过以下方式反馈意见:

我们重视您的隐私

我们使用 cookie 为您在我们的网站上提供最佳体验。继续使用该网站即表示您同意使用 cookie。如果您拒绝,将使用一个单独的 cookie 来确保您在访问本网站时不会被跟踪或记住。