如何训练高质量模型

您正在查看V2.5.2版本的文档。如果您想查阅其他版本的文档,可以点击页面右上角“切换版本”按钮进行切换。

■ 如果您想使用最新版本,可以从梅卡曼德下载中心下载。

■ 如果您不确定当前使用的产品是哪个版本,请随时联系梅卡曼德技术支持。

本节将介绍最影响模型质量的几个因素以及如何训练出高质量文本检测模型。

确保图像质量

避免 过曝、过暗、模糊、遮挡 等。这些情况会导致深度学习模型所依赖的特征丢失,影响模型训练效果。

图像质量差:文本区域有遮挡,不利于文本区域检测,可能会导致后续文本识别不准确。

improve model accuracy occlusion 1

improve model accuracy occlusion 2

优化建议:确保文本区域完整无遮挡。

图像质量差:过曝 图像质量差:过暗

improve model accuracy overexposure

improve model accuracy underexposure

优化建议:建议通过遮光或补光的方式避免。

确保数据质量

“文本检测”模块可检测图像中文本区域。实际应用场景中,图像中的文本只占据图像中一小部分区域,因此在采集数据时,相机和光照条件调节好后建议保持稳定,避免数据偏差影响模型效果。

选取数据

选取多种朝向的文本

选取多样化图像数据。实际场景中,图像中的文本可能是横向(0° 和 180°)、竖向(90°) 或倾斜的(其他角度),若只采用横向和竖向的图像数据进行训练,训练出来的模型较难定位倾斜的文本区域。

如果少采集了某种情况的数据,算法模块会缺少该情况下数据的学习,将导致模型在该情况下检测效果不佳,因此必须根据情况增加数据样本,降低误差。
improve model accuracy orientation

选取合适的数据

  • 训练集数量可控

    对于“文本检测”模块初次建模,建议使用 30~50 张图像作为训练集,后续可根据验证效果再进行数据调整。

  • 数据占比均衡

    训练集中 不同文本朝向 的图像比例要均衡,采用多样数据有助于提升模型效果。

  • 减少无效数据

    采用高质量图像,确保导入的每张图像都能有利于模型训练。添加低质量或不相关数据可能会对模型训练产生负面影响。

数据量并不是越大越好,前期加入大量无效的数据不利于后期的模型改进,同时还会延长模型训练时间。

确保标注质量

确保 精确性,即标注时,绘制的标注框应尽量贴合目标文本边缘以减少干扰,禁止出现标注不完全或标注框过大的情况。

错误标注 正确标注

improve model accuracy fit 0

improve model accuracy fit 1

improve model accuracy fit 2

我们重视您的隐私

我们使用 cookie 为您在我们的网站上提供最佳体验。继续使用该网站即表示您同意使用 cookie。如果您拒绝,将使用一个单独的 cookie 来确保您在访问本网站时不会被跟踪或记住。