如何训练高质量模型

您正在查看V2.5.2版本的文档。如果您想查阅其他版本的文档，可以点击页面右上角“切换版本”按钮进行切换。

■ 如果您想使用最新版本，可以从梅卡曼德下载中心下载。

■ 如果您不确定当前使用的产品是哪个版本，请随时联系梅卡曼德技术支持。

本节将介绍最影响模型质量的几个因素以及如何训练出高质量文本检测模型。

确保图像质量

避免 过曝、过暗、模糊、遮挡 等。这些情况会导致深度学习模型所依赖的特征丢失，影响模型训练效果。

图像质量差：文本区域有遮挡，不利于文本区域检测，可能会导致后续文本识别不准确。

优化建议：确保文本区域完整无遮挡。

图像质量差：文本区域有遮挡，不利于文本区域检测，可能会导致后续文本识别不准确。

improve model accuracy occlusion 1

improve model accuracy occlusion 2

优化建议：确保文本区域完整无遮挡。

图像质量差：过曝	图像质量差：过暗

优化建议：建议通过遮光或补光的方式避免。

图像质量差：过曝

图像质量差：过暗

improve model accuracy overexposure

improve model accuracy underexposure

优化建议：建议通过遮光或补光的方式避免。

“文本检测”模块可检测图像中文本区域。实际应用场景中，图像中的文本只占据图像中一小部分区域，因此在采集数据时，相机和光照条件调节好后建议保持稳定，避免数据偏差影响模型效果。

选取多样化图像数据。实际场景中，图像中的文本可能是横向（0° 和 180°）、竖向（90°）或倾斜的（其他角度），若只采用横向和竖向的图像数据进行训练，训练出来的模型较难定位倾斜的文本区域。

如果少采集了某种情况的数据，算法模块会缺少该情况下数据的学习，将导致模型在该情况下检测效果不佳，因此必须根据情况增加数据样本，降低误差。

数据量并不是越大越好，前期加入大量无效的数据不利于后期的模型改进，同时还会延长模型训练时间。

确保 精确性，即标注时，绘制的标注框应尽量贴合目标文本边缘以减少干扰，禁止出现标注不完全或标注框过大的情况。

错误标注

正确标注

improve model accuracy fit 0

improve model accuracy fit 1

improve model accuracy fit 2

我要反馈