如何训练高质量模型

您正在查看旧版本的文档。点击页面右上角可切换到最新版本的文档。

本节将介绍最影响模型质量的几个因素以及如何训练出高质量非监督分割模型。

确保图像质量

  • 避免 图像中物体位置、形状、大小不一致,或图像背景多变 。这些情况会严重干扰模型效果,应确保使用的 OK 图差异较小。

多数图像 错误示例

improve model accuracy normal

object of different size

different object shape

different image background

图像存在一定的背景干扰的,可以前置“目标检测”模块;图像中物体朝向各异的,可前置“快速定位”模块。模块级联方法可参阅 级联模块的使用

设置合理的感兴趣区域(ROI)

设置 ROI 可以有效排除背景的干扰,ROI 边界应尽量贴近物体外轮廓。

improve model accuracy roi
同一 ROI 设定将应用于所有图片,因此需要保证所有图片中的物体都位于 ROI 内。

设置合理的 OK/NG 结果阈值

“非监督分割”算法模块对于 OK、NG 及 Unknown 结果的判定取决于对缺陷度统计图设定的阈值,且 OK 结果的阈值越大,识别的缺陷区域越小,需要根据实际情况设置合理的阈值,使模型实现最佳性能。

原图 OK 结果阈值:0.10 OK 结果阈值:0.20

original image

OK threshold 2

OK threshold 1

在缺陷度统计图中,绿色曲线的纵坐标表示缺陷度低于 OK 结果阈值的 OK 图像占比,红色曲线的纵坐标表示缺陷度高于 NG 结果阈值的 NG 图像占比。当红色曲线与绿色曲线不相交时,可以通过阈值将 OK 与 NG 图完全分开,且两者不相交的区域越大,模型效果越好。

效果良好 效果欠佳

good model performance

poor model performance

选取合适的数据

  • 训练集数量可控

    初次使用“非监督分割”模块时,建议使用 30~50 张图像作为训练集,后续可根据验证效果再调整数据。

  • 训练集 OK 图像全面且均衡

    如果 OK 图存在多种情况,应尽量保证训练集中涵盖了所有可能的情况,且数据量均衡。

  • 减少无效数据

    确保导入的每张图像都能有利于模型训练,添加相似度过高或重复图像对模型训练意义不大,还可能会延长模型训练时间。

我们重视您的隐私

我们使用 cookie 为您在我们的网站上提供最佳体验。继续使用该网站即表示您同意使用 cookie。如果您拒绝,将使用一个单独的 cookie 来确保您在访问本网站时不会被跟踪或记住。