如何训练高质量模型
本节将介绍最影响模型质量的几个因素以及如何训练出高质量非监督分割模型。
确保图像质量
-
避免 图像中物体位置、形状、大小不一致,或图像背景多变 。这些情况会严重干扰模型效果,应确保使用的 OK 图差异较小。
多数图像 | 错误示例 | ||
---|---|---|---|
图像存在一定的背景干扰的,可以前置“目标检测”模块;图像中物体朝向各异的,可前置“快速定位”模块。模块级联方法可参阅 级联模块的使用。 |
设置合理的 OK/NG 结果阈值
“非监督分割”算法模块对于 OK、NG 及 Unknown 结果的判定取决于对缺陷度统计图设定的阈值,且 OK 结果的阈值越大,识别的缺陷区域越小,需要根据实际情况设置合理的阈值,使模型实现最佳性能。
原图 | OK 结果阈值:0.10 | OK 结果阈值:0.20 |
---|---|---|
在缺陷度统计图中,绿色曲线的纵坐标表示缺陷度低于 OK 结果阈值的 OK 图像占比,红色曲线的纵坐标表示缺陷度高于 NG 结果阈值的 NG 图像占比。当红色曲线与绿色曲线不相交时,可以通过阈值将 OK 与 NG 图完全分开,且两者不相交的区域越大,模型效果越好。
效果良好 | 效果欠佳 |
---|---|
选取合适的数据
-
训练集数量可控
初次使用“非监督分割”模块时,建议使用 30~50 张图像作为训练集,后续可根据验证效果再调整数据。
-
训练集 OK 图像全面且均衡
如果 OK 图存在多种情况,应尽量保证训练集中涵盖了所有可能的情况,且数据量均衡。
-
减少无效数据
确保导入的每张图像都能有利于模型训练,添加相似度过高或重复图像对模型训练意义不大,还可能会延长模型训练时间。