고품질 모델을 훈련시키는 방법¶
산업 품질 검사에는 과검률 및 미검률에 대한 엄격한 제한이 있습니다. 따라서 "결함 세그먼테이션" 모델의 품질이 매우 중요합니다. 이 부분에서는 모델 품질에 가장 큰 영향을 미치는 몇 가지 요소와 고품질 결함 세그먼테이션 모델을 훈련시키는 방법을 소개하겠습니다.
레이블링 품질을 보장하기¶
레이블링의 품질은 모델 효과에 가장 큰 영향을 미치는 요소입니다. 실제 프로젝트에서 레이블링 품질로 인해 모델 효과가 좋지 않다는 경우가 90% 이상을 차지합니다. 따라서 모델 성능이 좋지 않으면 레이블링 품질 문제를 해결하는 것이 최우선이 되어야 합니다.
레이블링 품질은 일관성, 완전성, 정확성 및 확실성 측면에서 고려되어야 합니다.
일관성 : 결함 레이블링 방식의 일관성을 보장하고 동일한 유형의 결함에 대해 다른 방식으로 레이블링을 하는 것을 금지합니다.
완전성 : 결함 판정 기준에 부합하는 모든 영역에 대해 레이블링을 했는지 확인하고 누락된 영역이 있으면 안됩니다.
정확성 : 레이블링 영역이 결함의 가장자리에 최대한 밀착시켜야 하고 결함 영역을 정확하게 표기해야 하며 면적이 큰 레이블을 광범위하게 결함 영역을 덮으면 안됩니다.
확실성 : 결함 판정 기준 충족 여부를 판단할 수 없는 경우 마스크 다각형 도구를 사용하여 결함 영역을 덮을 수 있습니다.
주의
이미지 속에 결함이 여러 개가 있는 경우, 결함 판정 기준을 충족할지 여부를 판단하지 못하면 모델 훈련 효과에 영향을 끼치지 않도록 해당 이미지를 삭제할 수 있습니다.
올바른 ROI를 설정하기¶
ROI를 설정하는 것은 배경의 간섭을 효과적으로 줄일 수 있으며 설정한 ROI의 가장자리가 물체의 윤곽에 최대한 밀착시켜야 합니다.
힌트
모든 이미지에 동일한 ROI 설정이 적용되므로 모든 이미지 속의 물체가 ROI 범위 내에 위치하는지 확인해야 합니다. 특히 물체의 위치/크기가 고정되지 않은 시나리오에서는 더욱 주의해야 합니다.
올바른 훈련 세트를 선택하기¶
훈련 세트의 수량이 적당해야 함
처음에 "결함 세그먼테이션" 모듈을 사용하여 모델을 만들 때 이미지 20~30 장을 선택하여 훈련 세트로 사용하는 것이 좋습니다. 물론 결함의 종류와 차이성에 따라 이미지의 수량을 적절하게 조절할 수 있습니다. 하지만 수가 많으면 많을수록 효과가 더욱 좋은 것이 아닙니다. 초기 단계에 잘못된 데이터 세트가 많으면 이후 모델 반복에 도움이 되지 않으며 모델 훈련 시간이 길어집니다.
대표적인 데이터를 선택해야 함
훈련 세트에는 감지해야 할 모든 결함 유형을 나타내는 NG 이미지를 포함해야 하며 이미지에 다양한 모양, 배경, 색상, 크기 등 정보를 포함해야 함니다. OK 이미지의 특징 차이가 비교적으로 작은 경우 적은 수의 OK 이미지를 선택해도 됩니다.
데이터의 비율이 균형을 이뤄야 함
훈련 세트에 있는 다양한 NG 이미지의 비율은 균형을 이루어야 하며, 한 종류의 NG 이미지가 20장, 다른 종류의 NG 이미지가 5장만 있는 것은 금지되어 있습니다.
데이터 세트는 터미널 시나리오와 일치해야 함
시나리오의 조명 조건, 작업물 특징, 배경, 시야 크기 등 요소가 일치해야 합니다.