고품질 모델을 훈련시키는 방법
산업 품질 검사는 일반적으로 미검률과 과검률에 대한 엄격한 기준을 가지고 있으므로 결함 세그먼테이션 모델의 품질이 매우 중요합니다. 이 부분에서는 모델 품질에 영향을 미치는 요소 및 고품질 결함 세그먼테이션 모델을 훈련시키는 방법에 대해 소개하겠습니다.
레이블링 품질을 보장하기
레이블링 품질은 모델 효과에 가장 큰 영향을 미치는 요소입니다. 실제 프로젝트에서는 레이블링 품질로 인해 모델 효과가 좋지 않은 경우가 90% 이상을 차지합니다. 따라서 모델 효과가 좋지 않을 때 레이블링 품질을 우선 확인해야 합니다.
레이블링 품질은 일관성, 완전성, 정확성 및 확실성 측면에서 고려되어야 합니다:
-
일관성: 결함 레이블링 방식의 일관성을 보장하고 동일한 유형의 결함에 대해 다른 방식으로 레이블링을 하면 안됩니다.
-
완전성: 결함 판정 기준에 부합하는 모든 영역에 대해 레이블링을 했는지 확인하고 누락된 영역이 있으면 안됩니다.
-
정확성: 레이블링 영역이 결함의 가장자리에 최대한 밀착시켜야 하고 결함 영역을 정확하게 표기해야 하며 면적이 큰 레이블을 광범위하게 결함 영역을 덮으면 안됩니다.
-
확실성: 결함 판정 기준 충족 여부를 판단할 수 없는 경우 마스크 다각형 도구를 사용하여 결함 영역을 덮을 수 있습니다.
이미지 속에 결함이 여러 개가 있는 경우, 결함 판정 기준을 충족할지 여부를 판단하지 못하면 모델 훈련 효과에 영향을 끼치지 않도록 해당 이미지를 삭제할 수 있습니다. |
올바른 ROI를 설정하기
ROI를 설정하는 것은 배경의 간섭을 효과적으로 줄일 수 있으며 설정한 ROI의 가장자리가 물체의 윤곽에 최대한 밀착시켜야 합니다.
모든 이미지에 동일한 ROI 설정이 적용되므로 모든 이미지 속의 물체가 ROI 범위 내에 위치하는지 확인해야 합니다. 특히 물체의 위치/크기가 고정되지 않은 시나리오에서는 더욱 주의해야 합니다. |
올바른 훈련 세트를 선택하기
-
훈련 세트의 수량이 적당해야 함 처음에 "결함 세그먼테이션" 모듈을 사용하여 모델을 만들 때 이미지 20~30 장을 선택하여 훈련 세트로 사용하는 것이 좋습니다(결함의 종류 및 차이 정도에 따라 데이터의 양을 적절히 조절 가능). 이미지의 수가 많으면 많을수록 효과가 더 좋은 것이 아닙니다. 초기 단계에 잘못된 데이터 세트가 많으면 이후 모델 반복에 도움이 되지 않으며 모델 훈련 시간이 길어집니다.
-
대표적인 데이터를 선택해야 함 훈련 세트에는 감지해야 할 모든 결함 유형을 나타내는 NG 이미지를 포함해야 하며 이미지에 다양한 모양, 배경, 색상, 크기 등 정보를 포함해야 함니다. OK 이미지의 특징 차이가 비교적으로 작은 경우 적은 수의 OK 이미지를 선택해도 됩니다.
-
데이터의 비율이 균형을 이뤄야 함 훈련 세트에 있는 다양한 NG 이미지의 비율은 균형을 이루어야 하며, 한 종류의 NG 이미지가 20장, 다른 종류의 NG 이미지가 5장만 있으면 안됩니다.
-
데이터는 실제 응용 시나리오와 일치해야 함 이미지를 수집할 때의 조명 조건, 작업물 특징, 배경, 시야 크기 등 요소가 모델의 실제 응용 시나리오와 일치해야 합니다.