고품질 모델을 훈련시키는 방법

산업 품질 검사는 일반적으로 미검률과 과검률에 대한 엄격한 기준을 가지고 있으므로 결함 세그먼테이션 모델의 품질이 매우 중요합니다. 이 부분에서는 모델 품질에 영향을 미치는 요소 및 고품질 결함 세그먼테이션 모델을 훈련시키는 방법에 대해 소개하겠습니다.

레이블링 품질을 보장하기

레이블링 품질은 모델 효과에 가장 큰 영향을 미치는 요소입니다. 실제 프로젝트에서는 레이블링 품질로 인해 모델 효과가 좋지 않은 경우가 90% 이상을 차지합니다. 따라서 모델 효과가 좋지 않을 때 레이블링 품질을 우선 확인해야 합니다.

레이블링 품질은 일관성, 완전성, 정확성 및 확실성 측면에서 고려되어야 합니다:

  1. 일관성: 결함 레이블링 방식의 일관성을 보장하고 동일한 유형의 결함에 대해 다른 방식으로 레이블링을 하면 안됩니다.

    improve model accuracy label consistency
  2. 완전성: 결함 판정 기준에 부합하는 모든 영역에 대해 레이블링을 했는지 확인하고 누락된 영역이 있으면 안됩니다.

    improve model accuracy label completeness
  3. 정확성: 레이블링 영역이 결함의 가장자리에 최대한 밀착시켜야 하고 결함 영역을 정확하게 표기해야 하며 면적이 큰 레이블을 광범위하게 결함 영역을 덮으면 안됩니다.

    improve model accuracy label accuracy
  4. 확실성: 결함 판정 기준 충족 여부를 판단할 수 없는 경우 마스크 다각형 도구를 사용하여 결함 영역을 덮을 수 있습니다.

    improve model accuracy certainty
이미지 속에 결함이 여러 개가 있는 경우, 결함 판정 기준을 충족할지 여부를 판단하지 못하면 모델 훈련 효과에 영향을 끼치지 않도록 해당 이미지를 삭제할 수 있습니다.

올바른 ROI를 설정하기

ROI를 설정하는 것은 배경의 간섭을 효과적으로 줄일 수 있으며 설정한 ROI의 가장자리가 물체의 윤곽에 최대한 밀착시켜야 합니다.

improve model accuracy roi
모든 이미지에 동일한 ROI 설정이 적용되므로 모든 이미지 속의 물체가 ROI 범위 내에 위치하는지 확인해야 합니다. 특히 물체의 위치/크기가 고정되지 않은 시나리오에서는 더욱 주의해야 합니다.

올바른 훈련 세트를 선택하기

  • 훈련 세트의 수량이 적당해야 함 처음에 "결함 세그먼테이션" 모듈을 사용하여 모델을 만들 때 이미지 20~30 장을 선택하여 훈련 세트로 사용하는 것이 좋습니다(결함의 종류 및 차이 정도에 따라 데이터의 양을 적절히 조절 가능). 이미지의 수가 많으면 많을수록 효과가 더 좋은 것이 아닙니다. 초기 단계에 잘못된 데이터 세트가 많으면 이후 모델 반복에 도움이 되지 않으며 모델 훈련 시간이 길어집니다.

  • 대표적인 데이터를 선택해야 함 훈련 세트에는 감지해야 할 모든 결함 유형을 나타내는 NG 이미지를 포함해야 하며 이미지에 다양한 모양, 배경, 색상, 크기 등 정보를 포함해야 함니다. OK 이미지의 특징 차이가 비교적으로 작은 경우 적은 수의 OK 이미지를 선택해도 됩니다.

  • 데이터의 비율이 균형을 이뤄야 함 훈련 세트에 있는 다양한 NG 이미지의 비율은 균형을 이루어야 하며, 한 종류의 NG 이미지가 20장, 다른 종류의 NG 이미지가 5장만 있으면 안됩니다.

  • 데이터는 실제 응용 시나리오와 일치해야 함 이미지를 수집할 때의 조명 조건, 작업물 특징, 배경, 시야 크기 등 요소가 모델의 실제 응용 시나리오와 일치해야 합니다.