고품질 모델을 훈련시키는 방법¶
이 부분에서는 모델 품질에 영향을 미치는 요소 및 고품질 물체 검출 모델을 훈련시키는 방법에 대해 소개하겠습니다.
이미지의 품질을 보장하기¶
과하게 밝거나 어두운 경우, 색상 왜곡, 뚜렷하게 보이지 못한 경우, 장애물이 시야를 가린 경우 등을 피하십시오. 이러한 상황은 딥 러닝 모델이 의존하는 특징의 손실로 이어지고 모델 훈련 효과에 악영향을 미칩니다.
이미지를 캡처할 때 배경, 시각, 높이 등 조건이 실제 응용 시와 일치해야 합니다. 일치하지 않으면 실제 응용 시 딥 러닝의 효과에 악영향을 끼쳐 데이터를 다시 캡처해야 한다는 경우도 종종 있습니다. 따라서 이미지를 캡처하기 전에 부디 실제 작업 현장의 조건을 파악해야 합니다.
데이터 세트의 품질을 보장하기¶
"물체 검출" 모듈은 이미지 속 물체의 특징을 학습함으로써 모델을 훈련시키고 실제 응용 시나리오에 응용합니다. 따라서 캡처/선택한 데이터 세트는 반드시 실제 응용 시와 일치해야 고품질의 모델을 훈련시킬 수 있습니다.
데이터 세트를 캡처하기¶
다양한 배치 방식을 합리적으로 할당해야 합니다. 예를 들어, 실제 생산 시 물체가 수평적으로 혹은 수직적으로 들어올 수 있지만 수평적으로 들어온 물체의 이미지만 캡처하고 훈련시키면 수직적으로 들어온 물체에 대한 분류 효과를 보장할 수 없습니다. 따라서 이미지를 캡처할 때 실제 생산 시 모든 가능한 경우를 고려해야 합니다 . 구체적으로 다음과 같습니다.
실제 응용에서 나타날 수 있는 물체의 방향 .
실제 응용에서 나타날 수 있는 물체의 위치 .
실제 응용에서 나타날 수 있는 물체 사이의 관계 .
주의
어떤 상황에 대한 이미지를 캡처하지 않았다면 알고리즘 모듈을 통해 모델을 훈련할 때 해당 상황에 대해 학습하지 못하게 되어 모델은 해당 상황을 식별하기 어려울 수도 있습니다. 따라서 실제 상황에 따라 데이터 샘플을 늘려 오차를 낮춰야 합니다.
물체의 방향
물체의 위치
물체 사이의 관계
캡처된 이미지의 예시¶
어떤 작업물에 대한 감지 프로젝트의 경우, 물체 종류는 무질서하게 배치되어 있는 로터이고 모든 로터의 정확한 위치를 감지해야 합니다. 총 30 장 정도 캡처하면 됩니다.
물체의 위치 면에서 실제 생산 시 빈 안에 로터가 위치할 수 있는 모든 위치를 고려해야 하며, 동시에 피킹 시 로터의 수가 좀좀 줄어드는 상황을 고려해야 합니다.
물체 사이의 관계 면에서 로터들이 무질서하게 배치된 경우, 깔끔하게 배치된 경우, 그리고 서로 겹친 경우를 고려해야 합니다.
철근의 수량을 계산하는 프로젝트의 경우, 들어온 물체는 묶음 철근이며 정확한 철근의 수량을 계산해야 합니다. 총 20 장을 캡처하면 됩니다.
철근의 특징은 상대적으로 단일하므로 물체 위치 의 다양성만 고려하면 되고 실제 생산 시 카메라 시야에 철근이 있는 모든 위치의 이미지를 캡처해야 합니다.
올바른 데이터 세트를 선택하기¶
훈련 세트의 수량이 적당해야 함
처음에 "물체 검출" 모듈을 사용하여 모델을 훈련시킬 때 이미지 20 장을 선택하여 훈련 세트로 사용하는 것이 좋습니다. 이미지의 수가 많으면 많을수록 효과가 더욱 좋은 것이 아닙니다. 초기 단계에 잘못된 데이터 세트가 많으면 이후 모델 반복에 도움이 되지 않으며 모델 훈련 시간이 길어집니다.
대표적인 데이터를 선택해야 함
데이터 세트에 있는 이미지에는 대상 물체의 모든 조명, 색상, 크기 조건을 모두 포함해야 합니다.
조명 : 실제로 조명 조건이 변하게 되면 데이트 세트에 조명이 없는 경우의 이미지를 포함해야 합니다.
색상 : 부품들의 색상이 다르면 데이터 세트에 모든 색생의 이미지를 포함해야 합니다.
크기 : 부품들의 크기가 다르면 데이터 세트에 모든 크기의 이미지를 포함해야 합니다.
주의
실제 작업 현장에 작업물이 회전, 크기 조정 등으로 인해 해당 이미지 데이터 세트를 수집할 수 없는 경우가 나타날 수 있는데 이때 데이터 증강 훈련 파라미터를 조절함으로써 데이터 세트를 보완하여 현장의 모든 조건이 훈련 세트에 포함되도록 할 수 있습니다.
데이터의 비율이 균형을 이뤄야 함
훈련 세트에 종류나 배치 방식이 서로 다른 이미지가 차지하는 비율은 균형을 이루어야 합니다. 그렇지 않으면 모델 효과에 악영향을 끼칠 수도 있습니다. 한 종류 물체의 이미지가 20장, 다른 종류 물체의 이미지가 3장만 있는 것, 깔끔하게 배치된 경우 40장, 무질서하게 배치된 경우 5장만 있는 것이 금지되어 있습니다.
데이터 세트는 터미널 시나리오와 일치해야 함
시나리오의 조명 조건, 작업물 특징, 배경, 시야 크기 등 요소가 일치해야 합니다.
레이블링 품질을 보장하기¶
레이블링 품질은 완전성 및 정확성 두 가지 측면에서 고려해야 합니다.
완전성 : 모든 물체에 레이블을 지정하고 누락된 물체가 있으면 안됩니다.
정확성 : 레이블링 시 사각형 도구는 물체의 가장자리에 최대한 밀착시켜야 하며 물체의 특정 부분을 레이블링을 하지 않거나 물체의 윤곽선 외부에 많은 영역에 레이블링을 하는 것을 금지합니다.