고품질 모델을 훈련시키는 방법¶
이 부분에서는 모델 품질에 영향을 미치는 요소 및 고품질 이미지 분류 모델을 훈련시키는 방법에 대해 소개하겠습니다.
이미지의 품질을 보장하기¶
과하게 밝거나 어두운 경우, 색상 왜곡, 뚜렷하게 보이지 못한 경우, 장애물이 시야를 가린 경우 등을 피하십시오. 이러한 상황은 딥 러닝 모델이 의존하는 특징의 손실로 이어지고 모델 훈련 효과에 악영향을 미칩니다.
이미지를 캡처할 때 배경, 시각, 높이 등 조건이 실제 응용 시와 일치해야 합니다. 일치하지 않으면 실제 응용 시 딥 러닝의 효과에 악영향을 끼쳐 데이터를 다시 캡처해야 한다는 경우도 종종 있습니다. 따라서 이미지를 캡처하기 전에 부디 실제 작업 현장의 조건을 파악해야 합니다.
데이터 세트의 품질을 보장하기¶
"이미지 분류" 모듈은 기존 이미지의 특징을 학습함으로써 모델을 훈련시키고 실제 응용 시나리오에 응용합니다. 따라서 캡처/선택한 데이터 세트는 반드시 실제 응용 시와 일치해야 고품질의 모델을 훈련시킬 수 있습니다.
데이터 세트를 캡처하기¶
다양한 배치 방식을 합리적으로 할당해야 합니다. 예를 들어, 실제 생산 시 물체가 수평적으로 혹은 수직적으로 들어올 수 있지만 수평적으로 들어온 물체의 이미지만 캡처하고 훈련시키면 수직적으로 들어온 물체에 대한 분류 효과를 보장할 수 없습니다. 따라서 이미지를 캡처할 때 실제 생산 시 모든 가능한 경우를 고려해야 합니다 . 구체적으로 다음과 같습니다.
실제 응용에서 나타날 수 있는 분류될 물체 다양한 각도 특징.
실제 응용에서 나타날 수 있는 분류될 물체 다양한 위치 특징.
다양한 각도
다양한 위치
캡처된 이미지의 예시¶
밸브 튜브 프로젝트의 경우, 물체 유형이 단일하고 물체의 앞면과 뒷면을 구분해야 하며 물체의 위치 변동이 크지 않고 앞, 뒷면에 대해 각각 이미지 15장을 캡처합니다.
엔진 밸브 조립 프로젝트의 경우, 물체 유형이 단일하고 부품이 카드 슬롯에 올바르게 배치되어 있는지를 판단해야 합니다. 카드 슬롯 밖에 배치할 때 나타날 수 있는 자세가 상대적으로 많기 때문에 다양한 위치와 다양한 각도를 고려해야 해서 20 장 정도를 캡처하면 됩니다. 카드 슬롯 안에 배치할 때 다양한 위치만 고려하기 때문에 10장 정도 캡처하면 됩니다.
얇은 금속판 프로젝트의 경우, 물체 유형이 두 가지로 나눠고 부품의 크기를 구분해야 하며 위치와 각도가 서로 다른 경우가 나타날 수 있으므로 앞,뒷면에 대해 각각 20 장을 캡처합니다.
올바른 데이터 세트를 선택하기¶
훈련 세트의 수량이 적당해야 함
처음에 "이미지 분류" 모듈을 사용하여 모델을 만들 때 이미지 30 장을 선택하여 훈련 세트로 사용하는 것이 좋습니다. 이미지의 수가 많으면 많을수록 효과가 더욱 좋은 것이 아닙니다. 초기 단계에 잘못된 데이터 세트가 많으면 이후 모델 반복에 도움이 되지 않으며 모델 훈련 시간이 길어집니다.
대표적인 데이터를 선택해야 함
데이터 세트에 있는 이미지에는 대상 물체의 모든 조명, 색상, 크기 조건을 모두 포함해야 합니다.
조명: 실제로 조명 조건이 변하게 되면 데이트 세트에 조명이 없는 경우의 이미지를 포함해야 합니다.
색상: 부품들의 색상이 다르면 데이터 세트에 모든 색생의 이미지를 포함해야 합니다.
크기: 부품들의 크기가 다르면 데이터 세트에 모든 크기의 이미지를 포함해야 합니다.
주의
실제 작업 현장에 작업물이 회전, 크기 조정 등으로 인해 해당 이미지 데이터 세트를 수집할 수 없는 경우가 나타날 수 있는데 이때 데이터 증강 훈련 파라미터를 조절함으로써 데이터 세트를 보완하여 현장의 모든 조건이 훈련 세트에 포함되도록 할 수 있습니다.
데이터의 비율이 균형을 이뤄야 함
훈련 세트에 다양한 종류의 이미지가 차지하는 비율은 균형을 이루어야 합니다. 그렇지 않으면 모델 효과에 악영향을 끼칠 수도 있습니다. 한 종류 물체의 이미지가 20장, 다른 종류 물체의 이미지가 3장만 있는 것은 금지되어 있습니다.
데이터 세트는 터미널 시나리오와 일치해야 함
시나리오의 조명 조건, 작업물 특징, 배경, 시야 크기 등 요소가 일치해야 합니다.