데이터 획득 기준
딥 러닝 모델을 훈련할 때, 모델은 이미지에 있는 물체의 특징(색상, 윤곽선, 위치 등)을 추출하고 훈련합니다. 이미지가 과도하게 노출되었거나, 너무 어둡거나, 색상이 왜곡되었거나, 흐릿하거나, 가려져 있는 경우, 이러한 조건으로 인해 딥 러닝 모델이 의존하는 특징 정보가 손실될 수 있으며, 이는 모델 훈련 성능에 영향을 미칩니다.
이 부분에서는 고품질 이미지를 획득하여 모델 인식률과 정확도를 높일 수 있도록, 이미지 획득 전 준비 사항, 획득 중 유의사항, 획득 후 데이터 필터링 기준을 소개합니다.
데이터 획득 전 준비사항
현장 조명 환경 개선
Mech-DLK를 사용하면 현장 조명의 영향을 어느 정도 줄일 수 있습니다. 현장 조명이 어느 정도 변화하더라도 딥 러닝은 안정적으로 작동할 수 있습니다. 하지만 조명 변화가 너무 큰 경우 실제 환경과의 차이로 인해 이미지 내 물체의 세부 정보가 손실될 수 있으며, 이로 인해 모델 학습 성능에 부정적인 영향을 줄 수 있습니다.
다음과 같이 현장 조명이 변화될 수 있습니다.
-
낮과 밤의 조명 차이가 큼 (직사광선, 일반 조명, 조명 없음/조명이 약함)
-
인공 조명원의 밝기가 크게 변동
-
색온도 변화가 큼
-
컬러 맵의 픽셀 값에 영향을 미칠 수 있는 조명 변화
현장 조명 변화가 불가피하다면, 다음과 같은 방법으로 영향을 줄일 수 있습니다.
-
프로젝트 상황에 맞게 적절한 차광이나 보조 조명을 설계해 적용합니다.
-
프로젝트 요구 사항에 맞는 카메라 유형을 선택합니다. 물체의 윤곽만 구분하면 되는 경우, 흑백(MONO) 카메라를 사용하면 됩니다. 물체의 색상도 구분해야 하는 경우, 컬러 카메라를 사용하면 더 나은 결과를 얻을 수 있습니다.
-
Mech-Eye Viewer에서 카메라의 노출 모드와 화이트 밸런스 등 2D 파라미터를 조정하여 획득한 이미지가 실제 작업 환경과 일치하도록 합니다.
ROI 외부의 이미지가 과다 노출되고, ROI 내부의 이미지가 정상인 경우, 이미지를 추가로 처리할 필요는 없습니다. |



데이터 획득 중 주의사항
데이터 획득 과정에서는 다양한 배치 조건에 따라 이미지 캡처 수를 적절히 배분해야 합니다. 예를 들어, 실제 생산 과정에서는 물체가 수평과 수직으로 배치될 수 있는데, 수평 배치된 물체의 데이터만 수집하는 경우, 수직 배치된 물체에 대한 분류 성능을 보장할 수 없습니다. 따라서 데이터를 획득할 때 아래와 같은 실제 생산 시 고려해야 되는 포인트를 참조해야 합니다.
-
실제 솔루션에서 나타날 수 있는 모든 물체 방향이 포함되었는지 확인합니다.
-
실제 솔루션에서 나타날 수 있는 모든 물체 위치가 포함되었는지 확인합니다.
-
실제 솔루션에서 나타날 수 있는 모든 물체 간 위치 관계가 포함되었는지 확인합니다.
위 세 가지 포인트 중 하나라도 데이터셋에서 누락되면, 딥 러닝 모델은 해당 특징을 제대로 훈련하지 못해 물체를 정확하게 인식할 수 없습니다. 충분한 샘플이 포함된 데이터셋은 오류를 줄이는 데 도움이 됩니다. |
물체 방향

물체 위치


물체 간 위치 관계


데이터 획득 후 필터링 기준
-
훈련 세트의 질량 및 수량 제어
일부 모듈을 처음 사용할 때는 훈련 세트의 이미지 품질과 양을 제어하는 것이 좋습니다.
-
고품질 이미지를 사용하면 모델 훈련 효과도 좋습니다. 품질이 낮거나 관련성이 없는 이미지는 모델 학습에 악영향을 미칠 수 있습니다.
-
이미지 수가 많다고 항상 좋은 것은 아닙니다. 초기에 부적절한 이미지를 대량으로 추가하는 것은 모델 개선에 도움이 되지 않으며, 오히려 훈련 시간을 증가시킬 수 있습니다.
모듈 훈련 세트의 권장 이미지 수 인스턴스 세그먼테이션
30~50
결함 세그먼테이션
20~30(결함 유형 및 차이 정도에 따라 조정)
이미지 분류
30
물체 검출
30
신속하게 위치 지정
40
텍스트 감지
30~50
텍스트 인식
40
비지도 세그먼테이션
30~50개의 OK 이미지
-
-
대표적인 데이터를 선택
-
이미지 획득은 인식하고자 하는 물체의 조명, 색상, 크기 등 모든 조건을 고려해야 합니다.
-
조명 : 현장에서는 일반적으로 조명 환경이 바뀌기 때문에 데이터에는 다양한 조명 조건의 이미지가 포함되어야 합니다.
-
색상 : 다양한 색상으로 나타날 수 있으며, 데이터에는 모든 색상의 이미지가 포함되어야 합니다.
-
크기 : 물체의 크기가 다양할 수 있으므로, 데이터에는 모든 크기의 물체 이미지가 포함되어야 합니다.
현장에서 물체가 회전하거나 이미지 크기가 변할 수 있습니다.만약 모든 현장 조건을 직접 캡처하는 것이 어려운 경우, 데이터 증강 훈련 파라미터를 조정하여 훈련 세트를 보완할 수 있습니다.
-
-
-
데이터 비율 균형
훈련 세트에 포함된 다양한 클래스 또는 배치 방식의 이미지 수는 실제 프로젝트의 요구 사항에 맞춰 비례해야 합니다. 그렇지 않으면 훈련 효과가 저하될 수 있습니다. (예시 : 특정 물체에 대한 이미지가 20개이고, 다른 물체는 3장만 있는 경우는 없어야 합니다.)
-
데이터는 실제와 일치
이미지를 획득할 때 조명 조건, 물체 특징, 배경, 시야 등 요소는 실제 환경과 일치해야 합니다.