AI 문자 인식 도구

현재 최신 버전 (2.2.0)에 대한 매뉴얼을 보고 계십니다. 다른 버전에 액세스하려면 페이지 오른쪽 상단 모서리에 있는 '버전 전환' 버튼을 클릭하세요.

■ 현재 사용하고 있는 제품의 버전이 확실하지 않은 경우에는 언제든지 당사 기술 지원팀에 문의하시기 바랍니다.

기능 소개

"AI 문자 인식 도구"는 딥 러닝 기반의 시각화 판독 도구로, 서로 다른 문자에 대한 사용자 정의 학습을 지원합니다. 사용자는 마법사 방식의 구성 절차를 완료함으로써 이미지 획득부터 모델 추론까지의 전체 흐름을 빠르게 구현할 수 있습니다. 이 도구는 일반적으로 금속 각인, 곡면 문자, 복잡한 배경 등 전통적인 알고리즘으로 처리하기 어려운 시나리오에 적용됩니다.

이 도구에는 사전 학습된 모델이 내장되어 있어, 목표 영역만 설정하면 처음부터 학습하지 않고도 바로 추론할 수 있습니다. 사용자는 검증 결과에 따라 필요 시 추가 학습으로 모델을 최적화하면 됩니다.

overall workflow
  1. 이미지 획득: 모델 검증 및 최적화에 사용할 이미지 데이터를 취득합니다. 실제 생산 환경의 대표 상황을 충분히 포함해 이미지 품질과 다양성을 확보함으로써 모델 판정 정확도를 높이는 것을 권장합니다.

  2. 목표 영역 설정: 취득한 이미지에서 목표 영역(ROI)을 설정합니다. 직사각형 또는 원환 형태를 지원하며, 문자 영역을 정확히 박스 지정해 후속 인식을 위한 핵심 범위를 고정합니다.

  3. 모델 검증 및 최적화: 취득한 이미지를 사용해 모델 인식 효과를 검증합니다. 실제 상황에 따라 보정 문자 내용, 인식 범위, 판정 조건 및 문자열 연결 규칙을 설정할 수 있습니다. 인식 결과가 정확하지 않으면 "추가 학습" 기능으로 이미지를 보충하고 모델을 방향성 있게 최적화하여 실제 요구를 만족할 때까지 개선할 수 있습니다.

사용 절차

도구에 들어간 후 왼쪽 모델 목록에서 오른쪽 상단의 새로 만들기를 클릭하여 새 모델을 만들고 새로운 모델 구성 절차로 들어갑니다.

이미지 획득

모델 검증 및 최적화에 사용할 이미지 데이터를 취득합니다.

  1. 현재 스텝의 입력 포트에 이미지 데이터가 연결되어 있는지 확인합니다.

  2. 도구에 진입하면 카메라가 자동으로 한 장의 이미지 데이터를 취득하여 모델 검증에 사용합니다. 이미지 획득 버튼을 클릭해 새로운 이미지 데이터를 취득하여 모델을 검증할 수도 있습니다.

이미지를 취득할 때는 다음과 같은 생산 현장의 대표 변화를 포함하는 것이 좋습니다.

  • 위치 및 각도 차이: 대상 물체가 시야 내에서 평행 이동, 회전 또는 기울어지는 이미지를 포함합니다.

  • 조명 및 배경 차이: 서로 다른 밝기, 그림자, 복잡한 배경 또는 색상 변화가 있는 이미지를 포함합니다.

  • 외관 및 형태 차이: 대상 물체에 경미한 변형, 오염, 스크래치 또는 배치별 색차가 존재하는 이미지를 포함합니다.

다양한 이미지는 모델 효과를 더 전면적으로 검증하는 데 도움이 되며, 후속 최적화 효율도 높여 줍니다.

목표 영역 설정

이미지를 취득한 후에는 문자 인식 범위를 제한하기 위해 목표 영역(ROI)을 설정해야 합니다.

"2D 정렬 파라미터 그룹" 포트에 입력이 존재하면, ROI는 목표 포즈와 함께 동기 변환됩니다. 여기서 설정하는 ROI는 기준 위치이며, 실제 인식 시에는 정렬 파라미터에 따라 동적으로 오프셋됩니다.

  1. 편집 버튼을 클릭하여 목표 영역 설정 화면으로 들어갑니다.

  2. 단일 문자 크기를 설정합니다.

    시스템은 시각화 영역에 주황색의 기본 문자 크기 직사각형 박스를 자동 생성합니다. 선택한 뒤 테두리를 드래그하여 크기를 조정할 수 있습니다. 모델 추론 정밀도를 보장하려면 이 박스를 실제 문자 크기와 유사하게 조정해야 하며, 너무 크거나 너무 작으면 인식 효과에 영향을 줍니다.

    시각화 영역에 문자 크기 영역이 보이지 않으면, "문자 크기 영역 표시" 스위치가 켜져 있는지 확인하십시오.

  3. 목표 영역을 설정합니다. 두 가지 방식을 제공합니다.

    설정 방식 설명

    전체를 목표 영역으로 사용

    ROI가 전체 이미지를 자동으로 덮습니다. 목표 문자가 이미지를 가득 채우는 시나리오에 적합합니다. 일부 영역을 제외해야 하면 다음 단계에서 마스킹 영역을 설정할 수 있습니다.

    사용자 정의 목표 영역

    "직사각형" 또는 "원환" 박스 지정 도구를 선택하여 시각화 영역에서 드래그해 ROI를 그립니다. 목표 문자의 실제 위치와 형태에 맞춰 목표 영역을 정확히 박스 지정하고, 관련 없는 배경이 포함되지 않도록 하십시오.

    • 직사각형 박스 지정: 직접 드래그하여 직사각형 ROI를 그립니다.

    • 원환 박스 지정: 아래 그림을 참고하여 원주를 따라 드래그해 원환 ROI를 그립니다. 그린 뒤에는 원형 문자 읽기 방향을 시계 방향 또는 반시계 방향으로 설정해야 합니다.

      set circular roi
  4. 마스킹 영역을 설정합니다(선택 사항).

    목표 영역 안에 반사광, 그림자 또는 고정 배경 등 관련 없는 간섭이 있을 경우, 마스킹 영역을 설정하여 이를 제외함으로써 모델 학습과 분류 판정 결과에 영향을 주지 않도록 할 수 있습니다.

    마스킹 영역 설정 버튼을 클릭하고 "다각형" 박스 지정 도구를 사용하여 시각화 영역에 마스킹 영역을 그립니다. 마우스 왼쪽 버튼 클릭으로 다각형 꼭짓점을 추가하고, 마우스 오른쪽 버튼을 두 번 클릭해 다각형을 닫아 박스 지정을 완료합니다.

  5. 설정을 마친 후 저장 후 사용을 클릭하여 목표 영역 구성을 적용합니다.

문자 크기 영역, 목표 영역, 마스킹 영역의 마스크가 완전히 겹칠 때맨 위에 있는 레이어만 편집할 수 있습니다.

마우스 오른쪽 버튼을 클릭하면 영역 삭제, 맨 앞으로, 맨 뒤로 보내기 작업을 빠르게 수행할 수 있습니다.

모델 검증 및 최적화

목표 영역 설정을 완료한 뒤 검증 버튼을 클릭하면 검증 화면으로 들어갑니다.

검증 파라미터 설정 및 모델 효과 검증

검증 화면에서 다음 파라미터를 확인하거나 설정하고, 모델의 인식 결과가 기대에 부합하는지 관찰할 수 있습니다.

파라미터 설명

검증 결과

파라미터 설명: 문자 인식 결과를 표시합니다. 판정을 활성화하면 설정한 판정 조건에 따라 검증 결과가 OK 또는 NG로 표시됩니다.

소요 시간

파라미터 설명: 단일 추론의 소요 시간(ms)을 표시합니다.

신뢰도 임계값

파라미터 설명: 모델이 문자를 인식하는 최소 신뢰도 기준입니다. 이 값보다 낮은 인식 결과는 인식 실패로 판정됩니다.

기본값: 0.5

조정 설명: 기본값 사용을 권장합니다.

보정 문자 내용

파라미터 설명: 인식 결과 앞 N자리 문자의 유형을 제한하는 데 사용됩니다. 입력한 와일드카드 수가 제한되는 문자 자리 수를 결정하며, 그 길이를 초과하는 뒤의 문자는 영향을 받지 않습니다. 어떤 자리의 문자가 제한 유형에 부합하지 않으면 모델은 해당 유형 내에서 신뢰도가 가장 높은 후보 문자로 대체합니다. 지원하는 와일드카드: ?(임의 문자), $(영문자), %(숫자), @(기호), !(영문 대문자), &(영문 소문자).

기본값: 꺼짐.

조정 설명: 앞자리 몇 자리에 명확한 유형 요구가 있는 고정 형식 문자 보정에 적합합니다. 실제 인코딩 규칙에 따라 왼쪽에서 오른쪽으로 와일드카드를 입력하고, 과도한 제한으로 잘못된 보정이 발생하지 않도록 하십시오.

조정 예시:

실제 인코딩 형식이 "숫자 + 영문 대문자 + 숫자 + …​"인 것이 알려져 있지만, 모델 인식 결과가 "iR20181102ar06Xd"로 나와 첫 문자가 영문 소문자로 잘못 인식된 경우를 가정합니다.

before character correction

이때 입력 상자에 "%!%"를 입력합니다(1번째 자리는 숫자, 2번째 자리는 영문 대문자, 3번째 자리는 숫자로 제한하며, 4번째 이후는 제한하지 않음). 다시 추론하면 첫 문자가 가장 신뢰도가 높은 숫자로 보정되어 결과가 "1R20181102ar06Xd"로 바뀝니다.

after character correction

인식 대상

파라미터 설명: 인식 결과에서 읽어 후속 처리에 참여할 문자 유형을 지정합니다. 선택하지 않은 문자는 무시됩니다.

값 목록: 영문 대문자, 영문 소문자, 숫자, 기호

기본값: 모두 선택.

조정 설명: 실제 문자 내용에 따라 인식에 참여할 문자 유형을 선택하여, 관련 없는 문자 간섭을 줄이고 모델 판정 정확도를 높이십시오.

연결 구분자

파라미터 설명: 여러 줄 문자를 인식했을 때, 행과 행 사이를 어떤 방식으로 연결할지 지정합니다.

기본값: 없음.

조정 설명: 실제 요구에 따라 조정하십시오.

판정 활성화

파라미터 설명: 인식 결과가 기대에 부합하는지 검증하는 데 사용됩니다. 문자 유형, 문자 개수 또는 고정 형식을 제한할 수 있으며, 규칙에 맞지 않는 결과는 NG로 판정됩니다. 두 가지 판정 모드를 지원합니다.

  • 문자 개수 판정: 문자 개수 범위 [최솟값, 최댓값]를 설정하며, 인식 결과 길이가 이 범위 안에 없으면 NG로 판정합니다.

  • 문자 내용 판정: 인식 결과를 기준 문자열과 자리별로 비교합니다. 기준 문자열 길이 범위 내의 문자만 비교하며, 초과 부분은 판정에 참여하지 않고 통과로 간주합니다. 불일치하면 NG로 판정합니다. 기준은 두 가지 방식으로 제공합니다.

    • 수동 입력 모드: 고정 문자열 또는 와일드카드 템플릿을 기준으로 수동 입력합니다. 와일드카드 규칙은 "보정 문자 내용"과 동일합니다.

      예를 들어 "%!%"를 입력하고 인식 결과가 "iR20181102ar06Xd"라면, 시스템은 앞 3자리만 비교합니다. 첫 번째 자리의 "i"는 숫자(%)가 아니므로 NG로 판정합니다. 4번째 이후는 판정에 참여하지 않습니다.

    • 전역 변수 모드: 전역 변수에서 기준 문자열을 가져와 비교합니다. 이 모드로 전환하면 사용 가능한 전역 변수가 표시됩니다. 여기서는 "단일 결과" 모드이며 데이터 유형이 문자열(String)인 전역 변수만 연결할 수 있습니다. 선택 후에는 해당 변수의 현재 값을 판정 기준으로 사용합니다. 전역 변수 사용 방법은 전역 변수를 참조하십시오.

기본값: 꺼짐.

조정 설명: 자동 합격성 검사에 사용됩니다. 고정 형식 검증은 수동 입력 모드를, 동적 내용 검증은 전역 변수 모드를 선택하십시오.

추가 학습 및 모델 효과 최적화(선택 사항)

검증 과정에서 인식 결과가 정확하지 않다면(예: 문자 오인식, 누락 인식 또는 배경 오검출), "추가 학습" 기능을 통해 방향성 있게 수정하여 모델 효과가 실제 요구를 만족할 때까지 개선할 수 있습니다.

다음과 같은 경우에는 추가 학습을 권장합니다.

  • 문자 오인식: 예를 들어 "A"를 "4"로 인식하거나, "0"와 "O"를 혼동하는 경우.

  • 문자 누락 인식: 일부 문자가 검출되지 않은 경우.

  • 배경 오검출: 문자 영역이 아닌 부분(예: 로고, 텍스처, 반사 얼룩)이 문자로 잘못 인식된 경우.

구체적인 절차는 다음과 같습니다.

  1. 검증 화면에서 추가 학습 버튼을 클릭하여 추가 학습 페이지로 들어갑니다.

  2. 문제 유형에 따라 추가 내용을 입력합니다.

    추가 내용 설명 작업

    인식 내용

    누락 인식 또는 오인식을 수정하는 데 사용됩니다. 이미지에서 올바르게 인식되지 않은 문자 영역을 박스 지정하고, 해당 위치의 올바른 문자 내용을 입력하여 학습 내용으로 추가합니다.

    1. 추가 버튼을 클릭하고, 시각화 영역에서 문자 영역을 직사각형으로 박스 지정합니다.

    2. 올바른 문자를 입력하고, 빈 영역을 클릭해 추가를 확정합니다.

    3. 다음 이미지 추론을 클릭하면 시스템은 추가된 내용을 기반으로 모델을 업데이트하고, 새로 취득한 이미지에서 추론 검증을 수행합니다. 위 단계를 반복하여 학습 내용 라벨링을 완료합니다.

    제외 내용

    배경 오검출을 제거하는 데 사용됩니다. 이미지에서 문자로 잘못 인식된 영역을 박스 지정해 무시 영역으로 표시하면, 해당 영역의 인식 결과가 제거됩니다.

    1. 추가 버튼을 클릭하고, 시각화 영역에서 드래그하여 제외 영역을 그립니다. 마우스를 놓으면 추가가 완료됩니다.

    2. 다음 이미지 추론을 클릭하면 시스템은 추가된 내용을 기반으로 모델을 업데이트하고, 새로 취득한 이미지에서 추론 검증을 수행합니다. 위 단계를 반복하여 제외 내용 라벨링을 완료합니다.

  3. 학습 버튼을 클릭하여 추가 학습 내용을 사용해 모델을 다시 학습시킵니다. 학습이 완료되면 시스템은 자동으로 검증 화면으로 돌아가 최적화된 인식 효과를 검증할 수 있습니다.

    현재 메커니즘에서는 추가 학습에서 라벨링한 문자가 검증 규칙의 "보정 문자 내용" 및 "인식 대상" 제한을 받지 않으므로, 여전히 인식 결과에 나타날 수 있습니다. 인식 결과와 검증 규칙이 충돌하는 것을 피하려면, 보정 문자 내용 및 인식 대상과 일치하는 학습 내용만 추가하는 것을 권장합니다.

  4. 검증이 완료되면 저장 후 사용 버튼을 클릭하여 모델 구성을 저장합니다.

이로써 모델 구성이 완료됩니다. 도구 창을 닫은 뒤 "모델 이름" 파라미터의 드롭다운 목록에서 해당 모델을 선택하면, 후속 추론 스텝에서 이 모델을 사용해 문자 인식을 수행할 수 있습니다.

이 페이지가 도움이 되었습니까?

다음 방법을 통해 피드백을 보내주실 수 있습니다:

저희는 귀하의 개인정보를 소중히 다룹니다.

당사 웹사이트는 최상의 사용자 경험을 제공하기 위해 쿠키를 사용하고 있습니다. "모두 수락"을 클릭하시면 쿠키 사용에 동의하시는 것이며, "모두 거부"를 클릭하시면 이 웹사이트 방문 시 귀하의 정보가 추적되거나 기억되지 않도록 단일 쿠키만 사용됩니다.