


CNN에 기반한 실제 환경에서의 색상 및 문자 인식


CNN-facilitated Color and Character Recognition in Practical Applications

박현철, 이상웅

This research study is conducted in an attempt to automate the task of color and character recognition, particularly used in industries. This task was done manually by humans which is a waste of human resources. Current systems that are employed for automatic extraction of characters require a constant source of illumination, a certain pattern, and a fixed camera angle. Convolutional Neural Network (CNN) promises a high recognition rate of 99% for optical character recognition and outputs stable results even in varying environmental conditions. Therefore, this paper implements CNN for the estimation of the character region. For color classification in industries, the color strongly depends on the concentration of the paint and the illumination conditions. The first problem is the misclassification of the chromatic color to another unique color and the neighboring hue of the chromatic color when the brightness and chroma are low in the RGB color space. This paper uses a feed forward neural network to solve the first issue of color classification. The color of an object is perceived by the ray of light that it reflects. When this light color changes, the color of the object looks different. This attributes to the second problem in which the perception of colors varies with the change in the illumination color of the light source. To tackle this issue, this paper proposes to implement CNN for the approximation of the color of the light source.


본 연구는 산업체 현장에서 사람이 직접 수행하는 색선 및 문자 인식을 자동화하기 위한 기초연구이다. 과거의 산업 체 현장에서 사용된 문자 추출 방법은 획득한 영상에서 고정된 카메라 각도, 일정한 조명 그리고 문자가 이루는 일 정한 패턴에 따라 정해진 파라미터 값으로 문자추출 시스템이 진행된다. 본 논문에서는 과거의 고정된 파라미터 값 에 따라 순차적인 시스템으로 추출하던 방법과 달리 환경 변화에도 강인한 결과를 보여주었던 컨볼루션 신경망 (Convolutional Neural Network, CNN)을 통하여 문자영역을 추정하고자 한다. 본 논문에서 문자 영역 추정에 사용되는 CNN 구조는 컨볼루션 단계와 풀링 단계가 하나씩 이루어진 구조를 사용하여 문자영역과 비 문자영역으 로 분류를 시도하고자 한다. 산업체 현장에서 발생되는 색선 인식의 주요 문제 중 첫 번째는 색선에 사용하는 도료 의 농도와 조명의 밝기 변화에 따라 달라지는 색선 분류 문제이다. 이는 색선의 색상이 RGB 색 공간에서 명도와 채도가 낮은 값을 가질 때 색선의 고유색이 이웃한 색조로 잘못 분류되는 문제이다. 본 논문에서는 색 분류 문제를 전방향 신경망을 통하여 해결한다. 두 번째 문제는 조명의 색상 변화에 따른 색 항상성 문제이다. 사물의 색은 광원 의 색상에 따라 그 반사광이 달라진다. 때문에 조명의 색에 변화가 생길 경우 색선의 반사광 또한 달라질 수 있다. 영상의 적절한 보정을 위하여 광원의 색을 추정할 필요가 있다. 본 논문에서는 RGB 3채널에 대해 1x1x3 컨볼루션 이 이루어지는 CNN 구조를 통하여 광원의 색을 추정하고자 한다.


 1. 서론
 2. 컨볼루션 신경망(CNN)
  2.1 컨볼루션 층
  2.2 풀링 층
  2.3 출력 층
 3. 문자 및 색상 인식
  3.1 문자 인식
  3.2 색상 인식
 4. 실험 결과 및 분석
  4.1 실험 환경
  4.2 실험 결과
 5. 결론


  • 박현철 Hyun-Cheol Park. 조선대학교 컴퓨터공학과
  • 이상웅 Sang-Woong Lee. 조선대학교 컴퓨터공학과


