OCR 이란?
OCR 이란 Optical Character Reader 또는 Recognation의 약자로 빛을 이용해 문자를 판독하는 장치로 종이에 인쇄되거나 손으로 쓴 문자, 기호, 마크 등에 빛을 비추어 그 반사 광선을 전기 신호로 바꾸어 컴퓨터에 입력하는 장치다. OCR은 보통 세금이나 공공요금 고지서나 영수증에 많이 사용된다. 광문자 인식은 특수한 판독 장치를 이용하기도 하지만 흔히 소형 광 스캐너와 전용의 소프트웨어를 사용해서 한다. OCR 기법에는 유형정합(pattern matching)과 획분석법(stroke analysis method)이 잘 알려져 있으나, 최근에는 손으로 쓴 문자인식과 같은 기법을 사용하는 예가 늘어나고 있다. OCR은 읽은 문자와 이미 저장되어 있는 문자의 비교를 통해 판독한다. OCR의 판독특성 때문에 쓴 문자를 인식하는 데 약간의 오류가 존재한다는 단점이 있다.
[네이버 지식백과] OCR (시사상식사전, 박문각)
ocr 무료적용
스캔독은 모든 문서에 무료로 OCR을 적용해드리고 있습니다.
그러나 OCR이 현재기술로는 완벽하지는 않습니다. 프로그램자체가 영어권 국가에서 개발되어 알파벳을 사용하는 언어에 적합합니다. 기술이 발전하여 한글도 우수한 변환 결과를 얻을 수 있지만 특별한 폰트나 일정크기 이상의 폰트는 인식을 못하는 경우도 있습니다. 또한 필기체는 특성상 인식하기가 힘듭니다.
그리고 바탕이 흰색의 무늬가 없는 바탕에서 인식률이 좋지만 색깔이 들어간 바탕, 무늬가 있는 바탕에서는 인식률이 떨어지며 짙은 색상의 바탕에 흰 글자의 경우도 역시 인식률이 떨어지는 현상이 나타납니다.
표준적인 글자크기와 폰트라고 하여도 밑줄이 그어져 있거나 필기를 위해 어떠한 내용이 삽입되어있다면 이 또한 인식률이 떨어져 오류가 나기도 합니다.
이러한 점들을 참고하여 COR오류가 나더라도 참고하시기 바랍니다.