본문 바로가기

openCV3

[Tesseract & OpenCV]를 이용한 OCR-2-2 전처리(pre-processing) Tesseract & OpenCV 앞선 포스팅 내용에 이어서 OpenCV를 이용한 이미지 전처리에 대해 알아보겠습니다. 오늘은 이미지 전처리 중에서도 형태적(Morphological)인 변환에 대해서 알아보겠습니다. 형태적인 변환이라는 것은 커널함수를 이용하여 이미지를 특정 조건에 맞도록 변환하는 것입니다. 여기서의 변환은 특정 부분을 단순화하거나, 제거, 보정하는 것을 의미합니다. 보통 binary나 grayscale 이미지에 사용된다고 합니다. 4) Dilation(팽창) Dilation은 이미지의 각 부분에 커널을 적용하여 커널과 일치하는 부분에 하나라도 0이 있으면 해당 부분을 모두 채우는 방식입니다. 결과적으로 이미지 경계를 기준으로 팽창하는 효과가 발생되게 됩니다. 커널의 모양에 따라 적용 결.. 2020. 8. 22.
[Tesseract & OpenCV]를 이용한 OCR-2-1 전처리(pre-processing) Tesseract & OpenCV 지난번에 이어 오늘은 테서랙트와 OpenCV를 이용한 OCR에서 OCR 정확도를 높이기 위해 이미지 전처리에 대해 알아보겠습니다. OpenCV는 Open source computer vision library의 약자로 이미지/영상 처리를 효과적으로 도와주는 강력한 API입니다. 처음에는 Intel에서 개발되었고 이후 BSD license로 무료로 사용할 수 있게 되었다고 합니다. OpenCV tutorial 사이트에 방문하시면 더 많은 정보를 확인하실 수 있습니다. 그리고 "gramman"님께서 OpenCV tutorial 사이트를 참고해서 번역 및 정리해놓은 사이트를 방문하시면 잘 정리된 한글 자료를 확인하실 수도 있습니다. 0) 이미지 불러오기 본 포스팅에서는 Ope.. 2020. 8. 18.
[Tesseract & OpenCV]를 이용한 OCR-1 테서랙트 설치 및 환경설정 # Tesseract & OpenCV Tesseract와 OpenCV를 이용한 OCR(Optical Character Recognition)에 대해 알아보겠습니다. 테서랙트(Tesseract)는 다양한 운영체제에서 사용할 수 있도록 개발된 OCR 엔진입니다. 처음에 1985년에 HP연구소에서 개발되었던 소프트웨어가 2005년 오픈 소스로 출시 되었고 이후 2006년부터는 구글에서 후원하고 있다고 합니다. 현재는 버전 5까지 개발된 상태이며, 버전 4 기준 116개의 언어에 대해 문자 인식이 가능하다고 합니다. 본 포스팅에서는 윈도우와 파이썬 환경에서 테서랙트와 OpenCV를 이용하여 OCR을 수행하는 과정에 대해 다뤄보도록 하겠습니다. 먼저 윈도우 버전의 테서랙트를 설치하려면 테서랙트 깃허브에서 윈도우 .. 2020. 8. 15.