본문 바로가기

Data science19

[Tesseract & OpenCV]를 이용한 OCR-1 테서랙트 설치 및 환경설정 # Tesseract & OpenCV Tesseract와 OpenCV를 이용한 OCR(Optical Character Recognition)에 대해 알아보겠습니다. 테서랙트(Tesseract)는 다양한 운영체제에서 사용할 수 있도록 개발된 OCR 엔진입니다. 처음에 1985년에 HP연구소에서 개발되었던 소프트웨어가 2005년 오픈 소스로 출시 되었고 이후 2006년부터는 구글에서 후원하고 있다고 합니다. 현재는 버전 5까지 개발된 상태이며, 버전 4 기준 116개의 언어에 대해 문자 인식이 가능하다고 합니다. 본 포스팅에서는 윈도우와 파이썬 환경에서 테서랙트와 OpenCV를 이용하여 OCR을 수행하는 과정에 대해 다뤄보도록 하겠습니다. 먼저 윈도우 버전의 테서랙트를 설치하려면 테서랙트 깃허브에서 윈도우 .. 2020. 8. 15.
주피터 노트북 환경설정 # Jupyter notbook 환경설정 주피터 노트북을 사용할때 유용한 환경설정 몇가지를 소개하려합니다. 먼저, 주피터 노트북 환경설정을 위해서는 환경설정 파일을 생성해야 하는데요, 아래 그림과 같이 명령프롬프트(cmd)창에서 "jupyter notebook --generate-config"를 입력하여 "jupyter_notebook_config.py" 파일을 생성합니다. 생성된 파일의 경로로 들어가서 마우스 오른쪽 버튼을 눌러 해당파일을 메모장이나 노트패드와 같은 편집기로 열어줍니다. 파일을 열면 아래와 같이 설정 내역들을 볼 수 있습니다. 주피터 노트북을 사용하는데 있어 유용한 설정 몇가지를 소개하겠습니다. 1. 주피터 노트북이 열리는 기본 경로 설정 명령프롬프트창에서 주피터 노트북을 실행하면 실행.. 2020. 6. 3.
Python 패키지 수동 설치 파이썬 패키지 수동 설치, 'wheel' 파일 설치 파이썬 관련 패키지를 설치할 때 명령프롬프트(cmd)창에서 'pip install ~' 명령어를 사용하면 파이썬 패키지들을 설치할 수 있습니다. 하지만 보안등의 이유로 내부망과 외부망이 분리된 곳이나 ip를 제한적으로 개방해놓은 곳에서는 pip install로 설치를 하지 못하는 경우가 있는데요, 이럴때는 '~.whl' 형식의 파일(wheel 파일)을 다운로드하여 수동으로 필요한 패키지를 설치할 수 있습니다. 1. pypi.org 사이트에 방문하여 필요한 패키지를 검색 예시로 딥러닝 라이브러리인 'keras' 를 찾아보겠습니다. 메인화면에서 검색창에 'keras'를 입력합니다. 검색된 항목중 'keras'를 선택합니다. (간혹 검색하려는 패키지와 관련된.. 2020. 6. 2.