티스토리 뷰

728x90

「이미 만들어진 학습 데이터를 사용하여 간단히 구현해 text포함 이미지를 text로 뽑아보겠습니다.」


※코드는 맨 아래 위치해 있습니다.

[이번 포스팅은 anaconda가 설치되었다고 가정하고 설명드립니다. anaconda가 없으신 분들은 이곳을 클릭해 다운로드하여 주십시오.]

사용하기 위한 모듈을 다운로드하여 봅시다. 다음 명령어를 anaconda prompt에 입력해 주세요

  • conda activate "환경 이름"
  • conda install -c conda-forge pytesseract
  • 여기를 방문해 인식하기 원하는 문자를 다운로드하여주세요 (github.com/tesseract-ocr/tessdata)
  • 아래의 순서대로 다운로드한 파일을 옮겨주세요
  • C:(보기 - 숨겨진 파일 보기 O) -> ProgramData -> Anaconda3 -> envs -> "만든 폴더 이름 -> Library  -> bin -> tessdata -> [넣어주세요]

 

이 사진처럼 들어가면 성공입니다.

 

  • anaconda prompt로 들어갑니다.
  • cd 명령어로 경로를 jupyter notebook을 열 파일 위치로 이동합니다.

 

이 사진처럼 해주시면 성공입니다.

 

  • jupyter notebook에서 새로운 python 페이지를 만듭니다.

 

위 사진처럼 클릭해주시면 됩니다. 순서는 빨주노초파남보 입니다.

 

  • 지금 인식시켜볼 사진입니다.

 

영어 인식용 이미지 입니다.
한글 인식용 이미지 입니다.

 

인식 시킬 이미지와 각 이미지를 pytesseract로 돌려본 결과입니다. 신기하지 않으신가요?

 

    • CODE 입니다.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
import matplotlib.image as img #이 코드는 이미지를 띄워주는 코드입니다.
import matplotlib.pyplot as plt
 
Img1 = "Img_Kor.png"
Img2 = "Img_Eng.png"
 
Img_Kor = img.imread(Img1)
Img_Eng = img.imread(Img2)
 
plt.imshow(Img_Kor)
plt.axis('off')
plt.show()
print("     ------------------ 구분선")
plt.imshow(Img_Eng)
plt.axis('off')
plt.show()
 
########################################################################
                                           #eng영어를 인식합니다.
import pytesseract
 
text = pytesseract.image_to_string("Img_Eng.png", lang='eng')
print(text
      
#########################################################################
                                          #kor한글을 인식합니다.
import pytesseract
 
text = pytesseract.image_to_string("Img_Kor.png", lang = 'kor')
print(text)
cs

 

댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/01   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함