네이버 시리즈 텍스트 추출 - neibeo silijeu tegseuteu chuchul

0. 차례

1. 들어가기

2. newocr 사이트에서 이미지에 있는 텍스트 추출하기

3. 마무리...

4. 참고자료(Reference)

1. 들어가기

이번 포스팅은 이미지안에 있는 텍스트를 추출해주는 사이트 newocr에 말씀드리려고 합니다. 참고로 newocr 사이트는 광학 문자 인식(Optical character recognition; OCR) 기술로 텍스트를 추출하며 OCR이란 사람이 쓰거나 기계로 인쇄한 문자의 영상을 이미지 스캐너로 획득하여 기계가 읽을 수 있는 문자로 변환하는 것을 말합니다.2)

2. newocr 사이트에서 이미지에 있는 텍스트 추출하기

먼저, 아래 링크를 통해 newocr 사이트에 접속합니다.

https://www.newocr.com/

Free Online OCR - Convert JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu to Text

Free online OCR service that allows to convert scanned images, faxes, screenshots, PDF documents and ebooks to text, can process 122 languages and supports layout analysis

www.newocr.com

러면 아래와 같은 페이지가 나타나게 됩니다. 페이지 상단에 JPEG, PNG, GIF, BMP, TIFF, PDF, DjWu가 적용가능한 포맷 형식이라고 명시되어 있으니 사용시 참고하시길 바랍니다.

네이버 시리즈 텍스트 추출 - neibeo silijeu tegseuteu chuchul

다음으로 위의 그림에 있는 [파일선택]을 눌러 원하는 그림파일을 로컬 컴퓨터에서 서버로 올리고 [Preview]을 눌러줍니다.

그러면 아래 그림처럼 업로드된 이미지가 뜹니다. 여기서 먼저, ① 이미지에서 인식할 텍스트의 언어를 선택하고, ② 인식될 범위를 지정하십시오. 그 다음으로 [OCR]을 눌러 실행시킵니다.

네이버 시리즈 텍스트 추출 - neibeo silijeu tegseuteu chuchul

그러면 아래에 추출된 텍스트가 생성 되고 이를 클립보드로 복사/붙여넣기할 수 있으며, 워드문서나 pdf, txt 등으로 다운로드 받을 수 있습니다.

네이버 시리즈 텍스트 추출 - neibeo silijeu tegseuteu chuchul

3. 마무리...

복잡하지 않는 이미지에서는 잘 수행이 되지만 그렇지 않은 경우에는 정확도가 비교적 떨어지는 편입니다. 하지만 심플한 이미지를 이용하는 경우에는 언어 설정만 주의해서 사용하면 좋은 수준의 결과를 나타내는 것 같습니다.

4. 참고자료(Reference)

1) https://www.newocr.com/

2) https://ko.wikipedia.org/wiki/%EA%B4%91%ED%95%99_%EB%AC%B8%EC%9E%90_%EC%9D%B8%EC%8B%9D

구글 드라이브는 구글에서 제공하는 클라우드 서비스로 파일 저장, 공유 등의 기능을 제고합니다. 뿐만 아니라 구글 문서 기능과도 연동되어 있어 이미지를 구글 드라이브에 업로드하여 구글 문서를 열람할 경우 이미지의 텍스트를 추출할 수 있습니다. 이 글에서 그 과정을 자세하게 소개합니다. 

관련 글

- 구글 드라이브 업로드한 파일 공유하는 방법

이미지 텍스트 추출하는 방법

1. 네이버에서 구글 드라이브를 검색하여 접속합니다. 

2. 새탭에서 구글 드라이브에 연결되면 드라이브로 이동을 클릭하여 구글 계정 로그인을 진행합니다.

3. 구글 드라이브로 들어가면 왼쪽 상단에 있는 + 새로 만들기를 클릭합니다. 

4. 파일 업로드를 선택합니다.

네이버 시리즈 텍스트 추출 - neibeo silijeu tegseuteu chuchul

5. 열기 창이 열리면 텍스트를 추출할 이미지를 선택하고 열기를 클릭합니다.

6. 이미지가 구글 드라이브에 업로드되면 그 파일을 마우스 오른쪽 버튼으로 클릭합니다.

7. 다음과 같은 메뉴가 펼쳐지면 연결 앱 - 구글 문서를 선택합니다. 

8. 구글 문서에서 이미지가 열리면 상단에는 업로드한 이미지가 표시되고, 하단에는 이미지에 포함되어 있는 텍스트가 추출되어 표시됩니다. 이미지 뿐만 아니라 PDF도 동일한 방법으로 텍스트를 추출할 수 있습니다.