Knowledge

OCR(Optical Character Recognition) 관련

메디츠 2024. 1. 20. 14:06
반응형

13년 9월 기준.

 

ABBYY finereader

ABBYY사에서 개발한 소프트웨어

가장 뛰어난 성능을 가지고 있음

 

Tesseract-ocr

Google에서 제공하는 Open source

Open source중에서 유일하게 한글 ocr 지원

 

http://msdn.microsoft.com/en-us/library/aa167607(office.11).aspx

// MODI 관련

http://support.microsoft.com/kb/982760/ko

// Office 2010에는 MODI가 제거되어서 따로 설치

 

https://code.google.com/p/tesseract-ocr/

// 영문하고 숫자 가능

https://code.google.com/p/tesseract-ocr/downloads/detail?name=kor.traineddata.gz

// 한글데이터

 

http://sourceforge.net/projects/javaocr/

http://code.google.com/p/mezzofanti/

 

C#

http://code.google.com/p/tesseractdotnet/

http://code.google.com/p/jtesseract/wiki/QuickStartupGuide

 

http://stackoverflow.com/questions/16598390/tesseract-ocr-simple-example

// C# tesseract

http://www.pixel-technology.com/freeware/tessnet2/

// C# tesseract example

 

http://stackoverflow.com/questions/2424246/tesseract-net-in-c-sharp

// pixel-technology꺼보다 leptonica 추천

http://www.leptonica.com/download.html

 

tesseract 3 c# wrapper

http://code.google.com/p/tesseractdotnet/

// dll쓰는 wrapper

반응형