OCR(Optical Character Recognition) 관련
13년 9월 기준.
ABBYY finereader
ABBYY사에서 개발한 소프트웨어
가장 뛰어난 성능을 가지고 있음
Tesseract-ocr
Google에서 제공하는 Open source
Open source중에서 유일하게 한글 ocr 지원
http://msdn.microsoft.com/en-us/library/aa167607(office.11).aspx
// MODI 관련
http://support.microsoft.com/kb/982760/ko
// Office 2010에는 MODI가 제거되어서 따로 설치
https://code.google.com/p/tesseract-ocr/
// 영문하고 숫자 가능
https://code.google.com/p/tesseract-ocr/downloads/detail?name=kor.traineddata.gz
// 한글데이터
http://sourceforge.net/projects/javaocr/
http://code.google.com/p/mezzofanti/
C#
http://code.google.com/p/tesseractdotnet/
http://code.google.com/p/jtesseract/wiki/QuickStartupGuide
http://stackoverflow.com/questions/16598390/tesseract-ocr-simple-example
// C# tesseract
http://www.pixel-technology.com/freeware/tessnet2/
// C# tesseract example
http://stackoverflow.com/questions/2424246/tesseract-net-in-c-sharp
// pixel-technology꺼보다 leptonica 추천
http://www.leptonica.com/download.html
tesseract 3 c# wrapper
http://code.google.com/p/tesseractdotnet/
// dll쓰는 wrapper