71
Tesseract.js je biblioteka javascripta koja iz slika dolazi gotovo na bilo kojem jeziku.Tesseract OCR motor bio je jedan od top 3 motora 1995. na UNLV testu preciznosti.Između 1995. i 2006. na njemu je malo posla, ali to je vjerojatno jedan od najtačnijih dostupnih OCR motora s otvorenim kodom.Izvorni kod čitat će binarnu, sivu ili obojenu sliku i izlazni tekst.Ugrađen je tiff čitač koji će čitati nekomprimirane TIFF slike ili se može dodati libtiff za čitanje komprimiranih slika.Postoje jezične datoteke za mnoge jezike, čak i za skup teksta u frazama Fraktur i crne letvice ....