Tesseract telepítés számlakép felismeréséhez

Számlakép szöveg felismerés (OCR)

Bizonyos számlakép fájlok tartalmilag nehezebben feldolgozhatók, így a rajtuk szereplő szövegtartalomból a program csak korlátozott javaslatokat tud adni a társítás során. Ezek a fájlok lehetnek eredetileg képfájlok, vagy képet tartalmazó PDF-ek. A rendszer külső program segítségével képes a szövegtartalom kinyerésére, melyet a szükséges telepítést követően engedélyezhetünk itt.

Telepítés:

  • Windows telepítés: Töltse le a Tesseract telepítőt a GitHub-ról a rendszerének megfelelő verzióval (32-bit vagy 64-bit). Futtassa a telepítőt és kövesse az utasításokat. A telepítés után adja hozzá a Tesseract-ot a rendszer környezeti változóihoz
    https://github.com/UB-Mannheim/tesseract/wiki
  • Linux és macOS telepítés: A Tesseract telepíthető a csomagkezelőkön keresztül, például apt-get vagy brew parancsokkal

A beállítások ablakon csak akkor lehet a Tesseract használatát választani, ha a telepítés sikeresnek látszik.