Benutzer:DelphiN/OCR: Unterschied zwischen den Versionen

K
keine Bearbeitungszusammenfassung
(Die Seite wurde neu angelegt: „Ich sammle hier meine Erkenntnisse zur automatischen Schrifterkennung (OCR). ''(Diese Sammlung ist völlig unvollständig und sollte nur mit vorsicht genutzt werden!)'' == Tools == === Tesseract === Als erstes müssen wir sicherstellen tesseract ist installiert: sudo apt-get install tesseract-ocr jbig2 Wir müssen noch mindestens die Sprache '''Deutsch''' nachinstallieren: sudo apt search tesseract- lang | grep deu sudo apt-get install tessera…“)
 
KKeine Bearbeitungszusammenfassung
Zeile 3: Zeile 3:
== Tools ==
== Tools ==


=== Tesseract ===
=== [https://tesseract-ocr.github.io/ Tesseract] ===


Als erstes müssen wir sicherstellen tesseract ist installiert:
Als erstes müssen wir sicherstellen tesseract ist installiert:
Zeile 43: Zeile 43:


Einfache Tests mit jaided.ai waren sehr schlecht. Nicht zu gebrauchen für deutsche Frakturschrit.
Einfache Tests mit jaided.ai waren sehr schlecht. Nicht zu gebrauchen für deutsche Frakturschrit.
=== https://pero-ocr.fit.vutbr.cz ===
Die Ergebnisse vom Project PERO OCR sind ziemlich beeindruckend. Leider ist beim Mehr-Spalten Layout recht viel Handarbeit nötig. Für Dokumente hilfreich, für ganze Bücher scheinbar nicht ideal!