Oberflächenadministratoren, SMW-Administratoren, SMW-Kuratoren, SMW-Editoren, Oversighter, Administratoren, Widget-Bearbeiter
1.656
Bearbeitungen
(Die Seite wurde neu angelegt: „Ich sammle hier meine Erkenntnisse zur automatischen Schrifterkennung (OCR). ''(Diese Sammlung ist völlig unvollständig und sollte nur mit vorsicht genutzt werden!)'' == Tools == === Tesseract === Als erstes müssen wir sicherstellen tesseract ist installiert: sudo apt-get install tesseract-ocr jbig2 Wir müssen noch mindestens die Sprache '''Deutsch''' nachinstallieren: sudo apt search tesseract- lang | grep deu sudo apt-get install tessera…“) |
KKeine Bearbeitungszusammenfassung |
||
| Zeile 3: | Zeile 3: | ||
== Tools == | == Tools == | ||
=== Tesseract === | === [https://tesseract-ocr.github.io/ Tesseract] === | ||
Als erstes müssen wir sicherstellen tesseract ist installiert: | Als erstes müssen wir sicherstellen tesseract ist installiert: | ||
| Zeile 43: | Zeile 43: | ||
Einfache Tests mit jaided.ai waren sehr schlecht. Nicht zu gebrauchen für deutsche Frakturschrit. | Einfache Tests mit jaided.ai waren sehr schlecht. Nicht zu gebrauchen für deutsche Frakturschrit. | ||
=== https://pero-ocr.fit.vutbr.cz === | |||
Die Ergebnisse vom Project PERO OCR sind ziemlich beeindruckend. Leider ist beim Mehr-Spalten Layout recht viel Handarbeit nötig. Für Dokumente hilfreich, für ganze Bücher scheinbar nicht ideal! | |||
Bearbeitungen