Oberflächenadministratoren, SMW-Administratoren, SMW-Kuratoren, SMW-Editoren, Oversighter, Administratoren, Widget-Bearbeiter
1.656
Bearbeitungen
K (→Tesseract) |
K (→Tools) |
||
| (Eine dazwischenliegende Version desselben Benutzers wird nicht angezeigt) | |||
| Zeile 1: | Zeile 1: | ||
Ich sammle hier meine Erkenntnisse zur automatischen Schrifterkennung (OCR). ''(Diese Sammlung ist völlig unvollständig und sollte nur mit vorsicht genutzt werden!)'' | Ich sammle hier meine Erkenntnisse zur automatischen Schrifterkennung (OCR). ''(Diese Sammlung ist völlig unvollständig und sollte nur mit vorsicht genutzt werden!)'' | ||
== | == Links == | ||
* https://ocrmypdf.readthedocs.io/en/latest/cookbook.html#redo-existing-ocr | * https://ocrmypdf.readthedocs.io/en/latest/cookbook.html#redo-existing-ocr | ||
| Zeile 7: | Zeile 7: | ||
* https://github.com/tsmdt/docs4training-ocr/blob/main/Training-mit-Tesseract.md | * https://github.com/tsmdt/docs4training-ocr/blob/main/Training-mit-Tesseract.md | ||
* https://opensource.archium.org/index.php/OCR-Workflow | * https://opensource.archium.org/index.php/OCR-Workflow | ||
* https://www.vermessungs-bibliothek.de/buch-pdfs-mit-fraktur-ocr/ | |||
== Tools == | |||
=== [https://tesseract-ocr.github.io/ Tesseract] === | === [https://tesseract-ocr.github.io/ Tesseract] === | ||
| Zeile 38: | Zeile 41: | ||
tesseract --list-langs | tesseract --list-langs | ||
==== Tests === | ==== Tests ==== | ||
Um eine Sprache zu finden die mit der deutschen Frakturschrift klar kommt habe ich folgenden Aufruf verwendet, der einen txt output erzeugt, den man gut vergleichen kann: | Um eine Sprache zu finden die mit der deutschen Frakturschrift klar kommt habe ich folgenden Aufruf verwendet, der einen txt output erzeugt, den man gut vergleichen kann: | ||
Bearbeitungen