Benutzer:DelphiN/OCR: Unterschied zwischen den Versionen

K
 
(Eine dazwischenliegende Version desselben Benutzers wird nicht angezeigt)
Zeile 1: Zeile 1:
Ich sammle hier meine Erkenntnisse zur automatischen Schrifterkennung (OCR). ''(Diese Sammlung ist völlig unvollständig und sollte nur mit vorsicht genutzt werden!)''
Ich sammle hier meine Erkenntnisse zur automatischen Schrifterkennung (OCR). ''(Diese Sammlung ist völlig unvollständig und sollte nur mit vorsicht genutzt werden!)''


== Tools ==
== Links ==


* https://ocrmypdf.readthedocs.io/en/latest/cookbook.html#redo-existing-ocr
* https://ocrmypdf.readthedocs.io/en/latest/cookbook.html#redo-existing-ocr
Zeile 7: Zeile 7:
* https://github.com/tsmdt/docs4training-ocr/blob/main/Training-mit-Tesseract.md
* https://github.com/tsmdt/docs4training-ocr/blob/main/Training-mit-Tesseract.md
* https://opensource.archium.org/index.php/OCR-Workflow
* https://opensource.archium.org/index.php/OCR-Workflow
* https://www.vermessungs-bibliothek.de/buch-pdfs-mit-fraktur-ocr/
== Tools ==


=== [https://tesseract-ocr.github.io/ Tesseract] ===
=== [https://tesseract-ocr.github.io/ Tesseract] ===
Zeile 38: Zeile 41:
   tesseract --list-langs
   tesseract --list-langs


==== Tests ===
==== Tests ====


Um eine Sprache zu finden die mit der deutschen Frakturschrift klar kommt habe ich folgenden Aufruf verwendet, der einen txt output erzeugt, den man gut vergleichen kann:
Um eine Sprache zu finden die mit der deutschen Frakturschrift klar kommt habe ich folgenden Aufruf verwendet, der einen txt output erzeugt, den man gut vergleichen kann: