Hallo zusammen,
Derzeit versuche ich mit per Komandozeile mit Tesseract auszuwerten.
Mit einem Schaltplaneditor habe ich ein paar Texte erstellt, dies dann als BMP exportiert und die Texte wurden einwandfrei ausgewertet.
Also kann es theoretisch nicht an Tesseract liegen...
Tesseract neigt dazu schlechte bis unbrauchbare Ergebnisse zu liefern wenn das Eingangsbild nicht so ist wie es für Tesseract sein sollte, du solltest in etwas
300 dpi
12 Punkt Schriftgröße
haben, weitere Sollgrößen werden auch unter
https://github.com/tesseract-ocr/tes...ImproveQuality genannt.
Versuche dein Bild entsprechend zu skalieren. Tesseract bzw. die verwendete Library (Leptonica
http://www.leptonica.com/) unterstützt 32Bit Farbbilder allerdings wird für die Texterkennung normalerweise ein intern daraus abgeleitetes Graustufenbild oder S/W Bild verwendet. Wenn die unterschiedlichen Farben dicht beieinander liegen und gleiche oder ähnliche Helligkeitswerte produzieren dann gehen bei der Wandlung ggf. Informationen verloren. Evtl. ist es eine gute Idee die Wandlung Farbe - Graustufen oder Farbe - SW selbst vorzunehmen, weil Du dann Einfluss auf das erzeugte Bild nehmen kannst und Konvertierungsfehler ausgleichen kannst.
Bevor Du dich an eine Implementierung mit Delphi ranmachst, kannst Du natürlich ein beliebiges Grafikprogramm nehmen und erst mal Deinen Screenshot damit Skalieren und anpassen um auf der Komandozeile auszuprobieren ob die Änderungen was bringen.
cu Ha-Jö