1.5k Aufrufe
Gefragt in Textverarbeitung von aidualc1971 Einsteiger_in (3 Punkte)
Hallo!
Ich habe einen Drucker HP Officejet Pro L7590. Ich scanne ein Dokument ein, welches ich in Word weiter bearbeiten möchte (nicht nur Texterkennung). Die Software für OCR war für den Solution Center von HP bei. Damit kann man auch Bilder scannen, PDF erstellen usw.

Ich habe die Möglichkeiten "Text an RTF-Datei" und "Text an Word". Der Scan klappt hervorragend, das Dokument sieht so aus, wie es aussehen soll. Aber dann...

Egal, welche Möglichkeiten ich nutze (es gibt dann noch Abstimmungen wie z. B. Ausgabetyp - schwarz/weiß, Farbe, Graustufen -, Scharfzeichnen - keine, niedrig, mittel, hoch, extrem - und Moiré entfernen).

Ich denke, ich habe jede mögliche Version versucht, das Ergebnis ist immer anders, aber niemals brauchbar.

Lauter kyrillische Zeichen, die Tabellen sind nicht so, wie sie sein müssen, hier und da fehlt einfach was usw.

Aber: Der erste Scan heute morgen hat geklappt - ich musste nur ein bißchen was verändern, aber im Großen und Ganzen brauchbar-, nur habe ich mir nicht aufgeschrieben und schon gar nicht habe ich behalten, welches Angebot ich ausgewählt habe.

Es wäre toll, wenn sich jemand auskennt und mir hilft.

Habe auch schon verschiedene OCR-Software heruntergeladen, aber die waren dann wirklich entweder Vollschrott oder dienten nur der Texterkennung.

Danke im Voraus!!!

1 Antwort

0 Punkte
Beantwortet von kjg17 Profi (34.4k Punkte)
Hallo,

von den Freeware- und den zu den Druckern mitgelieferten OCR-Versionen sollte man keine Wunderdinge erwarten.

Dass HP "Text an Word" anbietet ist mir neu, bisher war es immer "Text an WordPad" und da werden weder Grafiken eingebettet, noch erkannte Tabellen als solche formatiert. Das funktioniert nur mit dem RTF-Format, mehr oder weniger gut.

Die OCR-Software vergleicht die Form der Zeichen nur mit ein paar Standard-Schriftarten. Wurde in der Vorlage keine dieser Schriftarten verwendet kann u.U. richtiger Müll heraus kommen, wenn sie nicht einmal eine dieser Schriften ähnlich ist. Sehr kleine Schrift erschwert den Erkennungsvorgang noch zusätzlich. Um hier eventuell noch etwas bügeln zu können werden auch noch die Wörter mit einem Wörterbuch verglichen. Billige oder kostenlose OCR-Software unterstützt i.d.R. nur eine Sprache und macht dann bei Vorlagen in anderen Sprachen entsprechend viele Fehler.

Es bringt also nichts, wenn du dir mitunter vergleichsweise gute OCR-Freeware in englisch beschaffst, die verstümmelt deutsche Texte u.U. sogar noch zusätzlich.

Wenn deine Vorlagen für die OCR-Software von HP zu komplex sind, wirst du wohl Kauf-Software benötigen. Um zu sehen was diese im Gegensatz zu Freeware leisten kann, könntest du dir z.B. mal die Testversion von -> ABBYY FineReader installieren.

Gruß
Kalle
...