hallo,
Ich habe vor, einige Texte zu digitalisieren. Das Ziel ist es, durchsuchbare Text-PDF-Dokumente (Dateigröße < 4MB) zu erhalten, um diese dann online zur Verfügung zu stellen.
Dazu habe ich mir ein HP-Scanner mit ADF/Einzelblatt-Einzug (Scanjet 8250) sowie als OCR-Software ReadIris Pro 11 gekauft. Auch habe ich inzwischen FineReader 7.0 Professional ausprobiert – in dem Fall am PC, während ich sonst mit dem iMac und OS X 10.4.3 arbeite.
Ich erreiche mittlerweile eine gute Komprimierung (12KB pro Seite (reiner Text)) und habe am Ende durchsuchbare PDF-Dokumente. Leider macht die OCR-Software (Read Iris) nach wie vor viele Fehler und ich stehe vor dem Problem, dass ich in Acrobate (6.0 bzw. 7.0) keine Rechtschreibungs-Prüfung für den Fließtext (nur in Kommentaren und Formularen) durchführen kann und dies auch in der OCR nicht möglich ist.
Verfügt jemand über Erfahrungswerte hinsichtlich der Digitalisierung längerer Texte? Jegliche Information wäre sehr hilfreich.
Besten Dank im Voraus und Freundliche Grüße,
pea
pea Gast |