Forum
Tipps
News
Menu-Icon

Text-Digitalisierung / Rechtschreibprüfung / OCR/Acrobate

hallo,

Ich habe vor, einige Texte zu digitalisieren. Das Ziel ist es, durchsuchbare Text-PDF-Dokumente (Dateigröße < 4MB) zu erhalten, um diese dann online zur Verfügung zu stellen.

Dazu habe ich mir ein HP-Scanner mit ADF/Einzelblatt-Einzug (Scanjet 8250) sowie als OCR-Software ReadIris Pro 11 gekauft. Auch habe ich inzwischen FineReader 7.0 Professional ausprobiert – in dem Fall am PC, während ich sonst mit dem iMac und OS X 10.4.3 arbeite.

Ich erreiche mittlerweile eine gute Komprimierung (12KB pro Seite (reiner Text)) und habe am Ende durchsuchbare PDF-Dokumente. Leider macht die OCR-Software (Read Iris) nach wie vor viele Fehler und ich stehe vor dem Problem, dass ich in Acrobate (6.0 bzw. 7.0) keine Rechtschreibungs-Prüfung für den Fließtext (nur in Kommentaren und Formularen) durchführen kann und dies auch in der OCR nicht möglich ist.

Verfügt jemand über Erfahrungswerte hinsichtlich der Digitalisierung längerer Texte? Jegliche Information wäre sehr hilfreich.

Besten Dank im Voraus und Freundliche Grüße,

pea



Antworten zu Text-Digitalisierung / Rechtschreibprüfung / OCR/Acrobate:

Hat dir diese Antwort geholfen?

Danke ButtonHilfreiche Antwort Button

Hi,

? ist es nicht möglich, vor der PDF-Endstufe ein .DOC zumachen

! und dieses in ein "Text-"Programm (MS Word, OpenOffice) zu schicken wg. div. Prüfungen

! zu beiden Progs gibts Plugins für .PDF-Ausgabe


« Text-Digitalisierung / Rechtschreibprüfung / OCR/AcrobateSpurenwischer »
 

Schnelle Hilfe: Hier nach ähnlichen Fragen und passenden Tipps suchen!

Fremdwörter? Erklärungen im Lexikon!
Provider
Ein Provider ist ein Zugriffs- oder Zugangsanbieter für Telefon- und Internetdienste. Ein Zugangsprovider erlaubt die Einwahl per Modem oder DSL, während ein Em...

Prozessfarben
Prozessfarben, auch Druckfarben genannt, werden durch Mischen der Gundfarben Cyan, Maganta, Gelb und Schwarz (CMYK-Farbraum) erzeugt. Diese Art der Farbmischung wird auch...

Prozessor
Der Prozessor (auch Hauptprozessor oder englisch CPU - als Abkürzung für "Central Processing Unit" - genannt) ist die zentrale Recheneinheit des Computers. Der ...