Forum
Tipps
News
Menu-Icon

viele pdf's zu text automatisieren

hi,

ich möchte eine menge (egal wie viele, es sind halt viele) pdfs mit einem (freien wär super ;)) programm per ocr "analysieren" und dann als eine textdatei speichern. am besten wäre es wenn das programm einen bestimmten ordner,wo sich die dateien befinden, überwacht und die pdf's automatisch umwandelt...es wäre auch schon super, wenn es nur ein (FREIES!) programm gibt das viele pdf's aufeinmal (bzw in so einer warteschlange) verarbeitet und nicht jedes einzelnd konvertieren muss. ;)



Antworten zu viele pdf's zu text automatisieren:

Hat dir diese Antwort geholfen?

Danke ButtonHilfreiche Antwort Button

 

Zitat
ich möchte eine menge (egal wie viele, es sind halt viele) pdfs mit einem (freien wär super Wink) programm per ocr "analysieren" und dann als eine textdatei speichern. 
Wozu PDFs mit OCR "analysieren? PDF einfach als Textdatei konvertieren. Das erledigt u. a. Adobe Acrobat (Nicht Adobe Reader!) OCR = Opctical Character Recognition, wird landläufig für / beim Scannen von Papiervorlagen zur Texterkennung genutzt.   ;D

 
Zitat
am besten wäre es wenn das programm einen bestimmten ordner,wo sich die dateien befinden, überwacht und die pdf's automatisch umwandelt.
Klar.  ;D

 
Zitat
..es wäre auch schon super, wenn es nur ein (FREIES!) programm gibt das viele pdf's aufeinmal (bzw in so einer warteschlange) verarbeitet und nicht jedes einzelnd konvertieren muss.
auch klar.  ;), kosten sollte ein derart professionelles Programm, das Ordner mit vielen PDFs selbstständig überwacht und bei jeder neuen Datei automatisch in Text konvertiert natürlich nichts.

Dein Suchbegriff / Suchbegriffkombi für die Suche nach einer kostenlosen PDF-Analysier-und-zu-Text-ändern Software heisst also:

"Freeware Converter / Konverter pdf zu / to text"  ;D
 

k danke werdem ich mal auf die suche machen

leider habe ich bis jetzt kein hilfreiches programm gefunden das meinen anpsprüchen gerecht wurde. das problem ist halt folgendes: es sollen rechnungen digitalisiert werden und als pdf bzw textdokument gespeichert werden. vorher soll aber noch ein anderes programm einen barcode auf einer rechnung erkennen und die folgenden "blätter" ohne barcode zusammengefasst in jeweils eine pdf datei gespeichert werden.

bisher habe ich es geschafft, dass ich ein blatt einscanne, wo ein barcode drauf ist und die folgenden blätter (die dazugehören) in EINER pdf gespeichert werden und nach dem barcode benannt werden. soweit so gut...nun jetzt soll ein programm die pdfs in ein txtdokument umwandeln sodass man die alten pdfs bearbeiten kann.

das klingt alles etwas komig was ich da vorhabe aber mein chef will es so haben..^^ da ich praktikant bin, wäre es super wenn ich hilfe bekomme ;) geht sich hier nämlich um eine ausbildung ;)

Hat dir diese Antwort geholfen?

Danke ButtonHilfreiche Antwort Button

 

Zitat
programm gefunden das meinen anpsprüchen gerecht wurde. das problem ist halt folgendes: es sollen rechnungen digitalisiert werden und als pdf bzw textdokument gespeichert werden. vorher soll aber noch ein anderes programm einen barcode auf einer rechnung erkennen und die folgenden "blätter" ohne barcode zusammengefasst in jeweils eine pdf datei gespeichert werden.
Diese Aufgabenstellung wird weder eine Standard-OCR-Software noch weniger eine Freeware erfüllen. Falls diese Aufgabe überhaupt per SW automatisiert werden kann, erfordert das eine sehr spezialisierte Software - die Frage ist, ob eine solche Lösung überhaupt ohne individuelle Programmierung bereits realisiert wurde.

Schönen Gruss an Deinen Chef: er soll sich mit dafür spezialisierten Anbietern in Verbindung setzen und (vermutl.) mindestens einen 5-stelligen Betrag für die Realisierung ansetzen. 

Hierfür:

 
Zitat
un jetzt soll ein programm die pdfs in ein txtdokument umwandeln sodass man die alten pdfs bearbeiten kann.

Brauchst Du, soweit die PDFs nicht gescannt wurden, Adobe Acrobat.

Die Alternative bzw. zusätzliche OCR-Software ist z.B.

http://www.zdnet.de/downloads/prg/0/0/de10113300-wc.html

mittels der Du die Dokumente neu scannen und weiterbearbeiten kannst. Gewisse Aufgaben lassen sich damit auch automatisieren. 
« Letzte Änderung: 05.03.08, 11:55:34 von PWT »

super, die lösung gefällt meinen chef, er hat jetzt die idee, dass man abbyy vielleicht mit einer kommandozeile oder ähnliches automatisieren kann. gibt es das für das programm? oder andere lösungen? danke :)


« HILFE irgendeine offlog dateinregestriert jeden tastenklick von mir64 bit treiber für nvidia geforce 8800 gts 610mb »
 

Schnelle Hilfe: Hier nach ähnlichen Fragen und passenden Tipps suchen!

Fremdwörter? Erklärungen im Lexikon!
OCR
  OCR steht für "Optical Character Recognition" und ist die Bezeichnung für die optische Zeichenerkennung. Die OCR Technologie zielt darauf ab, Texte in...

PDF
PDF ist das Kürzel für Portable Document Format, ein plattformunabhängiges Dateiformat für Dokumente. Entwickelt wurde das PDF Format (Endung: .p...

Acrobat
Ein Softwarestandard der Firma Adobe für das Erstellen und Anzeigen von PDF - Dokumenten;. Je nach Fähigkeit werden diese Programme mit den Zusätzen Standa...