PDF-Dateien nach Suchbegriffen auslesen
- Gerhardus 1
- Beiträge: 397
- Registriert: 10.01.2014, 07:25
- Wohnort: 22149 Hamburg
PDF-Dateien nach Suchbegriffen auslesen
Liebe Mitstreiter,
heute komme ich mit einem Problem auf Sie zu, welches mich seit Monaten nicht mehr losläßt:
Wenn ich ein Buch im PDF-Format (z.B. bei Google-Books) gefunden habe, dann möchte ich dieses Buch gerne auf meinem PC haben und dort nach meinen Suchbegriffen durchstöbern. Trotzdem, dass ich viele Stunden mit der Suche nach einem solchen Programm, und installieren und deinstallieren des Programms verbracht habe, habe ich nichts gefunden, um diese PDF-Datei auszulesen.
Meine Frage: Gibt es jemanden unter uns, der ein solches Programm kennt und vielleicht sogar benutzt? Oder gibt es eine andere Möglichkeit, ein PDF-Buch nach eigenen Wünschen mit Suchbegriffen durchzustöbern?
heute komme ich mit einem Problem auf Sie zu, welches mich seit Monaten nicht mehr losläßt:
Wenn ich ein Buch im PDF-Format (z.B. bei Google-Books) gefunden habe, dann möchte ich dieses Buch gerne auf meinem PC haben und dort nach meinen Suchbegriffen durchstöbern. Trotzdem, dass ich viele Stunden mit der Suche nach einem solchen Programm, und installieren und deinstallieren des Programms verbracht habe, habe ich nichts gefunden, um diese PDF-Datei auszulesen.
Meine Frage: Gibt es jemanden unter uns, der ein solches Programm kennt und vielleicht sogar benutzt? Oder gibt es eine andere Möglichkeit, ein PDF-Buch nach eigenen Wünschen mit Suchbegriffen durchzustöbern?
Mit Forschergruß aus HH-Rahlstedt
Hallo,
grundsätzlich sollte es mit jedem PDF-Reader gehen - ABER!
Es kommt darauf an, wie die Seiten aufgebaut sind, als Text oder als Grafik. Im ungünstigsten Fall müsste da mit Schrifterkennung drüber gegangen werden.
grundsätzlich sollte es mit jedem PDF-Reader gehen - ABER!
Es kommt darauf an, wie die Seiten aufgebaut sind, als Text oder als Grafik. Im ungünstigsten Fall müsste da mit Schrifterkennung drüber gegangen werden.
Bleibt gesund, Gruß
bjew (Bernhard) ------ manchmal etwas kurz angebunden
System: Win10 auf Laptop mit i7 --- Ahnenblatt 2.74 (als Backup), 2.99[p] u. V3.42
bjew (Bernhard) ------ manchmal etwas kurz angebunden
System: Win10 auf Laptop mit i7 --- Ahnenblatt 2.74 (als Backup), 2.99[p] u. V3.42
Fragen und Antworten rund um Ahnenblatt (Knowledge Base) (nicht ganz aktuell - trotzdem nützlich)
Bitte immer lesen ===> Handbücher zu Version 3.x
Tips und Tricks für kleine Probleme
Bitte immer lesen ===> Handbücher zu Version 3.x
Tips und Tricks für kleine Probleme
Es geht hier wohl nur um "Grafiken / Scans" innerhalb einer pdf-Datei. Ansonsten kann man sie ja direkt problemlos durchsuchen.
Dann braucht man wohl eine OCR-Software. Bei normaler Schrift sind diese recht leistungsfähig, bei alten Frakturschriften, Sütterlin oder ähnlichem, gibt es aber wohl nur wenige kostenpflichtige Programme die einem weiterhelfen? Soweit jedenfalls meine Erinnerung an eine ähnliche Diskussion.
Marcus
Dann braucht man wohl eine OCR-Software. Bei normaler Schrift sind diese recht leistungsfähig, bei alten Frakturschriften, Sütterlin oder ähnlichem, gibt es aber wohl nur wenige kostenpflichtige Programme die einem weiterhelfen? Soweit jedenfalls meine Erinnerung an eine ähnliche Diskussion.
Marcus
Vielleicht solltest dich einfach mit dem Buch begnügen und die Suchfunktion innerhalb Google-Books nutzen?
Sollte es sich um Frakturschriften handeln, wirst du keine "billige" leistungsfähige Software finden.
Sollte es sich um Frakturschriften handeln, wirst du keine "billige" leistungsfähige Software finden.
Bleibt gesund, Gruß
bjew (Bernhard) ------ manchmal etwas kurz angebunden
System: Win10 auf Laptop mit i7 --- Ahnenblatt 2.74 (als Backup), 2.99[p] u. V3.42
bjew (Bernhard) ------ manchmal etwas kurz angebunden
System: Win10 auf Laptop mit i7 --- Ahnenblatt 2.74 (als Backup), 2.99[p] u. V3.42
Fragen und Antworten rund um Ahnenblatt (Knowledge Base) (nicht ganz aktuell - trotzdem nützlich)
Bitte immer lesen ===> Handbücher zu Version 3.x
Tips und Tricks für kleine Probleme
Bitte immer lesen ===> Handbücher zu Version 3.x
Tips und Tricks für kleine Probleme
- Gerhardus 1
- Beiträge: 397
- Registriert: 10.01.2014, 07:25
- Wohnort: 22149 Hamburg
Liebe Mitstreiter,
vielen Dank für Eure Nachrichten. Leider sind es wirklich alles Bilder, die zu PDF gewandelt wurden.
Ich bin gespannt, ob ich ein Prg. finde, die diese Dateien auslesen kann. Auf jeden Fall melde ich mich nochmals dazu, wenn ich etwas gefunden habe.
Gruß
Gerhardus1
vielen Dank für Eure Nachrichten. Leider sind es wirklich alles Bilder, die zu PDF gewandelt wurden.
Ich bin gespannt, ob ich ein Prg. finde, die diese Dateien auslesen kann. Auf jeden Fall melde ich mich nochmals dazu, wenn ich etwas gefunden habe.
Gruß
Gerhardus1
Mit Forschergruß aus HH-Rahlstedt
Hallo Gerhard,
ich wusste doch, dass wir das "erst" diskutiert hatten. Und siehe da, die Frage damals stammte auch von Dir.
Ich fürchte viel Neues hat sich auf dem Gebiet nicht ergeben ...
http://www.ahnenblattportal.de/viewtopi ... 3104#43104
Marcus
ich wusste doch, dass wir das "erst" diskutiert hatten. Und siehe da, die Frage damals stammte auch von Dir.
Ich fürchte viel Neues hat sich auf dem Gebiet nicht ergeben ...
http://www.ahnenblattportal.de/viewtopi ... 3104#43104
Marcus
- Gerhardus 1
- Beiträge: 397
- Registriert: 10.01.2014, 07:25
- Wohnort: 22149 Hamburg
Hallo Gerhardus,
das Problem mit dem Auslesen lässt sich prinzipiell lösen.
Ich habe einen Test mit einem einfachen Digitalfoto (960 x 1280 Pixel bzw. 1,4 MP) durchgeführt. Das Bild enthält ca. 40 Textzeilen, also fast wie eine A4-Seite, allerdings ein relativ guter Druck. Dargestellt ist eine Tafel an einem Denkmal, aufgrund der Position leicht verzerrt aufgenommen (schräg von unten).
1. Bild geöffnet (in diesem Fall mit XnView, Irfanview geht ebenso)
2. als PDF gedruckt (PDFCreator)
3. PDF-Datei mit Adobe Acrobat Professional geöffnet
4. Dokument - OCR-Texterkennung - Text mit OCR erkennen
Jetzt liegt eine durchsuchbare PDF vor, die auch gespeichert werden kann.
Mit dem AcrobatReader X gehts aber nicht, weil offenbar keine OCR integriert ist. Da wird eine Konvertierung z.B. in Word vorgeschlagen, das scheint aber kostenpflichtig zu sein. Neuere (gekaufte) Software habe ich nicht!
Wenn Du aber Textseiten mit Handschrift oder Fraktur hast wirds kompliziert oder unmöglich.
Gruß
Manfred
das Problem mit dem Auslesen lässt sich prinzipiell lösen.
Ich habe einen Test mit einem einfachen Digitalfoto (960 x 1280 Pixel bzw. 1,4 MP) durchgeführt. Das Bild enthält ca. 40 Textzeilen, also fast wie eine A4-Seite, allerdings ein relativ guter Druck. Dargestellt ist eine Tafel an einem Denkmal, aufgrund der Position leicht verzerrt aufgenommen (schräg von unten).
1. Bild geöffnet (in diesem Fall mit XnView, Irfanview geht ebenso)
2. als PDF gedruckt (PDFCreator)
3. PDF-Datei mit Adobe Acrobat Professional geöffnet
4. Dokument - OCR-Texterkennung - Text mit OCR erkennen
Jetzt liegt eine durchsuchbare PDF vor, die auch gespeichert werden kann.
Mit dem AcrobatReader X gehts aber nicht, weil offenbar keine OCR integriert ist. Da wird eine Konvertierung z.B. in Word vorgeschlagen, das scheint aber kostenpflichtig zu sein. Neuere (gekaufte) Software habe ich nicht!
Wenn Du aber Textseiten mit Handschrift oder Fraktur hast wirds kompliziert oder unmöglich.
Gruß
Manfred
- Gerhardus 1
- Beiträge: 397
- Registriert: 10.01.2014, 07:25
- Wohnort: 22149 Hamburg
Hallo Manfred,
vielen Dank für Deinen Test einschl. Ergebnis. Das Problem - wie Du selbst schreibst - wird sein, dass früher viele Bücher in Sütterlin oder in Fraktur geschrieben wurden. Ich habe nun 8 verschiedene OCR-Prg. zusammen. Mal sehen vielleicht schaffe ich es zeitlich mich am Wochenende hinzusetzen und die Prg. zu testen. Danach werde ich von meinen Tests berichten.
Gruß
Gerhardus1
vielen Dank für Deinen Test einschl. Ergebnis. Das Problem - wie Du selbst schreibst - wird sein, dass früher viele Bücher in Sütterlin oder in Fraktur geschrieben wurden. Ich habe nun 8 verschiedene OCR-Prg. zusammen. Mal sehen vielleicht schaffe ich es zeitlich mich am Wochenende hinzusetzen und die Prg. zu testen. Danach werde ich von meinen Tests berichten.
Gruß
Gerhardus1
Mit Forschergruß aus HH-Rahlstedt