Seite 2 von 3

Verfasst: 04.08.2021, 20:13
von Rock Way
Guten Abend beisammen,

da fange ich mit dem Einscannen alter Unterlagen an und frage mich, wie und nach welchem Muster ich die Dateien benenne und abspeichere. Voilá: Ahnenblattportal hat verschiedene und dabei hilfreiche Antworten parat. Großartig !!! Danke für die Vorarbeit, von der ich unmittelbar profitieren darf. Danke :).

Was ich jetzt hier im Forum noch nicht auf Anhieb finden konnte ist eine Diskussion um eine Best-Practice-Lösung zu besonders gut geeigneten Dateiformaten, insbesondere zu

- jpg vs png vs gif vs andere
- Best geeignete Scan-Auflösung
- pdf vs. pdf-a vs. Office-Formate zur Archivierung
u.s.w.

Ich meine dabei nicht die grundsätzlichen Fragen zu Pixel- vs. Vektor-Grafik u.s.w., sondern eher klassisch Best Practice zu unserem Zweck betr. AB.

Habe ich da doch etwas überlesen ?

Schöne Grüße aus dem Rheinland
sendet Michael

Verfasst: 04.08.2021, 22:33
von Geri
Hallo Michael, da gibt's keine »Patentlösung« – hier mal einige (sicher bei weitem nicht komplette Gedanken:

1) Bilder vs. pdf: hier würde ich zu Bildformaten tendieren, da pdf's NACHTRÄGLICH nur schwer bearbeitbar sind und meist UNGEFRAGT bei Scan/Speichern die Auflösung REDUZIEREN;

2) Bildformat: hier kommt's drauf an, was Du weiter damit vorhast UND wieviel Platz DU dafür hast (tiff's können z.B.: seheeehr groß werden, bei jpg's wird mit jeder neuen Speicherung die Qualität schlechter, gif's würde ich gar nicht empfehlen – die sind eigentlich nur für bewegte Bilder);
  • jp(e)g: klein, aber verlustbehaftet – ideal, wenn Du aus Familysearch oder matricula (mit den anderen Archiven habe ich keine Erfahrung) ein Bild downloadest und NICHT nachbearbeitest, dort liegen sie nämlich schon als jpg vor;
  • png: wenn Du Bilder nachbearbeitest (beschneiden, aufhellen, richtigen Eintrag markieren, …) die beste Wahl – komprimiert (praktisch) verlustfrei (auch nach mehreren Speichervorgängen), das Ergebnis ist aber größer als jpg;
  • tif(f): absolut verlustfrei bei Nachbearbeitung, aber eben sehr speicherhungrig;
  • Nachtrag: bmp würde ich auch nicht verwenden (»kann« am wenigsten), andere (exotische und tw. programmspezifische) Formate lasse ich auch außen vor;
3) Auflösung bei Scans: im Normalfall 300 x 300 dpi – ein Kompromiss Qualität vs. Dateigröße (nur beim Scan KLEINER, WICHTIGER, GUT ERHALTENER Bilder würde ich bis auf max. 600 x 600 dpi gehen);

4) wenn pdf, dann möglichst pdf-a, da diese dann in der Office-Version (Mirkosaft, OpenOffice, LibreOffice, …) mit der sie erstellt wurden leichter nachbearbeitbar sind – hier würde ich aber gleich das Office meines Vertrauens belassen, AB kennt die ja auch als Quellen-Medium.

Andere werden vielleicht zusätzliche/genauere (oder andere?) Gedanken haben…

Verfasst: 05.08.2021, 10:12
von Rock Way
Hallo Gerald,

danke vielmals für deine Gedanken. Meine Vermutungen gehen ganz in Richtung deiner Argumente, die insofern eine prima Bestätigung für mich sind. Vielen Dank.

Schöne Grüße
Michael

Verfasst: 05.08.2021, 17:01
von Fridolin
Abgesehen vom Zweck, zu dem du die Dokumente in die Familiendatei zuordnest, würde ich all diese Fragen davon abhängig machen, wie lange die Medien zur Verfügung stehen sollen und welche Bearbeitungsprogramme du hast.

PNG ist ein reines RGB-Format - für den Druck nicht gedacht. Willst du Bilder in hoher Qualität haben, rate ich dazu, zweierlei Größen abzulegen - Ahnenblatt hat bei der Erstellung von Tafeln und Listen dann doch Mühe mit großen Speicheranfragen, wie man gelegentlich hört (während des Editierens der Familiendatei spielt es noch keine Rolle).

Ich erstelle gern PDFs für wichtige Dokumente, weil ich ihnen den Text beigeben kann und sie so durchsuchbar mache. Bildformate bieten das nicht. Aber das geht sicherlich nicht mit jedem Programm - ich habe PhotoLine als spezielle Bildbearbeitung in Gebrauch, mit der ich auch Vektor- und Textebenen (drüber oder drunter) einziehen kann. Unumschränkt empfehlen kann ich das Programm aber nicht: Es schwächelt etwas bei den Erklärungen und Hilfestellungen für Ungeübte - ansonsten genial.

Wieso PDF-A von einer Textverarbeitung besser editiert werden könnte, ist mir nicht klar - worum geht es da? M.E. kann PDF überhaupt nicht gut editiert werden, mit Ausnahme von Word, das anscheinend solche Fähigkeiten antrainiert bekam.

Verfasst: 05.08.2021, 17:57
von Geri
Hallo Fridolin, ein PDF-A hat IN der Datei EINGEPACKT die mit einem anderen Programm (z.B.: Word) erstellten und von dort in PDF exportierten Original-Daten, d.h. es ist meist mit dem Erstellerprogramm nachträglich leicht editierbar, dafür aber fast doppelt so groß wie ein PDF ohne »-A«.

EDIT: Obige Erklärung von mir ist ein Blödsinn (ich konnte die PDF-A immer leicht bearbeiten, sie waren größer als normale PDFs, daher schloss ich daraus obigen Blödsinn). Es ließ mir keine Ruhe, daher hier der Link:
[link=]https://de.wikipedia.org/wiki/PDF/A[/link]
zum Nachlesen. Wichtigste Unterschiede: Die verwendeten Schriften werden in das Dokument eingebettet (daher die zunehmende Größe) und die PDF-A sind für Langzeitarchivierung vorgesehen.

Verfasst: 05.08.2021, 20:48
von Rock Way
Hallo Frido,
ja, es ist natürlich alles eine Frage der Ziele und damit auch der Frage einer evtl. langen Verfügbarkeit (eigentlich selbstverständlich ;). Deinen Rat, Bilder in zwei Größen abzulegen, hatte ich bereits begonnen, weil ich wohl zweigleisig fahren werden. AB ist die eine Schiene, ein namentliches Datenarchiv mit vielen weiteren Dokumenten und Scans dann die zweite eigenständige Quelle. Dazu dann noch die Papierkisten mit den Originalen (wer die wohl später einmal entsorgt ?)

Hallo Gerald,
danke für die Klarstellung. Ja, pdf-a ist für die langfristige Speicherung. Du kommt mit deiner Antwort meiner Recherche zuvor (wie, pdf-a kann man auch ändern? ;). Danke.

Bei der Gelegenheit Einscannen von Urkunden und Dokumenten sowie Bildern habe ich nun zwei Entdeckungen gemacht (man lernt ja nie aus)

- Mein Scanner ist recht ungenau an den Rändern (wenn ich exakt anlege, dann fehlt der Rand ca. 2 bis 3 mm links und oben).

- Zudem kann der Scanner wohl gar nicht die längeren Formate (bei A4 ist Ende, auch wenn die Software "Legal" erlaubt d.h. 14" statt 11,7" bei A4-Format). Allerdings gewinnt Legal anstelle von A4 etwas an Breite (215,9 mm statt 210,0 mm bei A4).

Und dann sind da noch einige Bilder die schön sauber hinter einem Passeparout aufgezogen sind. Die Bilder liegen daher nicht auf dem Scan-Glas auf. Da werde ich dann mit Abfotografieren arbeiten müssen (dann wohl in RAW, denn jpg ist wirklich zu verlustbehaftet). Was mich wirklich fasziniert ist die irre Qualität dieser ca. 120 Jahre alten Fotos.

Einen schönen Abend wünscht aus dem Rheinland
Michael

Verfasst: 05.08.2021, 20:57
von Fridolin
Hallo Gerald,

das gibt es durchaus: eine PDF-Datei mit eingebettetem Word- o.ä. Dokument. Das hat m.E. aber nichts mit PDF-A zu tun. Ich kenne diese Option jedenfalls von OpenOffice/LibreOffice; von Word kann ich mir das auch gut vorstellen. Jede PDF-Datei kann seit einigen Jahren Dokumente im Anhang haben - und so eben auch die Original-Vorlage, was gewisse Vorteile hat.

Verfasst: 05.08.2021, 22:30
von Geri
Ja genau, ich hatte in LibreOffice immer als Hybrid-PDF (mit eingebetteter ODF-Datei) und PDF-A gespeichert – daher meine obige Eselei! :wallb:

Verfasst: 06.08.2021, 07:26
von Fridolin
Nochmal zur Durchsuchbarkeit von PDFs:

Einige Scanner bieten einen OCR-Durchgang an, mit dem die Inhalte eines Dokuments durchsuchbar als Text hinterlegt werden.

Mein Scanner hat das lange Zeit nicht angeboten - also bin ich dazu übergegangen, dasselbe manuell zu machen: Unsichtbar hinter dem gescannten Bild lege ich eine Textebene an, in der ich den Inhalt eintippe. Das funktioniert im Endeffekt genauso. Möglicherweise kann man das mit OpenOffice/LibreOffice Draw auch machen: Müsste man die Textebene zunächst über dem Bild anlegen, damit man sieht, was man da macht - anschließend die Ebene hinter das gescannte Bild legen.

Verfasst: 06.08.2021, 16:36
von UngerMa
Hallo,

zu den unterschiedlichen PDF-Versionen kann ich nichts sagen.
Allerdings: Word und Excel (auch Ahnenblatt) erzeugen beim Druck durchsuchbare PDF. Das ist vielleicht vom Drucker abhängig, mit PDFCreator klappt es jedenfalls.

In Adobe Acrobat 8.0 Professional ist eine recht gut funktionierende OCR integriert, die auch bei gescannten oder fotografierten PDF (Bilder vorher umwandeln!) prima Ergebnisse liefert. Natürlich ist immer Voraussetzung, dass die Vorlagen entsprechende Qualität haben (Auflösung, Kontrast, verwendbare Schriftart). Es sind etliche Sprachen möglich.
Mir ist die Software vor längerer Zeit mal "zugeflogen", war irgendwann mal eine kostenlose Testversion. Ich weiß nicht, ob der "normale" Reader so etwas kann.

Normale Textdokumente scanne ich i.d.R. mit Auflösungen von 240 bis 360 dpi. Das hängt aber von der Schriftgröße ab. Bei Fotos nehme ich Auflösungen zwischen 360 und 1200 dpi, wobei die höheren Werte zum Beispiel bei Gruppenbildern recht günstig sind.

Seiten aus Kirchenbüchern (Doppelseite etwa A2) fotografiert mit 12 MPixel sind schon etwas zu groß, da ist eine Verkleinerung auf 50 Prozent immer noch gut genug. OCR hat da sowieso keine Chance.

Gruß
Manfred

Verfasst: 19.08.2021, 20:40
von Rock Way
Hallo allseits,

Fragen über Fragen.
Da habe ich nun ein Familienstammbuch mit einer Urkunde, die folgende Angaben enthält:

1. Heiratsurkunde Georg und Emilie (1913)
2. Sterbebescheinigung Emilie (1956)
3. Sterbebescheinigung Georg (1965)

Ein Scan und dann die Frage,
a) wie benenne ich nun die Datei
b) speichere ich diese nun mehrfach ab bei jedem Ereignis (immerhin 13 MB groß) ?

Ich glaube, da denke ich an einem verregneten Wochenende nochmals näher drüber nach ;) Oder gibt es einen bewährten Tipp aus der Praxis ?

Schöne Grüße sendet
Michael

Verfasst: 19.08.2021, 21:21
von Fridolin
Hallo Michael,

wieviele Seiten hat denn dieses Stammbuch? Mir kommen 13 MB ein bisschen viel vor. Natürlich nicht im Vergleich zu ganzen Fernsehfilmen, die man heutzutage aus dem einen oder anderen Grund ja auch schon zuhause abspeichert... Mit ein paar Tricks würde man aber sicherlich auch auf 5 MB kommen. Es würde allerdings ein bisschen Erfahrung im Umgang mit Bildbearbeitungs-Software voraussetzen: Reduzierung der Farbenzahl (z.B. auf 1000 oder 256 Farben) sowie der Auflösung (evtl. genügen 200 dpi).

Bei mir heißt so eine Datei "NachnameMann-NachnameFrau 1913 Familienbuch". Begründung:
1. Ich benutze die Datei für alle Daten, die darin vorkommen, also sowohl für Georg wie Emilie, auch für deren Kinder (falls vorhanden); Personen lassen sich in der Genealogie halbwegs sicher mit Nachname, Vorname, Geburtsjahr zuordnen, noch sicherer erscheint mir die Zuordnung bei Paaren mit beiden Nachnamen sowie Hochzeitsjahr;
2. Oft heißen solche Büchlein "Stammbuch", weil sie ja die Abstammung belegen sollen. Aber genealogisch handelt es sich gerade nicht um Stammlinien, die da dokumentiert werden, sondern um die Ahnen/Vorfahren bzw. die Herkunft - darum "Familienbuch".

Ich kenne es aus der Verwaltung, dass man Dokumente niemals in mehreren Exemplaren an verschiedenen Stellen (also im Computer unter verschiedenen Namen) abspeichern soll: Wird irgendwo eine Notiz oder Korrektur angebracht, würde das i.d.R. beim Zweitexemplar übersehen. Also einmal speichern, mehrfach referenzieren.

Wenn du möchtest, kannst du die Urkunde dazu im Quellenverzeichnis von AB 3.x anlegen und mehrfach referenzieren - nichts leichter als das.

Übrigens benenne ich Dokumente, die zu einer Einzelperson gehören, mit Unterstrich zwischen Familien- und Vornamen, so dass keine Verwechslung mit dem Dokument eines Paars entstehen kann (Bindestrich zwischen beiden Familiennamen).

Verfasst: 19.08.2021, 22:13
von Rock Way
Hallo Fridolin,

zu nächst ein dickes Dankeschön an dieser Stelle für deine stets kompetente, nette und sehr empathisch/persönliche Art, geduldig auf die Fragen im Forum zu antworten. Das ist schon wirklich eine Erwähnung wert. Vieeelen Dank an dich !

Ich fasse mir an die eigene Nase, da ich meine Frage doch schon wieder ein klein wenig unpräzise ins Forum gestellt habe. Ich gelobe Besserung.

Bei dem Scan handelt es sich um EINE Doppelseite aus dem Stammbuch mit den Inhalten 1 x Heiratsurkunde sowie 2 x Sterbevermerke der beiden Eheleute.

Der Scan ist in der Größe Letter erstellt, 300 dpi bei Vollfarbe (schöne Stempel und Gebührenmarken) und bringt es auf 13 MB.

Bei deinem Namenskonzept für Dateien wird es für mich schnell schwierig, weil wir aus zwei entfernten Zweigen den Namen Müller haben und auch von gleichen Vornamen über Generationen gebeutelt werden. Also habe ich angefangen, die Dateien wie folgt zu benennen: 1913-05-01_sowieso_Urk_Mueller_Georg.

Dieser Dateiname passt natürlich üüüüberhaupt nicht zu Georgs Sterbevermerk aus 1964. Diesen würde ich auch niemals dort suchen und würde daher auch wohl nicht in dein Namenskonzept passen.

Den Hinweis auf das Quellenverzeichnis werde ich mir näher ansehen. Das liest sich schonmal gut. Am Ende bleibt da aber auch die Frage, wie und wo ich die "Rohdatei" im Dateisystem wiederfinden kann. Dazu denke ich schon über Unterverzeichnisse der einzelnen Personen nach als Dateisammlung. Da mir aber auch redundante Dateien eigentlich ein Greuel sind - hänge ich nun an dieser Stelle etwas fest.

Ich glaube ich muss anders denken, denn sicher ist das die einzige Urkunde überhaupt die solch drei Einträge auf sich vereint. In der Zeit wo ich hier den Verkehr aufhalte, hätte diese auch schnell 3 x unter den drei Ereignissen abspeichern können. 13 MB hin oder her ;)

Das mit dem Binde-/_Unterstrich lebe ich auch nach meinem System. Wer mir dann mal über die Schulter schaut, der schüttelt meist bei solchen Macken mit dem Kopf ;).

In diesem Sinne viele Grüße aus dem Rheinland
und auf bald
Michael

Verfasst: 19.08.2021, 23:04
von Fridolin
"Macken" klingt schonmal nicht schlecht im Bereich Genealogie - solange die Macke nicht darin besteht, jeden Tag mit einem neuen System anzufangen. Beständigkeit ist da eine Tugend.

Dass das Dokument das einzige bleiben soll, das mehrere Personen betrifft, würde mich nach meiner Erfahrung wundern. Das würde heißen: Alle Familienzweige haben ihre Ahnennachweise aus dem "Dritten Reich" weggeworfen und alle Familienbücher entsorgt. Unwahrscheinlich. Eher hast du sie einfach noch nicht.

Dokumente zu Personen werden bei mir so zugeordnet: Familienname_Vorname_Geburtsjahr [evtl. Unterscheidungsnummer bei mehreren gleichen Personen]. Und dann die Art der Urkunde. Die Sterbeurkunde wäre dann sehr wohl unter "Müller_Georg_1913" zu finden, auch wenn die Fortsetzung dann "Sterbeurkunde1964" heißen darf.

Ich habe meine Dokumente in einem Ordner "Belege" versammelt - getrennt von den Orts- und Personenfotos sowie Landkarten. Aber das hat den Nachteil, dass Ahnenblatt dann beim Umziehen auf einen neuen Rechner bzw. einen neuen Speicherort nicht helfen würde. Zum Glück ist das bei mir nicht absehbar: Alles liegt auf einem Netzlaufwerk, und ich erwarte, dass die Pfade für die nächsten 15 Jahre noch identisch bleiben (falls es Windows für den Privatbereich noch so lange gibt). Alles immer Laufwerk O:\. Das konkurriert mit nichts anderem.