Hallo Kurt
kefranz hat geschrieben:[...] aber es bleiben zu viele Doppeldaten wie:
Bastian; Sebstian usw.
und damnn kommen Meldungen wie:
Johann hat schon andere Eltern Bastian...
Johann hat schon andere Eltern Sebastian... usw
Wenn die Ahnen Dateien von zwei verschiedenen Autoren kommt, sind 100 und mehr Fehler zu bearbeiten und dann weiß ich noch immer nicht wo und wieviel Doppeldaten in der Form "Bastian; Sebstian" in der neuen Datei sind.
Ich würde anhand dieser Fehlermeldungen die Ausgangsdateien so lange anpassen, bis keine Fehler mehr gefunden werden, so dass AB lediglich Doppelte zusammenlegen muss.
Anhand der ausgedruckten Liste "noch zu prüfen" (siehe unten) kommt man doch recht schnell zum Ziel.
Es müßte eine Möglichkeit geben die einzelnen Satensätze zu vergleichen.
Ein solches Programm stelle ich mir nicht so trivial vor, wie es zunächst aussieht. Was sollte man denn vergleichen, gewiss nicht den 1. Datensatz der Datei A mit dem 1. der Datei B, usw. Die nächste Möglichkeit wäre, die Dateien nach Namen(1)/Vornamen(2)/Geburtsdaten(3) zu sortieren und dann, ja was dann vergleichen? 1+2+3 (da würde der Bastian nicht identisch sein mit dem Sebastian), oder 1+2 (dto.)oder 1+3 (evtl., wenn in beiden Dateien das selbe Datum vorhanden)? Wenn man so vorginge, dann würden ebenfalls sehr viele Interaktionen zwischen Programm und Mensch stattfinden müssen. Letzlich entstünde mit einem solchen Programm dann wohl zumindest der gleiche Aufwand wie beim AB-Zusammenführen, das ich immer noch für den besseren Weg halte
Es gibt zwar Programme, die die Inhalte von 2 Dateien inhaltlich vergleichen, aber damit kommt man nicht wirklich weiter, weil die Personen ja nur Teil einer AB-Datei sind. Anhand der vielen Unterschiede (berechtigte und unberechtigte), die angezeigt werden, sucht man sich den Wolf.
Eine andere Möglichkeit wäre, beide Dateien im CSV-Format auszugeben und beide Dateien (mit Kennzeichnung 1 + 2) in einer CSV-Datei zusammenzuführen. Dann diese Gesamtdatei sortieren nach "Name/Vorname/Geburtsdatum/Kennzeichnung" und manuell bearbeiten und dabei entweder gegenseitig anpassen (und dann in AB Zusammenführung) oder Doubletten entfernen (und dann Ergebnis in AB einlesen). Aber wie gesagt, ich würde die AB-Zusammenführung bevorzugen, weil damit die 100%-Doubletten schon zusammengeführt werden und nur noch die Problemfälle bearbeitet werden müssten.
Viel Erfolg