Plugin: Ausgabe im GEDCOM-Format mit ANSI-Zeichensatz
Plugin: Ausgabe im GEDCOM-Format mit ANSI-Zeichensatz
Dieses klitzekleine Plugin ist noch nicht einmal auf meinem Mist gewachsen. Ich habe es auf einen Tip von Hugo erstellt und verwende es schon seit einiger Zeit zur Aufbereitung meiner Daten für DftCom2.
Was es macht, zeigt die hier drunter gefügte Beschreibung:
Ausgabe der Ahnenblatt-Datei im GEDCOM-Format mit ANSI-Zeichensatz
------------------------------------------------------------------------------------
Wenn man in Ahnenblatt auch nur ein einziges UNICODE-Zeichen verwendet,
erfolgt die Ausgabe einer GEDCOM-Datei im UNICODE-Zeichensatz.
Will man nun eine GEDCOM-Datei in einem anderen Programm weiter
verarbeiten, das noch nicht UNICODE-fähig ist, dann muss man seine
Datei in den ANSI-Zeichensatz umwandeln.
Mit diesem Plugin kann man eine Ahnenblattdatei im GEDCOM-Format mit
ANSI-Zeichensatz ausgeben. Die Ausgabe erfolgt im TEMP-Verzeichnis des
Users mit dem Namen "Ausgabe_ged_ansi.ged
Aber Achtung:
Dabei gehen die besonderen nur in UNICODE darstellbaren Zeichen
verloren oder werden durch andere Zeichen ersetzt.
Torquatus (nach einem Tipp von Hugo)
17.10.2009
Was es macht, zeigt die hier drunter gefügte Beschreibung:
Ausgabe der Ahnenblatt-Datei im GEDCOM-Format mit ANSI-Zeichensatz
------------------------------------------------------------------------------------
Wenn man in Ahnenblatt auch nur ein einziges UNICODE-Zeichen verwendet,
erfolgt die Ausgabe einer GEDCOM-Datei im UNICODE-Zeichensatz.
Will man nun eine GEDCOM-Datei in einem anderen Programm weiter
verarbeiten, das noch nicht UNICODE-fähig ist, dann muss man seine
Datei in den ANSI-Zeichensatz umwandeln.
Mit diesem Plugin kann man eine Ahnenblattdatei im GEDCOM-Format mit
ANSI-Zeichensatz ausgeben. Die Ausgabe erfolgt im TEMP-Verzeichnis des
Users mit dem Namen "Ausgabe_ged_ansi.ged
Aber Achtung:
Dabei gehen die besonderen nur in UNICODE darstellbaren Zeichen
verloren oder werden durch andere Zeichen ersetzt.
Torquatus (nach einem Tipp von Hugo)
17.10.2009
Du hast keine ausreichende Berechtigung, um die Dateianhänge dieses Beitrags anzusehen.
Gruß, Torquatus
C.c. - Übrigens stelle ich den Antrag, dass Ahnenblatt das beste aller Ahnenprogramme werden muss - frei nach Cato
C.c. - Übrigens stelle ich den Antrag, dass Ahnenblatt das beste aller Ahnenprogramme werden muss - frei nach Cato
Hallo Torquatus,
der Beschrieb hört sich super an und ich verwende auch sehr gern das dftcom2. Bevor ich es aber ausprobiere, kannst du bitte mal ein Beispiel geben, wie die Ausgabe bei dftcom2 mit und ohne Plugin aussieht? (Ich hab mich mit Unicode und ASCII noch nicht befasst. ASCII ist mir aus DOS-Zeiten noch ein Begriff.
Danke schon mal,
Chlodwig
der Beschrieb hört sich super an und ich verwende auch sehr gern das dftcom2. Bevor ich es aber ausprobiere, kannst du bitte mal ein Beispiel geben, wie die Ausgabe bei dftcom2 mit und ohne Plugin aussieht? (Ich hab mich mit Unicode und ASCII noch nicht befasst. ASCII ist mir aus DOS-Zeiten noch ein Begriff.
Danke schon mal,
Chlodwig
Gruß, Chlodwig
Hallo Chlodwig,
so lange Du mit der GEDCOM-Ausgabe aus Ahnenblatt im DftCom2 keine Problem hast, brauchst Du das Plugin nicht.
Erst dann, wenn ein erstes Unicode-Zeichen in Ahnenblatt erfasst wurde, erfolgt die Ausgabe mit dem UNICODE-Zeichensatz und damit läuft DftCom2 leider nicht mehr.
Bei mir ist das der Fall, obwohl ich mich nicht mehr genau erinnern kann, weshalb und zu welcher Person ich UNICODE-Zeichen erfasst habe. Es kann sein, dass ich einen kyrillisch geschriebenen Namen halt einfach mit kyrillischen Schriftzeichen erfasst habe, weil ich die lateinische Entsprechung nicht ermitteln konnte. Möglich! Ich frage mich jetzt, wie kann man denn das herausfinden? Weiß das hier jemand?
Den verwendeten Zeichnsatz sieht man im Kopf der GEDCOM-Datei. Ist die Datei im UNICODE-Zeichensatz steht dort 1 CHAR UTF-8 und ist sie im ANSI-Zeichensatz, steht dort 1 CHAR ANSI. Siehe unten.
Versucht man nun mit DftCom2 eine GEDCOM-Datei im UTF-8-Zeichnsatz zu verarbeiten, erhält man eine Fehlermeldung; siehe unten.
Wandelt man aber die Datei mittels Plugin in den ANSI-Zeichensatz um, dann können UNICODE-Zeichen verschwinden oder in falsche Zeichen umgewandelt werden. Ich habe mal mit Dirks-Unicode-Beispiel-Datei getestet. Siehe unten. Das ist zwar nicht erfreulich, aber bei meinen 26.000 Hanseln nehme ich einige in DftCom2 falsch angezeigte in Kauf.
Wer viele UNICODE-Zeichen in seiner Datei hat, kann daher DftCom nicht verwenden. Ich schon
Übrigens:
Ich habe mir eine Anleitung für DftCom2 gestrickt, die Dir evtl. auch nützen könnte. Die Grund-Idee dazu stammt wiederum von Hugo. Zumindest bekomme ich damit die Religion, die Taufpaten und die Quellen in meine DftCom2-Datei. Ich hänge die Anleitung mal hier dran.
so lange Du mit der GEDCOM-Ausgabe aus Ahnenblatt im DftCom2 keine Problem hast, brauchst Du das Plugin nicht.
Erst dann, wenn ein erstes Unicode-Zeichen in Ahnenblatt erfasst wurde, erfolgt die Ausgabe mit dem UNICODE-Zeichensatz und damit läuft DftCom2 leider nicht mehr.
Bei mir ist das der Fall, obwohl ich mich nicht mehr genau erinnern kann, weshalb und zu welcher Person ich UNICODE-Zeichen erfasst habe. Es kann sein, dass ich einen kyrillisch geschriebenen Namen halt einfach mit kyrillischen Schriftzeichen erfasst habe, weil ich die lateinische Entsprechung nicht ermitteln konnte. Möglich! Ich frage mich jetzt, wie kann man denn das herausfinden? Weiß das hier jemand?
Den verwendeten Zeichnsatz sieht man im Kopf der GEDCOM-Datei. Ist die Datei im UNICODE-Zeichensatz steht dort 1 CHAR UTF-8 und ist sie im ANSI-Zeichensatz, steht dort 1 CHAR ANSI. Siehe unten.
Versucht man nun mit DftCom2 eine GEDCOM-Datei im UTF-8-Zeichnsatz zu verarbeiten, erhält man eine Fehlermeldung; siehe unten.
Wandelt man aber die Datei mittels Plugin in den ANSI-Zeichensatz um, dann können UNICODE-Zeichen verschwinden oder in falsche Zeichen umgewandelt werden. Ich habe mal mit Dirks-Unicode-Beispiel-Datei getestet. Siehe unten. Das ist zwar nicht erfreulich, aber bei meinen 26.000 Hanseln nehme ich einige in DftCom2 falsch angezeigte in Kauf.
Wer viele UNICODE-Zeichen in seiner Datei hat, kann daher DftCom nicht verwenden. Ich schon
Übrigens:
Ich habe mir eine Anleitung für DftCom2 gestrickt, die Dir evtl. auch nützen könnte. Die Grund-Idee dazu stammt wiederum von Hugo. Zumindest bekomme ich damit die Religion, die Taufpaten und die Quellen in meine DftCom2-Datei. Ich hänge die Anleitung mal hier dran.
Du hast keine ausreichende Berechtigung, um die Dateianhänge dieses Beitrags anzusehen.
Gruß, Torquatus
C.c. - Übrigens stelle ich den Antrag, dass Ahnenblatt das beste aller Ahnenprogramme werden muss - frei nach Cato
C.c. - Übrigens stelle ich den Antrag, dass Ahnenblatt das beste aller Ahnenprogramme werden muss - frei nach Cato
Hallo Chlodwig,
ich habe mal wieder vergessen, dass die Portal-Software nur max. 5 Anhänge zulässt. Hier kommt jetzt auch noch die Anleitung
Spätere Ergänzung: Und weil hier mit nur 1 Anhang noch Platz ist, füge ich zwei Beispiele mit DftCom2-Anzeigen (nach Anwendung Plugin) dran.
ich habe mal wieder vergessen, dass die Portal-Software nur max. 5 Anhänge zulässt. Hier kommt jetzt auch noch die Anleitung
Spätere Ergänzung: Und weil hier mit nur 1 Anhang noch Platz ist, füge ich zwei Beispiele mit DftCom2-Anzeigen (nach Anwendung Plugin) dran.
Du hast keine ausreichende Berechtigung, um die Dateianhänge dieses Beitrags anzusehen.
Gruß, Torquatus
C.c. - Übrigens stelle ich den Antrag, dass Ahnenblatt das beste aller Ahnenprogramme werden muss - frei nach Cato
C.c. - Übrigens stelle ich den Antrag, dass Ahnenblatt das beste aller Ahnenprogramme werden muss - frei nach Cato
Re: Plugin: Ausgabe im GEDCOM-Format mit ANSI-Zeichensatz
Guten Tag Torquatus
Hab dieses Tool nur wieder ausgebuddelt und Jürgen hats umgeschrieben
Gruß Hugo
Torquatus hat geschrieben:Aber Achtung:
Dabei gehen die besonderen nur in UNICODE darstellbaren Zeichen
verloren oder werden durch andere Zeichen ersetzt.
Das laß mal bitte wegTorquatus hat geschrieben:(nach einem Tipp von Hugo)
Hab dieses Tool nur wieder ausgebuddelt und Jürgen hats umgeschrieben
Gruß Hugo
Das Gestern ist Geschichte
Das Morgen ist ein Rätsel
Das Heute ist ein Geschenk
Hallo Chlodwig,
Ein "Семёновна" in der Datei und schon hat man das Probleme.
Und mir hat immer noch keiner gesagt, wie ich herausfinde, wo meine UNICODE-Zeichen stecken. Hat da jemand einen Tipp?
fühle Dich nicht erschlagen von der Fülle, aber ich dachte es könnte ja auch noch weitere User geben, die mit UNICODE und DftCom2 Probleme haben oder bekommen.Chlodwig hat geschrieben:das war ausführlich - danke!
Ein "Семёновна" in der Datei und schon hat man das Probleme.
So isses
Es ist wohl so, dass es entweder funzt oder eben nicht.
Da bin ich aber froh, dass dft2com bei mir einfach funktioniert. Offensichtlich habe ich keinen Unicode drinnen.
Und mir hat immer noch keiner gesagt, wie ich herausfinde, wo meine UNICODE-Zeichen stecken. Hat da jemand einen Tipp?
Gruß, Torquatus
C.c. - Übrigens stelle ich den Antrag, dass Ahnenblatt das beste aller Ahnenprogramme werden muss - frei nach Cato
C.c. - Übrigens stelle ich den Antrag, dass Ahnenblatt das beste aller Ahnenprogramme werden muss - frei nach Cato
Hallo Torquatus,
Wenn Du es hinbekommst, dass Du alle Zeichen Deiner Datei in EXCEL (nach dem speichern als csv-Datei) einzeln ansprechen kannst, dann könntest Du mit dem Befehl "=CODE()" den Wert eines jeden Zeichens ausgeben lassen bzw. abfragen, ob dieserWert >255 ist.
Werte >255 müssten aus UNICODE-Zeichen resultieren.
Allerdings ist mir noch kein Weg eingefallen, wie man die Zeichen der csv-Datei einzeln abfragen kann - evtl. mit Hilfe eines Macros.
Vielleicht hat ja Othmar eine Idee - er kennt sich ja auch sehr gut mit EXCEL aus.
Du bist doch ein EXCEL-Spezi.Torquatus hat geschrieben:Und mir hat immer noch keiner gesagt, wie ich herausfinde, wo meine UNICODE-Zeichen stecken. Hat da jemand einen Tipp?
Wenn Du es hinbekommst, dass Du alle Zeichen Deiner Datei in EXCEL (nach dem speichern als csv-Datei) einzeln ansprechen kannst, dann könntest Du mit dem Befehl "=CODE()" den Wert eines jeden Zeichens ausgeben lassen bzw. abfragen, ob dieserWert >255 ist.
Werte >255 müssten aus UNICODE-Zeichen resultieren.
Allerdings ist mir noch kein Weg eingefallen, wie man die Zeichen der csv-Datei einzeln abfragen kann - evtl. mit Hilfe eines Macros.
Vielleicht hat ja Othmar eine Idee - er kennt sich ja auch sehr gut mit EXCEL aus.
Gruß
Jürgen
Jürgen
Hallo Jürgen,
danke für Deine Tipps. Mittels =CODE(TEIL(C2;n;1)) konnte ich zumindest feststellen, dass ich keinen Geburtsnamen im Unicode-Breich > 255 habe. Offenbar stecken die Zeichen > 255 in den Anmerkungen.
Man müsste eigentlich in der CSV-Datei ja nur jedes 2. Byte prüfen auf hexa >00. Siehe unten. Aber für heute Nacht bin ich zu müde dazu, zumal ich schon länger nicht mehr programmiert habe
danke für Deine Tipps. Mittels =CODE(TEIL(C2;n;1)) konnte ich zumindest feststellen, dass ich keinen Geburtsnamen im Unicode-Breich > 255 habe. Offenbar stecken die Zeichen > 255 in den Anmerkungen.
Man müsste eigentlich in der CSV-Datei ja nur jedes 2. Byte prüfen auf hexa >00. Siehe unten. Aber für heute Nacht bin ich zu müde dazu, zumal ich schon länger nicht mehr programmiert habe
Du hast keine ausreichende Berechtigung, um die Dateianhänge dieses Beitrags anzusehen.
Gruß, Torquatus
C.c. - Übrigens stelle ich den Antrag, dass Ahnenblatt das beste aller Ahnenprogramme werden muss - frei nach Cato
C.c. - Übrigens stelle ich den Antrag, dass Ahnenblatt das beste aller Ahnenprogramme werden muss - frei nach Cato
Hallo zusammen,
die Diskussion hat mich dazu angeregt ein Plugin zu schreiben.
Bezeichnung: UNICODE finden Vers. 1.00 (JT)
Dieses Plugin listet die Datensätze der aus Ahnenblatt erstellten csv-Datei auf, die UNICODE-Zeichen enthalten.
Es wird jedes enthaltene UNICODE-Zeichen benannt und auch die Stelle innerhalb des Datensatzes.
So kann man in Ahnenblatt gezielt die UNICODE-Zeichen ersetzen.
Das ganze macht natürlich nur dann Sinn, wenn nicht viele UNICODE-Zeichen enthalten sind und diese evtl. versehentlich durch "Kopieren und Einfügen" in die Datei gekommen sind.
Das Plugin ist im Downloadbereich zu finden.
klick mich "Plugin: UNICODE finden (JT)"
Der Hilfetext zum Plugin stammt im Wesentlichen von Torquatus - vielen Dank dafür.
die Diskussion hat mich dazu angeregt ein Plugin zu schreiben.
Bezeichnung: UNICODE finden Vers. 1.00 (JT)
Dieses Plugin listet die Datensätze der aus Ahnenblatt erstellten csv-Datei auf, die UNICODE-Zeichen enthalten.
Es wird jedes enthaltene UNICODE-Zeichen benannt und auch die Stelle innerhalb des Datensatzes.
So kann man in Ahnenblatt gezielt die UNICODE-Zeichen ersetzen.
Das ganze macht natürlich nur dann Sinn, wenn nicht viele UNICODE-Zeichen enthalten sind und diese evtl. versehentlich durch "Kopieren und Einfügen" in die Datei gekommen sind.
Das Plugin ist im Downloadbereich zu finden.
klick mich "Plugin: UNICODE finden (JT)"
Der Hilfetext zum Plugin stammt im Wesentlichen von Torquatus - vielen Dank dafür.
Gruß
Jürgen
Jürgen
Hallo Jürgen,
Auch mit der endgültigen Version ist meine aktuelle Datei Unicode-frei. Um zu testen, wie Deine finale Version des Plugin arbeitet, musste ich eine meiner 999 Sicherungen bemühen; siehe unten. Sauber
Nochmals vielen Dank.
Ich wollte mich nicht aufdrängen Es freute mich einfach, dass Du dieses Plugin geschrieben hast und mein Dankeschön dazu war der Hilfe-Text. Schließlich war ich gerade im Thema fit. Den Hinweis auf mich nimm bitte gelegentlich raus.Der Hilfetext zum Plugin stammt im Wesentlichen von Torquatus - vielen Dank dafür.
Auch mit der endgültigen Version ist meine aktuelle Datei Unicode-frei. Um zu testen, wie Deine finale Version des Plugin arbeitet, musste ich eine meiner 999 Sicherungen bemühen; siehe unten. Sauber
Nochmals vielen Dank.
Du hast keine ausreichende Berechtigung, um die Dateianhänge dieses Beitrags anzusehen.
Gruß, Torquatus
C.c. - Übrigens stelle ich den Antrag, dass Ahnenblatt das beste aller Ahnenprogramme werden muss - frei nach Cato
C.c. - Übrigens stelle ich den Antrag, dass Ahnenblatt das beste aller Ahnenprogramme werden muss - frei nach Cato
Hmm, scheinbar dürfen Admins so viel hochladen wie sie wollen - daher war mir die Grenze nicht mehr parat. Habe die Anzahl auf 10 hochgesetzt. Mehr macht wohl auch keinen Sinn, da man dann mit den Skripten (je nach Dateigrößen) Probleme bekommen könnte.Marcus hat geschrieben:Ich hatte letzte Woche eine Anleitung mit acht Anhängen erstellt Es sollten aber mehr gehen. Ich gehe dem mal auf den Grund.Torquatus hat geschrieben:
ich habe mal wieder vergessen, dass die Portal-Software nur max. 5 Anhänge zulässt. Hier kommt jetzt auch noch die Anleitung
Marcus
Marcus