Seite 1 von 3

Plugin: Ausgabe im GEDCOM-Format mit ANSI-Zeichensatz

Verfasst: 17.10.2009, 19:55
von Torquatus
Dieses klitzekleine Plugin ist noch nicht einmal auf meinem Mist gewachsen. Ich habe es auf einen Tip von Hugo erstellt und verwende es schon seit einiger Zeit zur Aufbereitung meiner Daten für DftCom2.

Was es macht, zeigt die hier drunter gefügte Beschreibung:

Ausgabe der Ahnenblatt-Datei im GEDCOM-Format mit ANSI-Zeichensatz
------------------------------------------------------------------------------------
Wenn man in Ahnenblatt auch nur ein einziges UNICODE-Zeichen verwendet,
erfolgt die Ausgabe einer GEDCOM-Datei im UNICODE-Zeichensatz.

Will man nun eine GEDCOM-Datei in einem anderen Programm weiter
verarbeiten, das noch nicht UNICODE-fähig ist, dann muss man seine
Datei in den ANSI-Zeichensatz umwandeln.

Mit diesem Plugin kann man eine Ahnenblattdatei im GEDCOM-Format mit
ANSI-Zeichensatz ausgeben. Die Ausgabe erfolgt im TEMP-Verzeichnis des
Users mit dem Namen "Ausgabe_ged_ansi.ged

Aber Achtung:
Dabei gehen die besonderen nur in UNICODE darstellbaren Zeichen
verloren oder werden durch andere Zeichen ersetzt.

Torquatus (nach einem Tipp von Hugo)
17.10.2009

Verfasst: 18.10.2009, 14:33
von Chlodwig
Hallo Torquatus,

der Beschrieb hört sich super an und ich verwende auch sehr gern das dftcom2. Bevor ich es aber ausprobiere, kannst du bitte mal ein Beispiel geben, wie die Ausgabe bei dftcom2 mit und ohne Plugin aussieht? (Ich hab mich mit Unicode und ASCII noch nicht befasst. ASCII ist mir aus DOS-Zeiten noch ein Begriff.

Danke schon mal,

Chlodwig

Verfasst: 18.10.2009, 15:58
von Torquatus
Hallo Chlodwig,

so lange Du mit der GEDCOM-Ausgabe aus Ahnenblatt im DftCom2 keine Problem hast, brauchst Du das Plugin nicht.

Erst dann, wenn ein erstes Unicode-Zeichen in Ahnenblatt erfasst wurde, erfolgt die Ausgabe mit dem UNICODE-Zeichensatz und damit läuft DftCom2 leider nicht mehr.

Bei mir ist das der Fall, obwohl ich mich nicht mehr genau erinnern kann, weshalb und zu welcher Person ich UNICODE-Zeichen erfasst habe. Es kann sein, dass ich einen kyrillisch geschriebenen Namen halt einfach mit kyrillischen Schriftzeichen erfasst habe, weil ich die lateinische Entsprechung nicht ermitteln konnte. Möglich! Ich frage mich jetzt, wie kann man denn das herausfinden? Weiß das hier jemand?

Den verwendeten Zeichnsatz sieht man im Kopf der GEDCOM-Datei. Ist die Datei im UNICODE-Zeichensatz steht dort 1 CHAR UTF-8 und ist sie im ANSI-Zeichensatz, steht dort 1 CHAR ANSI. Siehe unten.

Versucht man nun mit DftCom2 eine GEDCOM-Datei im UTF-8-Zeichnsatz zu verarbeiten, erhält man eine Fehlermeldung; siehe unten.

Wandelt man aber die Datei mittels Plugin in den ANSI-Zeichensatz um, dann können UNICODE-Zeichen verschwinden oder in falsche Zeichen umgewandelt werden. Ich habe mal mit Dirks-Unicode-Beispiel-Datei getestet. Siehe unten. Das ist zwar nicht erfreulich, aber bei meinen 26.000 Hanseln nehme ich einige in DftCom2 falsch angezeigte in Kauf.

Wer viele UNICODE-Zeichen in seiner Datei hat, kann daher DftCom nicht verwenden. Ich schon :wink:

Übrigens:
Ich habe mir eine Anleitung für DftCom2 gestrickt, die Dir evtl. auch nützen könnte. Die Grund-Idee dazu stammt wiederum von Hugo. Zumindest bekomme ich damit die Religion, die Taufpaten und die Quellen in meine DftCom2-Datei. Ich hänge die Anleitung mal hier dran.

Verfasst: 18.10.2009, 16:03
von Torquatus
Hallo Chlodwig,

ich habe mal wieder vergessen, dass die Portal-Software nur max. 5 Anhänge zulässt. Hier kommt jetzt auch noch die Anleitung 8)

Spätere Ergänzung: Und weil hier mit nur 1 Anhang noch Platz ist, füge ich zwei Beispiele mit DftCom2-Anzeigen (nach Anwendung Plugin) dran.

Re: Plugin: Ausgabe im GEDCOM-Format mit ANSI-Zeichensatz

Verfasst: 18.10.2009, 16:39
von Hugo
Guten Tag Torquatus
Torquatus hat geschrieben:Aber Achtung:
Dabei gehen die besonderen nur in UNICODE darstellbaren Zeichen
verloren oder werden durch andere Zeichen ersetzt.
:up:
Torquatus hat geschrieben:(nach einem Tipp von Hugo)
Das laß mal bitte weg
Hab dieses Tool nur wieder ausgebuddelt und Jürgen hats umgeschrieben

Gruß Hugo

Verfasst: 18.10.2009, 20:52
von Chlodwig
Hallo Torquatus,

das war ausführlich- danke!

Es ist wohl so, dass es entweder funzt oder eben nicht.
Da bin ich aber froh, dass dft2com bei mir einfach funktioniert. Offensichtlich habe ich keinen Unicode drinnen.

Chlodwig

Verfasst: 18.10.2009, 23:54
von Marcus
Torquatus hat geschrieben:
ich habe mal wieder vergessen, dass die Portal-Software nur max. 5 Anhänge zulässt. Hier kommt jetzt auch noch die Anleitung 8)
Ich hatte letzte Woche eine Anleitung mit acht Anhängen erstellt :wink: Es sollten aber mehr gehen. Ich gehe dem mal auf den Grund.
Marcus

Verfasst: 19.10.2009, 08:45
von Torquatus
Hallo Chlodwig,
Chlodwig hat geschrieben:das war ausführlich - danke!
fühle Dich nicht erschlagen von der Fülle, aber ich dachte es könnte ja auch noch weitere User geben, die mit UNICODE und DftCom2 Probleme haben oder bekommen.

Ein "Семёновна" in der Datei und schon hat man das Probleme.

Es ist wohl so, dass es entweder funzt oder eben nicht.
Da bin ich aber froh, dass dft2com bei mir einfach funktioniert. Offensichtlich habe ich keinen Unicode drinnen.
So isses :wink:

Und mir hat immer noch keiner gesagt, wie ich herausfinde, wo meine UNICODE-Zeichen stecken. Hat da jemand einen Tipp?

Verfasst: 20.10.2009, 21:39
von Jürgen T.
Hallo Torquatus,
Torquatus hat geschrieben:Und mir hat immer noch keiner gesagt, wie ich herausfinde, wo meine UNICODE-Zeichen stecken. Hat da jemand einen Tipp?
Du bist doch ein EXCEL-Spezi.

Wenn Du es hinbekommst, dass Du alle Zeichen Deiner Datei in EXCEL (nach dem speichern als csv-Datei) einzeln ansprechen kannst, dann könntest Du mit dem Befehl "=CODE()" den Wert eines jeden Zeichens ausgeben lassen bzw. abfragen, ob dieserWert >255 ist.
Werte >255 müssten aus UNICODE-Zeichen resultieren.

Allerdings ist mir noch kein Weg eingefallen, wie man die Zeichen der csv-Datei einzeln abfragen kann - evtl. mit Hilfe eines Macros.
Vielleicht hat ja Othmar eine Idee - er kennt sich ja auch sehr gut mit EXCEL aus.

Verfasst: 21.10.2009, 00:15
von Torquatus
Hallo Jürgen,

danke für Deine Tipps. Mittels =CODE(TEIL(C2;n;1)) konnte ich zumindest feststellen, dass ich keinen Geburtsnamen im Unicode-Breich > 255 habe. Offenbar stecken die Zeichen > 255 in den Anmerkungen.

Man müsste eigentlich in der CSV-Datei ja nur jedes 2. Byte prüfen auf hexa >00. Siehe unten. Aber für heute Nacht bin ich zu müde dazu, zumal ich schon länger nicht mehr programmiert habe :cry:

Verfasst: 22.10.2009, 17:55
von Jürgen T.
Hallo zusammen,

die Diskussion hat mich dazu angeregt ein Plugin zu schreiben.

Bezeichnung: UNICODE finden Vers. 1.00 (JT)

Dieses Plugin listet die Datensätze der aus Ahnenblatt erstellten csv-Datei auf, die UNICODE-Zeichen enthalten.
Es wird jedes enthaltene UNICODE-Zeichen benannt und auch die Stelle innerhalb des Datensatzes.
So kann man in Ahnenblatt gezielt die UNICODE-Zeichen ersetzen.

Das ganze macht natürlich nur dann Sinn, wenn nicht viele UNICODE-Zeichen enthalten sind und diese evtl. versehentlich durch "Kopieren und Einfügen" in die Datei gekommen sind.

Das Plugin ist im Downloadbereich zu finden.
klick mich "Plugin: UNICODE finden (JT)"

Der Hilfetext zum Plugin stammt im Wesentlichen von Torquatus - vielen Dank dafür.

Verfasst: 22.10.2009, 19:32
von Torquatus
Hallo Jürgen,
Der Hilfetext zum Plugin stammt im Wesentlichen von Torquatus - vielen Dank dafür.
Ich wollte mich nicht aufdrängen :roll: Es freute mich einfach, dass Du dieses Plugin geschrieben hast und mein Dankeschön dazu war der Hilfe-Text. Schließlich war ich gerade im Thema fit. Den Hinweis auf mich nimm bitte gelegentlich raus.

Auch mit der endgültigen Version ist meine aktuelle Datei Unicode-frei. Um zu testen, wie Deine finale Version des Plugin arbeitet, musste ich eine meiner 999 Sicherungen bemühen; siehe unten. Sauber :up:

Nochmals vielen Dank. :thanks:

Verfasst: 22.10.2009, 22:48
von Marcus
Gibt es einen einfachen Test auf das Zeichen (ob Unicode oder nicht) oder wie hast Du es realisiert?
Marcus

Verfasst: 22.10.2009, 22:57
von Marcus
Marcus hat geschrieben:
Torquatus hat geschrieben:
ich habe mal wieder vergessen, dass die Portal-Software nur max. 5 Anhänge zulässt. Hier kommt jetzt auch noch die Anleitung 8)
Ich hatte letzte Woche eine Anleitung mit acht Anhängen erstellt :wink: Es sollten aber mehr gehen. Ich gehe dem mal auf den Grund.
Marcus
Hmm, scheinbar dürfen Admins so viel hochladen wie sie wollen - daher war mir die Grenze nicht mehr parat. Habe die Anzahl auf 10 hochgesetzt. Mehr macht wohl auch keinen Sinn, da man dann mit den Skripten (je nach Dateigrößen) Probleme bekommen könnte.
Marcus