Plugin: Ausgabe im GEDCOM-Format mit ANSI-Zeichensatz

Plugins, Sprachdateien, Rahmen & Hintergrundgrafiken
Benutzeravatar
Torquatus
Beiträge: 3801
Registriert: 19.01.2006, 22:19
Wohnort: Mannheim

Plugin: Ausgabe im GEDCOM-Format mit ANSI-Zeichensatz

Beitrag von Torquatus »

Dieses klitzekleine Plugin ist noch nicht einmal auf meinem Mist gewachsen. Ich habe es auf einen Tip von Hugo erstellt und verwende es schon seit einiger Zeit zur Aufbereitung meiner Daten für DftCom2.

Was es macht, zeigt die hier drunter gefügte Beschreibung:

Ausgabe der Ahnenblatt-Datei im GEDCOM-Format mit ANSI-Zeichensatz
------------------------------------------------------------------------------------
Wenn man in Ahnenblatt auch nur ein einziges UNICODE-Zeichen verwendet,
erfolgt die Ausgabe einer GEDCOM-Datei im UNICODE-Zeichensatz.

Will man nun eine GEDCOM-Datei in einem anderen Programm weiter
verarbeiten, das noch nicht UNICODE-fähig ist, dann muss man seine
Datei in den ANSI-Zeichensatz umwandeln.

Mit diesem Plugin kann man eine Ahnenblattdatei im GEDCOM-Format mit
ANSI-Zeichensatz ausgeben. Die Ausgabe erfolgt im TEMP-Verzeichnis des
Users mit dem Namen "Ausgabe_ged_ansi.ged

Aber Achtung:
Dabei gehen die besonderen nur in UNICODE darstellbaren Zeichen
verloren oder werden durch andere Zeichen ersetzt.

Torquatus (nach einem Tipp von Hugo)
17.10.2009
Du hast keine ausreichende Berechtigung, um die Dateianhänge dieses Beitrags anzusehen.
Gruß, Torquatus

C.c. - Übrigens stelle ich den Antrag, dass Ahnenblatt das beste aller Ahnenprogramme werden muss - frei nach Cato
Benutzeravatar
Chlodwig
Super Moderator
Beiträge: 1640
Registriert: 20.01.2006, 13:49
Wohnort: Ostbayern

Beitrag von Chlodwig »

Hallo Torquatus,

der Beschrieb hört sich super an und ich verwende auch sehr gern das dftcom2. Bevor ich es aber ausprobiere, kannst du bitte mal ein Beispiel geben, wie die Ausgabe bei dftcom2 mit und ohne Plugin aussieht? (Ich hab mich mit Unicode und ASCII noch nicht befasst. ASCII ist mir aus DOS-Zeiten noch ein Begriff.

Danke schon mal,

Chlodwig
Gruß, Chlodwig
Benutzeravatar
Torquatus
Beiträge: 3801
Registriert: 19.01.2006, 22:19
Wohnort: Mannheim

Beitrag von Torquatus »

Hallo Chlodwig,

so lange Du mit der GEDCOM-Ausgabe aus Ahnenblatt im DftCom2 keine Problem hast, brauchst Du das Plugin nicht.

Erst dann, wenn ein erstes Unicode-Zeichen in Ahnenblatt erfasst wurde, erfolgt die Ausgabe mit dem UNICODE-Zeichensatz und damit läuft DftCom2 leider nicht mehr.

Bei mir ist das der Fall, obwohl ich mich nicht mehr genau erinnern kann, weshalb und zu welcher Person ich UNICODE-Zeichen erfasst habe. Es kann sein, dass ich einen kyrillisch geschriebenen Namen halt einfach mit kyrillischen Schriftzeichen erfasst habe, weil ich die lateinische Entsprechung nicht ermitteln konnte. Möglich! Ich frage mich jetzt, wie kann man denn das herausfinden? Weiß das hier jemand?

Den verwendeten Zeichnsatz sieht man im Kopf der GEDCOM-Datei. Ist die Datei im UNICODE-Zeichensatz steht dort 1 CHAR UTF-8 und ist sie im ANSI-Zeichensatz, steht dort 1 CHAR ANSI. Siehe unten.

Versucht man nun mit DftCom2 eine GEDCOM-Datei im UTF-8-Zeichnsatz zu verarbeiten, erhält man eine Fehlermeldung; siehe unten.

Wandelt man aber die Datei mittels Plugin in den ANSI-Zeichensatz um, dann können UNICODE-Zeichen verschwinden oder in falsche Zeichen umgewandelt werden. Ich habe mal mit Dirks-Unicode-Beispiel-Datei getestet. Siehe unten. Das ist zwar nicht erfreulich, aber bei meinen 26.000 Hanseln nehme ich einige in DftCom2 falsch angezeigte in Kauf.

Wer viele UNICODE-Zeichen in seiner Datei hat, kann daher DftCom nicht verwenden. Ich schon :wink:

Übrigens:
Ich habe mir eine Anleitung für DftCom2 gestrickt, die Dir evtl. auch nützen könnte. Die Grund-Idee dazu stammt wiederum von Hugo. Zumindest bekomme ich damit die Religion, die Taufpaten und die Quellen in meine DftCom2-Datei. Ich hänge die Anleitung mal hier dran.
Du hast keine ausreichende Berechtigung, um die Dateianhänge dieses Beitrags anzusehen.
Gruß, Torquatus

C.c. - Übrigens stelle ich den Antrag, dass Ahnenblatt das beste aller Ahnenprogramme werden muss - frei nach Cato
Benutzeravatar
Torquatus
Beiträge: 3801
Registriert: 19.01.2006, 22:19
Wohnort: Mannheim

Beitrag von Torquatus »

Hallo Chlodwig,

ich habe mal wieder vergessen, dass die Portal-Software nur max. 5 Anhänge zulässt. Hier kommt jetzt auch noch die Anleitung 8)

Spätere Ergänzung: Und weil hier mit nur 1 Anhang noch Platz ist, füge ich zwei Beispiele mit DftCom2-Anzeigen (nach Anwendung Plugin) dran.
Du hast keine ausreichende Berechtigung, um die Dateianhänge dieses Beitrags anzusehen.
Gruß, Torquatus

C.c. - Übrigens stelle ich den Antrag, dass Ahnenblatt das beste aller Ahnenprogramme werden muss - frei nach Cato
Benutzeravatar
Hugo
Administrator
Beiträge: 7169
Registriert: 19.01.2006, 19:33
Wohnort: Hamburg

Re: Plugin: Ausgabe im GEDCOM-Format mit ANSI-Zeichensatz

Beitrag von Hugo »

Guten Tag Torquatus
Torquatus hat geschrieben:Aber Achtung:
Dabei gehen die besonderen nur in UNICODE darstellbaren Zeichen
verloren oder werden durch andere Zeichen ersetzt.
:up:
Torquatus hat geschrieben:(nach einem Tipp von Hugo)
Das laß mal bitte weg
Hab dieses Tool nur wieder ausgebuddelt und Jürgen hats umgeschrieben

Gruß Hugo
Das Gestern ist Geschichte
Das Morgen ist ein Rätsel
Das Heute ist ein Geschenk
Benutzeravatar
Chlodwig
Super Moderator
Beiträge: 1640
Registriert: 20.01.2006, 13:49
Wohnort: Ostbayern

Beitrag von Chlodwig »

Hallo Torquatus,

das war ausführlich- danke!

Es ist wohl so, dass es entweder funzt oder eben nicht.
Da bin ich aber froh, dass dft2com bei mir einfach funktioniert. Offensichtlich habe ich keinen Unicode drinnen.

Chlodwig
Gruß, Chlodwig
Benutzeravatar
Marcus
Administrator
Beiträge: 7522
Registriert: 19.01.2006, 21:55

Beitrag von Marcus »

Torquatus hat geschrieben:
ich habe mal wieder vergessen, dass die Portal-Software nur max. 5 Anhänge zulässt. Hier kommt jetzt auch noch die Anleitung 8)
Ich hatte letzte Woche eine Anleitung mit acht Anhängen erstellt :wink: Es sollten aber mehr gehen. Ich gehe dem mal auf den Grund.
Marcus
Benutzeravatar
Torquatus
Beiträge: 3801
Registriert: 19.01.2006, 22:19
Wohnort: Mannheim

Beitrag von Torquatus »

Hallo Chlodwig,
Chlodwig hat geschrieben:das war ausführlich - danke!
fühle Dich nicht erschlagen von der Fülle, aber ich dachte es könnte ja auch noch weitere User geben, die mit UNICODE und DftCom2 Probleme haben oder bekommen.

Ein "Семёновна" in der Datei und schon hat man das Probleme.

Es ist wohl so, dass es entweder funzt oder eben nicht.
Da bin ich aber froh, dass dft2com bei mir einfach funktioniert. Offensichtlich habe ich keinen Unicode drinnen.
So isses :wink:

Und mir hat immer noch keiner gesagt, wie ich herausfinde, wo meine UNICODE-Zeichen stecken. Hat da jemand einen Tipp?
Gruß, Torquatus

C.c. - Übrigens stelle ich den Antrag, dass Ahnenblatt das beste aller Ahnenprogramme werden muss - frei nach Cato
Benutzeravatar
Jürgen T.
Beiträge: 1607
Registriert: 29.12.2006, 14:29
Wohnort: Bernkastel-Kues (Mosel)

Beitrag von Jürgen T. »

Hallo Torquatus,
Torquatus hat geschrieben:Und mir hat immer noch keiner gesagt, wie ich herausfinde, wo meine UNICODE-Zeichen stecken. Hat da jemand einen Tipp?
Du bist doch ein EXCEL-Spezi.

Wenn Du es hinbekommst, dass Du alle Zeichen Deiner Datei in EXCEL (nach dem speichern als csv-Datei) einzeln ansprechen kannst, dann könntest Du mit dem Befehl "=CODE()" den Wert eines jeden Zeichens ausgeben lassen bzw. abfragen, ob dieserWert >255 ist.
Werte >255 müssten aus UNICODE-Zeichen resultieren.

Allerdings ist mir noch kein Weg eingefallen, wie man die Zeichen der csv-Datei einzeln abfragen kann - evtl. mit Hilfe eines Macros.
Vielleicht hat ja Othmar eine Idee - er kennt sich ja auch sehr gut mit EXCEL aus.
Gruß
Jürgen
Benutzeravatar
Torquatus
Beiträge: 3801
Registriert: 19.01.2006, 22:19
Wohnort: Mannheim

Beitrag von Torquatus »

Hallo Jürgen,

danke für Deine Tipps. Mittels =CODE(TEIL(C2;n;1)) konnte ich zumindest feststellen, dass ich keinen Geburtsnamen im Unicode-Breich > 255 habe. Offenbar stecken die Zeichen > 255 in den Anmerkungen.

Man müsste eigentlich in der CSV-Datei ja nur jedes 2. Byte prüfen auf hexa >00. Siehe unten. Aber für heute Nacht bin ich zu müde dazu, zumal ich schon länger nicht mehr programmiert habe :cry:
Du hast keine ausreichende Berechtigung, um die Dateianhänge dieses Beitrags anzusehen.
Gruß, Torquatus

C.c. - Übrigens stelle ich den Antrag, dass Ahnenblatt das beste aller Ahnenprogramme werden muss - frei nach Cato
Benutzeravatar
Jürgen T.
Beiträge: 1607
Registriert: 29.12.2006, 14:29
Wohnort: Bernkastel-Kues (Mosel)

Beitrag von Jürgen T. »

Hallo zusammen,

die Diskussion hat mich dazu angeregt ein Plugin zu schreiben.

Bezeichnung: UNICODE finden Vers. 1.00 (JT)

Dieses Plugin listet die Datensätze der aus Ahnenblatt erstellten csv-Datei auf, die UNICODE-Zeichen enthalten.
Es wird jedes enthaltene UNICODE-Zeichen benannt und auch die Stelle innerhalb des Datensatzes.
So kann man in Ahnenblatt gezielt die UNICODE-Zeichen ersetzen.

Das ganze macht natürlich nur dann Sinn, wenn nicht viele UNICODE-Zeichen enthalten sind und diese evtl. versehentlich durch "Kopieren und Einfügen" in die Datei gekommen sind.

Das Plugin ist im Downloadbereich zu finden.
klick mich "Plugin: UNICODE finden (JT)"

Der Hilfetext zum Plugin stammt im Wesentlichen von Torquatus - vielen Dank dafür.
Gruß
Jürgen
Benutzeravatar
Torquatus
Beiträge: 3801
Registriert: 19.01.2006, 22:19
Wohnort: Mannheim

Beitrag von Torquatus »

Hallo Jürgen,
Der Hilfetext zum Plugin stammt im Wesentlichen von Torquatus - vielen Dank dafür.
Ich wollte mich nicht aufdrängen :roll: Es freute mich einfach, dass Du dieses Plugin geschrieben hast und mein Dankeschön dazu war der Hilfe-Text. Schließlich war ich gerade im Thema fit. Den Hinweis auf mich nimm bitte gelegentlich raus.

Auch mit der endgültigen Version ist meine aktuelle Datei Unicode-frei. Um zu testen, wie Deine finale Version des Plugin arbeitet, musste ich eine meiner 999 Sicherungen bemühen; siehe unten. Sauber :up:

Nochmals vielen Dank. :thanks:
Du hast keine ausreichende Berechtigung, um die Dateianhänge dieses Beitrags anzusehen.
Gruß, Torquatus

C.c. - Übrigens stelle ich den Antrag, dass Ahnenblatt das beste aller Ahnenprogramme werden muss - frei nach Cato
Benutzeravatar
Marcus
Administrator
Beiträge: 7522
Registriert: 19.01.2006, 21:55

Beitrag von Marcus »

Gibt es einen einfachen Test auf das Zeichen (ob Unicode oder nicht) oder wie hast Du es realisiert?
Marcus
Benutzeravatar
Marcus
Administrator
Beiträge: 7522
Registriert: 19.01.2006, 21:55

Beitrag von Marcus »

Marcus hat geschrieben:
Torquatus hat geschrieben:
ich habe mal wieder vergessen, dass die Portal-Software nur max. 5 Anhänge zulässt. Hier kommt jetzt auch noch die Anleitung 8)
Ich hatte letzte Woche eine Anleitung mit acht Anhängen erstellt :wink: Es sollten aber mehr gehen. Ich gehe dem mal auf den Grund.
Marcus
Hmm, scheinbar dürfen Admins so viel hochladen wie sie wollen - daher war mir die Grenze nicht mehr parat. Habe die Anzahl auf 10 hochgesetzt. Mehr macht wohl auch keinen Sinn, da man dann mit den Skripten (je nach Dateigrößen) Probleme bekommen könnte.
Marcus
Antworten