Seite 2 von 2
Verfasst: 29.07.2007, 15:29
von Marcus
Hugo hat geschrieben:
Hab den "alten" Wunsch dazu gefunden
256 __O__ Erweiterte Eingabemöglichkeit von internationalen Sonderzeichen
Ui danke! Nachdem weder zu Unicode noch zu UTF-8 was zu finden war, habe ich den neuen erschaffen - der wird wieder gestrichen und freigegeben.
Die anderen Diskussionen sind mir bekannt, dachte nur es wäre nie als Wunsch verewigt worden.
In einen anderen Thema hatte Torquatus mich mal gebeten, die Unterschiede von ASCII, ANSI, UTF-8, Unicode darzustellen
Auch der geplante zukünfte UTF-16 Code wird dort angesprochen
UTF-16 gibt es aber doch schon ewig?! Die Zeichenkodierung in Java z.B. läuft über diesen Code.
Nachtrag
Da war doch auch noch etwas ungeklärtes dazu
ä ö ü ß sind auf einen nicht deutsch eingestellten Rechner nicht darstellbar
Denke das ist eher eine Einstellungssache in Windows.
Marcus
Verfasst: 29.07.2007, 15:59
von Hugo
Guten Tag
Marcus hat geschrieben:Ui danke! Nachdem weder zu Unicode noch zu UTF-8 was zu finden war, habe ich den neuen erschaffen - der wird wieder gestrichen und freigegeben.
Es waren mit Absicht weder Unicode noch UTF-8 im Wunschtitel genannt
Dafür gibt es einfach zu viele Schriftcodes
Marcus hat geschrieben:UTF-16 gibt es aber doch schon ewig?! Die Zeichenkodierung in Java z.B. läuft über diesen Code.
Jeeiin
Ist noch nicht offiziell plattformübergreifend als Standart abgesegnet
Marcus hat geschrieben:Hugo hat geschrieben:Da war doch auch noch etwas ungeklärtes dazu
ä ö ü ß sind auf einen nicht deutsch eingestellten Rechner nicht darstellbar
Denke das ist eher eine Einstellungssache in Windows.
Marcus
Leider ist es nicht so
ä ö ü ß sind nicht in allen internationalen ANSI-Zeichensätzen enthalten
Soweit mir bekannt nur bei westlichen und mitteleuropäischen Windows
Wenn die Erinnerung mich nicht täuscht, fehlen die sogar schon im polnischen
Wie aber schon erwähnt, ich beziehe mich dabei auf den ANSI-Teil
Im UTF-8 sind sie natürlich da
Gruß Hugo
Verfasst: 29.07.2007, 16:31
von Marcus
Hugo hat geschrieben:
Marcus hat geschrieben:UTF-16 gibt es aber doch schon ewig?! Die Zeichenkodierung in Java z.B. läuft über diesen Code.
Jeeiin
Ist noch nicht offiziell plattformübergreifend als Standart abgesegnet
Also der Standard ist fertig & nutzbar. Wüsste auch nicht wie der noch pattformübergreifend "abgesegnet" werden könnte. Plattformübergreifender als eine Verankerung in Java kann ich mir eigentlich auch kaum was vorstellen. Es wird in Programmen (und Betriebssystemen?) halt nicht genutzt, da sich der Speicherbedarf verdoppelt und das für 99,9% aller Dateien wohl ohne "Gewinn" wäre. Insofern ist fraglich, ob der sich jemals gegenüber UTF-8 ganz durchsetzen wird.
Hugo hat geschrieben:
Leider ist es nicht so
ä ö ü ß sind nicht in allen internationalen ANSI-Zeichensätzen enthalten
Soweit mir bekannt nur bei westlichen und mitteleuropäischen Windows
Wenn die Erinnerung mich nicht täuscht, fehlen die sogar schon im polnischen
Wie aber schon erwähnt, ich beziehe mich dabei auf den ANSI-Teil
Im UTF-8 sind sie natürlich da
Also ist es doch in Ahnenblatt derzeit nicht änderbar
Um das zu beeinflussen, muss man die Ländereinstellungen in Windows ändern?!
Marcus
Verfasst: 29.07.2007, 16:59
von Hugo
Guten Tag
Betrifft UTF-16
Marcus hat geschrieben:Also der Standard ist fertig & nutzbar. Wüsste auch nicht wie der noch pattformübergreifend "abgesegnet" werden könnte
Ganz einfach
Windows stellt nur Zeichensätze bis UTF - 8 zur Verfügung (64.000 Zeichen)
UTF-16 hingegen wäre eine Erweiterung auf 128.000 Zeichen pro Schriftart
Betrifft Ländercodes ANSI
Marcus hat geschrieben:Also ist es doch in Ahnenblatt derzeit nicht änderbar
Um das zu beeinflussen, muss man die Ländereinstellungen in Windows ändern?!
Leider ja
Ansonsten tritt auch noch folgendes Problem auf
Bezüglich dem Hatscheks Problem änderte ich auf meinen PC den Ländercode auf mitteleuropäisch
Klappte auch alles Prima
Nur bei meinen Sohn sah die Datei mit westlichen Ländercode bei einigen von mir benutzten Zeichen recht merkwürdig aus
Von dem Rechner meines zweiten Sohnes mit amerikanischen Ländercode will ich gar nicht erst anfangen
ANSI ist eben nicht international genormt
Gruß Hugo
Verfasst: 30.07.2007, 18:58
von Hugo
Guten Tag
Heute wendete sich eine Freundin an uns, weil sie ein Problem mit Ahnenblatt hat
Sie kann keine deutschen Sonderzeichen eingeben, weil sie einen polnischen Ländercode auf ihren Rechner eingestellt hat
Dafür kann sie aber Hatscheks eingeben
Sie wollte sich schon vor lauter Verzweiflung ein anderes Programm suchen
Wir konnten sie aber erstmal davon abbringen
Trotzdem schaute ich daraufhin mal ein wenig über den Zaun
Es gibt tatsächlich kaum Programme, die den UTF - 8 Code bei der Eingabe unterstützen
Somit wäre es doch ein echtes Schmanckerl, wenn Ahnenblatt das könnte
Vor allem, wie oben geschildert, dringend notwendig
Gruß Hugo
Verfasst: 30.07.2007, 19:11
von Marcus
Hugo hat geschrieben:
Somit wäre es doch ein echtes Schmanckerl, wenn Ahnenblatt das könnte
Vor allem, wie oben geschildert, dringend notwendig
Dringend ist so eine Sache ... das betrifft ja bei weitem nicht nur Ahnenblatt. Auch fast alle anderen Windowsprogramme sind davon betroffen, genauso wie die Darstelung fast aller Internetseiten.
Marcus
Verfasst: 30.07.2007, 19:20
von Hugo
Guten Tag Marcus
Merkwürdiger Weise sind nur Win95 / 98 und NT davon betroffen, weil sie nur Truetype können und somit nur ANSI
Seit Win 2000 stellt dieses für alle Internetbrowser und den größten Teil der Programme kein Problem da, weil sie UTF - 8 unterstützen
Nur wenige Programme außerhalb der Ahnenforschungsprogramme haben ein Problem damit
Und da handelt es sich meistens um sehr alte Programme
Gruß Hugo
Verfasst: 30.07.2007, 20:01
von Claro
"Somit wäre es doch ein echtes Schmanckerl, wenn Ahnenblatt das könnte
Vor allem, wie oben geschildert, dringend notwendig "
Wir sind hier im Thread EXPORT. Daher Vorsicht!
Es wäre kontraproduktiv, wenn Ahnenblatt dies könnte. Generell gilt - Ausnahmen bestätigen die Regel -, daß Programme dann erfolgreich sind bzw. bleiben, wenn sie Daten jeglicher Struktur IMPORTIEREN können. Programme, die gut exportieren können, schaufeln sich dagegen das eigene Grab. Und das wollen wir doch alles nicht...
Ohnehin frage ich mich aber - Verständnisfrage - , wie dann die Weiterverarbeitung aussehen soll. Unterstützt GEDCOM dies?
Verfasst: 30.07.2007, 21:20
von Marcus
Hugo hat geschrieben:
Seit Win 2000 stellt dieses für alle Internetbrowser und den größten Teil der Programme kein Problem da, weil sie UTF - 8 unterstützen
Es gibt aber eben etliche Seiten (fast alle?) die nicht in UTF-8 codiert sind
Wer's nicht glauben mag, kann sich ja mal die diversen Internetangebote anschauen - auch dieses hier
Zur Stärke des Exports wünsche ich mir, dass dieser - wie bisher - dem Import nicht hinterherhinkt. An das "Grab schaufeln" mag ich da auch nicht glauben - ganz im Gegenteil! Sobald ich merke, dass mir ein Programm "kein zurück" mehr ermöglicht, dann ziehe ich die Notbremse sobald wie möglich.
Gedcom ist es wohl egal in welchem Zeichensatz die Daten hinterlegt sind. Dies muss jeweils nur das importierende Programm dann beachten.
Marcus
Verfasst: 31.07.2007, 00:27
von Flash
Ja. Wir hatten in einem anderen Thread schonmal drüber gesprochen und Hugo hat angemerkt, dass die Gedcom Dateien sogar ein Kennzeichnung für den Verwendeten Zeichensatz beinhalten. So kann man expliziet angeben, dass eine GEDCOM-Datei UTF-8 Zeichen enthält.
Allerdings ist so eine Umstellung auf UTF-8 nicht so einfach gemacht. Wenn Dirk das in Angriff nehmen würde, kann man sich darauf einstellen, dass in den darauffolgenden 4-6Monaten keine anderen AB-Updates kämen. In anbetracht der anderen Schmankerl die in letzter Zeit hier vorgeschlagen wurden kein sehr schöner Gedanke.
Verfasst: 31.07.2007, 06:56
von Hugo
Guten Tag
Marcus hat geschrieben:
Es gibt aber eben etliche Seiten (fast alle?) die nicht in UTF-8 codiert sind
Wer's nicht glauben mag, kann sich ja mal die diversen Internetangebote anschauen - auch dieses hier
Jetzt bringst Du mich ins Grübeln
Das verstehe ich nicht
Wieso kann ich hier auf einer XP-Kiste etwas sehen, was ich auf einer 98er Kiste nicht sehen kann
So wurde es erfasst: šŠ đĐ čČ ćĆ žŽ
So wurde es gespeichert: šŠ dÐ cC cC žŽ
Auf einer 98er Kiste sehen dann beide Zeilen so aus:
šŠ dÐ cC cC žŽ
PS: Auf einer XP-Kiste mit polnischen Ländercode sieht dieses Portal vollkommen normal aus. Auch die deutschen Sonderzeichen
Gruß Hugo
Verfasst: 31.07.2007, 12:08
von Gast
Dem schließe ich mich vorbehaltlos an ...
Hugo hat geschrieben:
Das verstehe ich nicht
Ich auch nicht wirklich
Habe allerdings auch schon öfter Probleme mit der Darstellung beobachtet ...
Marcus