PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Zeichenkodierung und Sprache



Pimpernuckel
13.03.2016, 10:33
Gibt es eine Möglichkeit, das Forum "ordentlich" so einzustellen, dass man als typografisch geprägter Mensch auch seine eigegebnen Sonderzeichen wie z.B. ordentliche deutsche Anführungszeichen auch angezeigt kriegt? Zur Zeit scheint das System aufgrund seiner anglophilen Grundeinstellungen alles aufzufressen - man kann es beim Schreiben eingeben und es wird auch in der Datenbank so gespeichert, aber die Seiten werden offensichtlich anders ausgeliefert.

Pimpernuckel

FranzW
13.03.2016, 10:49
Ich hab gerade im Post www.wb-community.com/showthread.php?p=748089 ein paar Unicode-Zeichen ausprobiert, inklusive der deutschen Anführungszeichen und bei mir wird alles so angezeigt, wie ich es hineingegeben habe.

Kvetinka
13.03.2016, 11:42
Das wechselt von Thread zu Thread: Śląsk

Wolfgang
13.03.2016, 14:36
wie etwas angezeigt wird bestimmt der webbrowser auf deinem rechner, nicht die serverseitige software
die software teilt bei der auslieferung dem browser mit dass die seiten der wbc iso-codiert sind

<meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1" />
was der browser daraus macht liegt auserhalb unseres wirkungsbereiches

auch unsere datenbank lauft und speichert in latin... das gibt oracle sogar als standard vor weils eigentlich fast ueberall passt

wenn es also zeichensatzprobleme gibt mal beim browser ansetzen und gucken welche codierung der aktiv hat


dass wir fuer die website, im irc-chat am ts iso 8859-1 (latin-1) verwenden haengt einfach damit zusammen dass das seit den fruehen 1980er-jahren die standardcodierung fuer westeuropa ist
utf-8 ist dagegen ralativ neu (gibts seit 1992) ist fuer englisschsprachige sites entwickelt, sonderzeichen (zb umlaute) die es im englischen nicht gibt erfordern statt 1 byte pro zeichen 2-4 byte pro zeichen

https://de.wikipedia.org/wiki/ISO_8859-1
ISO 8859-1 ist neben US-ASCII und UTF-8 (einer Unicode-Kodierung) die wohl wichtigste und am häufigsten gebrauchte Kodierung für lateinische Schriften.

ISO 8859 ist in Westeuropa, Amerika und Australien die dominierende Zeichenkodierung
https://de.wikipedia.org/wiki/UTF-8
Buchstaben des englischen Alphabets werden in UTF-8 und ISO-8859 identisch angezeigt. Probleme treten bei den anderen Zeichen auf, beispielsweise bei Umlauten.
Ein Beispiel für das Wort Höhe:
UTF-8-Text in ISO-8859-Umgebung
Höhe → Höhe. In UTF-8 besteht das Zeichen ö aus zwei Bytes, die in ISO-8859-1 den Zeichen à und ¶ entsprechen.
ISO-8859-Text in UTF-8-Umgebung
Höhe → H0xF6he bzw. Fehlermeldung mit Abbruch. Ein Byte mit dem Hexadezimalwert F6 ist in UTF-8 nicht zulässig.

FranzW
13.03.2016, 14:51
Wolfgang: Wenn die Seite als ISO-8859-1 ausgeliefert wird, sollte aber die serverseitige Software darauf achten, dass alle Sonderzeichen, die nur im Unicodevorrat vorhanden sind, auch durch entsprechende HTML-Entitäten ersetzt werden. Bei den koptischen Zeichen und bei den Musiknoten ist dies der Fall, jedoch nicht bei den deutschen Anführungszeichen.

Liebe Grüße aus Graz!

Wolfgang
13.03.2016, 15:22
auf der richtigen seite der verbindung suchen ;)
klar is es easy einfach zu sagen der andere sei schuld :P

wenn zeichen falsch sind zb anfuehrungsstriche in die falsche richtung stehen, dann hat der browser bei der texteingabe falsch interpretiert
der server uebernimmt ja nur was der browser ihm fertig codiert sendet
der server hat dem browser ja mitgeteilt wir kommunizieren in iso 8859-1 (8859-1 & 8859-15)
wenn der browser den befehl ignoriert und irgendwas falsch codiert uebergibt, kann der server nix fuer...
der nimmt nur was er bekommt und veraendert da drann nix


Für mindestens folgende Sprachen reicht ISO 8859-1 aus:
Afrikaans (È/è, É/é, Ê/ê, Ë/ë, Î/î, Ï/ï, Ô/ô, Û/û),
Albanisch (Ç/ç, Ë/ë),
Baskisch (Ñ/ñ),
Dänisch (Å/å, Æ/æ, Ø/ø),
Deutsch (Ä/ä, Ö/ö, Ü/ü, ß, in Fremdwörtern: É/é, nicht Euro-Symbol und ggf. ſ),
Englisch (£, ¢; veraltend: Æ/æ, ä, ë, ï, ö, ü, nicht Œ/œ),
Estnisch (Ä/ä, Ö/ö, Ü/ü, Õ/õ, nicht Š/š, Ž/ž (in Fremdwörtern)),
Färöisch (Á/á, Ð/ð, Í/í, Ó/ó, Ú/ú, Ý/ý, Æ/æ, Ø/ø),
Finnisch (Ä/ä, Ö/ö, in Fremdwörtern: Å/å, nicht Š/š, Ž/ž),
Französisch (Æ/æ, À/à, Â/â, È/è, É/é, Ê/ê, Ë/ë, Î/î, Ï/ï, Ô/ô, Ù/ù, Û/û, Ç/ç, Ü/ü, ÿ, nicht Œ/œ, Ÿ),
Irisches Gälisch, neue Orthographie (Á/á, É/é, Í/í, Ó/ó, Ú/ú),
Isländisch (Á/á, Ð/ð, É/é, Í/í, Ó/ó, Ú/ú, Ý/ý, Þ/þ, Æ/æ, Ö/ö),
Italienisch (À/à, È/è, É/é, Ò/ò, Ù/ù),
Katalanisch (À/à, Ç/ç, È/è, É/é, Í/í, Ï/ï, Ò/ò, Ó/ó, Ú/ú, Ü/ü, nicht dagg. Ŀl/ŀl),
Niederländisch (nicht IJ/ij, aber ÿ),
Norwegisch, Bokmål und Nynorsk (Å/å, Æ/æ, Ø/ø, Ò/ò),
Portugiesisch inkl. Portugiesisch (Brasilien) (À/à, Á/á, Â/â, Ã/ã, Ç/ç, É/é, Ê/ê, Í/í, Ó/ó, Ô/ô, Õ/õ, Ú/ú, Ü/ü),
Rätoromanisch,
Schottisches Gälisch (À/à, È/è, Ì/ì, Ò/ò, Ù/ù)
Schwedisch (Å/å, Ä/ä, Ö/ö),
Spanisch (¡, ¿, ª, º, Á/á, É/é, Í/í, Ñ/ñ, Ó/ó, Ú/ú, Ü/ü, früher auch Ç/ç),
Swahili und
Wallonisch (Â/â, Å/å, Ç/ç, È/è, É/é, Ê/ê, Î/î, Ô/ô, Û/û).

was also meinst du dass in iso fehlen wuerde ?
wer meint in einen deutschsprachigem bereich sprachen verwenden zu muessen die von 8859-1 nicht umfasst sind....
dem kann ich leider auch nicht helfen, wenn dessen browser die nicht korrekt formatiert uebergibt

formatierung ist client-angelegenheit und hat nichts mit dem server oder auf diesem laufender software zu tun denn genau damit ist erreicht dass es egal ist was der server fuer ein betriebssystem verwendet oder welche software auf diesem laeuft... es kommt immer das gleiche an und es wird immer das gleiche gespeichert

Jona Windeltiger
13.03.2016, 15:47
Nachdem ich einen nun einen Boskop gegessen habe will ich auch deutsche Anführungszeichen!!

Wolfgang
13.03.2016, 16:04
anfuehrungszeichen...
such dir doch welche aus...

https://de.wikipedia.org/wiki/Anf%C3%BChrungszeichen

typographische "text"
einfache typograpische 'text'
deutsche „text”
franzoesische »text«

usw...

liegt nicht am server sondern am client-betriebssystem und browser ;)


Browser
Die korrekte Darstellung in Browsern ist neben Browsertyp und -version von der verwendeten Schrift, anderen auf dem Computer verfügbaren Schriften und der Dokumentenkodierung abhängig.
Da sie in der am weitesten verbreiteten Kodierung ISO 8859-1 enthalten sind, werden von den typografisch korrekten die (doppelten) französischen Anführungszeichen am besten unterstützt. Inzwischen sind allerdings auch die deutschen Anführungszeichen unproblematisch, sofern die in Webtypographie genannten Hinweise befolgt werden.

Einige weit verbreitete Schriften, etwa Courier, Verdana, Tahoma oder San Francisco, stellen die schließenden Anführungszeichen falsch dar; diese Schriften eignen sich demnach nicht für die korrekte Darstellung deutscher Texte.

Pimpernuckel
13.03.2016, 16:32
Scheint 'n Eingabeprobelm zu sein. Schießt wohl irgendein Script dazwischen, wenn man Zeichen über Alt+Nummernblock eingibt. Wenn man's umständlich per Copy&Paste von woanders her macht, funktionierts.

Pimpernuckel

FranzW
13.03.2016, 18:40
Nachdem der Server recht wenig mit den Benutzereingaben macht, kann man auch die HTML-Entitäten (wie z.B: &amp;#8221; ) direkt eingeben, die werden direkt in den Beitrag durchgereicht.

Edit: Etwas macht der Server schon, nämlich Strichpunkt und Klammer zu in ein Emoticon verwandeln.

Wolfgang
13.03.2016, 20:13
interpretation von bb-code, verlinkung ins wiki, ... macht der server

das aendert nur nix am charset