iso-8859-1 oder UTF-8: was ist denn nun am verbreitesten?

  • Hi,

    bin gerade auf eine Website gestoßen (http://www.mediaevent.de/tutorial/sonderzeichen.html), die (fast) mein "Weltbild" zum Einsturz brachte.
    1.: Ä,Ö,Ü,ß und & sollen nicht mehr gequotet werden, der besseren Lesbarkeit wegen.
    2.: Wegen einiger Sonderzeichen (ASCII: Bull, Karo, etc.) ist es leichter, das Ganze in UTF-8 stattiso-8859-1 zu schreiben. :eek:
    Habe ich die ganze Zeit hinter'm Mond gelebt? Ich habe mich danach gerichtet, was mir HTML-Tidy "erzählt" hat.
    Für eine aufklärende Antwort wäre ich sehr dankbar. :)

    LG, Mütze

    PS: An anderer Stelle habe ich gelesen, dass nicht XHTML die Zukunft ist, sondern HTML 5. Ist das eine Ente oder auch wahr?

    ..... und wo lassen Sie denken? :rolleyes:

  • utf-8 ist, bei konsequenter Anwendung, die wohl beste Zeichenkodierung. Spätestens beim Einsatz mehrerer Sprachen, z.Bsp. aus dem kyrillischen Raum, auch sinnvoller als der iso-Standard.
    Derzeit ist das aber bei rein Deutschsprachigen Seiten egal ;)

    HTML 5 ist noch weit von der Fertigstellung entfernt, also nicht verrückt machen lassen ;)

    Gruß,
    Jojo


  • Aber ....

    Hi und Danke für's Antworten.
    Wenn UTF-8 eigentlich das Beste ist, warum zeigt das w3c immer an fallback in utf-8, also zurückfallen.:rolleyes:
    Ich benutze die Codierung jetzt, weil ich einige der Sonderzeichen gut gebrauchen kann (falls man das als Begründung anführen kann/darf).

    LG, Mütze

    ..... und wo lassen Sie denken? :rolleyes:

  • Das macht der, wenn du keine Zeichenkodierung angibst. ;)
    Fallback heißt, dass er aufhört nach einer benutzerdefinierten Codierung zu suchen und statt dessen UTF-8 als Standard nimmt, was w3 als Standard hat, ist ja wohl das Beste. ;)
    Kann mir jemand erklären, wofür man utf16 und utf32 braucht, außer um die Dateigröße zu verdoppeln oder zu vervierfachen? utf8 unterstützt doch schon multibyte-Zeichen, aber eben nur, wenn sie gebraucht werden.

    Achso:
    Ich würde mal sagen, das andere ist eine Ente.
    XHTML gehört die Zukunft, weil es für Programme viel einfacher ist mit XML umzugehen, dort ist die Syntax logischer, HTML hat viel mehr Ausnahmen. XML wird mittlerweile für sehr viele Formate verwendet, ich wüsste nicht, warum das bei HTML anders sein sollte.

  • Danke!

    Dann geb' ich jetzt weiterhin UTF-8 als Zeichensatz an. :D

    LG, Mütze

    Edit: Vllt. bin ich ein Spätzünder oder doof, aber man kann, laut W3C, den iso-8859-1-Zeichensatz und trotzdem die Sonderzeichen "bull", etc. benutzen. Ist valide.

    ..... und wo lassen Sie denken? :rolleyes:

    Einmal editiert, zuletzt von Mütze (18. November 2008 um 09:03)