Categories: Software

Zeichenkodierung: So werden Webseiten korrekt dargestellt

Die von HTML unterstützte Zeichenkodierung ist durch den Unicode-Zeichensatz definiert. Unicode unterstützt jedes Alphabet und ermöglicht es, Millionen von Zeichen zu repräsentieren, darunter auch Zeichen mit Akzenten. Jedem Zeichen ist dabei ein zwei Byte langer Code zugewiesen. Die weit verbreitete ASCII-Kodierung kommt hingegen mit einem Byte aus und wird zum Beispiel in den USA häufig verwendet.

Hier eine Auswahl der zur Verfügung stehenden Zeichenkodierungen:

  • ISO 8859-1: Dies ist die Standardkodierung für das lateinische Alphabet, auch Latin1 genannt. Sie umfasst alle auf lateinischen Buchstaben basierenden Sprachen der Welt.
  • UTF-8 (8-Bit UCS/Unicode Transformation Format): Diese Zeichenkodierung repräsentiert jedes Zeichen des Unicode-Standards. Die Kodierung von Bytecodes und die Zeichenzuordnungen von UTF-8 sind abwärtskompatibel zu ASCII.
  • UTF-16 (16-Bit Unicode Transformation Format): Eine Zeichenkodierung mit variabler Länge für Unicode, die jedes Unicode-Zeichen abbilden kann.
  • US-ASCII ist eine Teilmenge von UTF-8, die die im ASCII-Standard enthaltenen Zeichen abdeckt.

Eine vollständige Aufzählung aller möglichen Zeichenkodierungen ist online verfügbar. Die derzeit am häufigsten verwendete und zu empfehlende Kodierung ist UTF-8.

Wie wählt man die richtige Zeichenkodierung?

Das Hauptproblem bei der Wahl der Zeichenkodierung besteht darin, sich für eine zu entscheiden, die alle unterschiedlichen Sprachen und Anforderungen der jeweiligen Zielgruppe abdeckt. Die Zeichenkodierung ist entscheidend, wenn es um Anwendungen geht, in denen unterschiedliche Sprachen verwendet werden, die wiederum unterschiedliche Zeichenkodierungen erfordern.

Bei der Wahl einer Zeichenkodierung muss man wissen, welche Zeichen Verwendung finden sollen. Außerdem müssen die zur Arbeit mit den Dateien eingesetzten Zeichenkodierungen bekannt sein, die der Browser und alle anderen Anwendungen unterstützen. Die meisten Browser unterstützen die Standards UTF-8 (die bessere Wahl) sowie US-ASCII. Werden andere als diese beiden Standards verwendet, sollte man vorher entsprechende Tests durchführen.

Page: 1 2 3

ZDNet.de Redaktion

Recent Posts

HPE baut Supercomputer am Leibniz-Rechenzentrum

Das System basiert auf Hardware von HPE-Cray und Nvidia. Die Inbetriebnahme erfolgt 2027.

3 Tagen ago

Bund meldet Fortschritte in der Netzversorgung

Die Bundesnetzagentur hat ihr Gigabit-Grundbuch aktualisiert. Drei von vier Haushalten sollen jetzt Zugang zu Breitbandanschlüssen…

3 Tagen ago

Vorinstallierte Schadsoftware auf IoT-Geräten

Mit dem Internet verbundene Digitale Bilderrahmen oder Mediaplayer können mit Schadsoftware infiziert werden und sind…

6 Tagen ago

iOS und iPadOS 18.2 beseitigen 21 Sicherheitslücken

Schädliche Apps können unter Umständen einen Systemabsturz auslösen. Mindestens eine Anfälligkeit erlaubt eine Remotecodeausführung.

7 Tagen ago

Top-Malware im November: Infostealer Formbook bleibt Nummer 1

Sein Anteil an allen Infektionen steigt in Deutschland auf 18,5 Prozent. Das Botnet Androxgh0st integriert…

7 Tagen ago

Google schließt schwerwiegende Sicherheitslücken in Chrome

Betroffen sind Chrome 131 und früher für Windows, macOS und Linux. Angreifer können unter Umständen…

1 Woche ago