Thanks to visit codestin.com
Credit goes to developer.mozilla.org

Dieser Inhalt wurde automatisch aus dem Englischen übersetzt, und kann Fehler enthalten. Erfahre mehr über dieses Experiment.

View in English Always switch to English

UTF-8

UTF-8 (UCS Transformation Format 8) ist die am häufigsten verwendete Zeichenkodierung im World Wide Web. Jedes Zeichen wird durch ein bis vier Bytes dargestellt. UTF-8 ist rückwärtskompatibel mit ASCII und kann jedes standardisierte Unicode-Zeichen darstellen.

Die ersten 128 UTF-8-Zeichen entsprechen exakt den ersten 128 ASCII-Zeichen (nummeriert von 0-127), was bedeutet, dass vorhandener ASCII-Text bereits gültiges UTF-8 ist. Alle anderen Zeichen verwenden zwei bis vier Bytes. Jedes Byte hat einige Bits, die für Kodierungszwecke reserviert sind. Da Nicht-ASCII-Zeichen mehr als ein Byte für die Speicherung benötigen, besteht das Risiko, dass sie beschädigt werden, wenn die Bytes getrennt werden und nicht wieder kombiniert werden.

Siehe auch