Kodierung

Die Zeichenkodierung ist wichtig, damit ein Text korrekt dargestellt wird. Beim Erstellen eines Dokuments wird dabei immer eine Kodierung angegeben, damit die enthaltenen Zeichen so dargestellt werden, wie gewünscht. Ein Indiz für eine falsche Kodierung sind Sonderzeichen wie Fragezeichen, Ringe oder Kästchen an Stellen, wo sie nicht hingehören. 

Erst stellt sich die Frage, welche Zeichen man verwenden will. Die Sammlung dieser Zeichen nennt man Zeichensatz. Dieser Zeichensatz wird dann kodiert, indem jedem Zeichen ein Wert zugeordnet wird, um es korrekt zu interpretieren und darzustellen. 

Man darf nicht vergessen, dass Textdokumente nicht in den Zeichen selbst gespeichert werden, sondern für Computer nur Folgen von 0en und 1en sind. Um diese Folgen in die Schriftzeichen umzuwandeln, die wir auf dem Bildschirm sehen, gibt es Kodierungen. Das sind die Tabellen mit den Werten eines Zeichensatzes.

Es gibt allerdings verschiedene Zeichensätze (je nachdem, welche Zeichen man verwenden will) und Kodierungen.

Bekannte Kodierungen sind beispielsweise ASCII (American Standard Code for Information Interchange). Diese Kodierung benötigt verschiedene Erweiterungen für die unterschiedlichen Schriftsysteme (z.B. Griechisch, Kyrillisch usw.)

Eine wichtige Kodierung ist UTF-8. Sie wird für den Zeichensatz Unicode verwendet. Dies ist häufig die beste Kodierung, da sie fast alle Zeichen enthält. In den gängigen Textverarbeitungsprogrammen wie MS Office Word oder LibreOffice Writer usw. ist diese Kodierung bereits voreingestellt. Sie kann aber auch geändert werden. (In MS Word: Im Menü Speichern unter.. findet sich unter dem Punkt Tools der Punkt "Weboptionen". Unter dem Reiter "Codierung" finden Sie die verschiedenen Kodierungs-Möglichkeiten. 

Auch bei den meisten Texteditoren kann auf ähnliche Weise die Kodierung eingestellt oder geändert werden. 

Von anderen Kodierungen ist eher abzuraten, da für die Archivierung eine möglichst hohe Interoperabilität und lange Lesbarkeit gewünscht ist, die durch andere Kodierungen weniger gewährleistet ist. 

Bei W3C (World Wide Web Consortium) findet sich eine Liste mit Kodierungen, die auf jeden Fall vermieden werden sollten (https://www.w3.org/International/questions/qa-choosing-encodings#avoid)