Moosburg Online: www.moosburg.org
Kyrillische Webseiten

ISO-5589-5 - UTF-8

Hinweise zum Erstellen von HTML-Seiten in kyrillischer (russischer) Schrift unter Windows 9x:

  • Es kann zunächst nötig sein, auf dem eigenen PC die kyrillische Sprachenunterstützung zu installieren:
    Start | Einstellungen | Systemsteuerung | Software | Windows Setup | Sprachenunterstützung | Details | Kyrillisch
    Sonst ist der Browser evtl. nicht in der Lage, kyrillische Schrift darzustellen (das gilt auch für diese Seite).

  • Man muß sich für eine kyrillische Zeichenkodierung entscheiden. Davon gibt es mehrere: Die Kodierung ISO-8859-5 wird als besonders zuverlässig angesehen, weil sie plattformunabhängig ist. Es sind aber auch Windows-1251 und KOI8-R verbreitet. Außerdem gibt es noch UTF-8 (dazu unten mehr).

  • Um die Zeichenkodierung zu definieren, gibt es zwei Möglichkeiten: Auf einem Apache-Webserver kann man eine Textdatei namens .htaccess anlegen, in der alle benötigten Kodierungen mit bestimmten Dateinamenerweiterungen verknüpft werden:
    AddType  text/html;charset=iso-8859-1    html
    AddType  text/html;charset=windows-1251  html1
    AddType  text/html;charset=iso-8859-5    html5
    AddType  text/html;charset=utf-8         html8
    
    
    Das bedeutet freilich, daß in diesem Beispiel die russischen Webseiten mit der Zeichenkodierung ISO-8859-5 immer den Dateinamen "*.html5" haben müssen, da "*.html" an die westeuropäischen Kodierung ISO-8859-1 vergeben ist.

  • Alternativ oder besser zusätzlich dazu kann man jeder russischen HTML-Seite im Header einen Meta-Tag geben, der im Browser die jeweilige Zeichenkodierung einstellt. Zwei Beispiele:
    <META HTTP-EQUIV="Content-Type" CONTENT="text/html; CHARSET=windows-1251">
    <META HTTP-EQUIV="Content-Type" CONTENT="text/html; CHARSET=iso-8859-5">
    
    
  • Die kyrillischen Zeichen werden im HTML-Quelltext mit lateinischen Sonderzeichen codiert, die auf einer deutschen Tastatur z.T. nur mit Alt + Num eingegeben werden können. Um "Россия" zu erhalten, muß man also (bei Windows-1251) "Ðîññèÿ" eintippen bzw. bei gedrückter Alt-Taste über den Zahlenblock die entsprechende Nummer eingeben.

    Zeichentabelle für ISO-8859-5
    Zeichentabelle für KOI8-R
    Zeichentabelle für Windows-1251

  • Für längere Texte ist diese Methode allerdings zu mühsam; daher lohnt es sich, das russische Tastaturlayout zu installieren (siehe unten) oder einen Tastaturmanager zu verwenden, z.B. Keys von Péter Szászvári. (Weitere Möglichkeiten der "Russifizierung" des eigenen PCs erklärt ausführlich Wolfgang Kirsch.)

  • Eine Kombination von lateinischer und kyrillischer Schrift auf einer Seite ist mit ISO-8859-5 (diese Seite) oder Windows-1251 zwar prinzipiell möglich. Alle lateinischen Sonderzeichen, die erhalten bleiben sollen (z.B. ä ö ü ß é ç) müssen dann mit entsprechenden HTML-Kodes maskiert werden (&auml; &ouml; &uuml; &szlig; &eacute; &ccedil; usw.). Netscape Navigator bis Version 4.x zeigt die Sonderzeichen allerdings trotz Maskierung nicht an. Eine Alternative wäre, auf solche Zeichen ganz zu verzichten (stattdessen: ae oe ue ss e c).

  • Eine bessere mehrsprachige Lösung bietet die Verwendung der multilingualen Unicode-Zeichenkodierung UTF-8 (diese Seite in UTF-8). Damit kann man die verschiedensten Sprachen und Schriftzeichen kombinieren. Unter Start | Einstellungen | Systemsteuerung | Tastatur | Sprache werden dazu die benötigten Tastaturlayouts installiert, zwischen denen man dann über ein Sprachsymbol in der Taskleiste wechseln kann. Zum Schreiben verwendet man einen UTF-8-fähigen HTML-Editor (z.B. Frontpage Express oder Netscape Composer) oder einen Unicode-Editor (z.B. SC UniPad oder für kurze Texte Jukka Korpelas gwrite). Header-Angabe:
    <META HTTP-EQUIV="Content-Type" CONTENT="text/html; CHARSET=utf-8">
    
    Näheres bei Paul Gorodyansky, wo man auch ein "phonetisches" russisches Tastaturlayout bekommt, das sich mit einer deutschen Tastatur leichter bedienen läßt als die originale Version. Bei Alan J. Flavell kann man sich umfassend über Möglichkeiten und Probleme der Internationalisierung informieren.

  • Will man einen bereits vorhandenen russischen Text im DOC- oder RTF-Format in eine Webseite umwandeln, geht man am besten so vor: den Text mit Word im Write-Format (*.wri) speichern; diese Datei mit Write oder einem Editor öffnen und als Textdatei (*.txt) speichern; den Inhalt der Textdatei in das HTML-Gerüst kopieren. (Eine direkte Konvertierung von Word nach HTML ist zwar möglich, führt aber zu einer falschen Kodierung.) Das Ergebnis dieser Methode ist zwangsläufig eine Webseite mit der Kodierung Windows-1251. Mit dem Unicode-Editor SC UniPad kann man man die Seite jedoch leicht in eine andere Zeichenkodierung konvertieren.

  • Die fertigen russischen Seiten werden wie gewohnt gespeichert (ohne Sonderzeichen im Dateinamen) und anschließend ganz normal auf den Server geladen. Siehe auch Tips für den Upload.

Wie das dann aussehen kann, zeigen z.B. unsere russischen Seiten über das Kriegsgefangenenlager Stalag VII A (ISO-5589-5 und Windows-1251). Sie sollten mit dem Internet Explorer, mit dem Netscape Navigator und mit Opera ab Version 6 funktionieren.


Bürgernetz Weihenstephan Moosburg Online Designzentrum
Zuletzt bearbeitet am 31.10.2006 von © Werner Schwarz (E-Mail) - Es gilt das Urheberrecht!