ISO-5589-5 - UTF-8
Hinweise zum Erstellen von HTML-Seiten in
kyrillischer (russischer) Schrift unter Windows 9x:
- Es kann zunächst nötig sein, auf dem
eigenen PC die kyrillische
Sprachenunterstützung zu installieren:
Start | Einstellungen | Systemsteuerung | Software |
Windows Setup | Sprachenunterstützung | Details |
Kyrillisch
Sonst ist der Browser evtl. nicht in der Lage,
kyrillische Schrift darzustellen (das gilt auch für
diese Seite).
- Man muß sich für eine kyrillische
Zeichenkodierung entscheiden. Davon gibt es mehrere:
Die Kodierung ISO-8859-5 wird als besonders
zuverlässig angesehen, weil sie
plattformunabhängig ist. Es sind aber auch
Windows-1251 und KOI8-R verbreitet. Außerdem gibt
es noch UTF-8 (dazu unten mehr).
-
Um die Zeichenkodierung zu definieren, gibt es zwei
Möglichkeiten: Auf einem Apache-Webserver kann man
eine Textdatei namens .htaccess anlegen, in der
alle benötigten Kodierungen mit bestimmten
Dateinamenerweiterungen verknüpft werden:
AddType text/html;charset=iso-8859-1 html
AddType text/html;charset=windows-1251 html1
AddType text/html;charset=iso-8859-5 html5
AddType text/html;charset=utf-8 html8
Das bedeutet freilich, daß in diesem Beispiel die
russischen Webseiten mit der Zeichenkodierung
ISO-8859-5 immer den Dateinamen "*.html5" haben
müssen, da "*.html" an die westeuropäischen
Kodierung ISO-8859-1 vergeben ist.
-
Alternativ oder besser zusätzlich dazu kann man
jeder russischen HTML-Seite im Header einen
Meta-Tag geben, der im Browser die jeweilige
Zeichenkodierung einstellt. Zwei Beispiele:
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; CHARSET=windows-1251">
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; CHARSET=iso-8859-5">
- Die kyrillischen Zeichen werden im HTML-Quelltext mit
lateinischen Sonderzeichen codiert, die auf einer
deutschen Tastatur z.T. nur mit Alt + Num eingegeben
werden können. Um
"Россия" zu
erhalten, muß man also (bei Windows-1251)
"Ðîññèÿ"
eintippen bzw. bei gedrückter Alt-Taste über
den Zahlenblock die entsprechende Nummer eingeben.
Zeichentabelle für
ISO-8859-5
Zeichentabelle für
KOI8-R
Zeichentabelle für
Windows-1251
- Für längere Texte ist diese Methode
allerdings zu mühsam; daher lohnt es sich, das
russische Tastaturlayout zu installieren (siehe unten)
oder einen Tastaturmanager zu verwenden, z.B. Keys
von Péter
Szászvári. (Weitere Möglichkeiten
der "Russifizierung" des eigenen PCs erklärt
ausführlich Wolfgang
Kirsch.)
- Eine Kombination von lateinischer und kyrillischer
Schrift auf einer Seite ist mit ISO-8859-5 (diese
Seite) oder Windows-1251 zwar prinzipiell möglich.
Alle lateinischen Sonderzeichen, die erhalten bleiben
sollen (z.B. ä ö ü ß é
ç) müssen dann mit entsprechenden
HTML-Kodes maskiert werden (ä ö
ü ß é ç usw.).
Netscape
Navigator bis Version 4.x zeigt die Sonderzeichen allerdings trotz
Maskierung nicht an. Eine Alternative wäre,
auf solche Zeichen ganz zu verzichten (stattdessen: ae oe
ue ss e c).
-
Eine bessere mehrsprachige Lösung bietet
die Verwendung der multilingualen
Unicode-Zeichenkodierung UTF-8 (diese Seite in UTF-8). Damit kann
man die verschiedensten Sprachen und Schriftzeichen
kombinieren. Unter Start | Einstellungen |
Systemsteuerung | Tastatur | Sprache werden dazu die
benötigten Tastaturlayouts installiert, zwischen
denen man dann über ein Sprachsymbol in der
Taskleiste wechseln kann. Zum Schreiben verwendet man
einen UTF-8-fähigen HTML-Editor (z.B. Frontpage
Express oder Netscape Composer) oder einen
Unicode-Editor (z.B.
SC UniPad oder für kurze Texte Jukka
Korpelas gwrite). Header-Angabe:
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; CHARSET=utf-8">
Näheres bei
Paul Gorodyansky, wo man auch ein "phonetisches"
russisches Tastaturlayout bekommt, das sich mit einer
deutschen Tastatur leichter bedienen läßt
als die originale Version. Bei Alan J.
Flavell kann man sich umfassend über
Möglichkeiten und Probleme der
Internationalisierung informieren.
- Will man einen bereits vorhandenen russischen Text im
DOC- oder RTF-Format in eine Webseite umwandeln,
geht man am besten so vor: den Text mit Word im
Write-Format (*.wri) speichern; diese Datei mit Write
oder einem Editor öffnen und als Textdatei (*.txt)
speichern; den Inhalt der Textdatei in das
HTML-Gerüst kopieren. (Eine direkte Konvertierung
von Word nach HTML ist zwar möglich, führt aber
zu einer falschen Kodierung.) Das Ergebnis dieser Methode
ist zwangsläufig eine Webseite mit der Kodierung
Windows-1251. Mit dem Unicode-Editor SC UniPad kann man man die
Seite jedoch leicht in eine andere Zeichenkodierung
konvertieren.
- Die fertigen russischen Seiten werden wie gewohnt
gespeichert (ohne Sonderzeichen im Dateinamen) und
anschließend ganz normal auf den Server geladen. Siehe auch Tips für den
Upload.
Wie das dann aussehen kann, zeigen z.B. unsere
russischen Seiten über das Kriegsgefangenenlager
Stalag VII A (ISO-5589-5 und Windows-1251). Sie sollten
mit dem Internet Explorer, mit dem Netscape
Navigator und mit Opera ab Version 6 funktionieren.
|