KOI8-R

KOI8-R

KOI8-R ist eine 8-Bit-Zeichenkodierung des kyrillischen Alphabets, wie es für die russische Sprache benutzt wird.

KOI8-R ist eine Übermenge von ASCII und enthält somit auch die 26 Buchstaben des lateinischen Alphabets. Die Kodierung kann auch für Bulgarisch benutzt werden, während für Ukrainisch eine verwandte Zeichenkodierung KOI8-U entworfen wurde, die vier zusätzlich erforderliche Codes enthält.

KOI8 ist vermutlich weiter verbreitet als ISO 8859-5, das nie besondere Beachtung fand. Die am weitesten verbreitete 8-Bit-Kodierung für Russisch dürfte aber Microsoft Windows Codepage 1251 sein.

KOI8 ist die russische Abkürzung für „Kod Obmena Informazijei, 8 bit“ (Код Обмена Информацией, 8 бит), übersetzt „Code für Informationsaustausch, 8 Bit“.

KOI8-R ist beschrieben in RFC 1489 und ist IANA-registriert und für MIME zugelassen.

Die KOI8-Zeichenkodierungen sind so entworfen, dass die kyrillischen Buchstaben nicht in ihrer natürlichen alphabetischen Ordnung angeordnet sind, sondern in der alphabetischen Ordnung der lateinischen Buchstaben, die sich bei einer (groben) Transliteration ergeben. Damit ergibt sich die interessante Eigenschaft, dass beim Weglassen des achten Bits kyrillischer Text als lateinische Transliteration (mit Mühe) lesbar bleibt. Dabei wurde die Zuordnung so gewählt, dass Groß- und Kleinbuchstaben vertauscht werden. Zum Beispiel wird aus Русский Текст bei Weglassen des MSB rUSSKIJ tEKST.

Diese Eigenschaft ist heute kaum mehr als eine historische Kuriosität, da es fast keine Übertragungswege mehr gibt, die nicht 8-bit clean sind und weil andererseits die „automatische“ Transliteration einer echten Transliteration gegenüber minderwertig ist.

Tabelle

KOI8-R
x0 x1 x2 x3 x4 x5 x6 x7 x8 x9 xA xB xC xD xE xF
0x nicht belegt
1x
2x SP ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z [ \ ] ^ _
6x ` a b c d e f g h i j k l m n o
7x p q r s t u v w x y z { | } ~
8x
9x NBSP ° ² · ÷
Ax ё
Bx Ё ©
Cx ю а б ц д е ф г х и й к л м н о
Dx п я р с т у ж в ь ы з ш э щ ч ъ
Ex Ю А Б Ц Д Е Ф Г Х И Й К Л М Н О
Fx П Я Р С Т У Ж В Ь Ы З Ш Э Щ Ч Ъ

Während gemäß RFC 1489 0x95 Unicode U+2219 (∙) sein soll, wird es wegen der Kompatibilität mit Codepage 1251 oft in U+2022 (•) umgesetzt.

Siehe auch

Weblinks


Wikimedia Foundation.

Игры ⚽ Нужен реферат?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • KOI8-R — is an 8 bit character encoding, designed to cover Russian, which uses the Cyrillic alphabet. It also happens to cover Bulgarian. A derivative encoding is KOI8 U, which adds Ukrainian characters. The original KOI 8 encoding was designed by Soviet… …   Wikipedia

  • KOI8-U — (Код Обмена Информацией, 8 бит KOI8) est un encodage 8 bits créé pour l ukrainien, qui utilise l alphabet cyrillique. KOI8 U est basé sur KOI8 R, qui couvre le russe et le bulgare, ajoutant ou remplaçant 8 caractères : Ґ, Є, І et Ї, en… …   Wikipédia en Français

  • Koi8-u — (Код Обмена Информацией, 8 бит KOI8) est un encodage 8 bits créé pour l ukrainien, qui utilise l alphabet cyrillique. KOI8 U est basé sur KOI8 R, qui couvre le russe et le bulgare, ajoutant ou remplacant 8 caractères : Ґ, Є, І et Ї, en… …   Wikipédia en Français

  • KOI8-U — is an 8 bit character encoding, designed to cover Ukrainian, which uses the Cyrillic alphabet. It is based on KOI8 R, which covers Russian and Bulgarian, but replaces eight graphic characters with four Ukrainian letters Ґ, Є, І, and Ї in both… …   Wikipedia

  • KOI8-R — es una codificación de caracteres de 8 bits, diseñado para el idioma ruso,para el uso del alfabeto cirílico. También sirve para el idioma búlgaro. Una derivación de esta codificación es el KOI8 U, el cual agrega caracteres para el idioma… …   Wikipedia Español

  • KOI8-U — ist ein Zeichensatz, der für die Zeichenkodierung des kyrillischen Alphabetes für die ukrainische Sprache in Computersystemen benutzt wird und verwendet nur ein einzelnes Byte zur Kodierung. KOI8 U ist eine Übermenge von ASCII und enthält somit… …   Deutsch Wikipedia

  • KOI8-R — (Код Обмена Информацией, 8 бит) est une page de code, conçue pour représenter les lettres cyrilliques (russe, par exemple). La RFC adéquate est RFC 1489. Il y a aussi une description GOST 19768 74. Le codage KOI8 R est vu comme le standard de… …   Wikipédia en Français

  • Koi8-r — (Код Обмена Информацией, 8 бит) est une page de code, conçue pour représenter les lettres cyrilliques (russe, par exemple). La RFC adéquate est RFC 1489. Il y a aussi une description GOST 19768 74. Le codage KOI8 R est vu comme le standard de… …   Wikipédia en Français

  • KOI8 — …   Википедия

  • KOI8-R — …   Википедия

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”