Codepage 950

Codepage 950

Big5 ist eine Zeichenkodierung für traditionelle chinesische Schriftzeichen. Sie kodiert 13.062 chinesische Schriftzeichen (zwei Schriftzeichen sind allerdings doppelt kodiert) und ist bei weitem der am meisten benutzte Zeichensatz in der Republik China (Taiwan). Der Name Big5 leitet sich davon ab, dass dieser Standard von den fünf größten taiwanischen Computerherstellern gemeinsam entwickelt wurde.

Inhaltsverzeichnis

Geschichte

Bevor Big5 existierte, wurden in Taiwan verschiedene zueinander inkompatible Zeichensätze wie IBM 5550 verwendet. Big5 sollte diese Zeichensätze ablösen und wurde 1984 eingeführt.

Nach der Einführung fand Big5 große Verbreitung und wurde u. a. in veränderter Form in Windows als Codepage 950 eingeführt. Später wurde CNS 11643 eingeführt, um Big5 abzulösen, dieses Vorhaben scheiterte jedoch. Aufgrund dessen wurde Big5 selber 2003 zum offiziellen Standard Taiwans erklärt.

Außer in Taiwan wird Big5 in Hongkong und Macao verwendet, die ebenfalls Langzeichen benutzen.

Aufbau und Struktur

Big5 ist ein variabler 16-Bit-Zeichensatz. Die Zeichen im Bereich von 0x00-0x7F werden in 8 Bits kodiert und sind offiziell unbelegt, in der Praxis entsprechen diese Zeichen jedoch meist ASCII. Die Zeichen im Bereich 0x80-0xFE werden in 16 Bits kodiert, wobei das zweite Byte im Bereich 0x40-0x7E und 0xA1-0xFE liegt.

Big5 ist in mehrere Bereiche eingeteilt:

  • Der Bereich von 0x8140-0xA0FE ist reserviert für private Nutzung.
  • Der Bereich von 0xA140-0xA3FF kodiert Satzzeichen, das griechische Alphabet und Symbole.
  • Der Bereich von 0xA440-0xC67E kodiert chinesische Schriftzeichen, die zuerst nach Strichen und dann nach Radikal sortiert werden.
  • Der Bereich von 0xC6A1-0xC8FE ist reserviert für private Nutzung.
  • Der Bereich von 0xC940-0xF9D5 kodiert weitere chinesische Schriftzeichen, die ebenfalls zuerst nach Strichen und dann nach Radikal sortiert werden.
  • Der Bereich von 0xF9D6-0xFEFE ist reserviert für private Nutzung.

Erweiterungen

Da Big5 viele benötigte Zeichen fehlen, haben sowohl Unternehmen als auch staatliche Institute eigene Erweiterungen zu Big5 entwickelt.

E-Ten

E-Ten hat für ihr Betriebssystem einige Zeichen aus dem IBM 5550-Zeichensatz hinzugefügt:

  • Der Bereich 0xA3C0-0xA3E0 enthält Steuerzeichen.
  • Der Bereich 0xC6A1-0xC875 enthält eingekreiste und eingeklammerte Ziffern, Radikale, japanische Kana sowie die kyrillische Schrift.
  • Der Bereich 0xF9D6-0xF9FE enthält sieben zusätzliche chinesische Schriftzeichen sowie Rahmenzeichnung.

Microsoft

Microsoft hat für Windows die Codepage 950 erstellt, die praktisch identisch zu Big5 ist, aber zusätzlich die Zeichen aus dem Bereich 0xF9D6-0xF9FE der E-Ten-Erweiterungen sowie das Eurozeichen enthält.

HKSCS

Hongkong benutzt ebenfalls Big5. Da dieser Zeichensatz jedoch viele benötigte Zeichen für das Kantonesische nicht enthält, hat Hongkong den Hong Kong Supplementary Character Set entwickelt, der auf Big5 basiert, jedoch viele zusätzliche Schriftzeichen enthält.

Weblinks


Wikimedia Foundation.

Игры ⚽ Поможем написать курсовую

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Codepage 936 — Windows Codepages 874 Thai 932 Japanisch 936 Vereinfachtes Chinesisch 949 Koreanisch 950 Traditionelles Chinesisch 1250 Mitteleuropäisch 1251 Kyrillisch …   Deutsch Wikipedia

  • Codepage 1251 — Windows Codepages 874 Thai 932 Japanisch 936 Vereinfachtes Chinesisch 949 Koreanisch 950 Traditionelles Chinesisch 1250 Mitteleuropäisch 1251 Kyrillisch …   Deutsch Wikipedia

  • Codepage 1250 — Windows Codepages 874 Thai 932 Japanisch 936 Vereinfachtes Chinesisch 949 Koreanisch 950 Traditionelles Chinesisch 1250 Mitteleuropäisch 1251 Kyrillisch …   Deutsch Wikipedia

  • Codepage 1252 — ISO 8859 1 Latin 1, Westeuropäisch 2 Latin 2, Mitteleuropäisch 3 Latin 3, Südeuropäisch 4 Latin 4, Baltisch 5 Kyrillisch 6 Arabisch 7 Griechisch 8 …   Deutsch Wikipedia

  • Codepage 1253 — Windows Codepages 874 Thai 932 Japanisch 936 Vereinfachtes Chinesisch 949 Koreanisch 950 Traditionelles Chinesisch 1250 Mitteleuropäisch 1251 Kyrillisch …   Deutsch Wikipedia

  • Codepage 1254 — Windows Codepages 874 Thai 932 Japanisch 936 Vereinfachtes Chinesisch 949 Koreanisch 950 Traditionelles Chinesisch 1250 Mitteleuropäisch 1251 Kyrillisch …   Deutsch Wikipedia

  • Codepage 1255 — Windows Codepages 874 Thai 932 Japanisch 936 Vereinfachtes Chinesisch 949 Koreanisch 950 Traditionelles Chinesisch 1250 Mitteleuropäisch 1251 Kyrillisch …   Deutsch Wikipedia

  • Codepage 1256 — Windows Codepages 874 Thai 932 Japanisch 936 Vereinfachtes Chinesisch 949 Koreanisch 950 Traditionelles Chinesisch 1250 Mitteleuropäisch 1251 Kyrillisch …   Deutsch Wikipedia

  • Codepage 1257 — Windows Codepages 874 Thai 932 Japanisch 936 Vereinfachtes Chinesisch 949 Koreanisch 950 Traditionelles Chinesisch 1250 Mitteleuropäisch 1251 Kyrillisch …   Deutsch Wikipedia

  • Codepage 1258 — Windows Codepages 874 Thai 932 Japanisch 936 Vereinfachtes Chinesisch 949 Koreanisch 950 Traditionelles Chinesisch 1250 Mitteleuropäisch 1251 Kyrillisch …   Deutsch Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”