ISO/IEC 8859-1

ISO 8859
-1	Latin-1, Westeuropäisch
-2	Latin-2, Mitteleuropäisch
-3	Latin-3, Südeuropäisch
-4	Latin-4, Baltisch
-5	Kyrillisch
-6	Arabisch
-7	Griechisch
-8	Hebräisch
-9	Latin-5, Türkisch
-10	Latin-6, Nordisch
-11	Thai
-13	Latin-7, Baltisch
-14	Latin-8, Keltisch
-15	Latin-9, Westeuropäisch
-16	Latin-10, Südosteuropäisch

ISO 8859-1, genauer ISO/IEC 8859-1, ist ein von der ISO zuletzt 1998 aktualisierter Standard für die Informationstechnik zur Zeichenkodierung mit acht Bit und der erste Teil der Normenfamilie ISO/IEC 8859.

Die mit sieben Bit kodierbaren Zeichen entsprechen US-ASCII mit führendem Nullbit. Zusätzlich zu den 95 darstellbaren ASCII-Zeichen (20₁₆–7E₁₆) kodiert ISO 8859-1 96 weitere (A0₁₆–FF₁₆), also insgesamt 191 von theoretisch möglichen 256 (= 2⁸). Den Positionen 00₁₆–1F₁₆ und 7F₁₆–9F₁₆ sind in ISO/IEC 8859 und damit ISO/IEC 8859-1 keine Zeichen zugewiesen. ISO-8859-1 (zu beachten ist der Bindestrich zwischen „ISO“ und „8859“) jedoch besetzt alle diese Stellen mit nicht darstellbaren Steuerzeichen.

ISO(-)8859-1 versucht möglichst viele Sonderzeichen westeuropäischer Sprachen abzudecken. Da zur Vollständigkeit neben dem Eurosymbol vor allem für Französisch einige Zeichen fehlen, wurde ISO/IEC 8859-15 geschaffen.

Windows-1252 Westeuropäisch (Western European) ist eine 8-Bit-Zeichenkodierung des Microsoft-Betriebssystems Windows, die die meisten westeuropäischen Sprachen unterstützt. Sie baut auf ISO 8859-1 und ISO 8859-15 auf.

Geschichte

ISO 8859-1 basiert auf dem DEC Multinational Character Set, das von der Digital Equipment Corporation im Terminal VT220 verwendet wurde. Es wurde ursprünglich von der European Computer Manufacturers Association (ECMA) entwickelt und im März 1985 als ECMA-94 veröffentlicht. Die zweite Auflage von ECMA-94 enthielt außerdem ISO 8859-2, ISO 8859-3 und ISO 8859-4 als Teil der Spezifikation.^[1]

Tabellen

ISO/IEC 8859-1

Code	…0	…1	…2	…3	…4	…5	…6	…7	…8	…9	…A	…B	…C	…D	…E	…F
0…	nicht belegt
1…	nicht belegt
2…	SP	!	"	#	$	%	&	'	(	)	*	+	,	-	.	/
3…	0	1	2	3	4	5	6	7	8	9	:	;	<	=	>	?
4…	@	A	B	C	D	E	F	G	H	I	J	K	L	M	N	O
5…	P	Q	R	S	T	U	V	W	X	Y	Z	[	\	]	^	_
6…	`	a	b	c	d	e	f	g	h	i	j	k	l	m	n	o
7…	p	q	r	s	t	u	v	w	x	y	z	{	\|	}	~
8…	nicht belegt
9…	nicht belegt
A…	NBSP	¡	¢	£	¤	¥	¦	§	¨	©	ª	«	¬	SHY	®	¯
B…	°	±	²	³	´	µ	¶	·	¸	¹	º	»	¼	½	¾	¿
C…	À	Á	Â	Ã	Ä	Å	Æ	Ç	È	É	Ê	Ë	Ì	Í	Î	Ï
D…	Ð	Ñ	Ò	Ó	Ô	Õ	Ö	×	Ø	Ù	Ú	Û	Ü	Ý	Þ	ß
E…	à	á	â	ã	ä	å	æ	ç	è	é	ê	ë	ì	í	î	ï
F…	ð	ñ	ò	ó	ô	õ	ö	÷	ø	ù	ú	û	ü	ý	þ	ÿ

SP (20₁₆, „space“) ist das Leerzeichen, NBSP (A0₁₆, „non-breaking space“) das feste Leerzeichen und an AD₁₆ ist der bedingte Trennstrich (SHY, „soft hyphen“), der normalerweise nur am Zeilenende sichtbar ist.

ISO-8859-1

Code	…0	…1	…2	…3	…4	…5	…6	…7	…8	…9	…A	…B	…C	…D	…E	…F
0…	NUL	SOH	STX	ETX	EOT	ENQ	ACK	BEL	BS	HT	LF	VT	FF	CR	SO	SI
1…	DLE	DC1	DC2	DC3	DC4	NAK	SYN	ETB	CAN	EM	SUB	ESC	FS	GS	RS	US
2…	wie ISO/IEC 8859, Windows-125X und US-ASCII
3…
4…
5…
6…
7…	wie ISO/IEC 8859, Windows-125X und US-ASCII															DEL
8…	PAD	HOP	BPH	NBH	IND	NEL	SSA	ESA	HTS	HTJ	VTS	PLD	PLU	RI	SS2	SS3
9…	DCS	PU1	PU2	STS	CCH	MW	SPA	EPA	SOS	SGCI	SCI	CSI	ST	OSC	PM	APC
A…	wie ISO/IEC 8859-1 und Windows-1252
B…
C…
D…
E…
F…

Die IANA hat folgende gleichwertige großschreibungsunabhängige Bezeichnungen für diese Codetabelle registriert:

ISO_8859-1:1987
ISO_8859-1
ISO-8859-1
ISO-IR-100
csISOLatin1
latin1
l1
IBM819
CP819

Windows-1252

Windows-Codepages
874	Thai
932	Japanisch
936	Vereinfachtes Chinesisch
949	Koreanisch
950	Traditionelles Chinesisch
1250	Mitteleuropäisch
1251	Kyrillisch
1252	Westeuropäisch
1253	Griechisch
1254	Türkisch
1255	Hebräisch
1256	Arabisch
1257	Baltisch
1258	Vietnamesisch

Windows-1252 wird als Westeuropäisch (Western European) bezeichnet.

Sie weicht von ISO-8859-1 im Bereich 80₁₆–9F₁₆ ab, dessen 32 Positionen hier 27 darstellbare Zeichen beinhalten, u. a. die in ISO 8859-15 hinzugekommenen und einige für bessere Typographie notwendige Zeichen. Die Unterschiede zwischen all diesen Kodierungen sowie generell mangelnde Konsequenz bei der Unterstützung verschiedener Zeichensätze sind ein häufiges Interoperabilitätsproblem.

Code	…0	…1	…2	…3	…4	…5	…6	…7	…8	…9	…A	…B	…C	…E	…F
0…	wie ISO-8859-1 und US-ASCII
1…	wie ISO-8859-1 und US-ASCII
2…	wie ISO/IEC 8859, ISO-8859-1 und US-ASCII
3…
4…
5…
6…
7…	wie ISO-8859-1 und US-ASCII
8…	€		‚	ƒ	„	…	†	‡	ˆ	‰	Š	‹	Œ	Ž
9…		‘	’	“	”	•	–	—	˜	™	š	›	œ	ž	Ÿ
A…	wie ISO/IEC 8859-1 und ISO-8859-1
B…
C…
D…
E…
F…

Windows-1252 ist ebenfalls bei der IANA registriert und akzeptiert u. a. „CP1252“ als Synonym.^[2]

siehe auch Windows-1250 Mitteleuropäisch (Central European), ISO-8859-2

ISO 8859-1 vs. ISO 8859-15 vs. Windows-1252

Unterschiede zwischen ISO 8859-1, ISO 8859-15 und Windows-1252
Zeichen	€	Š	š	Ž	ž	Œ	œ	Ÿ	¤	¦	¨	´	¸	¼	½	¾
ISO 8859-1	–	–	–	–	–	–	–	–	A4	A6	A8	B4	B8	BC	BD	BE
ISO 8859-15	A4	A6	A8	B4	B8	BC	BD	BE	–	–	–	–	–	–	–	–
Windows-1252	80	8A	9A	8E	9E	8C	9C	9F	A4	A6	A8	B4	B8	BC	BD	BE

Verwendung

ISO 8859-1 ist neben US-ASCII und UTF-8 (einer Unicode-Kodierung) die wohl wichtigste und am häufigsten gebrauchte Kodierung.

Für mindestens folgende Sprachen reicht ISO 8859-1 aus:

Afrikaans (È/è, É/é, Ê/ê, Ë/ë, Î/î, Ï/ï, Ô/ô, Û/û),
Albanisch (Ç/ç, Ë/ë),
Baskisch (Ñ/ñ),
Dänisch (Å/å, Æ/æ, Ø/ø),
Deutsch (Ä/ä, Ö/ö, Ü/ü, ß, in Fremdwörtern: É/é, nicht Euro-Symbol und ggf. ſ),
Englisch (£, ¢; veraltend: Æ/æ, ä, ë, ï, ö, ü, nicht Œ/œ),
Färöisch (Á/á, Ð/ð, Í/í, Ó/ó, Ú/ú, Ý/ý, Æ/æ, Ø/ø),
Finnisch (Ä/ä, Ö/ö, in Fremdwörtern: Å/å, nicht Š/š, Ž/ž),
Französisch (Æ/æ, À/à, Â/â, È/è, É/é, Ê/ê, Ë/ë, Î/î, Ï/ï, Ô/ô, Ù/ù, Û/û, Ç/ç, Ü/ü, ÿ, nicht Œ/œ, Ÿ),
Irisches Gälisch, neue Orthographie (Á/á, É/é, Í/í, Ó/ó, Ú/ú),
Isländisch (Á/á, Ð/ð, É/é, Í/í, Ó/ó, Ú/ú, Ý/ý, Þ/þ, Æ/æ, Ö/ö),
Italienisch (À/à, È/è, É/é, Ò/ò, Ù/ù),
Katalanisch (À/à, Ç/ç, È/è, É/é, Í/í, Ï/ï, Ò/ò, Ó/ó, Ú/ú, Ü/ü, nicht dagg. Ŀl/ŀl),
Niederländisch (nicht Ĳ/ĳ, aber ÿ),
Norwegisch, Bokmål und Nynorsk (Å/å, Æ/æ, Ø/ø, Ò/ò),
Portugiesisch inkl. Portugiesisch (Brasilien) (À/à, Á/á, Â/â, Ã/ã, Ç/ç, É/é, Ê/ê, Í/í, Ó/ó, Ô/ô, Õ/õ, Ú/ú, Ü/ü),
Rätoromanisch,
Schottisches Gälisch (À/à, È/è, Ì/ì, Ò/ò, Ù/ù)
Schwedisch (Å/å, Ä/ä, Ö/ö),
Spanisch (¡, ¿, ª, º, Á/á, É/é, Í/í, Ñ/ñ, Ó/ó, Ú/ú, Ü/ü, früher auch Ç/ç),
Swahili und
Wallonisch (Â/â, Å/å, Ç/ç, È/è, É/é, Ê/ê, Î/î, Ô/ô, Û/û).

Da dies heutzutage in Westeuropa, Amerika und Australien die am meisten verwendeten (Schrift-)Sprachen sind, ist es überall dort die dominierende Zeichenkodierung. Auch in Teilen Afrikas, in denen nicht die arabische Schrift verwendet wird, ist es weit verbreitet, obwohl oft einige Sonderzeichen fehlen, die aber auch in keiner anderen 8-Bit-Kodierung vorhanden sind, siehe z. B. pannigerianisches Alphabet.

Verwendung diakritischer Zeichen
Code	…0	…1	…2	…3	…4	…5	…6	…7	…8	…9	…A	…B	…C	…D	…E	…F
C…/E…	À/à	Á/á	Â/â	Ã/ã	Ä/ä	Å/å	Æ/æ	Ç/ç	È/è	É/é	Ê/ê	Ë/ë	Ì/ì	Í/í	Î/î	Ï/ï
C…/E…	fra, ita, cat, por, sco	fao, gle, isl, por, spa	fra, por, wln	por	deu, eng, fin, swe	dan, fin, nor, swe, wln	dan, eng, fao, fra, isl, nor	alb, fra, cat, por, wln	afr, fra, ita, cat, sco, wln	afr, fra, gle, isl, ita, cat, por, spa, wln	afr, fra, por, wln	afr, alb, eng, fra	sco	fao, fra, gle, isl, cat, por, spa	afr, wln	afr, eng, fra, cat
D…/F…	Ð/ð	Ñ/ñ	Ò/ò	Ó/ó	Ô/ô	Õ/õ	Ö/ö		Ø/ø	Ù/ù	Ú/ú	Û/û	Ü/ü	Ý/ý	Þ/þ	ß/ÿ
D…/F…	fao, isl	baq, spa	ita, cat, sco	fao, gle, isl, cat, por, spa	afr, fra, por, wln	por	deu, eng, fin, isl, swe		dan, fao, nor	fra, ita, sco	fao, gle, isl, cat, por, spa	afr, fra, wln	deu, eng, fra, cat, por, spa	fao, isl	isl	deu; fra, nld

Siehe auch

Einzelnachweise

↑ ECMA (Hrsg.): Standard ECMA-94: 8-Bit Single-Byte Coded Graphic Character Sets. 2. Auflage. Juni 1984 (online ; Stand: 4. Januar 2008).
↑ http://www.iana.org/assignments/charset-reg/windows-1252

Weblinks

Wikimedia Foundation.

Игры ⚽ Поможем решить контрольную работу

Schlagen Sie auch in anderen Wörterbüchern nach:

ISO/IEC 8859 — is a joint ISO and IEC standard for 8 bit character encodings for use by computers. The standard is divided into numbered, separately published parts, such as ISO/IEC 8859 1, ISO/IEC 8859 2, etc., each of which may be informally referred to as a… … Wikipedia
ISO/IEC 8859-1 — ISO 8859 1, more formally cited as ISO/IEC 8859 1 is part 1 of ISO/IEC 8859, a standard character encoding of the Latin alphabet. It is less formally referred to as Latin 1. It was originally developed by the ISO, but later jointly maintained by… … Wikipedia
ISO/IEC 8859-11 — ISO/IEC 8859 11:2001, Information technology 8 bit single byte coded graphic character sets Part 11: Latin/Thai alphabet, is part of the ISO/IEC 8859 series of ASCII based standard character encodings, first edition published in 2001. It is… … Wikipedia
ISO/IEC 8859-8 — ISO 8859 8, more formally cited as ISO/IEC 8859 8 (but not as Latin 8!), is part 8 of ISO/IEC 8859, a standard character encoding defined by ISO.ISO 8859 8 contains all the Hebrew letters (no Hebrew vowel signs). ISO 8859 8:1988, more commonly… … Wikipedia
ISO/IEC 8859-6 — ISO/IEC 8859 6:1999, Information technology 8 bit single byte coded graphic character sets Part 6: Latin/Arabic alphabet, is part of the ISO/IEC 8859 series of ASCII based standard character encodings, first edition published in 1987. It is… … Wikipedia
ISO/IEC 8859-15 — ISO 8859 15 is part 15 of ISO 8859, a standard character encoding defined by International Organization for Standardization. It is also known as Latin 9, and unofficially as Latin 0 but not as Latin 15. It is similar to ISO 8859 1 but replaces… … Wikipedia
ISO/IEC 8859-2 — ISO 8859 2, more formally cited as ISO/IEC 8859 2 or less formally as Latin 2, is part 2 of ISO/IEC 8859, a standard character encoding defined by ISO. It encodes what it refers to as Latin alphabet no. 2, consisting of 191 characters from the… … Wikipedia
ISO/IEC 8859-7 — ISO 8859 7, also known as Greek, is an 8 bit character encoding, part of the ISO 8859 standard. It was designed originally to cover the modern Greek language as well as mathematical symbols derived from the Greek.The original 1987 version of the… … Wikipedia
ISO/IEC 8859-13 — ISO 8859 13, also known as Latin 7 or Baltic Rim , is an 8 bit character encoding, part of the ISO 8859 standard. It was designed originally to cover the Baltic languages, and added characters missing from the earlier encodings ISO 8859 4 and ISO … Wikipedia
ISO/IEC 8859-16 — ISO 8859 16, also known as Latin 10 or South Eastern European , is an 8 bit character encoding, part of the ISO 8859 standard. It was designed to cover Albanian, Croatian, Hungarian, Polish, Romanian and Slovenian, but also French, German,… … Wikipedia

Academic dictionaries and encyclopedias

ISO/IEC 8859-1

Inhaltsverzeichnis

Geschichte

Tabellen

ISO/IEC 8859-1

ISO-8859-1

Windows-1252

ISO 8859-1 vs. ISO 8859-15 vs. Windows-1252

Verwendung

Siehe auch

Einzelnachweise

Weblinks

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Academic dictionaries and encyclopedias

Deutsch Wikipedia

ISO/IEC 8859-1

Inhaltsverzeichnis

Geschichte

Tabellen

ISO/IEC 8859-1

ISO-8859-1

Windows-1252

ISO 8859-1 vs. ISO 8859-15 vs. Windows-1252

Verwendung

Siehe auch

Einzelnachweise

Weblinks

Schlagen Sie auch in anderen Wörterbüchern nach:

Share the article and excerpts

Direct link