ASCII- und andere Codierungstabellen
Siehe auch
ASCII-Tabelle
Hexadezimale Nummerierung (Beispiel: A = 41h, dezimal 65)
Code 0 1 2 3 4 5 6 7 8 9 A B C D E F
----------------------------------------------------------------------
0x NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO SI
1x DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US
2x SP ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z [ \ ] ^ _
6x ` a b c d e f g h i j k l m n o
7x p q r s t u v w x y z { | } ~ DEL
ISO-8859-1
Oder auch ISO Latin 1. Ist ASCII mit 96 weiteren Symbolen:
Code 0 1 2 3 4 5 6 7 8 9 A B C D E F
----------------------------------------------------------------------
0x
1x
2x SP ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z [ \ ] ^ _
6x ` a b c d e f g h i j k l m n o
7x p q r s t u v w x y z { | } ~
8x
9x
Ax NBSP ¡ ¢ £ ¤ ¥ ¦ § ¨ © ª « ¬ SHY ® ¯
Bx ° ± ² ³ ´ µ ¶ · ¸ ¹ º » ¼ ½ ¾ ¿
Cx À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï
Dx Ð Ñ Ò Ó Ô Õ Ö × Ø Ù Ú Û Ü Ý Þ ß
Ex à á â ã ä å æ ç è é ê ë ì í î ï
Fx ð ñ ò ó ô õ ö ÷ ø ù ú û ü ý þ ÿ
Windows-1252
Windows fügt 27 weitere Symbole hinzu, um CP1252 zu erzeugen. Dies ist so ziemlich das Beste, was man tun kann, um Text in einzelnen Bytes darzustellen, da nicht viel Platz übrig ist, um weitere Symbole hinzuzufügen:
Code 0 1 2 3 4 5 6 7 8 9 A B C D E F
----------------------------------------------------------------------
0x NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO SI
1x DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US
2x SP ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z [ \ ] ^ _
6x ` a b c d e f g h i j k l m n o
7x p q r s t u v w x y z { | } ~ DEL
8x € ‚ ƒ „ x † ‡ ˆ ‰ Š ‹ Œ Ž
9x ‘ ’ “ ” • – — ˜ ™ š › œ ž Ÿ
Ax NBSP ¡ ¢ £ ¤ ¥ ¦ § ¨ © ª « ¬ SHY ® ¯
Bx ° ± ² ³ ´ µ ¶ · ¸ ¹ º » ¼ ½ ¾ ¿
Cx À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï
Dx Ð Ñ Ò Ó Ô Õ Ö × Ø Ù Ú Û Ü Ý Þ ß
Ex à á â ã ä å æ ç è é ê ë ì í î ï
Fx ð ñ ò ó ô õ ö ÷ ø ù ú û ü ý þ ÿ
Unicode
Jedes Zeichen hat einen Code-Point (
U+
-Präfix, gefolgt von 4, 5 oder 6 Ziffern), und einen eindeutigen Namen (immer in Uppercase-ASCII, beispielsweiseU+2602 UMBRELLA
).1.1 Millionen Code-Points möglich, davon 140’000 vergeben.
Encoding: Mapping eines Code-Point auf Bytes. Populäre Encoding-Methode: UTF-8.
UTF-8: Variable Byte-Länge für jeden Code-Point. Je grösser der Code-Point-Wert, desto mehr Bytes werden beansprucht (max. 6). ASCII-Zeichen sind immer 1 Byte gross, damit bleibt ASCII ein Subset von UTF-8 (Kompatibilität).
Codec: Kurzform für Coder/Decoder
Linuxfabrik in Unicode: Ḻїηυ✖ḟαßяḯḱ
Unicode-Website: https://home.unicode.org/
Built on 2024-11-18