ASCII- und andere Codierungstabellen

ASCII-Tabelle

Hexadezimale Nummerierung (Beispiel: A = 41h, dezimal 65)

Code    0   1   2   3   4   5   6   7   8   9   A   B   C   D   E   F
----------------------------------------------------------------------
0x     NUL SOH STX ETX EOT ENQ ACK BEL BS  HT  LF  VT  FF  CR  SO  SI
1x     DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM  SUB ESC FS  GS  RS  US
2x     SP   !   "   #   $   %   &   '   (   )   *   +   ,   -   .   /
3x      0   1   2   3   4   5   6   7   8   9   :   ;   <   =   >   ?
4x      @   A   B   C   D   E   F   G   H   I   J   K   L   M   N   O
5x      P   Q   R   S   T   U   V   W   X   Y   Z   [   \   ]   ^   _
6x      `   a   b   c   d   e   f   g   h   i   j   k   l   m   n   o
7x      p   q   r   s   t   u   v   w   x   y   z   {   |   }   ~  DEL

ISO-8859-1

Oder auch ISO Latin 1. Ist ASCII mit 96 weiteren Symbolen:

Code    0   1   2   3   4   5   6   7   8   9   A   B   C   D   E   F
----------------------------------------------------------------------
0x
1x
2x      SP  !   "   #   $   %   &   '   (   )   *   +   ,   -   .   /
3x      0   1   2   3   4   5   6   7   8   9   :   ;   <   =   >   ?
4x      @   A   B   C   D   E   F   G   H   I   J   K   L   M   N   O
5x      P   Q   R   S   T   U   V   W   X   Y   Z   [   \   ]   ^   _
6x      `   a   b   c   d   e   f   g   h   i   j   k   l   m   n   o
7x      p   q   r   s   t   u   v   w   x   y   z   {   |   }   ~
8x
9x
Ax    NBSP  ¡   ¢   £   ¤   ¥   ¦   §   ¨   ©   ª   «   ¬  SHY  ®   ¯
Bx      °   ±   ²   ³   ´   µ   ¶   ·   ¸   ¹   º   »   ¼   ½   ¾   ¿
Cx      À   Á   Â   Ã   Ä   Å   Æ   Ç   È   É   Ê   Ë   Ì   Í   Î   Ï
Dx      Ð   Ñ   Ò   Ó   Ô   Õ   Ö   ×   Ø   Ù   Ú   Û   Ü   Ý   Þ   ß
Ex      à   á   â   ã   ä   å   æ   ç   è   é   ê   ë   ì   í   î   ï
Fx      ð   ñ   ò   ó   ô   õ   ö   ÷   ø   ù   ú   û   ü   ý   þ   ÿ

Windows-1252

Windows fügt 27 weitere Symbole hinzu, um CP1252 zu erzeugen. Dies ist so ziemlich das Beste, was man tun kann, um Text in einzelnen Bytes darzustellen, da nicht viel Platz übrig ist, um weitere Symbole hinzuzufügen:

Code    0   1   2   3   4   5   6   7   8   9   A   B   C   D   E   F
----------------------------------------------------------------------
0x     NUL SOH STX ETX EOT ENQ ACK BEL BS  HT  LF  VT  FF  CR  SO  SI
1x     DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM  SUB ESC FS  GS  RS  US
2x      SP  !   "   #   $   %   &   '   (   )   *   +   ,   -   .   /
3x      0   1   2   3   4   5   6   7   8   9   :   ;   <   =   >   ?
4x      @   A   B   C   D   E   F   G   H   I   J   K   L   M   N   O
5x      P   Q   R   S   T   U   V   W   X   Y   Z   [   \   ]   ^   _
6x      `   a   b   c   d   e   f   g   h   i   j   k   l   m   n   o
7x      p   q   r   s   t   u   v   w   x   y   z   {   |   }   ~   DEL
8x      €       ‚   ƒ   „   x   †   ‡   ˆ   ‰   Š   ‹   Œ       Ž
9x          ‘   ’   “   ”   •   –   —   ˜   ™   š   ›   œ       ž   Ÿ
Ax    NBSP  ¡   ¢   £   ¤   ¥   ¦   §   ¨   ©   ª   «   ¬  SHY  ®   ¯
Bx      °   ±   ²   ³   ´   µ   ¶   ·   ¸   ¹   º   »   ¼   ½   ¾   ¿
Cx      À   Á   Â   Ã   Ä   Å   Æ   Ç   È   É   Ê   Ë   Ì   Í   Î   Ï
Dx      Ð   Ñ   Ò   Ó   Ô   Õ   Ö   ×   Ø   Ù   Ú   Û   Ü   Ý   Þ   ß
Ex      à   á   â   ã   ä   å   æ   ç   è   é   ê   ë   ì   í   î   ï
Fx      ð   ñ   ò   ó   ô   õ   ö   ÷   ø   ù   ú   û   ü   ý   þ   ÿ

Unicode

  • Jedes Zeichen hat einen Code-Point (U+-Präfix, gefolgt von 4, 5 oder 6 Ziffern), und einen eindeutigen Namen (immer in Uppercase-ASCII, beispielsweise U+2602 UMBRELLA).

  • 1.1 Millionen Code-Points möglich, davon 140’000 vergeben.

  • Encoding: Mapping eines Code-Point auf Bytes. Populäre Encoding-Methode: UTF-8.

  • UTF-8: Variable Byte-Länge für jeden Code-Point. Je grösser der Code-Point-Wert, desto mehr Bytes werden beansprucht (max. 6). ASCII-Zeichen sind immer 1 Byte gross, damit bleibt ASCII ein Subset von UTF-8 (Kompatibilität).

  • Codec: Kurzform für Coder/Decoder

  • Linuxfabrik in Unicode: Ḻїηυ✖ḟαßяḯḱ

  • Unicode-Website: https://home.unicode.org/

Built on 2022-06-03