Windows-1251 (CP 1251)
КОИ-8R
Управляющие ASCII символы Некоторые управляющие символы: LF, 0A - перевод строки CR LF Псевдографика Для оформления программ и документов в текстовом режиме, используются псевдографические символы. Псевдографика (ASCII) Unicode Unicode – стандарт кодирования символов. Коду символа сопоставляется некоторое положительное целое число. Для представления кода в компьютере используются форматы представления (UTF – Unicode transformation format): UTF-8, UTF-16, UTF-32 По стандарту Unicode первые 128 символов соответствуют ASCII. Unicode В первых версиях стандарта код символа представлялся двухбайтовым словом
8
8
2
16
=
65 536
В настоящее время стандарт Unicode обеспечивает кодирование 1 112 064 символов.
UTF-8 8-битный формат преобразования Unicode Обеспечивает совместимость с ASCII. Длина кода нефиксированная – от 1 до 4 байт Пример декодирования символа для UTF-8
Символ
|
UTF-8 (hex)
|
Unicode (hex)
|
А
|
D090
| |
1
1
0
1
0
0
0
0
1
0
0
1
0
0
0
0
1
0
0
0
0
0
1
0
0
0
0
0
1
4
0410
Достарыңызбен бөлісу: |