Информационные технологии


Пример неправильно выбранной кодировки



бет2/3
Дата14.06.2023
өлшемі1.44 Mb.
#475054
түріЛекция
1   2   3

Пример неправильно выбранной кодировки


Windows-1251 (CP 1251)
КОИ-8R

Управляющие ASCII символы

Некоторые управляющие символы:

TAB, 09 - табуляция

LF, 0A - перевод строки

CR, 0D - возврат каретки

CR LF

Псевдографика

Для оформления программ и документов в текстовом режиме, используются псевдографические символы.

Псевдографика (ASCII)

Unicode

Unicodeстандарт кодирования символов.

Коду символа сопоставляется некоторое положительное целое число.

Для представления кода в компьютере используются форматы представления (UTF – Unicode transformation format): UTF-8, UTF-16, UTF-32

По стандарту Unicode первые 128 символов соответствуют ASCII.

Unicode

В первых версиях стандарта код символа представлялся двухбайтовым словом


8
8
2
16
=
65 536
В настоящее время стандарт Unicode обеспечивает кодирование 1 112 064 символов.

UTF-8

8-битный формат преобразования Unicode

Обеспечивает совместимость с ASCII.

Длина кода нефиксированная – от 1 до 4 байт

Пример декодирования символа для UTF-8


Символ

UTF-8 (hex)

Unicode (hex)

А

D090

1
1
0
1
0
0
0
0
1
0
0
1
0
0
0
0
1
0
0
0
0
0
1
0
0
0
0
0
1
4
0410

Кириллическая таблица Unicode


 

0

1



Достарыңызбен бөлісу:
1   2   3




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет