ГЛАВА2. УРОК 7. Кодирование числовой информации.
Для представления информации в памяти ЭВМ используется двоичный способ кодирования.
Элементарная ячейка памяти ЭВМ имеет длину 8 бит (1 байт). Каждый байт имеет свой номер (его называют адресом). Наибольшую последовательность бит, которую ЭВМ может обрабатывать как единое целое, называют машинным словом. Длина машинного слова зависит от разрядности процессора и может быть равной 16, 32, 64 битам и т.д.
1. Простейшим и исторически первым является кодирование целых чисел.
Целые числа представляются в двоичном виде следующим образом:
00000000210 = 0102 00000001210 = 1102 . . . . . . . . . . 11111111210 = 255102
2. Более сложное представление существует для вещественных чисел. Различают 2 вида таких чисел.
2.1. с фиксированной точкой (запятой). Точка (запятая) - это подразумеваемая граница целой и дробной частей числа. Число с фиксированной запятой — формат представления вещественного числа в памяти ЭВМ в виде целого числа. Простейший пример арифметики с фиксированной запятой — перевод рублей в копейки. В таком случае, чтобы запомнить сумму 12 рублей 34 копейки, мы записываем в ячейку памяти число 1234. Про такую арифметику говорят: «f битов на дробную часть, i=n−f — на целую» и обозначают как «i,f» или «i.f». Например: арифметика 8,24 отводит на целую часть 8 битов и 24 — на дробную.
2.2. с плавающей точкой (запятой). Числа с плавающей точкой представляются в виде мантиссы и показателя степени. Число с плавающей запятой состоит из: мантиссы (выражающей значение числа без учёта порядка), знака мантиссы (указывающего на отрицательность или положительность числа), порядка (выражающего степень основания числа, на которое умножается мантисса), знака порядка. В вычислительных машинах показатель степени принято отделять от мантиссы буквой «E» (exponent). Например, число 1,528535047×10−25 в большинстве языков программирования высокого уровня записывается как 1.528535047E-25.
Задача:
Найти количество информации десятичных чисел 1, 3, 4, 11, 27, 42, 128, 129.
(1) 10 = (1)2 V (1) 10 = 1 бит
(3) 10 = (11)2 V (3) 10 = 2 бита
(4) 10 = (100)2 V (4) 10 = 3 бита
(11) 10 = (1011)2 V (11) 10 = 4 бита
(27) 10 = (11011)2 V (27) 10 = 5 бит
(42) 10 = (101010)2 V (42) 10 = 6 бит
(128) 10 = (1000000)2 V (128) 10 = 7 бит
(129) 10 = (10000001)2 V (129) 10 = 8 бит = 1b
Задача:
Число 33 в десятеричной системе счисления делится на 3 без остатка. Будут ли они делиться без остатка в двоичной системе счисления?
Решение.
(33)10 = (100001)2
(3)10 = (11)2
(1011)2 = (11)10
|
100001 11 .
11 1011
100
11
101
11
0
|
Замечание: Свойства чисел и арифметических действий над ними не зависят от системы счисления.
Задача:
Сколько существует различных последовательностей 0 и 1 в 1, 2, 3, 4х значном двоичном числе.
Решение.
1
|
0 1
|
2
|
21
|
2
|
00 – 01 – 10 – 11
|
4
|
22
|
3
|
000 – 001 – 010 – 011 – 100 – 101 – 110 – 111
|
8
|
23
|
4
|
0000 – 0001 – 0010 – 0011 – 0100 – 0101 – 0110 – 0111 – 1000 – 1001 – 1010 – 1011 – 1100 – 1101 – 1110 - 1111
|
16
|
24
|
Замечание: Аnk = nk – называется числом размещений с повторениями из n чисел по k.
Задача:
Какое количество различных наборов 0 и 1 можно закодировать в ячейке объемом 1 байт?
Решение.
1 b = 8 bit. А82 = 28 = 256 – наборов можно закодировать в ячейке объемом 1 байт.
Задача:
Назовите десятичное число, состоящее только из одних единичек в 5ти значном двоичном числе?
Состоящее только из одной единички и 5 нулей в 6ти значном двоичном числе?
Решение.
25 = 32 – количество наборов 0 и 1 в пятизначном двоичном числе.
(11111)2 – максимальный набор, поэтому из 32х наборов он будет последним – 32ым, однако 1ый набор – это (0)10, 2ой - (1)10, следовательно, 32ой набор будет – (31)10.
Набор (100000)2 – двоичное число на 1 больше (11111)2, следовательно, десятичное число будет – 32.
Задача:
Мадам де Монпансье получила 2 файла с шифрованной числовой информацией. Помогите ей узнать эти числа, если оба файла весят 1 b, 1ый файл в 3 раза легче 2ого и в десятичной форме эти числа представлены одной и той же цифрой.
Решение.
Пусть х – объем 1ого числа, тогда 3х – объем 2ого числа.
По условию задачи имеем х + 3х = 1b; 4х = 1b; х = ¼ b = 2 bit – объем 1ого числа.
Следовательно объем 2ого числа – 6 bit.
Найдем искомое число методом подбора.
Возьмем цифру 1. (1)10 = (1)2 V = 1 bit; (11)10 = (1011)2 V = 4 bit; (111)10 = (1101111)2 V = 7 bit – ни одно значение не подошло.
Возьмем цифру 2. (2)10 = (10)2 V = 2 bit; (22)10 = (10110)2 V = 5 bit; (222)10 = (11011110)2 V = 8 bit – не нашлось пары подходящих значений.
Возьмем цифру 3. (3)10 = (11)2 V = 2 bit; (33)10 = (100001)2 V = 6 bit – оба значения подошли.
ГЛАВА2. УРОК 8. Кодирование текстовой информации.
Лабораторная работа №1.
-
Создайте на рабочем столе текстовый документ.
-
Откройте его при помощи программы «Блокнот».
-
Напишите произвольное слово из 4 букв.
-
Сохраните изменения в документе и закройте программу «Блокнот».
-
Измерьте объем документа.
-
Обоснуйте получившийся результат: «Объем текстового документа равен числу сохраненных символов».
ЗАМЕЧАНИЕ 1: объем любого символа в текстовом представлении равен 1 байту.
Например, (0010 0000)2 – код клавиши «пробел» - V «пробел» = 1 b.
(1100 0000)2 – код русской буквы «А» - V «А» = 1 b.
(1110 0000)2 – код русской буквы «а» - V «а» = 1 b.
Если каждому символу алфавита сопоставить определенное целое число (например, порядковый номер), то с помощью двоичного кода можно кодировать и текстовую информацию. Для хранения двоичного кода одного символа выделен 1 байт = 8 бит.
Учитывая, что каждый бит принимает значение 0 или 1, количество их возможных сочетаний в байте равно
Значит, с помощью 1 байта можно получить 256 разных двоичных кодовых комбинаций и отобразить с их помощью 256 различных символов.
Такое количество символов вполне достаточно для представления текстовой информации, включая прописные и заглавные буквы русского и латинского алфавита, цифры, знаки, графические символы и т.д. Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111. Таким образом, человек различает символы по их начертанию, а компьютер - по их коду. Важно, что присвоение символу конкретного кода - это вопрос соглашения, которое фиксируется в кодовой таблице.
Например, ASCII коды букв латинского алфавита:
Первые 33 кода (с 0 до 32) соответствуют не символам, а операциям (перевод строки, ввод пробела и т. д.). Коды с 33 по 127 являются интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания. Они используются в международной кодировке ASCII. Национальные кодировки используют оставшиеся 128 вариантов символов (в каждой стране свои). Так, в настоящее время, для кодировки русских букв используют пять различных кодовых таблиц (КОИ-8, Windows 1251, СР 866, Mac, ISO).
Лабораторная работа №2.
-
Откройте произвольный документ в формате «html» - электронная страница Internet, при помощи программы «Internet Explorer».
-
Измените кодировку документа через управляющее меню, нажав последовательно команды «Вид», «Кодировка».
-
Обоснуйте получившийся результат: «Текст изображен при помощи непонятных символов - псевдографики».
ЗАМЕЧАНИЕ 2: Тексты, закодированные при помощи одной из таблиц, не будут правильно отображаться в другой кодировке.
Теперь становится понятным почему письмо на русском языке отправленное в Финлядию не будет прочитано адресатом.
Однако, начиная с 1997 года, последние версии Microsoft Office поддерживают новую кодировку UNICODE, которая на каждый символ отводит по 2 байта, а потому, можно закодировать не 256 а 65536 различных символов. Таким образом, в одну кодировку мы можем уместить латинский, русский, еврейский, немецкий и другие языки.
Задача.
Сколько символов содержит текстовая строка, объемом 1,5 Mb.
Решение.
1,5 Mb * 1024 = 1536 Kb = 1572862 b – символов содержит текстовая строка.
Задача.
Флоппи-диск имеет объем 1,44 Mb. Какое количество текстовых файлов может уместиться на дискету, если каждый файл содержит только информацию одного школьного учебника в 250 страниц, размером 40х80 символов.
Решение.
40 * 80 = 3 200 – символов содержится на 1 странице.
3 200 * 250 = 800 000 – символов содержится во всем учебнике.
800 000 * 1b = 800 000 b = 781,25 Kb = 0,7629 Mb – объем информации в учебнике.
1, 44 : 0,7629 = 1,8875 – учебник уместиться на дискету.
Задача.
Два текста содержат одинаковое количество символов. Первый текст записан на русском языке, а второй на языке племени нагури, алфавит которого состоит из 16 символов. Чей текст несет большее количество информации?
Решение.
I = К * а (информационный объем текста равен произведению числа символов на информационный вес одного символа).
Т.к. оба текста имеют одинаковое число символов (К), то разница зависит от информативности одного символа алфавита (а).
2а1 = 32, т.е. а1 = 5 бит,
2а2 = 16, т.е. а2 = 4 бит.
I1 = К * 5 бит, I2 = К * 4 бит.
Значит, текст, записанный на русском языке в 5/4 раза несет больше информации.
ГЛАВА2. УРОК 9. Кодирование графической информации.
ВПЕРВЫЕ технологию представления данных в графическом виде на больших ЭВМ реализовали в 50х годах ХХ столетья. Особенно интенсивно эта технология стала развиваться с 80х годов.
|
Графическую информацию можно представить в двух формах: аналоговой и дискретной. Пример аналоговой формы - это живописное полотно (картины, иконы), цвет которого изменяется непрерывно.
|
|
Изображение, напечатанное при помощи струйного принтера и состоящее из отдельных точек разного цвета – это дискретное представление.
Преобразование графической информации из аналоговой формы в дискретную происходит путем разбиения графического изображения на точки. При этом производится КОДИРОВАНИЕ – присвоение конкретного значения каждому элементу в форме кода. При этом качество будет зависеть от размера точки и количества цветов.
|
Вспомним устройство электронно-лучевой трубки.
Колба электронно-лучевой трубки покрыта специальным светящимся слоем – люминофором. Причем при увеличении, мы можем увидеть, что все изображение экрана по вертикали и горизонтали разбивается на достаточно мелкие прямоугольники -- так называемые элементы изображения, или пикселы (от английского pixel -- picture element).
|
При дальнейшем увеличении мы можем увидеть, что каждый пиксель состоит из трех слоев (R-Red-красный, B-Blue-синий, G-Green-зеленый). Такой выбор цветов связан с тем, что при различных оттенках этих трех цветов мы можем получить любой понравившийся нам цвет от белого до черного. Каждый из цветов кодируется различными наборами 0 и 1 от 00000000 до 11111111. Всего получим по 256 вариаций, а всего из трех цветов получатся более 1,5 млн. оттенков.
|
Таким образом, рисовальщик по точкам наносит изображение будущего произведения искусства, и может сохранить его в отдельном графическом файле.
«От чего же зависит объем графического файла?»
Выясним это, выполнив практическую работу.
Лабораторная работа №3.
-
Начертите 2 таблицы:
Имя файла
|
Объем файла
|
Что делали
|
Что происходило
|
1.bmp
|
|
|
|
2.bmp
|
|
|
|
Имя файла
|
Объем файла
|
Что делали
|
Что происходило
|
Кол-во цветов
|
Кол-во бит
|
3.bmp
|
|
|
|
|
|
4.bmp
|
|
|
|
|
|
5.bmp
|
|
|
|
|
|
6.bmp
|
|
|
|
|
|
-
-
Создайте при помощи графической программы «Paint» предложенный рисунок. НЕ СПЕШИ. Следуй инструкции.
-
Откройте «Paint».
-
Нарисуйте простейший рисунок.
-
Сохраните на Рабочем столе под именем «1.bmp».
|
| -
Измените атрибуты рисунка (уменьшите вдвое).
-
Сохраните под именем «2.bmp».
-
Сверните «Paint».
-
Измерьте файлы «1.bmp» и «2.bmp». Данные занесите в таблицу.
-
Разверните «Paint».
-
Выберите тип файла: «24разрядный» и сохраните под именем «3.bmp».
-
Сохраните рисунки под именами «4.bmp», «5.bmp» и «6.bmp» изменяя тип файлов: «256цветный», «16цветный», «монохромный».
-
Измерьте файлы «3.bmp», «4.bmp», «5.bmp» и «6.bmp». Данные занесите в таблицу.
Заполнив таблицу, учащиеся находят закономерности и делают выводы.
ЗАМЕЧАНИЕ 1: При уменьшении рисунка вдвое – объем файла уменьшился вдвое.
УТВЕРЖДЕНИЕ 1: Объем графического файла зависит от размера изображения.
ЗАМЕЧАНИЕ 2: При уменьшении цветов объем фала уменьшался пропорционально.
УТВЕРЖДЕНИЕ 2: Объем графического файла зависит от разрядности изображения.
Задача.
Какой объем займет фильм «Александр Невский», если его продолжительность 1,5 ч, а размер кадра 25 * 32 пикселя? Частота кадров – стандартная (24 кадра/с).
Решение.
1,5 час = 90 мин = 5400 секунд – продолжительность фильма.
5400 * 24 = 129 600 кадров – включает в себя фильм.
25 * 32 = 800 ps2 – площадь 1 кадра фильма.
129 600 * 800 = 103 680 000 пиксель – включает в себя фильм.
103 680 000 * 1 bit = 103 680 000 bit = 12 960 000 b = 12 656,25 Kb 12,4 Mb – объем фильма.
Задача.
Какой объем займет 256-цветный рисунок размером 512 * 512 пиксель?
Решение.
512 * 512 = 262 144 ps2 – площадь рисунка.
262 144 * 1 b = 262 144 b = 256 Kb – объем рисунка.
Задача.
Сколько цветов использовалось при сканировании фотографии размером 1024 * 1024 пиксель, если полученный объем файла 1 Mb?
Решение.
1024 * 1024 = 1 048 576 ps2 – площадь фотографии.
1 Mb : 1 048 576 = 1 048 576 b : 1 048 576 = 1 b = 8 bit – объем 1 пикселя => 256 цветов.
Задача.
Каковы размеры «Черного квадрата» Малевича, если его объем 100 bit.
Решение.
100 bit : 1 bit = 100 ps2 – площадь «Черного квадрата» Малевича => 10 * 10 ps – его размер.
Достарыңызбен бөлісу: |