Ақпараттық технологиялар және қауіпсіздік кафедрасы
Кан О.А., Мухамедиева Л.С.
«Ақпараттық қауіпсіздіктің ақпараттық негіздері»
пәні бойынша
Зертханалық жұмыс №1
Мамандығы: 6В06301 – «Ақпараттық қауіпсіздік жүйелері»
Қарағанды 2023 жАқпараттық технологиялар және қауіпсіздік кафедрасы
Кан О.А., Мухамедиева Л.С.
«Ақпараттық қауіпсіздіктің ақпараттық негіздері»
пәні бойынша
Зертханалық жұмыс №7
Мамандығы: 6В06301 – «Ақпараттық қауіпсіздік жүйелері»
Қарағанды 2023 ж
Зертхана 7
Тақырыбы: Мәліметтерді сығудың алгоритмдері мен бағдарламалары.
Жұмыстың мақсаты: Қысу алгоритмдерімен және оңтайлы кодтарды құру принциптерімен таныстыру.
Теориядан қысқаша мәлімет
Шифрлау, кодтау және стеганографиямен қатар криптографиялық түрлендіру әдістерінің бірі мәліметтерді қысу болып табылады.
Мәліметтерді сығымдау (архивтеу) – мәліметтерді криптографиялық түрлендіру, нәтижесінде оның артықтығы азаяды және сәйкесінше сақтау үшін аз жад қажет.
Қысу бастапқы деректерде қамтылған артықшылықты жоюға негізделген. Ақпаратты сығуды ақпаратты криптографиялық түрлендіру әдістеріне жатқызуға болады. Өйткені қысылған ақпаратты кері түрлендірусіз оқу немесе пайдалану мүмкін емес.
Кескінді сығудың ең қарапайым әдістерінің бірі - RLE алгоритмі. ( Жүгіру Ұзындығы Кодтау – айнымалы ұзындық жолымен кодтау). Бұл әдістің негізгі идеясы - бір қатардағы бірдей пикселдерді іздеу. Бірдей элементтердің табылған тізбегі қайталанулар санымен және элемент мәнімен ауыстырылады , бұл деректердің артық болуын айтарлықтай азайтады.
Көптеген топтық қысу схемалары бар, олардың біреуін келесідей көрсетуге болады:
Бізде келесідей көрінетін таңбалардың бастапқы тізбегі бар делік:
АААААААААААААААААААААААААААААААААААААААА
RLE қысуын қолданғаннан кейін бұл жол келесідей болады:
A5O7Y4M10P9
RLE алгоритмінің принципі: Қайталанатын таңба мәндерінің тізбегі оның мәнімен және қайталау санымен ауыстырылады. Енгізу тізбегінің әрбір деректер элементін сақтау үшін 1 байт бөлінсе, онда бастапқы реттілік 35 байт жадты, ал қысылған нұсқасы 11 байт жадты алады.
Қысу алгоритмдерін криптографиялық ақпаратты түрлендірудің сенімді құралы ретінде қарастыруға болмайды. Алгоритмдер құпия сақталса да, оларды статистикалық өңдеу әдістерімен салыстырмалы түрде оңай ашуға болады. Сондықтан құпия ақпараттың қысылған файлдары кейіннен шифрланады, бұл деректерді беру мен сақтаудың сенімділігі мен қауіпсіздігін айтарлықтай арттырады.
Оңтайлы кодтаудың статистикалық әдістері ақпаратты жоғалтпау арналары үшін Шеннонның негізгі теоремасына негізделген.
Шеннон қабылданған алфавиттің әріптерінен тұратын хабарламаларды кодтауға болатынын дәлелдеді. алфавиттің әр әрпіндегі екілік таңбалардың орташа саны осы хабарламалар көзінің энтропиясына ерікті түрде жақын болады, бірақ осы мәннен кем емес.
Тәжірибеде Шеннон-Фано коды келесідей құрастырылған: хабарламалардың A={a1,..., am } алфавитінің әріптері (мұндағы m – санау жүйесінің негізі) кестеде кему ретімен жазылады. ықтималдықтардың реті. Содан кейін олар әр топтағы ықтималдықтардың қосындылары мүмкіндігінше тең болатындай етіп екі топқа бөлінеді. Жоғарғы жартының барлық әріптеріне бірінші таңба ретінде 1, ал барлық төменгілер үшін 0 белгіленеді.Нәтижедегі топтардың әрқайсысы өз кезегінде жалпы ықтималдықтары бірдей екі топшаға бөлінеді және т.б. Әр топта бір ғана әріп қалғанша процесс қайталанады.
Оңтайлы кодтаудың мысалын қарастырайық. Басқарылатын объектінің температуралық өзгерістерінің барлық диапазоны 20 ішкі диапазонға бөлінген делік. Содан кейін 2-ші жүйеде 20 ішкі жолақты кодтау үшін 5 бит жеткілікті. Бақылау процесі кезінде X ( t ) сигналының мәні 1640 рет өлшенді. Өлшеу нәтижелері 1-кестеде көрсетілген.
1-кесте.
Жоқ.
ішкі диапазон
|
Сан
қайталаулар, m i
|
Ықтималдық
беріліс, P i
|
Жоқ.
қосалқы жолақ
|
Сан
қайталаулар, m i
|
Ықтималдық
беріліс, P i
|
1
2
3
4
5
6
7
8
9
10
|
5
17
14
40
101
180
300
210
29
31
|
0,003
0,01
0,008
0,024
0,06
0,08
0,11
0,09
0,017
0,019
|
он бір
12
13
14
15
16
17
18
19
20
|
68
120
152
304
59
10
60
103
210
180
|
0,04
0,043
0,09
0,10
0,034
0,006
0,036
0,06
0,09
0,08
|
Кестеде x 1 мәні 5 рет, x 2 -17 рет және т.б. Әрбір мәнді беру ықтималдығы формуламен анықталады
20
P i \u003d m i / Σ m i \u003d m i / 1640
i=1
Хабарламадағы ақпараттың мөлшері жүйенің энтропиясына тең және өрнектен анықталады (энтропия бір хабарламадағы ақпараттың орташа мөлшері ретінде анықталуы мүмкін)
20
мен ф = - H = -Σ P i log 2 P i ≈ 3,845 бит
i =1
Әрбір x i мәні бес екілік таңбамен кодталғандықтан, 1 таңбаға шаққандағы ақпарат көлемі I 1 = H / n , мұндағы n - екілік цифрлардың саны.
I 1 \u003d H / 5 \u003d 0,769 бит
Осылайша, қарастырылатын код оңтайлы емес, яғни. артықшылықты жүзеге асырады.
Шеннон-Фано кодтауы келесідей орындалады. Өлшенетін шаманың кодталған мәндері пайда болу ықтималдығының кему ретімен жазылады, содан кейін ықтималдыққа сәйкес шамамен бірдей ықтимал екі топқа бөлінеді: бірінші топқа x 14 , x 7 , x 8 (∑ p = 0,49 ) кіреді. ), ал екіншісі қалғандарының барлығын қамтиды . Бірінші топқа бірінші цифрда « таңбасы , екінші топқа «1» таңбасы беріледі. 0”Содан кейін әр топ қайтадан ықтималдығы бойынша екі бірдей ықтимал кіші топқа бөлінеді, т.б.
Мәселен, мысалы, код x 8 \u003d 011, x 1 \u003d 111111 және т.б. Нәтижесінде кодтар кестесін аламыз (2-кесте).
2-кесте.
Достарыңызбен бөлісу: |