______ ____________________Техникалық ғылымдар
234
факторлық талдау, дисперсиялық талдау, сипаттамалық талдау, корреляциялық
талдау, регрессиялық талдау, уақыттық серияларды талдау, компоненттік талдау сияқты
статистикалық әдістер.
Сонымен, Data Mining технологиясының мәні деректердің ҥлкен кӛлемінде жасырылған
анық емес, бірақ практикада пайдалы заңдылықтарды іздеу болып табылады . Data Mining
белгілі бір заңдылықтарды білдіретін шаблондар тҧжырымдамасына негізделген.[2]
Оларға Data Mining технологиясы шешетін міндеттер сәйкес келеді — жіктеу, болжау,
ассоциация, кластерлеу, ауытқуларды анықтау және талдау, байланыс талдауы, бағалау,
визуализация және қорытындылау. Жоғарыда аталған барлық тапсырмалар сипаттамалық және
болжамды болып бӛлінеді. Сипаттамалық тапсырмалар талданған деректерді тҥсінуді
жақсартуға бағытталған, мҧндай модельдердің басты сәті — адамның қабылдауының
қарапайымдылығы. Болжау тапсырмалары екі кезеңде шешіледі: алдымен белгілі нәтижелері
бар мәліметтер негізінде модель жасалады, содан кейін ол жаңа мәліметтер жиынтығы
негізінде нәтижелерді болжау ҥшін қолданылады.[3]
Жоғарыда аталған мәселелердің әрқайсысын шешудің ӛзіндік әдістері бар, мысалы,
жіктеу мәселесін шешу ҥшін байесиялық желілер, шешім ағаштарын индукциялау, жақын
кӛршінің әдісі қолданылады, ал болжау есептерін шешу ҥшін математикалық статистика
әдістері мен нейрондық желілер қолданылады. Сондай-ақ, кӛптеген тапсырмаларда
қолданылатын Data Mining есептерін шешудің негізгі әдістері бар.
Деректерді ӛндірудің негізгі әдістеріне алгоритмдер жатады. Барлық нысандарды
қарапайым санау 2 * N операцияны қажет етеді, мҧндағы N — нысандар саны.
Деректердің ҥлкен кӛлемімен қарапайым есептеуді қолдану мҥмкін емес екені анық,
сондықтан жоғары есептеу қиындықтары бар тапсырмалар ҥшін әр тҥрлі жаңа шешу
процесінің ҥлгілерін қолданамыз.
Мҧндай әдістердің артықшылығы-тҥсіну мен іске асырудың қарапайымдылығы, ал
кемшіліктері айтар болсақ зерттеу мен дамуға байланысты ресми теория мен кҥрделіліктің
болмауы.
Сондай-ақ, Data Mining негізгі әдістеріне статистика теориясының элементтері жатады.
Бҧл корреляциялық, регрессиялық, дисперсиялық және статистикалық деректерді талдаудың
басқа тҥрлері.[4]
Достарыңызбен бөлісу: |