Issn 305-9397. Ғылым және білім. 2022. №1-1 (66) issn 2305-9397



Pdf көрінісі
бет277/338
Дата03.10.2022
өлшемі7.12 Mb.
#461821
1   ...   273   274   275   276   277   278   279   280   ...   338
Журнал Наука и образование №3-3(68) 2022

 
Түйін сөздер: Data Mining, деректерді талдау, кластерлік талдау, дендограмма, 
статистикалық әдістер. 
Key words:
 Data Mining, data analysis, cluster analysis, dendrogram, statistical methods. 
 
Кіріспе.Ақпараттық технологиялардың дамуы нәтижесінде электронды тҥрде 
жинақталған мәліметтер саны тез ӛсуде. Бҧл деректер әртҥрлі форматтарда бар: мәтіндер, 
суреттер, аудио, видео, гипермәтіндік қҧжаттар, реляциялық деректер базасы және т. б. 
Алайда, қол жетімді ақпараттың басым бӛлігі белгілі бір адамға ешқандай пайда 
әкелмейді, ӛйткені ол мҧндай ақпаратты қайта ӛңдей алмайды. Пайдаланушыға пайдалы 
ақпаратты деректердің ҥлкен кӛлемінен алу мәселесі туындайды. 
Сонымен қатар математика және есептеу техникасы бір орнында тҧрмайды қарқынды 
дамып келеді. Деректерді сипаттап бӛлу кезінде (дәстҥрлі статистикалық әдістер талап 
ететіндей), белгілердің сызықтық емес тәуелділігі жағдайында да ақпаратты талдауға арналған 
әдістерге назар аудармауға мҥмкіндік беретін жаңа алгоритмдер қҧрылуда. Қазіргі заманғы 
технологиялар жҥздеген белгілердің ішінен ең ақпараттылығын таңдап, деректердің ҥлкен 
кӛлемін оңай ӛңдейді. Бҧрын таңдалған белгілер сенімді, кӛптеген мыңдаған мҥмкін 
нҧсқалардың алгоритмдерін қолдана отырып жҥзеге асырылады.
Қазіргі заманғы мәліметтерді сақтау мен ӛңдеу әдістерінің дамуы, жинақталған
талдауды керек ететін ақпараттардың тез ӛсуіне алып келуде. Жинақталған мәліметтердің 
соншалықты кӛптігі оны адам кҥшімен ӛңдеуге мҥмкіндік бермейді, әрі бҧл ӛңделмеген 
мәліметтердің ішінде, маңызды шешімдер қабылдауға керекті ақпараттар бар екені анық. Сол 


ISSN 2305-9397. Ғылым және білім. 2022. № 3-3 (68)____ _ 
233 
себептен, мәліметтерді автоматты талдау жасау ҥшін Data Mining технологиясын қолдану керек 
болады. 
Data Mining қолданбалы статистика, білімді тану, жасанды интеллект, мәліметтер 
базасының теориясы және т. б. сияқты ғылымдар негізінде пайда болған және дамитын кӛп 
салалы аймақ деп білеміз.
DataMining – бҧл жасырын заңдылықтарды (ақпарат шаблондарын) деректерден іздеуге 
негізделген шешім қабылдауды қолдау процесі 
Data Mining – ті анық емес, объективті және тәжірибеде пайдалы заңдылықтардың 
ҥлкен кӛлемін іздеуге арналған технология ретінде сипаттауға болады: – анық емес, ӛйткені 
табылған заңдылықтар ақпаратты ӛңдеудің стандартты әдістерімен немесе сараптамалық 
жолмен анықталмайды; – объективті, ӛйткені анықталған заңдылықтар әрдайым субъективті 
болып табылатын сараптамалық білімнен айырмашылығы шындыққа толығымен сәйкес келеді; 
– іс жҥзінде пайдалы, ӛйткені қорытындылар практикалық қолдануға болатын нақты мағынаға 
ие. 
Data Mining жҥйелерінің нарығы ӛсіп келеді. Бҧған ірі корпорациялардың қызметі 
ықпал етеді мысалға айтқанда: SAS, IBM, Microsoft, Oracle және тағы басқалары. 2027 жылға 
қарай кеңейтілген аналитиканың жаһандық нарығының кӛлемі 23,1% - ға ӛсіп, $56,2 млрд 
белгісіне жетеді деп кҥтілуде. 
Data Mining-тің соңғы тенденцияларына виртуалды және кеңейтілген шындық 
элементтері бар талдау әдістерін дамыту, оларды дерекқор жҥйелерімен біріктіру, 
медицинадағы инновациялар ҥшін биологиялық деректерді ӛндіру, веб-майнинг ӛндірісі 
(интернеттегі деректерді талдау), нақты уақыттағы деректерді талдау және деректерді ӛндіру 
кезінде қҧпиялылықты қорғау шаралары кіреді. Сала жетекшілері болашақта майнинг деректер 
ӛндірісі корпоративті деректер қоймаларына салынатын ақылды қосымшаларда қолданылады 
деп санайды. 
Мәліметтердегі заңдылықтарды анықтаудағы басты мәселе-ақпараттық массивтерді 
санау ҥшін қажет уақыт. 
Белгілі әдістер мҧндай сҧрыптауды жасанды тҥрде шектейді немесе іздеу тиімділігін 
тӛмендететін шешімдердің бҥтін ағаштарын салады. Бҧл мәселені шешу Data Mining ҥшін ӛнім 
әзірлеушілердің басты мақсаты болып қала береді.
Data Mining технологиясын ғылыми зерттеулер ҥшін қолдану ӛте тиімді болып келеді, 
жәнеде жыл сайын адам ӛмірінің барлық салаларында зерттеудің ӛзекті бағытына айналуда. 
Data Mining білім саласында, инженириада, медицинада, тағы басқа сала бағыттарында 
қолданылады.[1] 
Data Mining-ке қандай міндеттеріне қою керектігіне қатысты бірыңғай пікір жоқ. 
Тапсырмалар ӛндірілетін ақпарат тҥрлеріне бӛлінеді, бҧл Data Mining есептерінің ең жалпы 
жіктелуі: 
- жіктеу, (классификация) 
- кластерлеу, 
- болжау, 
- қауымдастық,(ассоциация) 
- визуализация. 
Ағылшын тілінен аударғанда, Data Mining-бҧл "деректерді ӛндіру".Бірақ іс жҥзінде Data 
Mining термині деректерді немесе ақпаратты жинауды, талдауды және зерттеуді білдіреді.
1989 жылы Григорий Пятицкий-Шапиро семинар ӛткізді, онда келесі міндет қойылды: 
"жасырын білім" деп аталатын ӛте ҥлкен мәліметтер базасы бар, осы жасырын білімді бастапқы 
деректердің ҥлкен кӛлемінде анықтау әдістерін жасау қажет. Бҧл тапсырма деректерді анықтау 
әдістеріне сілтеме жасау ҥшін қолданылатын Data Mining терминінің пайда болуына себеп 
болды. 
Data mining мыналарды қамтиды: 

жасанды нейрондық желілерді, шешім ағаштарын, ассоциативті жадты, 
эволюциялық бағдарламалауды, анық емес логика мен генетикалық алгоритмдерді қолдану 
негізінде болжау, модельдеу және жіктеу әдістері; 




Достарыңызбен бөлісу:
1   ...   273   274   275   276   277   278   279   280   ...   338




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет