ISSN 2305-9397. Ғылым және білім. 2022. № 3-3 (68)____ _
233
себептен, мәліметтерді автоматты талдау жасау ҥшін Data Mining технологиясын қолдану керек
болады.
Data Mining қолданбалы статистика, білімді тану,
жасанды интеллект, мәліметтер
базасының теориясы және т. б. сияқты ғылымдар негізінде пайда болған және дамитын кӛп
салалы аймақ деп білеміз.
DataMining – бҧл жасырын заңдылықтарды (ақпарат шаблондарын) деректерден іздеуге
негізделген шешім қабылдауды қолдау процесі
Data Mining – ті анық емес, объективті және тәжірибеде пайдалы заңдылықтардың
ҥлкен кӛлемін іздеуге арналған технология ретінде сипаттауға болады: – анық емес, ӛйткені
табылған заңдылықтар ақпаратты ӛңдеудің стандартты әдістерімен
немесе сараптамалық
жолмен анықталмайды; – объективті, ӛйткені анықталған заңдылықтар әрдайым субъективті
болып табылатын сараптамалық білімнен айырмашылығы шындыққа толығымен сәйкес келеді;
– іс жҥзінде пайдалы, ӛйткені қорытындылар практикалық қолдануға болатын нақты мағынаға
ие.
Data Mining жҥйелерінің нарығы ӛсіп келеді. Бҧған ірі корпорациялардың қызметі
ықпал етеді мысалға айтқанда: SAS, IBM, Microsoft, Oracle және тағы басқалары. 2027 жылға
қарай кеңейтілген аналитиканың жаһандық нарығының кӛлемі 23,1% - ға ӛсіп, $56,2 млрд
белгісіне жетеді деп кҥтілуде.
Data Mining-тің соңғы тенденцияларына виртуалды
және кеңейтілген шындық
элементтері бар талдау әдістерін дамыту, оларды дерекқор жҥйелерімен біріктіру,
медицинадағы инновациялар ҥшін биологиялық деректерді ӛндіру, веб-майнинг ӛндірісі
(интернеттегі деректерді талдау), нақты уақыттағы деректерді талдау және деректерді ӛндіру
кезінде қҧпиялылықты қорғау шаралары кіреді. Сала жетекшілері болашақта майнинг деректер
ӛндірісі корпоративті деректер қоймаларына салынатын ақылды қосымшаларда қолданылады
деп санайды.
Мәліметтердегі заңдылықтарды анықтаудағы басты мәселе-ақпараттық массивтерді
санау ҥшін қажет уақыт.
Белгілі әдістер мҧндай сҧрыптауды жасанды тҥрде шектейді
немесе іздеу тиімділігін
тӛмендететін шешімдердің бҥтін ағаштарын салады. Бҧл мәселені шешу Data Mining ҥшін ӛнім
әзірлеушілердің басты мақсаты болып қала береді.
Data Mining технологиясын ғылыми зерттеулер ҥшін қолдану ӛте тиімді болып келеді,
жәнеде жыл сайын адам ӛмірінің барлық салаларында зерттеудің ӛзекті бағытына айналуда.
Data Mining білім саласында, инженириада, медицинада, тағы
басқа сала бағыттарында
қолданылады.[1]
Data Mining-ке қандай міндеттеріне қою керектігіне қатысты бірыңғай пікір жоқ.
Тапсырмалар ӛндірілетін ақпарат тҥрлеріне бӛлінеді, бҧл Data Mining есептерінің ең жалпы
жіктелуі:
- жіктеу, (классификация)
- кластерлеу,
- болжау,
- қауымдастық,(ассоциация)
- визуализация.
Ағылшын тілінен аударғанда, Data Mining-бҧл "деректерді ӛндіру".Бірақ іс жҥзінде Data
Mining термині деректерді немесе ақпаратты жинауды, талдауды және зерттеуді білдіреді.
1989 жылы Григорий Пятицкий-Шапиро семинар ӛткізді, онда келесі міндет қойылды:
"жасырын білім" деп аталатын ӛте ҥлкен мәліметтер базасы бар, осы жасырын білімді бастапқы
деректердің ҥлкен кӛлемінде анықтау әдістерін жасау қажет. Бҧл тапсырма деректерді анықтау
әдістеріне сілтеме жасау ҥшін қолданылатын Data Mining терминінің пайда болуына себеп
болды.
Data mining мыналарды қамтиды:
жасанды нейрондық желілерді,
шешім ағаштарын, ассоциативті жадты,
эволюциялық бағдарламалауды, анық емес логика мен генетикалық алгоритмдерді қолдану
негізінде болжау, модельдеу және жіктеу әдістері;