Лекция 3 методы и стадии data mining



Pdf көрінісі
бет5/8
Дата29.01.2024
өлшемі328.87 Kb.
#490142
түріЛекция
1   2   3   4   5   6   7   8
ЛЕКЦИЯ 3 МЕТОДЫ И СТАДИИ DATA MINING


разделения основана на различных подходах к обучению математических 
моделей. 
Следует отметить, что существует два подхода отнесения статистических 
методов к Data Mining. Первый из них противопоставляет статистические 
методы и Data Mining, его сторонники считают классические статистические 
методы отдельным направлением анализа данных. Согласно второму подходу, 


статистические методы анализа являются частью математического 
инструментария Data Mining. Большинство авторитетных источников 
придерживается второго подхода. 
В этой классификации различают две группы методов

статистические 
методы
основанные 
на 
использовании 
усредненного накопленного опыта, который отражен в ретроспективных 
данных; 

кибернетические методы, включающие множество разнородных 
математических подходов. 
Недостаток такой классификации: и статистические, и кибернетические 
алгоритмы тем или иным образом опираются на сопоставление 
статистического опыта с результатами мониторинга текущей ситуации. 
Преимуществом такой классификации является ее удобство для 
интерпретации - она используется при описании математических средств 
современного подхода к извлечению знаний из массивов исходных наблюдений 
(оперативных и ретроспективных), т.е. в задачах Data Mining
Рассмотрим подробнее представленные выше группы. 
Статистические методы Data mining 
В эти методы представляют собой четыре взаимосвязанных раздела: 

предварительный анализ природы статистических данных 
(проверка 
гипотез 
стационарности, 
нормальности, 
независимости, 
однородности, оценка вида функции распределения, ее параметров и т.п.); 

выявление связей и закономерностей (линейный и нелинейный 
регрессионный анализ, корреляционный анализ и др.); 

многомерный статистический анализ (линейный и нелинейный 
дискриминантный анализ, кластерный анализ, компонентный анализ, 
факторный анализ и др.); 

динамические модели и прогноз на основе временных рядов. 
Арсенал статистических методов Data Mining классифицирован на четыре 
группы методов
1. Дескриптивный анализ и описание исходных данных. 
2. Анализ 
связей (корреляционный и регрессионный анализ, 
факторный анализдисперсионный анализ). 


3. Многомерный статистический анализ (компонентный анализ, 
дискриминантный 
анализ, 
многомерный 
регрессионный 
анализ, 
канонические корреляции и др.). 
4. Анализ 
временных 
рядов 
(динамические 
модели 
и 
прогнозирование). 


Достарыңызбен бөлісу:
1   2   3   4   5   6   7   8




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет