статистические
методы анализа являются частью математического
инструментария
Data Mining. Большинство
авторитетных источников
придерживается второго подхода.
В этой классификации различают две группы
методов:
статистические
методы,
основанные
на
использовании
усредненного накопленного опыта, который отражен в ретроспективных
данных;
кибернетические
методы, включающие
множество разнородных
математических подходов.
Недостаток такой классификации: и статистические, и кибернетические
алгоритмы тем или иным образом
опираются на сопоставление
статистического опыта с результатами мониторинга текущей ситуации.
Преимуществом такой классификации является ее удобство для
интерпретации - она используется при описании математических средств
современного подхода к
извлечению знаний из массивов исходных наблюдений
(оперативных и ретроспективных), т.е. в задачах
Data Mining.
Рассмотрим подробнее представленные выше группы.
Статистические методы Data mining
В эти
методы представляют собой четыре взаимосвязанных раздела:
предварительный анализ природы
статистических данных
(проверка
гипотез
стационарности,
нормальности,
независимости,
однородности, оценка вида функции распределения, ее параметров и т.п.);
выявление связей и
закономерностей (линейный и нелинейный
регрессионный анализ, корреляционный анализ и др.);
многомерный статистический анализ (линейный и нелинейный
дискриминантный анализ,
кластерный анализ, компонентный анализ,
факторный анализ и др.);
динамические модели и прогноз на основе временных рядов.
Арсенал статистических
методов Data Mining классифицирован на четыре
группы
методов:
1. Дескриптивный анализ и описание исходных данных.
2.
Анализ
связей (корреляционный и регрессионный анализ,
факторный анализ,
дисперсионный анализ).
3. Многомерный статистический анализ (компонентный анализ,
дискриминантный
анализ,
многомерный
регрессионный
анализ,
канонические корреляции и др.).
4.
Анализ
временных
рядов
(
динамические
модели
и
прогнозирование).
Достарыңызбен бөлісу: