Лекция 3 методы и стадии data mining



Pdf көрінісі
бет8/8
Дата29.01.2024
өлшемі328.87 Kb.
#490142
түріЛекция
1   2   3   4   5   6   7   8
ЛЕКЦИЯ 3 МЕТОДЫ И СТАДИИ DATA MINING

нейронные 
сети 
высокая низкая 
низкая 
низкая 
нейтральна
я 
низкая 
очень 
низкая 
низкая 
методы 
визуализации 
высокая очень низкая 
высокая 
высокая 
очень 
высокая 
низкая 
чрезвыча
йно 
низкая 
высокая / 
нейтраль
ная 
деревья 
решений 
низкая 
высокая 
высокая 
высокая / 
нейтральн
ая 
высокая 
высокая 
высокая / 
нейтраль
ная 
высокая / 
нейтраль
ная 
полиномиаль
ные 
нейронные 
сети 
высокая нейтральная 
низкая 
высокая / 
нейтральн
ая 
нейтральна
я / низкая 
нейтральная 
низкая / 
нейтраль
ная 
нейтраль
ная 


k-
ближайшего 
соседа 
низкая 
очень низкая 
высокая 

нейтральная 
нейтральн
ая 
нейтральна
я / низкая 
низкая 
высокая низкая 
Как видно из рассмотренной таблицы, каждый из методов имеет свои 
сильные и слабые стороны. Но ни один метод, какой бы не была его оценка с 
точки зрения присущих ему характеристик, не может обеспечить решение всего 
спектра задач Data Mining
Большинство инструментов Data Mining, предлагаемых сейчас на рынке 
программного обеспечения, реализуют сразу несколько методов, например, 
деревья решений, индукцию правил и визуализацию, или же нейронные сети
самоорганизующиеся карты Кохонена и визуализацию. 
В универсальных прикладных статистических пакетах (например, SPSS, 
SAS, 
STATGRAPHICS, 
Statistica, 
др.) реализуется широкий спектр 
разнообразнейших методов (как статистических, так и кибернетических). 
Следует учитывать, что для возможности их использования, а также для 
интерпретации результатов работы статистических методов (корреляционного, 
регрессионного, факторного, дисперсионного анализа и др.) требуются 
специальные знания в области статистики. 
Универсальность того или иного инструмента часто накладывает 
определенные 
ограничения 
на 
его 
возможности. 
Преимуществом 
использования таких универсальных пакетов является возможность 
относительно легко сравнивать результаты построенных моделей, полученные 
различными методами. Такая возможность реализована, например, в пакете 
Statistica, где сравнение основано на так называемой "конкурентной оценке 
моделей". Эта оценка состоит в применении различных моделей к одному и 
тому же набору данных и последующем сравнении их характеристик для 
выбора наилучшей из них. 


Достарыңызбен бөлісу:
1   2   3   4   5   6   7   8




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет