Использование компонентов для визуализации данных. Объектно-ориентированный подход к рисованию



бет3/6
Дата27.05.2024
өлшемі1.36 Mb.
#501907
1   2   3   4   5   6
2024Магистратура.ppt12 лекция

Диаграмма рассеивания представляет собой график отклонения значений, прогнозируемых при помощи модели, от реальных. Эти диаграммы используют для непрерывных величин. Визуальная оценка качества построенной модели возможна только по окончанию процесса построения модели.
  • Таблица сопряженности используется для оценки результатов классификации. Такие таблицы применяются для различных методов классификации. Они уже использовались нами в предыдущих лекциях. Оценка качества построенной модели возможно только по окончанию процесса построения модели.
    • График изменения величины ошибкиГрафик демонстрирует изменение величины ошибки в процессе работы модели. Например, в процессе работы нейронных сетей пользователь может наблюдать за изменением ошибки на обучающем и тестовом множествах и остановить обучение для недопущения "переобучения" сети. Здесь оценка качества модели и его изменения может оцениваться непосредственно в процессе построения модели.
    • Методы визуализации
    • Методы визуализации, в зависимости от количества используемых измерений, принято классифицировать на две группы :
    • представление данных в одном, двух и трех измерениях;
    • представление данных в четырех и более измерениях.
    • Представление данных в одном, двух и трех измерениях
    • К этой группе методов относятся хорошо известные способы отображения информации, которые доступны для восприятия человеческим воображением. Практически любой современный инструмент Data Mining включает способы визуального представления из этой группы.
    • В соответствии с количеством измерений представления это могут быть следующие способы:
    • одномерное (univariate) измерение, или 1-D ;
    • двумерное (bivariate) измерение, или 2-D ;
    • трехмерное или проекционное (projection) измерение, или 3-D.
    • Следует заметить, что наиболее естественно человеческий глаз воспринимает двухмерные представления информации.
    • При использовании двух- и трехмерного представления информации пользователь имеет возможность увидеть закономерности набора данных:
    • его кластерную структуру и распределение объектов на классы (например, на диаграмме рассеивания);
    • топологические особенности;
    • наличие трендов;
    • информацию о взаимном расположении данных;
    • существование других зависимостей, присущих исследуемому набору данных.
    • Если набор данных имеет более трех измерений, то возможны такие варианты:
    • использование многомерных методов представления информации (они рассмотрены ниже);
    • снижение размерности до одно-, двух- или трехмерного представления. Существуют различные способы снижения размерности, один из них - факторный анализ. Для снижения размерности и одновременного визуального представления информации на двумерной карте используются самоорганизующиеся карты Кохонена.
    1   2   3   4   5   6




    ©dereksiz.org 2024
    әкімшілігінің қараңыз

        Басты бет