Белкоопсоюз



Pdf көрінісі
бет32/37
Дата03.01.2022
өлшемі1.85 Mb.
#451714
1   ...   29   30   31   32   33   34   35   36   37
Методичка по Галактике

Лабораторная работа 7 

ТЕХНОЛОГИИ И СИСТЕМЫ ИСКУССТВЕННОГО  

ИНТЕЛЛЕКТА 

 

7.1. Характеристика информационно-аналитической  



платформы «Deductor» 

 

«Deductor» является аналитической платформой  – основой для создания приложения СППР (системы 



поддержки принятия решений). 

Платформа  «Deductor»  состоит  из  двух  частей  –  многомерного  хранилища  данных  «Deductor 

Warehouse» и аналитического приложения «Deductor Studio». 

Хранилище данных предназначено для хранения информации, необходимой для анализа и выработки 

управленческих решений. При загрузке данных в хранилище автоматически выполняются все следующие 

действия: 

 данные преобразовываются из плоских таблиц в многомерное представление; 



 исключаются все дублирующиеся данные для уменьшения объемов базы данных; 

 обеспечивается непротиворечивость информации



 проводятся  все  необходимые  манипуляции,  позволяющие  в  10–100 раз  увеличить  скорость  извлече-

ния необходимых данных из хранилища. 

«Deductor Studio» – аналитическое ядро платформы «Deductor». В приложение «Deductor Studio» вклю-

чены средства, позволяющие получить информацию из произвольного источника данных, провести пол-

ный цикл обработки (очистку, трансформацию данных, построение моделей), отобразить полученные ре-

зультаты  наиболее  удобным  образом  (кросс-таблицы  (кубы),  таблицы,  диаграммы,  деревья  решений)  и 

экспортировать результаты в другие приложения, например, MS Word. 

Типовой сценарий работы в платформе «Deductor» включает четыре процедуры: 

 импорт данных; 



 обработка; 

 визуализация; 



 экспорт данных. 

Для вызова этих процедур используются специальные мастера: мастер импорта, мастер обработки, ма-

стер визуализации, мастер экспорта. 

В результате импорта данные приводятся к виду, пригодному для последующего анализа. В программе 

используются как механизмы прямого доступа к наиболее популярным базам данных, так и универсаль-

ные механизмы доступа ADO, ODBC. Импорт в приложение «Deductor Studio» осуществляется из файлов 

СУБД MS Access, MS SQL, Oracle, текстовых файлов, файлов MS Excel. Поддерживается работа с много-

мерным хранилищем данных «Deductor Warehouse». 

Под обработкой в приложении «Deductor Studio» подразумевается любое действие, связанное с преоб-

разованием  данных,  например,  очистка,  восстановление  пропусков,  фильтрация,  построение  модели  и 

прочее. Набор механизмов обработки, реализованный в приложении «Deductor Studio», приведен в табли-

це 20. 

 

Таб л иц а 2 0   –  Методы обработки в составе приложения «Deductor Studio» 



Метод 

Описание 

Нейронные сети 

Предназначены для решения задач регрессии и классификации. Мощный современ-

ный самообучающийся механизм, способный решать нелинейные задачи 

Деревья решений 

Метод машинного обучения, позволяющий автоматически извлекать из данных за-

кономерности, отображаемые в виде иерархической системы правил, легко интер-

претируемых человеком. Предназначен для решения задач классификации 

Самоорганизующиеся 

карты Кохонена 

Одна из разновидностей нейронных сетей, реализующих обучение «без учителя». 

Позволяет кластеризовать данные и отображать их в виде специальных карт. При 

помощи карт легко находить группы схожих объектов, оценивать значимость фак-

торов и выявлять зависимости 



 

48 


Око нча ни е т аб ли ц ы 2 0  

Метод 


Описание 

Линейная регрессия 

Классический линейный метод решения задачи регрессии 

Автокорреляция 

Нахождение линейной автокорреляционной зависимости. Метод применяется для 

обработки временных рядов для обнаружения периодичности, сезонности 

Группировка/разгруп- 

пировка 


Два взаимосвязанных метода обработки. Группировка позволяет объединять записи 

по полям-измерениям и агрегировать данные в полях-фактах. Разгруппировка разби-

вает полученные общие итоги в соответствии с рассчитанными пропорциями 

Вычисляемые данные 

Добавление полей, рассчитанных по заданным формулам 

Фильтрация 

Отбор записей в таблице по заданным условиям 

Дубликаты и противо-

речия 

Обнаружение и фильтрация дубликатов и противоречий 



Квантование 

Преобразование непрерывных данных в дискретные 

Дата и время 

Выделение из дат любого временного интервала (год, месяц, квартал и т. д.) 

Скользящее окно 

Трансформация временного ряда к скользящему окну 

Комплексная обработка  Понижение размерности и устранение незначащих факторов 

Парциальная обработка  Заполнение пропусков, редактирование аномалий, сглаживание, вычитание шума 

Прогнозирование 

Построение прогноза на основе модели, построенной любым способом. Например, 

при помощи нейросети или линейной регрессии 

 

Визуализация (отображение) результатов в приложении «Deductor Studio» проводится на любом этапе 



обработки. Пользователю предлагается широкий выбор способов визуализации, представленный в табли-

це 21. 


 

Таб л иц а 2 1   –  Способы визуализации результатов анализа 

Способ 

Описание 

OLAP (Online 

Analytical Proces- 

sing) 

Многомерное представление данных. Любые данные, используемые в программе, можно посмотреть в 



виде кросс-таблицы и кросс-диаграммы. Операции манипуляции многомерными данными – группиров-

ка, фильтрация, произвольное размещение измерений, детализация, выбор любого способа агрегации, 

отображение в абсолютных числах и в процентах 

Таблица 


Стандартное табличное представление с возможностью фильтрации данных 

Диаграмма 

График изменения любого показателя 

Гистограмма 

График разброса показателей 

Статистика 

Статистические показатели выборки 

Диаграмма рассе-

яния 

График отклонения прогнозируемых при помощи модели значений от реальных. Может быть построен 



только для непрерывных величин и только после использования механизмов построения модели, напри-

мер, нейросети или линейной регрессии 

Таблица сопря-

женности 

Предназначена для оценки результатов классификации вне зависимости от используемой модели. Таб-

лица сопряженности отображает результаты сравнения категориальных значений исходного выходного 

столбца и категориальных значений рассчитанного выходного столбца 

Что-если 

Позволяют «прогонять» через построенную модель любые интересующие пользователя данные и оце-

нить влияние того или иного фактора на результат 

Обучающая вы-

борка 


Выборка, используемая для построения модели. Выделяются данные, попавшие в обучающее, тестовое и 

валидационное множество с возможностью фильтрации 

Диаграмма про-

гноза 


Применяется после использования метода обработки Прогнозирование. Прогнозные значения выделяют-

ся цветом 

Граф нейросети 

Визуальное отображение весов обученной нейросети 

Дерево решений 

Отображение дерева решений, полученного при помощи соответствующего алгоритма. Имеется возмож-

ность посмотреть детальную информацию по любому узлу и фильтровать попавшие в него данные 

Карта Кохонена 

Отображение карт, построенных при помощи алгоритма Кохонена. Широкие возможности настройки – 

выбор количества кластеров, фильтрация по узлу (кластеру), выбор отображаемых полей 

Описание 

Текстовое описание параметров импорта (обработки, экспорта) в дереве сценариев обработки 

 

 



Достарыңызбен бөлісу:
1   ...   29   30   31   32   33   34   35   36   37




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет