2
3
1
Data Science
Большие данные — это огромные объёмы неструктурированной информации: например, метеоданные за какой-то период, статистика запросов в поисковых системах, результаты спортивных состязаний, базы данных геномов микроорганизмов и многое другое
Ключевые слова здесь — "огромный объём" и "неструктурированность"
Чтобы работать с такими данными, используют математическую статистику и методы МО
Специалист, который делает такую работу, называется датасайентист (или Data Scientist)
Он анализирует большие данные (Big Data), чтобы делать прогнозы
Какие именно прогнозы — зависит от того, какую задачу нужно решить
Итог работы дата-сайентиста — прогнозная модель
Если упростить, то это программный алгоритм, который находит оптимальное решение поставленной задачи
Это концепция объединения статистики, анализа данных, машинного обучения и связанных с ними методов для понимания и анализа реальных явлений
Data Science — это работа с большими данными (англ. Big Data)
2
3
1
Data Mining
Технологию Data Mining достаточно точно определяет Григорий Пиатецкий-Шапиро – один из основателей этого направления:
Data Mining – это процесс обнаружения в сырых данных
➢ ранее неизвестных
➢ нетривиальных
➢ практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности
Data Mining является мультидисциплинарной областью, возникшей и развивающейся на базе достижений прикладной статистики, распознавания образов, методов искусственного интеллекта, теории баз данных и др.
Отсюда обилие методов и алгоритмов, реализованных в различных действующих системах Data Mining
Многие из таких систем интегрируют в себе сразу несколько подходов
Тем не менее, как правило, в каждой системе имеется какая-то ключевая компонента, на которую делается главная ставка
Широкое понятие, означающее извлечение знаний из данных
Data mining переводится как "добыча" или "раскопка данных"
Нередко рядом с Data Mining встречаются слова "обнаружение знаний в базах данных" (knowledge discovery in databases) и "интеллектуальный анализ данных"
Их можно считать синонимами Data Mining
Достарыңызбен бөлісу: |