МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РЕСПУБЛИКИ КАЗАХСТАН
ЮЖНО-КАЗАХСТАНСКИЙ УНИВЕРСИТЕТ
им. М.АУЕЗОВА
Кафедра: «Вычислительная техника и программное обеспечение»
СРО 2
По дисциплине: Технологии больших данных
Тема: Современные способы хранения и обработки больших данных в научной литературе
Выполнил: Хилалов С.А.
Группа: ИП-19-6р
Приняла: Тарасова Р.Н.
Шымкент - 2022 г
Содержание
Введение 3
1 Характеристики больших данных 4
2 Большие данные в производстве 4
3 Big data и ценовая дискриминация клиентов 5
Список литературы 9
ВВЕДЕНИЕ
В статье «Big data processing» Билуха Иван Николаевич из Северного (Арктического) федерального университета имени М. В. Ломоносова (г. Архангельск) Билуха Иван Николаевич говорит и больших данных.
Большие данные — это широкое понятие данных, настолько объемных и сложных, что традиционные приложения для обработки данных не способны справиться с ними. Проблемы включают в себя анализ, хранение данных, поиск, совместное использование, хранение, передачу, визуализацию и конфиденциальность информации. Понятие часто относится к использованию прогностической аналитики или других определенных передовых методов для извлечения ценности из данных, и редко к определенному размеру набора данных. Точность в больших данных может
привести к более уверенному принятию решений. А лучшие решения могут означать большую операционную эффективность, снижение затрат и снижение риска.
Анализ наборов данных позволяет находить новые корреляции, выявлять тенденции развития бизнеса, предотвращать заболевания, бороться с преступностью и так далее. Ученые, специалисты в области средств массовой информации и рекламы, а также правительства регулярно сталкиваются с трудностями при работе с большими массивами данных в таких областях, как поиск в Интернете, финансы и бизнес-аналитика. Ученые сталкиваются с ограничениями в обработке информации, включая метеорологию, сложные физические симуляции, биологические и экологические исследования.
Наборы данных увеличиваются в размерах отчасти потому, что они все чаще собираются дешевыми и многочисленными мобильными устройствами для сбора информации, антеннами (дистанционное зондирование), программными журналами, камерами, микрофонами, считывателями радиоча
стотной идентификации и беспроводными сенсорными сетями.
С 1980-х годов технологический потенциал хранения информации на душу населения в мире примерно удваивался каждые 40 месяцев.
Большинство анализов данных — это анализ данных, которые обрабатываются на персональном компьютере или ноутбуке. Системы управления реляционными базами данных, а также пакеты статистики и визуализации для настольных компьютеров часто испытывают трудности с обработкой больших данных. Вместо этого работа требует массового параллельного программного обеспечения, работающего на десятках, сотнях
или даже тысячах серверов. То, что считается большими данными, варьируется в зависимости от возможностей пользователей и их инструментов, а расширяющиеся возможности де лают большие данные движущейся целью. Таким образом, то, что считается ≪большим≫ в один год, станет обычным в последующие годы. Для некоторых организаций, впервые столкнувшихся с сотнями гигабайт данных, может возникнуть необходимость пересмотреть варианты управления данными. Для других это может занять десятки или сотни терабайт, прежде чем размер данных станет существенным фактором.
Достарыңызбен бөлісу: |