2.2 Үлкен деректер мен дәстүрлі деректерді салыстыру
Кесте 1. Үлкен деректер мен дәстүрлі деректерді салыстыру
2.3 Үлкен деректердің 5 V компоненті
Әр түрлі пәндер үлкен деректер ұғымын әртүрлі мағына мен ерекшеліктерге сәйкес түсіндіреді, бірақ та үлкен деректер компоненттері туралы жалпы ортақ түсінік жоқ. Әдебиетте үлкен деректердің үш негізгі компоненттері көрсетілген. Уақыт өте келе деректер көлемі (volume), жылдамдық (velocity) және деректердің әртүрлілігі (variety) тұжырымдамаларына дұрыстық (verification) және құндылық (value) сияқты ұғымдар қосылды. Тиісті көздерде 5V үлкен деректер компоненттерінің стандартты анықтамасы әлі жоқ. Кейбір дереккөздер бұл анықтамаларды компоненттер / элементтер / / қасиеттер / үлкен деректердің өлшемдері сияқты әртүрлі атаулармен анықтайды.
Алайда, көбінесе қызығушылық тудыратын компонент - бұл деректер көлемі, бірақ үш негізгі компонент (көлем, әртүрлілік, жылдамдық) үлкен деректердің ең дәл анықтамасында қатар жүруі керек деп саналады. Сондай-ақ, үлкен деректердің құрамдас бөліктері көлем, жылдамдық, әртүрлілік, мән (құндылық) және дәлдік (volume, velocity, variety, value and veracity-5V) екендігі туралы пікірлер бар.
Бұл компоненттердің қарапайым анықтамалары деректердің көлемін, деректердің мөлшерін, деректер шығарылған сәттен бастап жариялануға кететін уақытты, сонымен қатар деректер алуан түрлі форматтағы айырмашылықтарды білдіру үшін қолданылады. Келесі процесте қосылған дәлдік үлкен деректердің сенімділігін көрсету үшін қолданылады. Үлкен деректер компоненттерінің соңғы және маңызды мәні компоненттері үлкен деректерден күтілетін шаманы білдіреді. Басқаша айтқанда, үлкен деректер тұжырымдамасының дерексіз мағынасы және оның институттарға қосқан үлесі соңғы қосылған компоненттің мағынасында болады. 2-суретте үлкен деректердің бес компоненті ұжымдық түрде көрсетілген.
Әдебиеттерде кең қол жетімді деректердің үлкен компоненттерінің толық түсіндірмелері:
iv. Деректердің дәлдігі
Үлкен деректердің дәлдігі (нақтылығы) немесе дұрыстығын екі екі айдар бойынша сипаттауға болады. Біріншіден, үлкен деректер мен деректердің сенімділігін құрайтын дереккөздердің дәлдігі түсіндіріледі. Екіншіден, деректерді қолданатын мақсатты аудитория үшін деректердің пайдалы болуы маңызды. Осы екі жағдайды ескере отырып, деректердің дәлдігін үлкен деректер компоненттері арасындағы ең қиын жағдай деп айтуға болады. Себебі, үлкен деректердің көпшілігі әр түрлі дереккөздерден келеді. Бұл жағдайды деректерді жинайтын компаниялар басқара алмайды [11].
Twitter-дің уақыт кестесі осының ең жақсы мысалдарының бірі болып табылады. Белгілі бір тақырыпта ашылған хэштегпен жасалған мазмұнның сол тақырыпқа қатысты екендігін тексеру қиын. Сондықтан белгілі бір тақырыпта жарнама жасағысы келетін кәсіпкерлер осы деректерді қарастырған кезде дұрыс тұтынушыға қол жеткізуде қиындықтарға тап болуы мүмкін. Әсіресе, әлеуметтік желілерде жарнама жасағысы келетіндер мақсатты аудиторияны дұрыс анықтауы керек. Сүзу процесі неғұрлым сезімтал болса, жарнаманың қажетті адамдарға қол жетімді болуы мүмкін. Үлкен деректердің үлкен көлемде болуы және деректердің әртүрлілігі бұл жұмысты қиындатады. Себебі үлкен деректердің сапасы мен дәлдігіне әсер ететін маңызды факторлар - бұл деректер көлемі мен деректердің әртүрлілігі. Деректердің мөлшері өсіп, деректер көзі өзгерген сайын, олардың сапасы да, сенімділігі де бірдей қарқынмен төмендейді. Бүгінгі күні қолданылатын BVA жүйелері осындай жағдайларды шешу үшін үнемі жетілдіріліп отырады.
Достарыңызбен бөлісу: |