Лекция тақырыбы: Үлкен деректердің компоненттері


Үлкен деректердің 7 V компоненті



бет6/7
Дата05.03.2024
өлшемі0.62 Mb.
#494305
түріЛекция
1   2   3   4   5   6   7
2.Үлкен деректердің компоненттері

2.4 Үлкен деректердің 7 V компоненті
Үлкен деректердің жоғарыда көрсетілген ерекшеліктеріне келесі «Өзгермелілік (variability) пен күрделілік» (complexity), «Құбылмалылық (Volatility) және жарамдылық» (Validity) компоненттері қосылды және 5V анықтамалары кеңейтілді [12].
Деректердің өзгермелілігі мен күрделілігі
SAS (Statistical Analysis Software – Статистикалық талдау бағдарламасы) өзгермелілік пен күрделілік шарттарын үлкен деректерге қосымша компонент ретінде қосты4. Өзгермелілік дегеніміз – деректер ағынының жылдамдығының өзгеруі мен сәйкес келмеуі. Күрделілік дегеніміз үлкен деректердің көптеген дереккөздердің көмегімен жасалынатындығын білдіреді. Деректердің шашыраңқы өндірісі, әлеуметтік желілерде белгілердің (hashtag) қолданылуы және аббревиатуралар деректерді қиындатады. Әр түрлі көздерден алынған деректер байланыстырылады, сәйкестендіріледі, тазаланады және түрлендіріледі (Gandomi ve Haider, 2015: 139)
Деректердің құбылмалылығы мен жарамдылығы
Құбылмалылық дегеніміз - бұл біздің деректерімізді қанша уақыт сақтайтынымызға жауап береді. Құбылмалылық функциясы дәлелденген немесе жарамды деректердің қажеттіліктерге жауап беруі үшін қанша уақыт сақталуы керектігі туралы мәселені қамтиды. Егер сізде жарамды деректер болса және нәтижелердің дұрыстығын дәлелдей алсаңыз, сіздің қажеттіліктеріңізді қанағаттандыру үшін деректер қанша уақыт сақталуы керек? - деген сұрақты осы компонент қарастырады.
Жарамдылық тұжырымдамасы деректер жиынтығының жоспарланған талдауға сәйкес келетіндігімен байланысты. Үлкен деректер жиынтығындағы деректердің жарамдылығын тексеру деректер арасында байланыс бар-жоғын анықтамас бұрын жасалады.
Кейбір дереккөздерде жоғарыда келтірілген V компоненттерінен басқа «virality » мен «viscosity» (тұтқырлық) туралы да айтылады. Қысқаша айтқанда, «virality» - бұл деректердің қаншалықты жылдам таратылатындығы және адамдардың бір-біріне деректер туралы хабарлау үрдісі ретінде анықталады. Тұтқырлық кідірісті сипаттау үшін қолданылады және деректердің таралу жылдамдығының коэффициенті ретінде анықтауға болады5.


Достарыңызбен бөлісу:
1   2   3   4   5   6   7




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет