Журналістика даних: Посібник


Хакерський марафон Mapa76



бет22/46
Дата15.07.2016
өлшемі7.71 Mb.
#201068
1   ...   18   19   20   21   22   23   24   25   ...   46

Хакерський марафон Mapa76


Ми відкрили в Буенос-Айресі підрозділ Hacks/Hackers («Журналісти/хакери») у квітні 2011 року. Ми провели дві початкові зустрічі, щоб популяризувати ідею більшої співпраці між журналістами та програмістами. На кожну прийшло від 120 до 150 людей. На третій зустрічі ми організували 30-годинний хакатон за участю восьми учасників під час конференції з цифрової журналістики в місті Розаріо, за 300 кілометрів від Буенос-Айреса.



Ілюстрація 41. Mapa76 (Hacks/Hackers Буенос-Айрес)
Темою, що весь час поставала на цих зустрічах, було бажання «вилучити» великі обсяги даних з Інтернету та представити їх у візуальній формі. Так народився проект під назвою Mapa76.info, який допомагає користувачам вилучати дані і потім представляти їх, використовуючи карти та «лінійки часу». Завдання аж ніяк не просте.

Чому Mapa76? 24 березня 1976 року в Аргентині стався державний заколот, який тривав до 1983 року. За цей період військової диктатури орієнтовно 30 тисяч людей зникли, тисячі загинули, і 500 дітей народилися в тюрмі. Більш ніж 30 років по тому кількість людей в Аргентині, засуджених за злочини проти людяності, скоєні під час диктатури, становить 262 особи (дані станом на вересень 2011 року). Наразі тривають 14 судів та ще 7 мають призначену дату початку. У розпочатих судових справах фігурують 802 особи.

Ці судові справи породжують значні обсяги даних, які складно обробляти дослідникам, журналістам, організаціям із прав людини, суддям, прокурорам та ін. Дані створюються в розрізнений спосіб, і слідчі зазвичай не використовують програмний інструментарій, щоб інтерпретувати ці дані. Зрештою це призводить до того, що певні факти залишаються поза полем зору, та обмеження кількості гіпотез. Mapa76 – це інструмент журналістських розслідувань, що надає відкритий доступ до цієї інформації заради виконання журналістських, законодавчих, юридичних та історичних завдань.

Готуючись до хакатону, ми створили платформу, яку б використовували програмісти та журналісти під час спільної роботи у день заходу. Мартін Сарсале розробив кілька базових алгоритмів для вилучення структурованих даних із нерозмічених текстових документів. Були використані деякі бібліотеки з проекту DocumentCloud.org, але небагато. Платформа автоматично аналізувала та вилучала з тексту імена, дані та географічні назви – і дозволяла користувачам досліджувати ключові факти у різних справах (такі як дата народження, місце арешту, імовірне місце зникнення тощо).

Нашою метою було надання платформи для автоматичного вилучення даних із судових вироків по військовій диктатурі у Аргентині. Ми хотіли знайти спосіб автоматичного (або принаймні напівавтоматичного) показу ключових даних, пов’язаних із справами у період 1976-1983 року, що засновані на письмових свідченнях, судових слуханнях та вироках. Вилучені дані (імена, місця та дати) збиралися, накопичувалися, після чого дослідники могли їх аналізувати чи покращувати, а також досліджувати за допомогою карт, лінійок часу та інструментів мережевого аналізу.

Проект дозволяв журналістам, слідчим, прокурорам та свідкам простежувати історію життя конкретної особи, включно з обставинами її захоплення та подальшого зникнення або звільнення. Коли якась інформація відсутня, користувачі мали змогу «прочесати» велику кількість документів, що могли бути пов’язані з цією справою.

Ми оприлюднили інформацію про хакатон під час зборів Hacks/ Hackers Буенос-Айрес, у якої на той час було близько 200 членів (на час написання цього розділу їх близько 540). Ми також зв’язалися з багатьма організаціями із захисту прав людини. На зустріч прийшло близько 40 осіб, серед них журналісти, представники правозахисних організацій, програмісти та дизайнери.

Під час хакатону ми визначили завдання, які могли б незалежно виконувати різні фахові групи учасників, щоб полегшити перебіг процесу. Наприклад, ми попросили дизайнерів попрацювати над інтерфейсом, який поєднував би карти та лінійки часу, програмістів – пошукати способи вилучення структурованих даних та розробити алгоритми розрізнення імен, а журналістів – подивитися, що сталося з певними людьми, порівняти різні версії історій і «прочесати» документи в пошуках сюжетів про ті чи інші випадки.

Мабуть, найбільшою проблемою, яка постала після завершення хакатону, було те, що наш проект був вельми амбіційним, наші оперативні завдання – вимогливими, і було складно координувати слабко пов’язану між собою мережу волонтерів. Майже в усіх залучених до проекту осіб були завантажені робочі дні, а багато хто також брав участь у інших акціях та проектах. Hacks/Hackers Буенос-Айрес провів 9 зустрічей у 2011 році.

Проект наразі перебуває на стадії активного розвитку. Є ядро команди з чотирьох людей, яке працює з понад десятьма учасниками. У нас є публічний список розсилки та репозиторій коду, і в такий спосіб усі охочі можуть долучитися до проекту.


Маріано Блехман, Hacks/Hackers Буенос-Айрес


Як Guardian Datablog висвітлював бунти в Британії


Влітку 2011 року Британією прокотилася хвиля масових заворушень. На той час політики вважали, що ці дії категорично не пов’язані із проблемою бідності, і ті, хто брали участь у мародерстві, є звичайними злочинцями. Більше того, прем’єр-міністр та чільні політики-консерватори звинуватили соціальні мережі у підбурюванні заворушень, натякаючи, що саме ці платформи заохочували погромників, і що бунти були організовані за допомогою Facebook, Twitter та Blackberry Messenger. Лунали заклики тимчасово заблокувати соціальні мережі. Через те, що уряд не розпочав розслідування причин виникнення бунтів, газета Guardian у співпраці з Лондонською школою економіки розпочала фундаментальний проект «Вивчаючи бунт», щоб дослідити ці питання.



Ілюстрація 42. Британські бунти: всі підтверджені інциденти (The Guardian)
Газета широко застосовувала методи журналістики даних, щоб дати громаді краще розуміння того, хто брав участь у мародерстві, і чому. Понад те, вони також працювали з іще однією командою науковців, очолюваною професором Робом Проктером з університету Манчестера, щоб краще зрозуміти роль соціальних медіа, які сама Guardian активно використовувала під час висвітлення заворушень. Команду проекту «Вивчаючи бунт» очолив Пол Льюіс, редактор спецпроектів у Guardian. Під час заворушень Пол готував репортажі з місця подій у містах по всій Англії (найчастіше за допомогою свого екаунту в Твіттері, @paullewis). Ця друга команда опрацювала 2,6 мільйони твіт-повідомлень про заворушення, які були надані сервісом Twitter. Головною метою цього дослідження соціальних медіа було встановити, як поширюються чутки в Twitter, яку функцію виконують різні користувачі/дійові особи у «розмноженні» та поширенні потоків інформації, чи ця платформа підбурювала до бунту, а також дослідити інші способи організації.

Говорячи про застосування методів журналістики даних та візуалізацій даних, буде корисно розрізняти два ключові періоди: власне період заворушень і те, в який спосіб дані допомагали повідомляти сюжети, пов’язані з поширенням заворушень; та другий період набагато інтенсивніших досліджень у виконанні двох команд науковців, що працювали з Guardian, зі збору даних, аналізу їх та написання поглиблених звітів про виявлені результати. Результати першої фази проекту «Вивчаючи бунт» були опубліковані під час тижня інтенсивного висвітлення теми на початку грудня 2011 року. Нижче наведено кілька базових прикладів використання журналістики даних під час обох періодів.


Фаза один: Бунти як вони є


За допомогою простих карт команда журналістів даних із Guardian показуваламісцезнаходження підтверджених випадків заворушень, і поєднавши дані про рівень бідності з даними про місця заворушень, вони почали спростовувати панівне твердження політиків про те, вони не були пов’язані з бідністю. Обидва ці приклади використовували готові картографічні програми, а в другому прикладі дані про місцезнаходження були поєднані з іншим набором даних, що започаткувало використання інших зв’язків та лінків.

Розглядаючи тему використання соціальних медіа під час заворушень, а саме Twitter, газета створила візуалізацію пов’язаних із бунтами хештегів, вжитих у цей період, що показало, що Twitter головним чином використовувався як спосіб реагування на заворушення, а не як засіб організації людей на мародерство, а хештег #riotcleanup («прибирання після бунту» - прим.), який розпочав спонтанну кампанію із прибирання вулиць після заворушень, характеризувався найбільш значним сплеском популярності під час періоду бунтів.


Фаза два: Вивчаючи бунт


Коли газета повідомила про факти, встановлені внаслідок інтенсивних досліджень та тісної співпраці з двома науковими командами, були створені дві візуалізації, які спричинили широке обговорення. Перша, коротке відео, показує результати поєднання відомих місць, де люди брали участь у заворушеннях, та місць поживання цих людей, тобто, демонструє так званий «маршрут бунту». Для цього газета співпрацювала з фахівцями-картографами транспорту з ITO World, щоб змоделювати найбільш імовірні маршрути, якими рухалися бунтівники, просуваючись до різноманітних місць майбутнього мародерства, вказати різні схеми для різних міст, включно з маршрутами на велику відстань.

Друга має справу зі способами поширення чуток у Твіттері. Під час дискусії з командою науковців було спільно визначено сім чуток для подальшого аналізу. Наукова команда після цього зібрала всі дані, пов’язані з кожною чуткою, та розробила кодову схему для позначення твітів за чотирма головними кодами: люди просто поширюють чутку (твердження), спростовують її (контр-твердження), ставлять питання (запит) та просто коментують (коментар). Всі твіти були закодовані в трьох примірниках і результати були візуалізовані командою фахівців з інтерактивної графіки в Guardian. Команда з Guardianнаписала про те, як вони створювали цю візуалізацію.

В цій візуалізації особливо вражає, що вона аргументовано показує те, що дуже важко описати, та передає вірусну природу чуток і шляхів розвитку їхнього життєвого циклу протягом певного часового проміжку. Роль провідних ЗМІ у поширенні деяких із цих чуток є очевидною (наприклад, коли їх відразу спростовують, або навпаки, підтверджують і перетворюють на новини), так само як і коректорська роль власне Твіттера щодо цих чуток. Візуалізація не тільки суттєво допомогла у створенні журналістських сюжетів, але надала бачення того, як функціонують чутки в Твіттері, що є корисною інформацією на випадок подібних подій у майбутньому.

Останній приклад чітко вказує на потужну синергію між газетою та командою науковців, спроможною виконати поглиблений аналіз 2,6 мільйонів твітів на тему заворушень. Попри те, що команда науковців створила набір специфічних інструментів задля виконання цього аналізу, вони зараз працюють над тим, щоб зробити їх доступними для всіх, хто хоче використати цей інструментарій для аналогічних завдань, і створити таким чином автоматизоване робоче місце для такого аналізу. В поєднанні з інструкціями «Як це зробити» від команди Guardian це стане корисним прикладом використання аналізу соціальних медіа та візуалізацій для того, щоб передавати такі важливі теми.


Фаріда Віз, університет Лейчестера



Достарыңызбен бөлісу:
1   ...   18   19   20   21   22   23   24   25   ...   46




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет