Журналістика даних: Посібник


Як працює команда журналістів-програмістів у Chicago Tribune



бет8/46
Дата15.07.2016
өлшемі7.71 Mb.
#201068
1   ...   4   5   6   7   8   9   10   11   ...   46

Як працює команда журналістів-програмістів у Chicago Tribune


Команда програмістів, що створюють «журналістські» програми у Chicago Tribune – це компашка щасливих хакерів, інтегрована в ньюсрум. Ми тісно співпрацюємо з редакторами та репортерами, допомагаючи їм: (1) досліджувати сюжети та відписуватися по них, (2) робити онлайн-ілюстрації до публікацій і (3) створювати епохальні веб-ресурси для добрих людей із Чикагщини.



Ілюстрація 16. Команда розробників «журналістських» програм у Chicago Tribune (Фото Брайяна Боєра)
Це важливо, що ми працюємо саме в ньюсрумі. Ми зазвичай знаходимо для себе роботу під час безпосереднього спілкування з журналістами. Вони знають, що ми будемо щасливі допомогти їм написати програму вилучення даних із неоковирного урядового вебсайту, розібрати на складники купу PDF-файлів, або у якийсь інший спосіб перетворити не-дані на те, що можна аналізувати. У такий спосіб ми дізнаємося про потенційні проекти журналістики даних ще на початковому етапі.

На відміну від багатьох інших команд, що працюють у цій галузі, нашу команду створили технарі, для яких журналістика означала зміну фаху. Дехто з нас отримав магістерський диплом після декількох років програмування для бізнесових потреб, а інших ми залучили зі спільноти прихильників відкритого урядування.

Ми працюємо оперативно. Щоб переконатися, що в нас завжди є контакт один з одним, щоранку ми проводимо 5-хвилинну планерку. Ми часто програмуємо парами – два програмісти за однією клавіатурою часто продуктивніші, ніж два програмісти за двома клавіатурами. На більшість проектів йде не більше тижня, але під час роботи над тривалішими проектами ми працюємо тижневими «порціями» і показуємо нашу роботу зацікавленій стороні – зазвичай це репортери та редактори – щотижня.

Наша мантра – це «помиляйся якнайшвидше». Якщо ти щось робиш не так, про це треба дізнатися якомога швидше, особливо якщо програмуєш під дедлайн!

У програмуванні все нових і нових завдань під дедлайн є потрясний аспект: ми завжди поповнюємо наш інструментарій. Щотижня ми створюємо програму чи дві, і після цього, на відміну від нормальних програмістських команд, ми можемо відкласти їх на задній план і розпочати наступний проект. Це та радість, яку ми ділимо навпіл із репортерами – щотижня ми дізнаємося про щось нове.

Усі ідеї програм надходять від репортерів та редакторів у ньюсрумі. Це, я вважаю, відрізняє нас від команд у інших ньюсрумах, які часто самі генерують ідеї. Ми розбудували міцні особисті та професійні стосунки із журналістами, і ці хлопці знають: якщо в них є дані, їм треба йти до нас.

Більшість нашої роботи в ньюсрумі – це підтримка журналістів. Ми допомагаємо журналістам вести «розкопки» даних, перетворювати файли PDF назад у таблиці, «розбирати на дані» вебсайти тощо. Це сервіс, який нам подобається надавати, бо він ще на ранніх етапах долучає нас до роботи з даними, яка відбувається в ньюсрумі. Деякі подібні роботи стають журналістськими програмами – картою, таблицею, часом навіть більшим вебсайтом.

На початку ми робили лінк на програму з написаної статті, що в результаті не генерувало багато трафіку. Наразі ж програмні додатки знаходяться у верхній частині вебсайту, а лінки з них ведуть на статтю, що йде на користь як для програми, так і для статті. Для наших робіт на вебсайті є окремий розділ, але трафік на нього не дуже активний. Але це й не дивно. Ситуація «Агов, сьогодні мені потрібні такі-от дані» насправді трапляється нечасто.

Нам подобається, коли завдяки нам зростає перегляд сторінок чи коли нас хвалять колеги, але це не головне. Наша мотивація – це той вплив, який має наша робота - на життя людей, на закони, на політиків тощо. Писана стаття називає тренд і «розбавляє» його кількома сюжетами. Але що читачу з цього, коли він закінчив її читати? Чи його родина у безпеці? Чи його дітей вчать як слід? Наша робота влучає в ціль, коли вона допомагає читачеві знайти в даних свій власний сюжет. Приклади таких впливових, персоналізованих розробок, виконаних нами, включають програмні додатки «Чи безпечними є будинки престарілих» та «Аналіз ситуації в школах».
Брайян Боєр, Chicago Tribune

За лаштунками The Guardian Datablog


Коли ми запускали Datablog, ми не мали уявлення про те, кого можуть зацікавити «сирі» дані, статистика та візуалізації. Як сказав один із босів у нашій організації: «А навіщо це комусь буде потрібно?»

Проект The Guardian Datablog  — редактором якого я є  —  свого часу був маленьким блогом, що містив повні масиви даних, пов’язаних із нашими публікаціями. Зараз він складається з головної сторінки (guardian.co.uk/data); пошукових механізмів, пов’язаних із даними про світове урядування та глобальний розвиток; візуалізації даних з Інтернету та графічні роботи від Guardian, та інструменти для дослідження даних із державних витрат. Кожного дня ми використовуємо електронні таблиці Google, щоб поширювати повний набір даних, на основі якого виконані наші роботи; ми візуалізуємо та аналізуємо ці дані, а тоді використовуємо їх як джерело тем публікацій для газети й сайту.

Оскільки я - редактор та журналіст, що працює з графікою, для мене це було логічним продовженням роботи, яку я вже виконував, - збирати нові масиви даних та возитися з ними, намагаючись знайти сенс у поточних новинах дня.


Ілюстрація 17. Візуалізація процесу створення The Guardian Datablog
Запитання, поставлене мені, отримало відповідь. Це були неймовірні кілька років для оприлюднення урядових даних. Обама відкрив дані уряду США в якості свого першого президентського указу, цьому прикладу наслідували інші урядові сайти цілого світу – Австралія, Нова Зеландя, уряд Британії на сайті Data.gov.uk.

У нас був скандал із витратами парламентарів – найбільш неочікуваний приклад британської журналістики даних – і його наслідками стало те, що Вестмінстер зараз зобов’язаний щорічно публікувати колосальні обсяги даних.

У нас пройшли загальні вибори, де кожна з провідних політичних сил заявляла про підтримку прозорості даних, відкриваючи перед світом власні бази даних. Наші газети присвячували дорогоцінні площі своїх колонок оприлюдненню бази даних Мінфіну COINS.

У той самий час, коли Інтернет постачає все більші й більші обсяги даних, читачі з усього світу більше ніж будь-коли цікавляться сирими фактами, на яких базуються новини. Коли ми запускали Datablog, то думали, що нашою аудиторією будуть програмісти. Насправді не програмісти, а звичайні люди хочуть більше знати про викиди оксиду вуглецю, чи еміграцію зі Східної Європи, чи спалах смертності в Афганістані – чи просто кількість вживань слова «love» у текстах пісень «Бітлз» (613 разів).

Поступово Datablog став відображати та доповнювати наші сюжети. Ми спільно роздобули 458 тисяч документів, пов’язаних із витратами парламентарів, і проаналізували детальні дані, подані депутатами. Ми допомогли нашим користувачам детально дослідити базу даних витрат Міністерства фінансів, і публікували дані, на яких базувалися наші новини.

Але радикальний поворот у журналістиці даних відбувся навесні 2010 року з однієї таблиці: 92201 рядок даних, кожен із яких описував у деталях певну військову подію в Афганістані. Це були бази даних війни, оприлюднені WikiLeaks. Це – частина перша. Далі були ще два епізоди – Ірак та дипломатичні телеграми. Офіційна назва двох перших частин – SIGACTS, база даних важливих бойових подій у армії США.

У ЗМІ найважливіше – це географія та близькість до відділу новин. Якщо ви поруч, то неважко пропонувати сюжети та стати частиною процесу; і навпаки, якщо, їхнє око вас не бачить в буквальному сенсі – то й серце в них не болить. До появи Wikileaks ми сиділи на різних поверхах, із художниками. Після Wikileaks ми сидимо на одному поверсі, поруч із відділом новин. Це означає, що для нас стало легше пропонувати новинарям ідеї, а журналісти з ньюсруму розраховують на нашу допомогу при підготовці своїх публікацій.

Не так давно журналісти контролювали доступ до офіційних даних. Ми писали статті на основі цифр та пропонували їх вдячній публіці, яка не цікавилася сирою статистикою. Ідея допуску сирої інформації в газети була анафемою.

Зараз ця динаміка змінилася до непізнаваності. Ми виконуємо нову роль - інтерпретаторів, які допомагають людям зрозуміти дані – і навіть просто публікують ці дані, бо вони цікаві самі по собі.

Але цифри без аналізу – це лише цифри, і тут ми починаємо діяти. Коли британський прем’єр заявив, що заворушення в серпні 2011 року не були пов’язані з бідністю, ми змогли додати до звернень протестувальників індикатори бідності, щоб показати, наскільки правдивим було твердження влади.

За всіма нашими публікаціями в сфері журналістики даних перебуває певний процес. Він постійно змінюється, застосовуються нові інструменти та техніки. Дехто каже, що вихід – це стати таким собі суперхакером, писати код та занурюватися в систему управління базами даних SQL. Ви можете вирішити піти цим шляхом. Але багато з того, що ми робимо, це простий Excel.

Для початку, ми знаходимо дані або отримуємо їх із різних джерел: найсвіжіших новин, урядових даних, журналістських розслідувань тощо. Після цього ми дивимося, що можна зробити з цими даними – чи потрібно скомбінувати їх з іншим масивом даних? Як відобразити зміни даних у часі? Ці таблиці часто потребують серйозного очищення – всі ці «зовнішні» колонки та хитромудро пов’язані клітини насправді створюють клопіт. І це якщо мова йде не про PDF – найгірший формат даних, відомий людству.

Офіційні дані часто містять власні коди: кожна школа, лікарня, виборчий округ чи орган місцевої влади мають унікальний код-ідентифікатор.

У країн вони теж є (до речі, код Великобританії – це GB). Ці коди корисні, бо дають змогу поєднувати різні набори даних, і просто вражає, скільки різноманітних відмінностей у правописі чи слововживанні ви помічаєте в процесі. Наприклад, є Бірма та М’янма, або округ Фаєтт у США – їх аж одинадцять у штатах у проміжку від Джорджії до Західної Вірджинії. За допомогою кодів можна порівнювати порівнюване.

Наприкінці цього процесу ви обираєте спосіб кінцевого представлення: це буде стаття чи інфографіка або візуалізація, і які для цього будуть застосовані інструменти? Наші головні інструменти – це безкоштовні засоби, за допомогою яких можна швидко щось зробити. Більш складну графіку створює наша команда розробників.

Це означає, що зазвичай ми використовуємо таблиці Google charts для невеликих лінійних графіків та секторних діаграм, або Google Fusion Tables, щоб легко та швидко створити карти.

Комусь може здатися, що це новий підхід. Насправді ж ні.

У найпершому числі Manchester Guardian, що вийшла в неділю, 5 травня 1821 року, новини були на звороті сторінки, як в усіх тогочасних газетах. Головним елементом на першій сторінці була реклама про розшук пса-лабрадора.

І посеред статей та поетичних уривків третину тієї сторінки на звороті займають, гм, факти. Таблиця повної вартості навчання в місцевих школах, яку «ніколи не бачила публіка», пише якийсь “NH”.

“NH” хотів, щоб його дані були опубліковані, бо інакше ці факти лишилися б на поталу недосвідчених клерків. Його мотиви: «Ця інформація та її зміст є цінною тому, що без знань про рівень вартості освіти навіть найкращі уявлення про умови та майбутній прогрес суспільства обов’язково будуть некоректними». Інакше кажучи, якщо люди не знають, що відбувається навколо, як суспільство може стати кращим?

Я не можу навести кращого пояснення тому, заради чого ми намагаємося робити нашу справу. І те повідомлення, що колись знаходилося на останніх сторінках газети, зараз може стати новиною на першій шпальті.
Саймон Роджерс, The Guardian




Достарыңызбен бөлісу:
1   ...   4   5   6   7   8   9   10   11   ...   46




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет