Журналістська програма – це велика інтерактивна база даних, яка передає журналістський сюжет. Розглядайте її так, як ви розглядали б будь-яку іншу форму журналістики. Вона просто використовує програмне забезпечення замість слів чи ілюстрацій.
Надаючи кожному читачеві дані, які мають для нього специфічне значення, журналістська програма може допомогти йому зрозуміти статтю так, що це матиме для нього особистий зміст. Вона може допомогти читачеві усвідомити його особистий зв’язок із ширшим національним феноменом, і посприяти в поєднанні того, що він знає, з тим, що йому було невідомо, таким чином заохочуючи до глибшого розуміння абстрактних ідей.
Ми схильні розробляти журналістські програми тоді, коли в нас є база даних (або коли ми вважаємо, що зможемо її отримати), яка є національною за масштабами але при цьому достатньо «гранульованою», щоб наводити суттєві деталі.
Журналістська програма повинна розповідати сюжет, і як будь-яка інша гарна стаття, вона потребує заголовка, автора, підзаголовка та врізу. Деякі з цих компонентів важко виокремити у інтерактивній програмі, але вони там є, якщо придивитися уважніше.
Крім цього, журналістська програма повинна бути генеративною – тобто, вона має генерувати нові статті та нову журналістську діяльність. Найкращі програми ProPublica використовувалися як підґрунтя для написання статей у місцевій пресі.
Як приклад розглянемо нашу журналістську програму Dollars for Docs («Долари лікарям»). Вона вперше відстежила мільйони доларів платежів від фармацевтичних компаній лікарям за їхні консультації, рекомендації тощо. Створена нами програма дала змог читачам знайти їхнього власного лікаря та побачити, скільки коштів той отримав. Журналісти з інших видань також користувалися цими даними. Понад 125 місцевих видань, включно з Boston Globe, Chicago Tribune та St. Louis Post-Dispatch, провели журналістські розслідування практики місцевих лікарів, використовуючи дані Dollars for Docs.
Декілька з цих місцевих публікацій були результатом формального партнерства, але більшість постала цілком незалежно – у деяких випадках ми мало що знали, а то й взагалі не знали про те, що над статтею ведеться робота, аж поки ця стаття не виходила. Оскільки ми є малим виданням, але національного масштабу, для нас це критично важливо. Ми не можемо знати місцеву ситуацію в 125 містах, але якщо наші дані допомагають журналістам, які знають місцеву ситуацію, створювати впливові публікації, наша місія виконана.
Ілюстрація 83. Карта Лос-Анджелеса (Los Angeles Times)
Одна з моїх улюблених журналістських програм - це «Карта Лос-Анджелеса» у Los Angeles Times, початок якій поклала колективна робота над картою багатьох районів Лос-Анджелеса, бо до запуску цього проекту не було незалежних, загальноприйнятих меж цих районів. Після цього початкового колективного проекту Los Angeles Times змогла взяти карти районів за основу для потужних проектів із журналістики даних – таких, як рівень злочинності за районами, якість шкільної освіти за районами тощо, - раніше б вони не мали змоги це зробити. Тож проект «Карти Лос-Анджелеса» виявився не тільки широким та специфічним водночас, - він ще й генеративний, і повідомляє людям власні сюжети.
Ресурси, необхідні для розробки журналістських програм, можуть суттєво відрізнятися. У New York Times десятки людей працюють над написанням програм та інтерактивною графікою. Та Talking Points Memo створила передову програму відстеження політичних опитувань, маючи команду з двох людей, і жоден із них не був фахівцем із комп’ютерних технологій.
Як більшість програмістів, що працюють в редакції, ми застосовуємо для розробки програм модифіковану методологію Agile. Ми швидко вносимо зміни та показуємо попередні варіанти іншим людям у редакції, з якими ми співпрацюємо. Найважливіше те, що ми працюємо в тісній взаємодії з журналістами та їхніми попередніми варіантами статей – навіть дуже попередніми. Ми діємо радше як репортери, аніж як традиційні програмісти. На додачу до написання коду ми телефонуємо нашим джерелам, збираємо інформацію та експертні коментарі. Було б дійсно складно розробити гарну журналістську програму на матеріалі, якого ми не розуміємо.
Чому редакціям варто цікавитися виробництвом комп’ютерних програм із журналістики даних? На це є три причини: це гарна журналістика, вона дуже популярна – найпопулярнішими рисами ProPublica є журналістські програми – і якщо цього не зробимо ми, це зробить хтось інший. Подумайте про здобутки, які ми випустимо з рук! І найважливіше, редакціям слід знати, що вони це можуть виконувати. Це легше, ніж здається зі сторони.
Скотт Клейн, ProPublica
Візуалізація як «робоча конячка» журналістики даних
Перш ніж ви спробуєте створити діаграму чи карту на основі ваших даних, поміркуйте хвилинку над тим, скільки ролей виконують статичні та інтерактивні графічні елементи у вашій журналістській роботі.
Візуалізація в журналістиці спроможна:
-
Допомогти вам визначити теми та запитання для подальшої роботи над сюжетом
-
Визначити відхилення в даних: це може бути ідея для якісної статті або, можливо, помилка у ваших даних
-
Допомогти знайти типові приклади
-
Показати слабкі місця у вашому репортажі
Візуалізації також виконують багато ролей під час публікації статей:
-
Ілюструють твердження, наведене в статті, у більш аргументований спосіб
-
Прибирають з тексту непотрібну технічну інформацію
Особливо в тому випадку, коли вони є інтерактивними та дозволяють вести дослідження, візуалізації роблять ваш процес роботи над матеріалом прозорим для читачів.
Із цих ролей випливає, що вам слід братися за візуалізації і на ранніх етапах вашої журналістської роботи, незалежно від того, чи ви працюєте над електронними даними, чи над документами. Не розглядайте це як окремий етап, про який варто задуматися вже після того, як стаття загалом написана. Хай ця робота допомагає вам скеровувати вашу журналістську діяльність.
Розпочати – це часом означає просто подати у візуальній формі вже зроблені вами нотатки. Погляньте на інфографіку в Ілюстрації 84, яка була опублікована у Washington Post в 2006 році.
Ілюстрація 84. Як змінювалися субсидії фермерам протягом часу (Washington Post)
Вона наводить ту частину доходу від ферм, яка пов’язана із субсидіями, та ключові події протягом останніх 45 років, що впливали на дохід. На її розробку пішло декілька місяців. Пошук даних, які можна було б використовувати протягом тривалого часу, з однотипними дефініціями та однотипними значеннями, становив суттєву проблему. Дослідження всіх цих піків та «низин» на візуалізації допомогло нам тримати в пам’яті контекст під час нашої журналістської роботи. Це також означало, що одна рутинна частина завдання була загалом завершена ще до того, як були написані статті.
Ось кілька підказок про те, за допомогою візуалізацій почати дослідження ваших баз даних.
Підказка 1. Використовуйте підбірку малих графіків (т.зв. small multiples, щоб швидко зорієнтуватися у великій базі даних
Я використав цю техніку у Washington Post, коли ми досліджували ідею про те, що адміністрація Джорджа Буша роздавала гранти, виходячи з політично ангажованих, а не незалежних міркувань. Більшість із цих програм із допомоги виконувалася за формулою, а інші фінансувалися роками, тож нам було цікаво, чи можна виявити тут якусь закономірність, розглянувши близько 1500 різних довільних потоків.
Я створив графік для кожної програми, де червоні точки вказували на рік президентських виборів, а зелені – на рік виборів до конгресу. Проблема: так, у деяких із цих програм справді спостерігався пік за шість місяців до президентських виборів – червоні точки з піковими цифрами поруч із ними – але це не той рік виборів. Замість перевиборів Джорджа Буша пік стосується президентських виборів 2000 року, коли Білл Клінтон перебував у Білому Домі, а його віце-президент Ел Гор ішов на наступні вибори.
Було справді легко це побачити за допомогою серій графіків, а не у таблиці з цифрами, а інтерактивна форма дала нам змогу перевірити різні типи грантів, регіонів та агенцій. Карти, виконані за принципом small multiples, надають спосіб відтворити час та місце в статичних зображеннях, які легко порівнювати – часом навіть легше, ніж у інтерактивній графіці.
Ілюстрація 85. Гранти міністерства охорони здоров’я та соціальних служб США: спарклайни допомагають оцінити тему статті (Washington Post)
Цей приклад було створено за допомогою короткої програми, написаної мовою PHP, але зараз набагато простіше робити таке за допомогою спарклайнів у Excel 2007 та 2010. Едвард Тафт, експерт з візуалізацій, винайшов ці «глибокі, прості, подібні до слів графіки», щоб передавати інформацію з великих баз даних у режимі «одного погляду». Зараз їх можна побачити всюди, від невеликих графіків під котируваннями на біржі до даних про перемоги та поразки в спорті.
Підказка 2: Розгляньте ваші дані зі сторони і "догори дригом"
Коли ви намагаєтеся зрозуміти, яка саме тема статті пов’язана з набором даних, то не існує неправильних способів розглядати ці дані; спробуйте будь-який підхід, який тільки можете придумати, і ви отримаєте інакшу перспективу. Якщо ви пишете про злочинність, можна поглянути на графік змін у насильницьких злочинах протягом року; іншим може бути зміна у відсотках; ще іншим – порівняння з іншими містами; або це може бути зміна протягом тривалих періодів часу. Використовуйте «сирі» цифри, відсотки та коефіцієнти .
Розгляньте це все у різних масштабах. Намагайтеся дотримуватися правила, що ваша вісь Х має перебувати на нулі. Тоді відступіть від цього правила і подивіться, чи це повідомить вам щось іще. Спробуйте логарифмічну шкалу та квадратні корні для даних, що мають дивний розподіл.
Враховуйте результати досліджень із візуального сприйняття. Експерименти Вільяма Клівленда показали, що око починає помічати зміни в зображенні, коли середній кут становить близько 45 градусів. З цього виходить, що вам слід ігнорувати принцип «завжди починайте з нуля», і замість цього намагатися отримати більш інформативну графіку. Наші дослідження з епідеміології показали, що потрібний рівень знаходиться на межі вашого графіка чи діаграми. Кожен із цих варіантів дозволяє побачити дані в різних перспективах. Коли це перестане повідомляти вам щось нове, ви знатимете, що справу завершено.
Підказка 3: Не робіть припущень
Після того, як ви розглянули ваші дані у різних ракурсах, ви, імовірно, виявили записи в базі даних, які видаються неправильними – ви можете не зрозуміти відразу що вони означають, або там будуть відхилення в даних (т.зв. викиди – прим.), які виглядають так, неначе це помилки, або ж тренди, які мають обернений характер.
Якщо ви хочете підготувати публікацію на основі ваших ранніх досліджень або зробити візуалізацію, вам слід з’ясувати ці питання, і тут не можна робити припущень. Це або підґрунтя для цікавих статей, або помилки; цікавий виклик, кинутий загальним уявленням, або ж просто непорозуміння.
Нема нічого незвичного в тому, що місцеві органи влади надають електронні таблиці, у яких повно помилок, так само легко не зрозуміти урядовий жаргон, використаний у базі даних.
Найперше, поверніться до початків вашої роботи. Чи прочитали ви документацію та застереження до неї, і чи існує ця проблема в оригінальній версії даних? Якщо все «по вашу сторону» виглядає коректно, тоді час сідати на телефон. Вам потрібно все з’ясувати, якщо ви плануєте це використовувати, тому починати треба негайно.
Сказавши це, зауважимо, що не кожна помилка справді щось важить. У базі даних фінансування виборчої кампанії типово мати кількасот поштових індексів, які не існують в природі, у базі даних на сто тисяч записів. До тих пір, поки всі ці індекси не належать до одного міста або не стосуються одного кандидата, ці випадкові помилки в записах насправді нічого не означають.
Вам слід запитати себе: Якщо я хочу використати ці обставини, чи отримають читачі фундаментально точне бачення того, про що повідомляють ці дані?
Підказка 4: Уникайте одержимості надмірною точністю
Протилежна сторона того, що ви не поставили достатньо запитань, - це надмірне захоплення точністю. Ваша дослідницька інфографіка має бути коректною загалом, але не турбуйтеся, якщо у вас різні рівні округлення цифр, якщо вони не становлять у сумі точно 100 відсотків, або якщо ви пропустили дані по року чи двох на проміжку в 20 років.
Насправді ви можете спробувати прибрати мітки та маркери масштабу, як це зроблено на діаграмах угорі, щоб отримати ще краще загальне відчуття даних
Підказка 5: Створюйте хронологію випадків та подій
На початку роботи над будь-якою складною статтею створіть хронологію ключових подій та ситуацій. Для цього завдання можна використати Excel, документ Word чи спеціалізований інструмент на кшталт TimeFlow, але в певний момент ви зрозумієте, яку базу даних можна «підкласти» під цю хронологію. Періодичний перегляд хронології покаже вам, чи існують у вашій статті «дірки», які потребують заповнення.
Підказка 6: Не зволікайте із зустрічами з вашим редакційним відділом графіки, і проводьте їх регулярно
Проведіть «мозковий штурм» про можливі варіанти графіки з редакційними художниками та дизайнерами. Вони матимуть гарні способи поглянути на ваші дані, пропозиції про те, як можна забезпечити інтерактивність, та знання про те, як поєднати дані та статтю. Вашу журналістську роботу значно полегшать знання про те, що вам слід зібрати вже на ранніх етапах, або ви можете попередити вашу команду, що візуалізацію неможливо створити, якщо ви не зберете ці дані.
ПІДКАЗКИ ДО ПУБЛІКАЦІЇ
Ви могли провести за вашим розслідуванням лише кілька днів чи кілька годин, а можливо, ви готували статтю протягом місяців. Але коли настає час її публікувати, два аспекти отримують більшу вагу.
Пам’ятаєте про той пропущений рік, який був у ваших ранніх дослідженнях? Раптом виявляється, що без нього ви не можете просуватися далі. А ті неякісні дані, які ви проігнорували в статті? Вони не даватимуть вам спокою.
Причина в тому, що ви не можете обійти в статті "неякісні" дані. Якщо йдеться про графіку, у вас або є все, що вам потрібно, або у вас нема нічого – середини не існує.
1. Співвідносьте зусилля зі збору даних із розробкою інтерактивної графіки
У інтерактивній графіці нічого не приховаєш. Якщо ви справді маєте намір дати змогу вашим читачам досліджувати дані так, як їм заманеться, тоді кожен елемент цих даних має бути тим, чим він названий. Користувачі можуть виявити будь-яку помилку в будь-який час, і це переслідуватиме вас місяцями та роками.
Якщо ви створюєте вашу власну базу даних, це означає, що вам слід вичитати на предмет помилок, перевірити факти та відредагувати всю базу даних. Якщо ви використовуєте урядові дані, вам слід вирішити, скільки вибіркових перевірок цих даних треба виконати, і що ви плануєте робити, якщо виявите неминучу помилку.
2. Робіть дизайн для двох типів читачів
Графіка – чи це є окрема інтерактивна візуалізація, чи статична візуалізація, яка супроводжує вашу статтю – повинна задовольняти потреби двох відмінних груп читачів. Вона має бути легкою для розуміння з першого погляду, але при цьому досить складною для того, щоб запропонувати щось цікаве людям, які хочуть заглибитися в неї. Якщо ви робите інтерактивну графіку, подбайте про те, щоб ваші читачі отримали з неї щось більше, ніж окрема цифра чи ім’я.
2. Подавайте одну ідею – а тоді спрощуйте її
Ви певні, що хочете, щоб люди бачили лише якусь одну річ? Прийміть рішення про те, яке саме найпотужніше враження має отримати ваш читач, а потім подбайте про те, щоб усе інше зникло. У багатьох випадках це означає вилучення інформації – навіть тоді, коли Інтернет дає вам можливість подати все. За винятком того, якщо ваша головна мета – це прозорість вашого журналістського розслідування, більшість деталей, зібраних у вашій хронології, просто не є достатньо важливими. У статичній графіці це буде страхіття. У інтерактивній – нудьга.
Достарыңызбен бөлісу: |