У серпні 2010 року я з деякими колегами організувала, на мою думку, одну з перших міжнародних конференцій із журналістики даних, яка пройшла в Амстердамі. На той час ця тема не особливо обговорювалася, й існувало лише кілька організацій, широко відомих своєю роботою в цій галузі.
Спосіб, за допомогою якого медійні організації на кшталт Guardian та New York Times опрацювали великий обсяг даних, опублікованих на Wikileaks, став одним з головних етапів, завдяки якому термін «журналістика даних» здобув поширення. Приблизно в той же час цей термін почав використовуватися більш розлого, разом із терміном «комп’ютеризована журналістика» - він описував, як журналісти використовують дані задля покращення своїх матеріалів та збільшення глибини досліджень із певної теми.
Я спілкувалася з досвідченими журналістами даних та науковцями в сфері журналістики у Твіттері, і виглядає так, що одне з найбільш ранніх визначень того, що ми зараз вважаємо журналістикою даних, було створене у 2006 році Адріаном Головатим, засновником EveryBlock — інформаційного сервісу, який давав змогу користувачам дізнаватися, що відбувається в місцевості, де вони живуть, у їхньому кварталі. У короткому есе «Сайти газет мають зазнати фундаментальних змін» він доводить, що журналістам слід публікувати структуровані дані, придатні для машинного зчитування, поруч із традиційним «великим масивом тексту»:
Наведу приклад: скажімо, місцева газета написала про пожежу. Спроможність прочитати цю статтю на екрані стільникового телефона – це круто і прекрасно. Слава технологіям! Але що я насправді хотіла б могти, так це дослідити «сирі» факти, що стоять за цією історією, один за одним, за шарами властивих їм ознак, і мати інфраструктуру для порівняння детальних подробиць цієї пожежі – дата, час, місце, жертви, номер пожежної частини, відстань від пожежної частини, імена та стаж пожежників, що її гасили, скільки вони їхали до пожежі – і все це з подробицями попередніх пожеж. І так щодо всіх наступних пожеж, коли б там вони не сталися.
Але в чому тут відмінність від інших форм журналістики, які використовують бази даних чи комп’ютери? Як – і до яких меж – журналістика даних відрізняється від інших форм журналістики, що існували в минулому.
«Комп’ютеризована журналістика» та «Точна журналістика»
Використання даних для покращення журналістських повідомлень та надання структурованої (а то й придатної для машинного зчитування) інформації громадськості має довгу історію. Можливо, найбільше відповідає тому, що ми зараз називаємо «журналістикою даних», так звана «комп’ютеризована журналістика» (КЖ), яка була першою спробою організованого та систематизованого використання комп’ютерів задля збору та аналізу даних – для того, щоб покращити журналістські повідомлення.
КЖ вперше застосували в 1952 році у телекомпанії CBS, щоб зробити прогноз результатів президентських виборів. З 1960-х років журналісти (переважно, ті, що займалися розслідуваннями, переважно, американці) шукали спосіб незалежного контролю за владою шляхом аналізу баз даних державних архівів а допомогою наукових методів. Прихильники цього комп’ютеризованого напрямку, «журналістика державних служб», з його допомогою намагалися виявляти певні тенденції, спростовувати поширені у громаді помилкові уявлення та розкривати факти неправомірної діяльності органів державної влади. Наприклад, Філіп Мейєр спробував спростувати повідомлення про заворушення 1967 року в Детройті – щоб показати, що участь у них брали не лише погано освічені мешканці Півдня США. Цикл статей Білла Дедмана «Колір грошей» у 1980-х розкрив систематичні расові упередження в політиці надання позик, притаманні великим фінансовим установам. У статті «Що пішло не так» Стів Дойг аналізував типові закономірності ушкоджень від урагану «Ендрю» на початку 1990-х років, щоб зрозуміти вплив неякісної політики та практики міського будівництва та розвитку. Журналістика, орієнтована на дані, прислужилася громаді, а журналісти отримали за це престижні премії
На початку 1970-х років термін «точна журналістика» вживався для опису такого-от способу збирання новин: «застосування дослідницьких методів, що використовуються у соціальних та біхевіористських науках, у журналістиці». Вважалося, що точну журналістику застосовуватимуть потужні медійні організації, використовуючи фахівців, обізнаних як із журналістикою, так і з соціальними науками. Вона народилася як відповідь на «нову журналістику», форму журналістики, де під час підготовки повідомлень використовувалася техніка літературних домислів. Мейєр припускає, що журналістиці, яка веде пошук об’єктивності та правди, потрібні радше наукові технології збору та аналізу даних, аніж літературні техніки.
«Точну журналістику» можна розглянути як реакцію на типові, часто цитовані слабкості та неадекватні прояви журналістики: залежність від прес-релізів (пізніше це отримало назву «дурналістика» (“churnalism”)), схиляння до провладних джерел інформації тощо. Мейєр убачає в цьому наслідки відсутності використання технік інформаційних наук та наукових методів, таких як опитування та громадські архіви. Точна журналістика, яку застосовували в 1960-ті, використовувалася для представлення груп меншості та їхніх повідомлень. За Мейєром:
«Точна журналістика була способом розширити інструментарій репортера так, щоб раніше недоступні теми, або лише згрубша доступні, могли стати темою ретельного журналістського розгляду. Це було особливо корисним задля того, щоб почути голос меншості та груп інакомислячих, які боролися за право бути представленими в ЗМІ».
Впливова стаття, опублікована в 1980-ті й присвячена стосункам між журналістикою та соціальними науками, є відлунням сучасного дискурсу навколо журналістики даних. Автори, два американські професори журналістики, стверджують, що в 1970-80-х роках розуміння громадськістю того, що таке новини, розширилося від обмеженої концепції «новина про подію» до «ситуаційного репортажу», чи висвітлення соціальних тенденцій. Використовуючи бази даних – наприклад, переписів населення чи соціологічних досліджень – журналісти спроможні «просунутися далі за повідомлення про окремі, ізольовані події й створити контекст, який надає цим подіям значення».
Як ми могли очікувати, практика використання даних для покращення репортажу є настільки давнім, як і саме поняття «дані». Як вказує Саймон Роджерс, перший приклад журналістики даних у газеті Guardian датований 1821 роком. Це наслідок витоку інформації - таблиця шкіл у Манчестері, де вказана кількість учнів, які їх відвідують, та вартість навчання в кожній школі. За Роджерсом, її оприлюднення допомогло вперше показати справжню кількість учнів, що отримували безкоштовну освіту, - вона була значно вищою, ніж це вказували офіційні цифри.
Ілюстрація 11. Журналістика даних у Guardian у 1821 (The Guardian)
Інший ранній приклад у Європі – це Флоренс Найтігейл та її головна публікація«Смертність у Британській армії», яка вийшла 1858 року. У своїй доповіді до парламенту вона використала графіку, щоб заохотити покращення служб охорони здоров’я в Британській армії. Найвідомішою є спіраль секцій, кожна з яких представляє кількість смертей протягом місяця, - вона показала, що переважна більшість смертей спричинена не кулями, а виліковними хворобами.
Ілюстрація 12. Смертність у Британській армії, за авторством Флоренс Найтінгейл (зображення з Вікіпедії)
Журналістика даних та комп’ютерна журналістика
Наразі існує дискусія на тему «тяглості та змін», що розгорнулася навколо терміну «журналістика даних» та його зв’язку з указаними вище попередніми журналістськими практиками, які застосовували обчислювальні методи задля аналізу наборів даних.
Дехто стверджує, що між КЖ та журналістикою даних існує відмінність. Вони кажуть, що КЖ – це технологія збору та аналізу даних, спрямована на покращення репортажу (зазвичай журналістського розслідування), натомість журналістика даних приділяє увагу тому, як дані можна включати до загального журналістського процесу. У цьому сенсі журналістка даних приділяє стільки ж – а іноді й більше – уваги даним як таким, аніж використанню цих даних лише для пошуку та покращення повідомлень. Ми бачимо, що в Guardian Datablog чи Texas Tribune дані публікуються поруч із статтями, або навіть окремо, самі по собі, щоб люди могли їх аналізувати та досліджувати.
Ще одна відмінність: у минулому журналісти, що вели розслідування, страждали від дефіциту інформації, пов’язаної з питанням, відповідь на яке вони намагалися знайти, або темою, до якої вони намагалися звернутися. І хоч це справді залишається проблемою, наразі існує величезний надлишок інформації, і журналісти не завжди знають, що з нею робити. Вони не знають, як отримати з даних цінність. Нещодавній приклад – це Об’єднана онлайнова інформаційна система, найбільша в Британії база даних із витрат – якої довго прагнули прихильники більшої прозорості, але яка після свого виходу загнала багатьох журналістів у ступор. Як мені нещодавно написав Філіп Мейєр: « Коли інформації було мало, більшість наших зусиль була спрямована на її пошук та збирання. Зараз інформації вдосталь, і обробка стає більш важливою».
З іншого боку, дехто доводить, що немає суттєвої відмінності між журналістикою даних та комп’ютерною журналістикою. Усім зараз зрозуміло, що навіть найсучасніші медійні практики мають свою історію, так само у них є і елемент новизни. І замість того, щоб сперечатися, чи є журналістика даних чимось цілком новим, більш плідний підхід – це розглядати її як частину давнішої традиції, але таку, що відповідає новим обставинам та умовам. Навіть якщо тут нема відмінності у техніках та завданнях, поява терміну «журналістика даних» на початку цього століття вказує на нову фазу, коли сам лише обсяг даних, вільно доступний в онлайні, у поєднанні з інструментарієм, орієнтованим на користувача, і засобами самостійної публікації та колективного фінансування дає змогу більшій кількості людей працювати з більшою кількістю даних так легко, як ще ніколи не було.
Цифрові технології та веб фундаментально змінюють спосіб публікації інформації. Журналістика даних – це лише частина екосистеми інструментів та практик, що виникли навколо сайтів та сервісів, пов’язаних із даними. Цитування та поширення початкових матеріалів є природним для заснованої на гіперпосиланнях структури WWW та того способу, до якого ми зараз призвичаїлися, щоденно переглядаючи інформацію. Якщо відступити в минуле, то принцип, який лежить в основі гіпертекстової структури веб – це принцип цитування в наукових працях. Цитувати та поширювати інформацію з джерел та дані, що стоять за повідомленням, - це один із базових способів, за допомогою якого журналістика даних може покращити журналістику взагалі, - те, що засновник Вікілікс Джуліан Ассанж назвав «науковою журналістикою».
Надавши змогу усім охочим «копати» джерела даних та знаходити інформацію, яка для них є важливою, а заодно й перевіряти твердження та кидати виклик узвичаєним уявленням, журналістика даних ефективно представляє масову демократизацію джерел, інструментів, технік та методологій, які раніше використовувалися спеціалістами –репортерами-«розслідувальниками», соціальними науковцями, статистиками, аналітиками та іншими експертами. Хоч наразі цитування та лінки на джерела даних є особливою ознакою журналістики даних, ми просуваємося до світу, в якому дані «безшовно» інтегровані у саму тканину медіа. Журналістам даних належить важлива роль – допомогти знизити бар’єри на шляху до розуміння та звертання до даних, і збільшити «грамотність даних» своїх читачів у масових масштабах.
Наразі новопостала спільнота людей, які називають себе журналістами даних, суттєво відрізняється від більш «зрілої» спільноти КЖ. Сподіваємося, в майбутньому ми побачимо міцніші зв’язки між цими двома спільнотами, переважно в той самий спосіб, у який зараз нові неурядові організації та організації громадських медіа на зразок ProPublica чи Бюро журналістських розслідувань працюють пліч-о-пліч із традиційними ЗМІ чи проектами журналістських розслідувань. І хоч спільнота журналістів даних може володіти більш інноваційними способами представлення даних та пов’язаних з ними історій, глибоко аналітичний та критичний підхід, властивий спільноті КЖ, є тим, чому журналістиці даних напевне слід було б повчитися.
Ліліана Бунегру, Європейський центр журналістики
Достарыңызбен бөлісу: |