Які інструменти візуалізації даних існують в інтернеті – такі, щоб їх було легко використовувати і при цьому не платити за них? У Guardian Datablog та Datastore ми намагаємося найбільше застосовувати безкоштовні й потужні засоби, які пропонує Інтернет.
Ілюстрація 102. Хроніки бойових дій, оприлюднені Wikileaks (Guardian)
Це може звучати трохи нещиро, бо в нас, без сумніву, є доступ до чудових команд фахівців Guardian, які виконують графічні та інтерактивні роботи, - для тих проектів, на які в нас є трохи більше часу – наприклад, таких, як ця карта витрат держслужбовців (її створили в Adobe Illustrator) чи інтерактивна карта заворушень у Британії, створена на основі повідомлень у Twitter.
Але для повсякденної роботи ми часто використовуємо ті ж інструменти, які може використати кожен – і створюємо графіку, яку також може створити кожен.
Тож що саме ми використовуємо?
Google Fusion Tables
Ця онлайнова база даних та картографічний інструмент є нашим вибором за замовчанням, якщо треба швидко створити деталізовані карти, особливо з можливістю масштабування. Ви отримуєте всю високу роздільну здатність карт Google, але тут можна відкривати великі бази даних - до 100 мегабайт у форматі CSV, наприклад. Коли ви спробуєте Fusion tables уперше, вони можуть здатися вам заскладними, але потренуйтеся ще. За її допомогою ми створювали карти на зразок наведеної вище карти Іраку, а також контурні карти на кшталт оцієї карти з рівнем бездомності.
Ілюстрація 103. Інтерактивна карта бездомності (Guardian)
Тут головна перевага – це гнучкість: ви можете, наприклад, завантажити файл у форматі kml, де вказано межі регіонів, - а тоді злити його з таблицею даних. Google Fusion Tables також отримує новий інтерфейс користувача, що полегшує її застосування.
Щоб це робити, вам не треба бути програмістом – а інструмент шарів у Fusion Tablesдозволяє поєднувати різні карти або ж створювати засоби пошуку та фільтрації, які потім можна вбудувати в блог чи на сайт.
Цей чудовий посібник Кетрін Харлі з Google – гарна відправна точка.
Головна підказка:
Використовуйте shpescape для конвертації офіційних файлів у форматі shp, щоб використати їх у Fusion tables. І стежте, щоб не пере ускладнювати карти - Fusion tables може впоратися не більше ніж із мільйоном точок на одну клітину.
Tableau Public
Якщо у вас немає безмежних ресурсів професійної редакції, то ця програма є безкоштовною – і дозволяє робити вельми складні візуалізації просто та легко, на основі баз даних розміром до ста тисяч рядків. Ми використовуємо її тоді, коли нам потрібно звести докупи різні типи діаграм – як на цій карті, де вказані найвищі рівні податків у світі, і де також є стовпчикова діаграма.
Або ви навіть можете використати Tableau Public для дослідження даних – так як ми це зробили нижче з даними про витрати на федеральні вибори в США (хоча при цьому в нас вичерпалися ресурси вільної безкоштовної версії програми – слід пильнувати за цим). Tableau Public також потребує специфічного форматування даних, щоб ви могли отримати від неї максимум. Але якщо ви через це пройдете, то матимете інтуїтивний інструмент, який працює так як треба. Аргентинська La Nación, скажімо, побудувала всю свою діяльність із журналістики даних навколо Tableau.
Ілюстрація 104. Фінансування президентської кампанії 2012 року (Guardian)
По Tableau також є гарні онлайнові посібники, з яких вам варто почати.
Головна підказка:
Tableau розроблена для комп’ютерів PC, хоча ведеться робота над версією для Маків. Використовуйте паралельні дзеркала, щоб це запрацювало.
Діаграми Google spreadsheet
Ілюстрація 105. Витрати та податки уряду Великобританії (Guardian)
Ви освоїли прості речі – такі як стовпчикові, лінійні чи секторні діаграми? Тоді знайте,що в електронних таблицях Google spreadsheets (які можна створити з фрагментів документів, завантажених під вашим екаунтом Google) можна створювати вельми ефектні діаграми – включно з анімованими пухирцевими діаграмами, використаними в Gapminder Ганса Рослінга. На відміну від інтерфейсів прикладних програм для побудови діаграм, тут вам не треба перейматися програмуванням – все вельми подібне до створення діаграм у Excel, де ви виділяєте дані та клацаєте мишкою на віджеті діаграми. Варто дослідити й можливості кастомізації – можна змінювати кольори, заголовки та шкалу масштабу. Ці діаграми є нейтральними з точки зору дизайну, що корисно для малих діаграм. У лінійних графіків також є кілька корисних опцій, включно з опцією анотації.
Головна підказка:
Витратіть час на опції, що дозволяють змінювати діаграму – ви маєте змогу створити власну кольорову палітру.
Ілюстрація 106. Засуджені на смерть та страти (Datamarket)
Explore this data - страти в США
У Datamarket, який більше відомий в якості постачальника даних, насправді є дуже навіть якісний інструментарій для візуалізації цифрових даних. Ви можете завантажити власні або використати бази даних, які пропонують вони – але вибір стає кращим, якщо ви отримаєте екаунт Pro.
Головна підказка:
Працює краще з даними, які мають часову прив’язку, але перевірте їхній розширений діапазон даних
Many Eyes
Якщо на світі є сайт, що потребує трохи ніжної люблячої турботи, то це Many Eyes від IBM. Коли його запустили під керівництвом Фернанди Б. Вегас та Мартіна Ваттенберга, це був унікальний ресурс, який давав людям змогу легко завантажувати та візуалізувати бази даних. Зараз, коли творці ресурсу працюють на Google, сайтові, схоже, бракує любовного ставлення – з його приглушеними кольоровими палітрами – і там мало що оновилося в сенсі візуалізацій.
Головна підказка:
Якщо ви завантажили дані, їх неможливо редагувати, тож заздалегідь подбайте про їх правильність
Ілюстрація 107. Вороги доктора Хто (Doctor Who) ( Guardian)
Color Brewer
Ілюстрація 108. Color Brewer
Color Brewer не є інструментом візуалізації в строгому сенсі цього слова – його початково створили за федеральні кошти для вибору кольорів карти, і на нього варто витратити трохи часу, якщо ви маєте наміри зробити набагато більше. Ви можете вибрати базовий колір і отримати коди для всієї палітри.
І трохи ще.
Якщо нічого зі вказаного вище вам не підійшло, варто також перевірити цю статтю в DailyTekk, де наведено ще більше варіантів. Ті, які ми навели вище, - це не єдині інструменти, просто їх використовують найчастіше. Є й багато інших, наприклад:
• Chartsbin Інструмент для створення клікабельних карт світу
• iCharts Спеціалізується на створенні малих діаграм-віджетів
• Geocommons Обмін даними та контурними даними задля створення глобальних та локальних карт
Ну і ще є piktochart.com, який надає шаблони для тих текстових/цифрових візуалізацій, яких зараз так багато.
Саймон Роджерс, Guardian
Як працює "кухня даних" у Verdens Gang
Сенс новинарської журналістики – це подавати читачам свіжу інформацію так швидко, як це можливо. Найшвидшим засобом може бути відео, фото, текст, графік, таблиця чи поєднання усього названого. У випадку з візуалізаціями мета та ж сама: швидке інформування. Нові інструменти роботи з даними дають журналістам змогу знаходити сюжети, які б вони не знайшли в інший спосіб, та презентувати історії по-новому. Ось кілька прикладів, що показують, як ми подаємо дані у найбільш популярній газеті Норвегії, Verdens Gang (VG).
Числа
Ілюстрація 110. Карта з даними платників податків та гравців у лотерею (Verdens Gang)
Сюжет цієї статті заснований на даних Бюро статистики Норвегії, даних платників податків та даних від національного лотерейного монополіста. В цій інтерактивній графіці читач може знайти різні види інформації по кожному норвезькому округу та муніципалітету. Оригінальна таблиця показує відсоток доходів, який витрачають на лотереї. Візуалізацію створено з використанням Access, Excel, MySql та Flash.
Мережі
Ілюстрація 111. Пишні пташки літають разом (Verdens Gang)
Ми застосували аналіз соціальних мереж, щоб дослідити зв’язки між 157 синами та доньками найбагатших людей Норвегії. Наш аналіз показав, що нащадки найбагатших осіб Норвегії також успадкували мережу зв’язків їхніх батьків. Хоч тут було понад 26000 зв’язків, інфографіка була виконана вручну у Фотошопі. Ми використовували: Access, Excel, Notepad, та інструмент аналізу соціальних мереж Ucinet.
Карти
Ілюстрація 112. Анімована теплокарта (Verdens Gang)
На цій анімованій теплокарті, поєднаній із простою стовпчиковою діаграмою, можна побачити дані про злочини, скоєні в центральній частині Осло, з погодинною розбивкою протягом вихідних днів – за кілька місяців. На цій же анімованій теплокарті видно кількість офіцерів поліції, що перебувають на роботі в один і той же час. Коли стаються злочини, кількість офіцерів поліції є найнижчою. Візуалізацію створено за допомогою ArcView разом із Spatial Analyst.
Дослідження текстів
Ілюстрація 113. Дослідження промов партійних лідерів (Verdens Gang)
Для цієї візуалізації ми дослідили тексти промов, виголошених сімома лідерами норвезьких політичних партій під час їхніх партійних з’їздів. Всі промови були проаналізовані, і ця аналітика дала ракурс для декількох публікацій. Кожна стаття отримала лінк на графік, і читачі отримали змогу досліджувати та вивчати мову політиків. Роботу було виконано за допомогою Excel, Access, Flash та Illustrator. Якби це було в 2012 році, то ми б зробили інтерактивну графіку на Javascript.
Заключні ремарки
Коли в нас виникає потреба візуалізувати статтю? Переважно у нас такої потреби нема, але часом ми хочемо це зробити, щоб допомогти нашим читачам. Журналістські сюжети, що містять великі обсяги даних, як правило, потребують візуалізації. Втім, ми критично підходимо до вибору тих даних, які маємо намір презентувати. Ми все це знаємо, коли пишемо статтю, але чи потрібно про це знати читачеві? Можливо, вистачить таблиці або простого графіка, що показує зміну ситуації від року А до року С. Головне в журналістиці даних – це не подавати гігантські обсяги даних. Головне – це журналістика!
У останні 2-3 роки спостерігався чіткий тренд до створення інтерактивної графіки та таблиць, які дозволяють читачеві заглиблюватися в різні теми. Гарна візуалізація – це як гарна картина. Ви розумієте, що на ній, подивившись на неї секунду чи дві. Чим більш ви дивитеся, тим більше помічаєте. Візуалізація не є гарною, коли читач не знає, з чого почати чи де зупинитися, або коли візуалізація перевантажена деталями. За такого сценарію, можливо, краще було б написати текст?
Джон Боунз, Verdens Gang
Дані – безцінні. Доступ до даних спроможний висвітлити теми в такий спосіб, який веде до результату. І навпаки, неякісна робота з даними може трансформувати факти в непрозору структуру, яка ні про що не повідомляє. Якщо дані не спонукають до дискусії або не надають контекстуального розуміння, їх вартість для громадськості може бути обмеженою.
Нігерія повернулася до демократії в 1999 році після довгих років військової диктатури. Спроби прозондувати факти, що стояли за даними, сприймалися владою як публічний виклик і розглядалися як наміри поставити під сумнів і без того заплямовану репутацію хунти. Закон про офіційні секрети вимагав від держслужбовців не поширювати урядову інформацію. Навіть через 13 років після повернення до демократії доступ до урядових даних може бути складною справою. Дані про державні витрати мало що говорять більшості громадськості, яка не вельми обізнана з бухгалтерією та складною арифметикою.
З поширенням мобільних телефонів та ростом кількості нігерійців, що мають онлайновий доступ, ми у BudgIT побачили гарну нагоду використати технології візуалізації даних для пояснення державних витрат та залучення людей до цієї тематики. Для цього нам треба було залучити користувачів різних комп’ютерних платформ та знайти доступ до наших громадян через неурядові організації. Мета проекту: зробити громадські дані соціальними, а також збудувати розлогу соціальну мережу з людей, що вимагають змін.
Ілюстрація 114. Фрагмент програми BudgIT (BudgIT Nigeria)
Щоб успішно залучати користувачів, нам треба розуміти, чого вони прагнуть. Що хвилює громадян Нігерії? Де вони відчувають брак інформації? Як ми можемо зробити дані суттєвими для їхнього життя? Найперша цільова аудиторія BudgIT’s – це середньостатистичний освічений нігерієць, який має доступ до онлайнових форумів та соціальних медіа. Для того, щоб позмагатися за обмежену увагу користувачів, залучених до широкого розмаїття захоплень (ігри, читання, спілкування) нам треба було подати дані в стислій та лаконічній манері. Після того, як цей фрагмент даних пошириться в Твіттері чи як інфографіка, виникає можливість більш тривалої взаємодії з більш інтерактивними практиками, щоб користувачі могли отримати ширшу картину.
Під час візуалізації даних важливо усвідомлювати рівень обізнаності наших користувачів із технологіями даних. Складні діаграми та інтерактивні програми, якими б красивими та хитромудрими вони не були, можуть бути неспроможні забезпечити змістовну комунікацію з нашими користувачами, виходячи з їхнього попереднього досвіду інтерпретації даних. Якісна візуалізація говорить з користувачами мовою, яку вони можуть зрозуміти, і повідомляє історію, з якою вони легко можуть відчути зв’язок.
Ми залучили понад 10 тисяч нігерійців до теми бюджету, і ми поділяємо їх на три категорії, щоб переконатися, що кожна отримує оптимальні дані. Короткі пояснення цих категорій наведені нижче:
• Випадкові користувачі. Це користувачі, які хочуть отримувати інформацію просто та швидко. Їх цікавить картинка на основі даних, а не детальна аналітика. Їх можна залучити за допомогою Твіттера чи інтерактивної графіки.
• Активні користувачі. Користувачі, які пожвавлюють дискусію та використовують дані для збільшення знань у певній галузі, або щоб зробити із цих даних висновки. Для цих користувачів ми запровадили механізми зворотного зв’язку та можливість поділитися своїми ідеями з іншими у соціальних мережах.
• Фанатики даних. Ці користувачі хочуть мати сирі дані для візуалізації чи аналізу. Ми просто даємо їм ці дані для їхніх потреб.
Ілюстрація 115. Фрагмент програми BudgIT із слайдерами, що показують схильності громадян
Наша робота в BudgIT має на меті наступне:
• Стимулювати дискусію навколо поточних трендів. BudgIT відстежує он-лайнові та офлайнові дискусії та вишукує і надає дані, пов’язані з цією тематикою. Наприклад, під час паливних страйків у січні 2012 року протестувальники незмінно переймалися потребою змінити паливні субсидії та зменшити «екзотичні» та непотрібні бюджетні витрати. BudgIT відстежив цю дискусію в соціальних мережах і за 36 напружених годин написав програму, яка дає змогу громадянам реорганізувати бюджет Нігерії.
• Якісні механізми зворотного зв’язку. Ми виходимо на користувачів через дискусійні канали та соціальні медіа. Багато з них хочуть знати про сюжети, що стоять за даними, і багато хто запитує про наше ставлення. Ми дбаємо про те, щоб наші відповіді лише пояснювали факти, що стоять за даними, і не були спотворені нашими особистими чи політичними поглядами. Нам потрібно тримати канали зворотного зв’язку відкритими, активно відповідати на коментарі та залучати користувачів у творчий спосіб, дбаючи, щоб спільнота, яка формується навколо даних, зберігалася.
• Працювати локально. Якщо база даних спрямована на конкретну групу, BudgIT має на меті локалізувати її контент та забезпечити дискусійний канал, що поєднує потреби та зацікавлення певної конкретної групи користувачів. Зокрема, ми зацікавлені у залученні користувачів до тем, які їх хвилюють, за допомогою СМС.
Після того, як ми оприлюднили дані про витрати на сайті yourbudgit.com, ми виходимо на наших громадян через різноманітні неурядові організації. Ми також плануємо розробити середовище співпраці, де громадяни та урядові структури можуть зустрічатися у меріях міст і обговорювати ключові питання бюджету, які слід вирішити в першу чергу.
Проект висвітлювався в місцевих та закордонних ЗМІ, від CP-Africa до BBC. Ми зробили огляд бюджетів 2002-2011 (оборонний сектор) для журналіста АР Джінка Ібукун. Більшість медійних організацій є фанатиками даних, і вони просили в нас наші дані для їхніх власних репортажів. Ми плануємо подальшу співпрацю з журналістами та виданнями протягом наступних місяців.
Олусен Онігбінде, BudgIT Нігерія
Як згуртувати людей навколо ваших даних
Майже такою ж важливою, як публікація даних, є реакція вашої аудиторії. Ви людська істота – вам властиво періодично робити помилки, щось випускати з поля зору чи приходити до хибних ідей. Ваша аудиторія – один із найкорисніших ваших активів. Вони мають змогу перевіряти факти та вказувати на речі, які ви не взяли до уваги.
Ілюстрація 116. Чи потрібно продовжувати розслідування? (Wired.co.uk)
Втім, залучення аудиторії – це непроста справа. Ви маєте справу з групою людей, які роками користувалися інтернетом, звикли стрибати з сайту на сайт і не залишати за собою нічого, окрім саркастичних коментарів. Створення рівня довіри між вами та вашими користувачами має критичне значення – їм потрібно знати, що вони отримають, як вони можуть реагувати і як можуть пропонувати зворотний зв’язок, а також вони мають знати, що до цього зворотного зв’язку прислухаються.
Але спочатку вам слід подумати про те, яку аудиторію ви маєте чи яку хотіли б отримати. Ту, яка отримуватиме та постачатиме інформацію про дані, з якими ви працюєте. Якщо це пов’язане із специфічною галуззю, тоді вам треба буде застосувати специфічні способи зв’язку з цією галуззю. Чи це комерційні структури, з якими ви хочете налагодити стосунки так, щоб вони мали бажання поширювати наявні у вас ресурси і результати вашої праці на ширшу аудиторію? Чи це веб-сайт місцевих громад, або форум, з яким ви хочете сконтактуватися? Чи це фахові видання, які можуть опублікувати деякі з сюжетів, знайдених вами у даних?
Соціальні медіа – це також важливий інструмент, хоч тут знову є залежність від того типу даних, з яким ви працюєте. Якщо ви розглядаєте статистику глобального постачання товарів, то навряд чи ви знайдете групу в Фейсбуку чи Твіттері, яка буде вельми зацікавлена у вашій роботі. З іншого боку, якщо ви маєте справу з індексами корупції з усього світу, це імовірно зацікавить ширшу аудиторію.
Коли йдеться про Твіттер, тут найкращим підходом може бути встановлення зв’язків з відомими особами, із коротким поясненням, чому ваша робота є важливою, та лінком на неї. Якщо вам пощастить, вони зроблять ретвіт також і їхнім читачам. Це чудовий спосіб поширити вашу роботу з мінімальними зусиллями – але не докучайте людям!
Як тільки на вашу сторінку стали заходити люди, вам слід подумати проте, як ця аудиторія буде взаємодіяти з вашою розробкою. Звісно, вони можуть прочитати написану вами статтю, подивитися на інфографіку чи карти, але вкрай цінно дати вашим користувачам змогу залишити свою відповідь. Це як ніщо інше створить у вас краще уявлення про тему, на яку ви пишете, та забезпечить інформацію для подальшої роботи над нею.
По-перше, само собою зрозуміло, що вам слід публікувати «сирі» дані разом із вашими статтями. Це може бути звичайний текст, де дані розмежовані крапкою з комою, або сторонній сервіс на кшталт Google Docs. У цій ситуації існуватиме лише одна версія даних, і ви зможете внести в неї правки, якщо це потрібно, у разі виявлення помилок. А ще краще зробити й те, і інше. Подбайте, щоб доступ людей до ваших «сирих» матеріалів був якомога простішим.
Тоді почніть міркувати про те, чи є інші способи взаємодії з вашою аудиторією. Відстежуйте, до яких частин ваших баз даних існує найбільша увага – імовірно, що ділянки з найбільшим трафіком говорять про щось таке, що ви могли пропустити. Наприклад, ви можете не звернути увагу на статистику бідності в Ісландії, але якщо до цих даних існує підвищена увага, можливо, тут є щось таке, на що варто поглянути ретельніше.
Не обмежуйтеся стандартним вікном для коментарів. Чи можна зробити так, щоб коментарі додавалися до певних клітин у електронній таблиці? Чи певних областей у інфографіці? Хоч більшість онлайнових видавничих систем зазвичай не дозволяють цього, варто поглянути, чи не можна створити щось трохи індивідуальніше. Імовірні вигоди від цього не слід недооцінювати.
Переконайтеся, що інші користувачі також бачать ці коментарі – вони в багатьох випадках мають майже таку цінність, як оригінальні дані, і якщо ви залишите цю інформацію лише для себе, ви позбавляєте свою аудиторію цих вартісних речей.
Насамкінець, інші люди можуть забажати опублікувати їхню власну інфографіку чи статті, виходячи з тих самих джерел даних – подумайте про те, як краще поєднати ці завдання, та надавайте коротку інформацію про їхню роботу. Можна, наприклад, використати специфічний хештег до цієї бази даних, або якщо робота насичена ілюстраціями, її можна поширити в групі у Flickr.
Стане в пригоді й можливість більш конфіденційного поширення інформації – у деяких випадках людям може бути небезпечно публічно поширювати їхні внески до бази даних, або їм просто незручно це робити. Ці люди, імовірно, нададуть перевагу відправленню інформації на електронну пошту, або навіть через анонімне вікно коментарів.
Найважливіше, що ви можете зробити з вашими даними – це розповсюджувати їх так широко й відкрито, як тільки це можливо. Якщо ваші читачі можуть перевіряти вашу роботу, знаходити ваші помилки та вишукувати речі, які ви випустили, - це безмежно покращить як вашу журналістику, так і враження, отримані вашими читачами.
Дункан Гір, Wired.co.uk
Достарыңызбен бөлісу: |