Протягом останніх місяців у Фінляндії продовжувалися суди з приводу фінансування виборчої кампанії під час фінських виборів 2007 року.
По тому, як у 2007 році пройшли вибори, преса виявила, що закони про оприлюднення даних з фінансування кампаній не писані для політиків. По суті, фонди кампаній витрачалися на підкуп виборців політиками, які потім відмовилися відкрити дані про ці витрати, як цього вимагає фінське законодавство.
Після цих інцидентів закон став суворішим. І на загальнодержавних виборах у березні 2011 року видання Helsingin Sanomat вирішило ретельно дослідити усі доступні дані з фінансування кампаній. За новим законом фінансування виборчої кампанії має бути відкритим, і лише пожертви до 1500 євро можуть залишатися анонімними.
Ілюстрація 38. Фінансування виборів (Helsingin Sanomat)
1. Знайти дані та програмістів
Helsingin Sanomat організовувала в себе хакерські марафони (хакатони) з березня 2011 року. Ми запрошували фінських програмістів, журналістів та графічних дизайнерів до підвального приміщення в нашій будівлі. Учасники ділилися на групи по троє, і їм пропонувалося розробити візуалізації та програми. У нас на той час було десь по 60 учасників на кожному з таких заходів. Ми вирішили, що дані з фінансування кампаній стануть центральною темою хакатону HS Open #2 в травні 2011 року.
Національна аудиторська служба Фінляндії – це офіційна установа, яка зберігає документацію про фінансування кампаній. Тут нам було нескладно. Директор з інформаційних технологій цієї служби, Якко Хамунен, створив веб-сайт, що надає доступ в режимі реального часу до бази даних з фінансування кампаній. Аудиторська служба зробила це всього через два місяці після нашого запиту.
Сайт Vaalirahoitus.fi від того часу й надалі надаватиме пресі та громадськості інформацію про фінансування кампаній на кожних виборах.
2. Знайти ідеї під час мозкового штурму
Учасники хакатону HS Open #2 придумали двадцять різних прототипів того, що можна було б зробити з даними. Усі ці прототипи можна знайти на нашому сайті (текст фінською мовою).
Дослідник з біоінформатики на ім’я Жанне Пелтола відзначив, що дані з фінансування кампаній виглядали подібно до генетичних даних, які вони досліджували з метою пошуку в них взаємних залежностей. У біоінформатиці є програма з відкритим кодом під назвою Cytoscape, яку використовують для позначення цих взаємних залежностей. Тож ми пропустили ці дані через Cytoscape й отримали дуже цікавий прототип.
3. Втілити ідею на папері й у Інтернеті
За законом про фінансування кампаній обрані парламентарі повинні оприлюднити дані про фінансування через два місяці після виборів. На практиці це означає, що ми отримуємо дійсні дані в середині червня. На хакатоні HS Open ми мали дані лише від тих парламентарів, які подали їх завчасно.
Також виникла проблема з форматом даних. Національна аудиторська служба надавала дані у двох файлах у форматі CSV. Один містив дані про загальний бюджет кампаній, у іншому був перелік усіх донорів. Нам треба було поєднати ці дві бази даних, створивши файл, у якому було три колонки: донор, отримувач та сума. Якщо політики використовували власні дані, в нашому форматі це виглядало так: політик А пожертвував Х євро політикові А. Можливо, це не зовсім інтуїтивно зрозуміло, але для Cytoscape цей формат підійшов.
Коли ми очистили та переформатували дані, то просто пропустили їх через Cytoscape. На основі результату наш графічний підрозділ зробив графіку на цілу сторінку.
Насамкінець ми створили красиву візуалізацію на нашому сайті. Цю графіку ми робили не на основі результатів аналізу за мережевим методом (з допомогою Cytoscape - прим.). Ми хотіли, щоб люди отримали простий спосіб дізнатися, скільки коштів іде на кампанію, і хто дає ці кошти. Перший режим перегляду показує розподіл коштів між парламентарями. Коли ви клікаєте на певному парламентарю, з’являється розшифровка його чи її фінансувань. Ви також можете проголосувати, гарним чи поганим є цей конкретний донор. Візуалізацію створили Джуна Рувінен та Юкка Кокко з рекламної агенції під назвою Satumaa.
Веб-версія візуалізації фінансування виборчих кампаній використовує такі ж дані, як і мережевий аналіз.
4. Опублікувати дані
Зрозуміло що, Національна аудиторська служба вже опублікувала дані самостійно, тож не було потреби робити це вдруге. Але так як ми очистили дані та переформатували їх у кращу структуру, ми вирішили їх оприлюднити. Ми зробили це на основі відкритої ліцензії Creative Commons Attribution. Після цього кілька незалежних програмістів зробили візуалізації цих даних, і ми опублікували деякі з них.
Інструменти, які ми використовували під час роботи над проектом: Excel та Google Refine для очистки та аналізу даних, Cytoscape для мережевого аналізу, Illustrator та Flash для візуалізацій. Замість Flash краще було б використати HTML5, але в нас була обмаль часу.
Чому ми навчилися? Можливо, найважливіший урок полягав у тому, що структури даних – це може бути дуже складно. Якщо оригінальні дані представлені в «незручному» форматі, на перерахунок та конвертування може піти багато часу.
Electoral Hack: виборча журналістика в режимі реального часу
Electoral Hack – це проект політичної аналітики, який візуалізує дані попередніх результатів виборів у Аргентині 23 жовтня 2011 року. Система також містить інформацію з попередніх виборів та соціодемографічну статистику з усієї країни. Проект оновлювався в режимі реального часу на основі інформації про попередні результати підрахунку голосів на національних виборах 2011 року, а потім навів підсумкові результати виборів.
Це була ініціатива групи Hacks/Hackers з Буенос-Айреса та політичного аналітика Енді Тоува, і вона була втілена в життя завдяки спільним зусиллям журналістів, програмістів, дизайнерів, політологів та інших представників місцевого осередку Hacks/Hackers.
Ілюстрація 39. Вибори-2011 (Hacks/Hackers Buenos Aires)
Які дані ми використовували?
Всі дані надходили з офіційних джерел: Національне виборче бюро забезпечило доступ до даних попереднього підрахунку від Indra; міністерство внутрішніх справ надало інформацію про виборчі посади та кандидатів від різних політичних партій; університетський проект надав біографічні дані та політичні платформи кожного з канндидатів у президенти; соціодемографічна інформація надійшла від національного перепису 2001 року (INDEC), перепису 2010 року (INDEC) та від міністерства охорони здоров’я.
Як ми програмували?
Програма була створена під час виборчого хакатону 2011 року, проведеного Hacks/Hackers Буенос-Айрес за день до виборів 23 жовтня 2011 року. У хакатоні взяли участь 30 добровольців із різним фахом та досвідом. Проект Electoral Hack розроблявся як відкрита платформа, яку можна буде вдосконалювати з часом. Для цієї технології ми використали Google Fusion Tables, Google Maps та бібліотеки векторної графіки.
Ми працювали над створенням полігональних форм для відтворення географічних даних та електоральної демографії. Поєднавши ці полігони з геоінформаційних програм та геометрію із публічних таблиць у Google Fusion Tables, ми згенерували таблиці з ключами, що пов’язували їх із електоральною базою даних міністерства внутрішніх справ, даними Indra та соціодемографічними даними від INDEC. З цього ми створили візуалізації в Google Maps.
Використовуючи інтерфейс прикладних програм (API) Google Maps, ми опублікували кілька тематичних карт, що представляли просторовий розподіл голосування за допомогою різних відтінків кольорів, де інтенсивність кольору означала відсоток голосів, отриманих різними кандидатами на президентство в різних адміністративних дільницях та пунктах соціологічних опитувань. Особливу увагу ми надали великим центрам урбанізації: Буенос-Айресу, 24 районам Великого Буенос-Айресу, містам Кордобі та Розаріо.
Ми застосували ту ж техніку для створення тематичних карт попередніх виборів, а саме президентських праймеріз 2011 року та виборів 2007 року, а також розподілу соціодемографічних даних, таких як бідність, дитяча смертність та умови життя, - все це придатне для аналізу та порівняння. Проект також показав просторовий розподіл відмінностей у процентній кількості голосів, набутих кожним із претендентів у загальних виборах у жовтні в порівнянні з серпневими праймеріз.
Згодом, використавши часткові дані попереднього підрахунку голосів, ми створили анімовану карту, що зображала анатомію підрахунку голосів: прогрес підрахунку відтворювався починаючи від закриття місцевих дільниць аж до ранку наступного дня.
Плюси -
Ми мали намір знайти та представити дані, і в нас це вийшло. У пригоді стала база даних UNICEF із дитячої соціодемографії, так само як бази даних кандидатів, створених групою yoquierosaber.org з університету Torcuato Di Tella. Під час хакатону ми зібрали великий обсяг додаткових даних, які ми зрештою не стали включати.
-
Було очевидно, що журналістську та програмістську роботу підсилили науковці. Без участі Енді Тоува та Хіларіо Морено Кампоса проект би не вдався.
Мінуси -
Соціодемографічні дані, якими ми могли скористатися, були застарілими (більшість – із перепису 2001 року) і не дуже деталізованими. Наприклад, в них не було детально вказано середньостатистичний місцевий ВВП, основні види економічної діяльності, рівень освіти, кількість шкіл, докторів на душу населення, багато інших речей, які б нам дуже хотілося мати.
-
Початково ми мали намір створити інструмент, який можна було використовувати для комбінування та відтворення будь-яких довільних даних, щоб журналісти могли легко публікувати в Інтернеті дані, які їх зацікавили. Але ми мусили залишити цю ідею на майбутнє.
-
Так як проект створювався добровольцями за короткий проміжок часу, було неможливо зробити все, що ми хотіли. Попри це, ми досягли значного прогресу в правильному напрямку.
-
З тієї самої причини вся спільна робота 30 людей зійшлася клином на одному програмісті, коли почали надходити дані, запропоновані владою, і у нас виникли проблеми з імпортом даних у режимі реального часу. За кілька годин ми це владнали.
Наслідки
Платформа Electoral Hack створила значний вплив на ЗМІ, про неї повідомили на телебаченні, радіо, в друкованих медіа та в онлайні. Карти з проекту були використані кількома медійними платформами під час виборів та в наступні дні. З плином часу карти та візуалізації оновлювалися, що ще більше нарощувало трафік. У день виборів сайт, створений того ж самого дня, отримав близько 20 тисяч унікальних відвідувань, а карти з нього протягом двох днів друкувала на першій шпальті газета Página/12, вони також були використані в статтях у La Nación. Деякі карти з’явилися в друкованій версії газети Clarín. Вперше в історії аргентинської журналістики були використані інтерактивні карти, що оновлювалися в режимі онлайн. На центральних картах можна було чітко бачити впевнену перемогу Кристини Фернандес де Кірхнер із 54% голосів, виділену кольоровим відтінком. Вони також допомогли користувачам розуміти специфічні ситуації, коли місцеві кандидати здобували повну перемогу в провінціях.
Цей розділ був написаний Маріано Блехманом, Маріанною Берруезо, Серджіо Соріном, Енді Тоувом та Мартіном Сарсале з Hacks/Hackers Буенос-Айрес
Достарыңызбен бөлісу: |