ЧОМУ І ЯК УКРЗАЛІЗНИЦЯ МАЄ ВІДКРИТИ СВОЇ ДАНІ?
АНДРІЙ ГАЗІН, АГЕНЦІЯ ЖУРНАЛІСТИКИ ДАНИХ, 2016 РІК
Задля забезпечення прозорості та підвищення ефективності діяльності, задля створення екосистеми сервісів, застосунків, аналітичних матеріалів, академічних досліджень та журналістських розслідувань (а також на виконання Постанови Кабміну про відкриті дані) «Укрзалізниця» має відкрити доступ до баз даних пасажирських і вантажних перевезень. Інтерес до цих даних проявляють розробники, журналісти, економісти, маркетологи та соціологи, громадські організації та аналітичні центри. Відкриття доступу до цих даних піде на користь насамперед самій «Укрзалізниці».
2
ВСТУП Згідно з Постановою Кабінету Міністрів про відкриті дані1, до 21 квітня 2016 року «Укрзалізниця» мала б оприлюднити 11 наборів даних, серед котрих, зокрема, є дані про пасажиропотік на внутрішніх і міжнародних маршрутах, пасажиропотік на постійних приміських маршрутах, база даних вантажних перевезень, дані щодо колійного, вагонного та локомотивного господарства, реєстр вагонів тощо.
Проблема в тому, що «Укрзалізниця» абсолютно не зацікавлена у відкритті своїх даних. Відмову публікувати дані компанія аргументує, використовуючи терміни «службова інформація», «конфіденційна інформація» та «державна таємниця». І хоча юристи загалом погоджуються, що аргументація залізниці не витримує критики, судитись із транспортним монополістом, здається, не хоче навіть Міністерство інфраструктури.
В екосистемі відкритих даних у всьому світі транспортні дані, разом із географічними та метеорологічними, традиційно користуються найбільшим попитом, оскільки надають можливості для розробки веб- та мобільних сервісів і застосунків, проведення наукових і маркетингових досліджень та журналістських розслідувань.
«Укрзалізниця» забезпечує 60% обсягу вантажних і 38% пасажирських перевезень в Україні, посідає перше місце в Європі (за винятком Росії) за вантажообігом, а також друге місце в СНД і четверте в Європі за пасажирообігом2 — і при цьому залишається абсолютно непрозорою компанією, щодо котрої багато питань у журналістів-розДані «Укрзалізниці» становлять знаслідувачів3. Відкриття даних «Укрзалізничний інтерес для економістів, соціологів, ці» може стати одним із перших кроків на програмістів і стартаперів, журналістівшляху до реформування компанії, забезрозслідувачів, маркетингових компаній, печення її прозорості та підзвітності, а малого та ресторанно-готельного бізнесу. також підвищення ефективності. Потенціал повторного використання цих даних надзвичайно високий, а користь від відкриття даних отримає насамперед сама «Укрзалізниця». Через зниження корупційних ризиків і пов’язаних з ними збитків, через отримання якісних сервісів, покликаних покращити досвід пасажирів під час планування подорожі, через якісну аналітику від експертного середовища, здатну підказати шляхи розвитку «Укрзалізниці».
Повна назва — «Про затвердження Положення про набори даних, які підлягають оприлюдненню у формі відкритих даних» kmu.gov.ua/control/uk/cardnpd?docid=248573101 2 Топ-100 найбільших державних підприємств issuu.com/mineconomdev/docs/soe_report_1q15 3 Борги залізничників перед Укрзалізницею, політиками та олігархами bihus.info/karta-uz/ 1
ЧОМУ І ЯК УКРЗАЛІЗНИЦЯ МАЄ ВІДКРИТИ СВОЇ ДАНІ?
3
ПРО ЯКІ ДАНІ ЙДЕТЬСЯ? У ПОСТАНОВІ КАБІНЕТУ МІНІСТРІВ ПРО ВІДКРИТІ ДАНІ ФІГУРУЮТЬ ТАКІ НАБОРИ ДАНИХ, ПОВ’ЯЗАНІ З «УКРЗАЛІЗНИЦЕЮ»: База даних про вантажні перевезення: вантажообіг, обсяг, дохід вантажних залізничних перевезень у розрізі контрагентів (вантажовідправник, вантажовласник, експедитор) із зазначенням типу вантажу, вагона, напрямку, тарифної схеми, інформації про сплату за перевезення; Інформація про обсяги відправлених, прийнятих вантажів у розрізі станцій; Реєстр наявних вагонів за типами, кількість запитів на вагони у розрізі станцій; Інформація про обсяги ремонту вагонів (одиниць, гривень);
Інформація про пробіг вантажних вагонів у порожньому стані (порожній пробіг); Дані щодо вагонного господарства (робочий, неробочий парк, структура в розрізі власності, типів вагонів, місцезнаходження); Дані щодо колійного господарства (протяжність, відремонтовано, потребують ремонту); Дані щодо локомотивного господарства (кількість, робочий, неробочий парк); Пасажиропотік на внутрішніх, міжнародних маршрутах; Пасажиропотік на постійних приміських маршрутах.
Із цим списком наборів даних є дві проблеми. ВІН Є НЕПОВНИМ: очевидно, бракує щонайменше чотирьох традиційних у такому випадку наборів даних із розташуванням усіх залізничних станцій, розкладу руху міжміських та приміських потягів, інформації про запізнення та статистики аварій і нещасних випадків на залізниці; не завадили б також дані щодо цін на квитки. ВИМОГИ ЩОДО СТРУКТУРИ НАБОРІВ ДАНИХ ОКРЕСЛЕНІ ДУЖЕ НЕЧІТКО, за винятком хіба інформації щодо вантажних перевезень, де в самій назві набору даних зазначений перелік полів, які обов’язково мають бути присутні. За відсутності чітко сформульованих вимог до структури кожного набору даних «Укрзалізниця» фактично може опублікувати які завгодно цифри якого завгодно рівня агрегації. Зрозуміло, що в такому випадку опубліковані набори даних не становитимуть жодного інтересу. Причина обох проблем полягає в тому, що «Укрзалізниця» відмовилась проводити в себе аудит даних, а отже детального переліку того, що і в якому вигляді збирає компанія, немає.
4
*** Для здійснення пасажирських та вантажних перевезень і підтримки управлінських рішень «Укрзалізниця» використовує близько двох десятків різних автоматизованих систем (АС) та баз даних4. У галузі пасажирських перевезень вони покликані забезпечувати оформлення, повернення та переоформлення квитків у всіх сполученнях, відстежувати зайнятість усіх місць по кожній станції маршруту поїзда, вести фінансово-статистичний облік перевезень та здійснювати взаєморозрахунки із залізничними адміністраціями інших країн. За задумом ці системи мали б надавати можливість побачити населеність кожного потягу та кількість пасажирів, які здійснюють висадку-посадку на конкретних зупинках, а також здійснювати автоматичне регулювання місць залежно від населеності поїзда.
поїзда, локомотива, вагона в режимі реального часу. Дані, які збираються автоматизованими системами керування перевезеннями, також використовуються для обчислення фінансового результату та підготовки бухгалтерської звітності. Разом з тим повноцінної внутрішньої аналітичної системи, яка б надавала вичерпну картину операцій, доходів та витрат «Укрзалізниці», очевидно, нема. Та й сама система збору, зберігання та використання даних в «Укрзалізниці» є недосконалою і не дозволяє швидко отримувати потрібні дані та здійснювати розрахунки. Про це свідчать як усні заяви представників Міністерства інфраструктури, так і дослідження, присвячені стану інформатизації УЗ.
У сфері вантажних перевезень ці АС та бази даних, як заявляється, мають забезпечувати централізоване керування процесом перевезень та надавати інформацію щодо місцезнаходження будь-якого
Пасажирські перевезення: Автоматизована система управління пасажирськими перевезеннями (АСК ПП УЗ); Автоматизована система продажу проїзних (перевізних) документів через канали обслуговування (ЕПД ПП); Аналітична система пасажирських перевезень (АІС ПАС). Вантажні перевезення: Автоматизована систем управління вантажними перевезеннями (АСК ВП УЗ); Оперативна вагонна та поїзна модель України; Оперативна модель неробочого парку; Автоматизований комплекс для складання нормативного графіку руху поїздів; Автоматизована система обліку передачі вагонів, контейнерів, вантажів в міждержавному сполученні (ППВ); Автоматизована система обліку доходних надходжень за вантажні перевезення та стану взаєморозрахунків з клієнтами (АС ОДНСВК); Автоматизована система для забезпечення планування перевезень вантажів (АС МЕСПЛАН); Автоматизована система взаємодії з вантажовласниками у процесі оформлення та обробки перевізних документів (АС КЛІЄНТ); Автоматизовані системи обліку орендованих вагонів власності УЗ та СНД; Автоматизований комплекс плану формування вантажних поїздів залізниць України; Автоматизована система формування та розподілу доходів від вантажних перевезень на основі інтегрованої обробки дорожньої відомості (АС ІОДВ); Взаєморозрахунки за користування вагонами; АС «Таксування перевізних документів по транзиту»; Облік змін парків вантажних вагонів та їх технічного стану; Електронна картотека вагонного парку (інвентарний та власний парк), електронна картотека контейнерного парку, електронна картотека клієнтів, електронна картотека СРС; Підсистема ведення нормативно-довідкової інформації (ПСВ НДІ); Інформаційна база по класифікації та кодуванню на залізничному транспорті. Підтримка управлінських рішень: Комплекс аналітичних систем на базі OLAP КОНТУР для фінансового та комерційного господарства. 5 Нова тарифна політика Укрзалізниці: Як знайти баланс з національною економікою voxukraine.org/2015/11/06/morernizatsiya-taryfnoi-systemy-ukrzaliznytsi-quo-vadis-ua/ 4
ЧОМУ І ЯК УКРЗАЛІЗНИЦЯ МАЄ ВІДКРИТИ СВОЇ ДАНІ?
5
Як зазначає радник міністра інфраструктури Іван Макушенко,
«Система управлінського обліку, що зараз працює в “Укрзалізниці”, є застарілою і не дасть можливості побудувати вичерпну, детальну і коректну аналітику всіх витрат, що має бути відправною точкою для формування деталізованої тарифної системи»5. З ним також погоджується інший радник міністра інфраструктури Олексій Соболев, на думку котрого «Укрзалізниця» використовує дані лише на 10% можливого потенціалу. Він зазначає, що від відкриття даних керівники підприємства здатні отримати зиск, оскільки експертна аналітична спільнота безкоштовно створить для них інструменти прийняття якісних управлінських рішень.
«Наприклад, якщо для “Укрзалізниці” буде аналітика по потоках, керівник буде бачити, хто куди хоче поїхати, і зможе краще спрямовувати маршрути та розподіляти ресурси»6, — каже він. Недосконалість аналітичної складової підкреслював і сам колишній міністр інфраструктури Андрій Пивоварський.
«Старожили мені пояснили, що ніколи не ставилось завдання ні щодо інформатизації, ні щодо аналітики, ні щодо казначейства, тому що якщо все це зробити, то буде прозорість, буде зрозуміло, куди гроші йдуть, звідки з’являються. І це не потрібно було. Змінюємо ситуацію. Нам це потрібно. Зрозуміти, де “Укрзалізниця” заробляє, де втрачає чи як використовує гроші»7, — заявляв Пивоварський у червні 2015 року. Крапку в цьому питанні можна поставити цитатою зі статті «Аналіз сучасного стану інформаційно-аналітичного забезпечення внутрішнього фінансового контролю на залізничному транспорті України»: «Безпосереднє застосування обчислювальної техніки у процесі проведення аудиту чи контрольного заходу, фінансовий аналіз отриманих даних (комп’ютерний аудит) супроводжується здебільшого використанням тільки програмних систем MS Word та Excel. Таким чином збирається, оцінюється та аналізується значна частка інформації. Єдиної інформаційно-аналітичної бази ВФК, яка б надавала можливість використання ревізорами інформації з різноманітних джерел та відповідала вимогам повноти даних, не існує. Даний факт створює значні перешкоди в контрольно-ревізійній роботі, наприклад, відбувається дублювання функцій, частина контрольних заходів проводиться за формами та методами, які не відповідають сучасним вимогам та ін.»8.
«Ми відкриваємо дані, які у світі ніхто не публікує» day.kyiv.ua/uk/article/tema-dnya-ekonomika/my-vidkryvayemo-dani-yaki-u-sviti-nihto-ne-publikuye 7 Андрій Пивоварський: Укрзалізниця матиме європейську трирівневу систему управління kmu.gov.ua/control/publish/article?art_id=248237958 8 Аналіз сучасного стану інформаційно-аналітичного забезпечення внутрішнього фінансового контролю на залізничному транспорті України eadnurt.diit.edu.ua/bitstream/123456789/1569/1/915shink.pdf 6
6
ЧОМУ «УКРЗАЛІЗНИЦЯ» ВІДМОВЛЯЄТЬСЯ ОПРИЛЮДНЮВАТИ ДАНІ? Відповідальні за відкриття даних в Міністерстві інфраструктури розраховували оприлюднити дані «Укрзалізниці» ще на початку 2016 року. Однак у компанії були інші плани щодо цього. Наприкінці грудня тодішній в.о. голови правління «Укрзалізниці» надіслав на адресу Мінінфраструктури листа, в котрому, по суті, заявляв про відмову компанії публікувати дані та наводив аргументи на користь цього рішення. У короткій формі ці аргументи виглядають так: «З метою уникнення розголошення інформації, що містить комерційну та державну таємницю, а також з урахуванням розмежування господарських функцій та функцій державного регулювання». Якщо розбирати аргументи «Укрзалізниці» детальніше, можна виділити три основні тези: ІНФОРМАЦІЯ Є СЛУЖБОВОЮ «Відповідно до Закону [про доступ до публічної інформації], інформація щодо дебіторської та кредиторської заборгованості підприємств у розрізі контрагентів, сум, дат виникнення та рахунків не підлягає оприлюдненню у формі відкритих даних, оскільки є службовою та використовується підприємствами для забезпечення господарської діяльності».
ІНФОРМАЦІЯ СТАНОВИТЬ ДЕРЖАВНУ ТАЄМНИЦЮ «Також повідомляємо про дію наказу Служби безпеки України від 12.08.2005 р. №440 “Про затвердження Зводу відомостей, що становлять державну таємницю”, зареєстрованого в Міністерстві юстиції 17.09.2005 р. за №902/11182, в якому передбачено перелік відомостей щодо діяльності ПАТ “Укрзалізниці”». ІНФОРМАЦІЯ Є КОНФІДЕНЦІЙНОЮ «Слід зауважити, що розділ шостий “Конфіденційність” договору про організацію перевезень транзитних вантажів залізничним транспортом України на 2016 рік передбачає наступне: “Сторони погодились, що текст Договору, будь-які матеріали, інформація та відомості, котрі стосуються розрахунків між ПАТ “Укрзалізниця” та Замовником за перевезення по цьому Договору та обсягів вантажів, перевезених під кодом Замовника, є конфіденційними і не можуть передаватись третім особам без попередньої письмової згоди іншої сторони Договору, крім випадків, коли таке передавання пов’язане з одержанням офіційних дозволів, документів для виконання Договору або сплати податків, інших обов’язкових платежів, а також у випадках, передбачених чинним законодавством, яке регулює зобов’язання Сторін Договору”».
ЧОМУ І ЯК УКРЗАЛІЗНИЦЯ МАЄ ВІДКРИТИ СВОЇ ДАНІ?
7
На підставі наведених аргументів «Укрзалізниця» пропонує Мінінфраструктури ініціювати внесення змін до Постанови Кабміну про відкриті дані. На думку медіа-юристки та адвокатки Людмили Панкратової, аргументи «Укрзалізниці» не витримують критики. Постанова Кабміну пройшла реєстрацію в Міністерстві юстиції, а отже юристи вже перевірили її на відповідність чинному законодавству. У такому разі «Укрзалізниці» слід не писати листи Міністерству, а оскаржувати сам акт Кабміну. ЩОДО ПОСИЛАННЯ НА «СЛУЖБОВУ ІНФОРМАЦІЮ» Панкратова стверджує таке: інформація може бути віднесена до службової лише із застосуванням трискладового тесту, тобто за сукупності таких вимог: в інтересах нацбезпеки, територіальної цілісності, громадського порядку з метою запобігання заворушенням чи злочинам, для охорони здоров’я населення, для захисту репутації або прав інших людей, для запобігання розголошенню інформації, одержаної конфіденційно, або для підтримання авторитету і неупередженості правосуддя;
ЩОДО ПОСИЛАННЯ НА «КОНФІДЕНЦІЙНУ ІНФОРМАЦІЮ», медіа-юристка коментує так: «Умови договору [між “Укрзалізницею” та замовником на вантажні перевезення] не повинні суперечити законам України. У випадку, коли умови договору не узгоджуються із законодавством, діє закон, а не договір. Отже, аргументи «Укрзалізниці» не є валідними. ЩОДО «ДЕРЖАВНОЇ ТАЄМНИЦІ» — аргумент більш вагомий, дані про обсяги пасажирських перевезень містять, серед іншого, і інформацію про переміщення українських військових, а в СБУ щодо цього є чіткі вказівки9. Однак цю інформацію просто можна вилучити з бази даних і зняти в такий спосіб усі питання.
розголошення інформації може завдати істотної шкоди цим інтересам; шкода від оприлюднення інформації переважає суспільний інтерес в її отриманні. Більш цікаво, що за офіціозною аргументацією «Укрзалізниці» ховається простий страх конкуренції з авто- та авіаперевізниками. Пояснюючи небажання оприлюднювати дані, екс-директор з пасажирських перевезень та сервісу «Укрзалізниці» Ігор Бреус прямим текстом заявив10, що компанія не хоче в одноосібному порядку відкривати дані, якими можуть скористатись її конкуренти, та вимагає подібних даних про обсяги перевезень за різними маршрутами від авто та авіаперевізників (в контексті екстремальної тінізації автоперевезень ця вимога, звісно, не є реалістичною).
Наказ «Про затвердження Зводу відомостей, що становлять державну таємницю» http://zakon3.rada.gov.ua/laws/ show/z0902-05/page 10 Позицію було озвучено під час прес-конференції «Чому і як Укрзалізниця має відкрити дані?», що відбулася 29 березня 2016 року. 9
8
ЧОМУ «УКРЗАЛІЗНИЦЯ» МАЄ ВІДКРИТИ ДАНІ? Крім власне основного аргументу — ці дані мають бути оприлюднені відповідно до Постанови Кабміну і за неоприлюднення даних Кодексом України про адміністративні правопорушення передбачена відповідальність,11 — є ще декілька. ЗАДЛЯ ПІДВИЩЕННЯ ЕФЕКТИВНОСТІ ДІЯЛЬНОСТІ САМОЇ «УКРЗАЛІЗНИЦІ» Оскільки дані «Укрзалізниці» мають низьку якість12 і не дозволяють отримати вичерпну інформацію для прийняття управлінських рішень, відкритість дасть можливість залучити зовнішніх спеціалістів та експертів, котрі зможуть запропонувати механізми підвищення якості даних. Це дозволить розпочати надзвичайно потрібний і актуальний для компанії процес зведення даних
трьох основних блоків аналітичної інформації — фінансового, дохідного та витратного — в єдину систему калькуляції собівартості послуг та виміру прибутку. Розробка такої системи оптимізує бізнес-процеси та підвищить якість даних, на основі котрих приймаються управлінські рішення. ДЛЯ ЗАБЕЗПЕЧЕННЯ ПРОЗОРОСТІ ТА ПІДЗВІТНОСТІ ДІЯЛЬНОСТІ Правоохоронні органи неодноразово викривали випадки необґрунтованого заниження тарифів на перевезення вантажів та надання тарифних преференцій компаніям, пов’язаним із працівниками «Укрзалізниці»13. Гравці ринку вантажних перевезень скаржаться на непрозорі схеми тарифікації та інші ускладнення під час оформлення вантажів14. Наявність відкритих даних про обсяги вантажних перевезень із зазначенням контрагентів, типу вантажу, тарифної схеми, забезпечать фіскальний та громадський контроль діяльності «Укрзалізниці» та убезпечать від завдання багатомільйонних збитків компанії.
Порушення Закону України «Про доступ до публічної інформації», а саме: необґрунтоване віднесення інформації до інформації з обмеженим доступом, ненадання відповіді на запит на інформацію, ненадання інформації, неправомірна відмова в наданні інформації, несвоєчасне або неповне надання інформації, надання недостовірної інформації, тягне за собою накладення штрафу на посадових осіб від двадцяти п’яти до п’ятдесяти неоподатковуваних мінімумів доходів громадян // Кодекс України про адміністративні правопорушення zakon3.rada.gov.ua/laws/show/80731-10/page14 12 За оцінкою колишнього аналітика «Укрзалізниці» Євгена Дмитриченка. 13 «Укрзалізниця»: за що вже «погоріли» корупціонери antikor.com.ua/articles/21678-ukrzaliznitsja_za_shcho_vhe_pogorili_koruptsioneri 14 За інформацією професора Київської школи економіки Тома Купе. 11
ЧОМУ І ЯК УКРЗАЛІЗНИЦЯ МАЄ ВІДКРИТИ СВОЇ ДАНІ?
ДЛЯ ЗАДОВОЛЕННЯ СУСПІЛЬНОГО ІНТЕРЕСУ ДО ЦИХ НАБОРІВ ДАНИХ За результатами проведеного Мінінфраструктури опитування, з усіх наявних у міністерства наборів даних чи не найбільшим попитом як серед експертів, так і поміж громадськості користуються саме дані про пасажирські та вантажні перевезення «Укрзалізниці». Після оприлюднення двох інтерактивних візуалізації на основі даних пасажирських перевезень у 2014—2015 роках «Агенція журналістики даних» отримала кілька десятків запитів на власне дані — від економістів та соціологів, програмістів та маркетологів, від громадських організацій та аналітичних центрів, які займаються дослідженням транспортної системи15.
ЧЕРЕЗ ВЕЛИКИЙ ПОТЕНЦІАЛ ПОВТОРНОГО ВИКОРИСТАННЯ ЦИХ ДАНИХ На основі даних, які «Укрзалізниця» продукує в процесі здійснення пасажирських та вантажних перевезень і практично не використовує ні для чого іншого, може виникнути ціла екосистема різноманітних веб- та мобільних сервісів та застосунків для самої залізниці та її клієнтів, аналітичних матеріалів, академічних і маркетингових досліджень та журналістських розслідувань.
«Агенція журналістики даних» отримала частину бази даних АСК ПП УЗ за домовленістю із Міністерством інфраструктури восени 2015 року — для проведення дослідження та розробки веб-аплікацій. Домовленості АЖД та Мінінфраструктури не передбачають передачі бази даних третім особам. 15
9
10
ЯК МОЖНА ВИКОРИСТАТИ ДАНІ «УКРЗАЛІЗНИЦІ»? ЕКСПЕРТНА АНАЛІТИКА У ситуації дискусії про шляхи реформування «Укрзалізниці» наявність детальних даних про пасажирські та вантажні перевезення дозволить не лише проаналізувати поточний стан компанії і виявити найбільш проблемні сегменти діяльності, але й змоделювати різні варіанти реформ та вибрати найоптимальніший. Предметом обговорення тут можуть стати тарифікація вантажних перевезень, система розподілу пасажирських квитків для продажу між станціями та система продажу квитків як така, модель ціноутворення на пасажирських перевезеннях, та система пільг)16. Без доступу до детальних даних економісти змушені оперувати здогадами та припущеннями — очікувати на якісну аналітику в такому разі не варто. Водночас користь від наявності подібної аналітики отримає насамперед сама «Укрзалізниця». СЕРВІСИ ДЛЯ ПАСАЖИРІВ Транспортні дані традиційно є одними з найбільш запитуваних і популярних на порталах відкритих даних у всьому світі, оскільки вони дозволяють створювати різноманітні сервіси для пасажирів. Передусім ідеться про інструменти пошуку потягів та маршрутів із пересадкою, планування подорожі, порівняння потягів за часом у дорозі та вартістю квитка, а також сповіщення про зміни в розкладі, призначення, скасування та запізнення потягів.
Зиск від створення таких сервісів і застосунків, зрештою, також отримає «Укрзалізниця», оскільки всі вони спрямовані на покращення сервісу і поліпшення досвіду клієнтів. СЕРВІСИ ДЛЯ БІЗНЕСУ Дані «Укрзалізниці» також створюють можливості для розробки b2b-сервісів — як у сфері вантажних, та і у сфері пасажирських перевезень. Щодо вантажних тут може йтися про полегшення процесів оформлення вантажів, щодо пасажирських — про сервіси для малого бізнесу та готельно-ресторанного і курортного бізнесу (для котрих інформація про переміщення людей є важливою в контексті планування витрат і доходів). Журналістські матеріали і розслідування Працюючи з базою даних пасажирських перевезень, ми створили два інтерактивних інструменти для дослідження пасажиропотоків на залізниці. Вони, у свою чергу, допомогли виявити аномальне явище — пасажирський трафік на вантажній станції Київ-Дніпровський у січні 2014 року. Потяги на цю станцію прибували з Маріуполя та Луганська у критичні дні протистояння на майдані Незалежності. Подальше дослідження виявило цілу серію організованих підвозів людей зі східних та південних регіонів України на Антимайдан у січні та лютому 2014 року. Очевидно, хтось із тодішнього
Яскравий приклад експертної аналітики — цикл статей про тарифну політику «Укрзалізниці» від експертної спільноти Vox Ukraine, зокрема матеріал радника міністра інфраструктури Івана Макушенка, заснований на аналізі даних бази вантажних перевезень «Укрзалізниці». 16
ЧОМУ І ЯК УКРЗАЛІЗНИЦЯ МАЄ ВІДКРИТИ СВОЇ ДАНІ?
керівництва «Укрзалізниці» сприяв цим підвозам. Це тільки один маленький приклад того, що можуть знайти журналісти у даних «Укрзалізниці». І це лише пасажирські перевезення. У даних вантажних перевезень, без сумніву, можна знайти матеріал для десятків розслідувань. ЖУРНАЛІСТСЬКІ МАТЕРІАЛИ І РОЗСЛІДУВАННЯ Працюючи з базою даних пасажирських перевезень, ми створили два інтерактивних інструменти для дослідження пасажиропотоків на залізниці17. Вони, у свою чергу, допомогли виявити аномальне явище — пасажирський трафік на вантажній станції Київ-Дніпровський у січні 2014 року. Потяги на цю станцію прибували з Маріуполя та Луганська у критичні дні протистояння на майдані Незалежності. Подальше дослідження виявило цілу серію організованих підвозів людей зі східних та південних регіонів України на Антимайдан у січні та лютому 2014 року. Очевидно, хтось із тодішнього керівництва «Укрзалізниці» сприяв цим підвозам. Це тільки один маленький приклад того, що можуть знайти журналісти у даних «Укрзалізниці». І це лише пасажирські
11
перевезення. У даних вантажних перевезень, без сумніву, можна знайти матеріал для десятків розслідувань. АКАДЕМІЧНІ ДОСЛІДЖЕННЯ У контексті академічної діяльності дані «Укрзалізниці» дозволяють аналізувати фактори, які впливають на інтенсивність сполучення між різними населеними пунктами та регіонами (мовні, економічні, історичні тощо), а також досліджувати вплив військового конфлікту на залізничне сполучення. МАРКЕТИНГОВІ ДОСЛІДЖЕННЯ Для маркетингових компаній дані «Укрзалізниці» — це джерело інформації про потенційних клієнтів, споживачів, покупців і т.д. Це інструмент виявлення зацікавлень і преференцій та інструмент профілювання аудиторії.
Поїздки залізницею. Інтерактивна карта пасажиропотоків міжміських поїздів за 2014—2015 роки texty.org.ua/d/uz_first/; Пасажири української залізниці. Інструмент для дослідження пасажиропотоків у розрізі станцій, годин доби і днів тижня прибуття та відправлення shiny.texty.org.ua/uz_traffic/ 17
12
ЯК «УКРЗАЛІЗНИЦЯ» МАЄ ВІДКРИТИ ДАНІ? Отже, щодо того, має «Укрзалізниця» відкривати дані чи ні, сумнівів нема — має, і крапка. Далі виникає питання, як. Зважаючи на обсяг і деталізацію даних та ризики оприлюднення інформації, що становить державну таємницю, ми рекомендуємо наступне. ПРОВЕСТИ АУДИТ ДАНИХ У першу чергу «Укрзалізниці» слід зробити перепис наявних даних та скласти реєстр усіх наборів даних, які збираються і зберігаються в процесі здійснення пасажирських та вантажних перевезень. Для кожного набору даних слід зазначити формат зберігання, перелік змінних (і типи даних), а також частоту оновлення і відповідальну за оновлення особу. ДОПОВНИТИ ПЕРЕЛІК НАБОРІВ ДАНИХ, ЩО ПІДЛЯГАЮТЬ ОПРИЛЮДНЕННЮ За результатами аудиту слід визначити найбільш важливі набори даних для різних груп інтересів — бізнесу, розробників, журналістів, дослідників тощо (для цього, зокрема, можна провести онлайн-
опитування). Якщо якихось наборів даних, визнаних такими, що представляють великий суспільний інтерес, нема у Постанові Кабміну про відкриті дані — додати їх до Постанови. ДЕПЕРСОНАЛІЗУВАТИ ДАНІ ТА ВИДАЛИТИ ІНФОРМАЦІЮ, ЩО СТАНОВИТЬ ДЕРЖАВНУ ТАЄМНИЦЮ Перед публікацією даних слід видалити з них персональну інформацію (зокрема імена і прізвища пасажирів) та інформацію про переміщення військових (оскільки вона є предметом державної таємниці). ДОКУМЕНТУВАТИ ДАНІ Без детальної супровідної документації навряд чи стороння людина дасть собі раду з даними «Укрзалізниці» (та й будьякими іншими, зрештою). Супровідна документація має містити опис усіх полів набору даних, а також мінімальні інструкції щодо обчислення базових статистик. Без наявності таких описів неможливо буде, наприклад, встановити сумарну кількість пасажирів, які скористались послугами залізниці за рік18.
Однією з особливостей бази даних АСК ПП УЗ є те, що операції відмови від придбання квитка або повернення квитка не фіксуються з від’ємними показниками. 18
ЧОМУ І ЯК УКРЗАЛІЗНИЦЯ МАЄ ВІДКРИТИ СВОЇ ДАНІ?
ВИЗНАЧИТИ ЛІЦЕНЗІЮ Тип ліцензії, під котрою опубліковані дані, визначає, в який спосіб ці дані можуть бути використані19 (скажімо, чи можуть дані бути використані для розробки комерційного сервісу). Аби не створювати обмежень у використанні даних, слід використовувати (і експліцитно зазначати) вільні ліцензії — наприклад, Open Government License20. ОБРАТИ ФОРМАТИ ПУБЛІКАЦІЇ ДАНИХ ТА ЧАСТОТУ ОНОВЛЕННЯ Для великих масивів даних — таких як бази даних пасажирських та вантажних перевезень, а також для даних, які оновлюються часто (наприклад, розкладу руху та інформації про запізнення поїздів) — є сенс використовувати прикладний програмний інтерфейс (API). Для всіх інших — традиційні формати відкритих даних — csv, json, xml.
СТВОРЮВАТИ ТЕМАТИЧНІ АГРЕГАЦІЇ Окрім відкриття доступу до баз даних через API, є сенс створювати тематичні агрегації для різних груп інтересів — науковців, журналістів, аналітичних центрів, громадських організацій і т.д. Кожна з таких агрегацій має надавати можливість досліджувати дані в різних вимірах: у розрізі станцій відправлення і призначення, у розрізі категорій вагонів, у розрізі пільг, у розрізі часу в дорозі та дистанції і т.д., у розрізі дати-часу придбання квитка та дати-часу відправлення потяга.
Publisher’s Guide to Open Data Licensing theodi.org/guides/reusers-guide-open-data-licensing Open Government Licence nationalarchives.gov.uk/doc/open-government-licence/version/3/. Разом з тим варто зазначити, що питання ліцензування відкритих даних в Україні загалом є невирішеним. 19
20
13
14
ДОСЛІДЖЕННЯ БУЛО ПРОВЕДЕНЕ ЗА ПІДТРИМКИ «ІНІЦІАТИВ З РОЗВИТКУ АНАЛІТИЧНИХ ЦЕНТРІВ», ЯКУ ВИКОНУЄ МІЖНАРОДНИЙ ФОНД «ВІДРОДЖЕННЯ» У ПАРТНЕРСТВІ З ФОНДОМ РОЗВИТКУ АНАЛІТИЧНИХ ЦЕНТРІВ (TTF) ЗА ФІНАНСОВОЇ ПІДТРИМКИ ПОСОЛЬСТВА ШВЕЦІЇ В УКРАЇНІ (SIDA). ДУМКИ ТА ПОЗИЦІЇ, ВИКЛАДЕНІ У ЦІЙ ПУБЛІКАЦІЇ, Є ПОЗИЦІЄЮ АВТОРА ТА НЕ ОБОВ’ЯЗКОВО ВІДОБРАЖАЮТЬ ПОЗИЦІЮ УРЯДУ ШВЕЦІЇ.