ТЕХНІЧНИЙ ОПИС МЕТОДОЛОГІЇ
TRANSPARENCY INTERNATIONAL ІНДЕКС СПРИЙНЯТТЯ КОРУПЦІЇ 2015
Індекс сприйняття корупції-2015: технічний опис методології Історія Індекс сприйняття корупції (ІСК) було засновано в 1995 році як зведений індикатор, що використовувався для вимірювання сприйняття корупції в державному секторі в різних країнах по всьому світі. Протягом останніх 20 років змінам та доповненням підлягали як джерела, з яких складається індекс, так і методологія. Слідом за ретельним процесом перегляду, в метедологію 2012 року було внесено деякі важливі зміни. Метод, який ми використовуємо для зібрання різних джерел даних, було спрощено і зараз включає дані лише за один рік з кожного джерела даних. Вирішальним є те, що цей метод дозволить нам порівнювати бали протягом часу, що було методологічно неможливо раніше. Враховуючи зміни до методології, необхідно наголосити на тому факті, що бали країн в ІСК 2012 не можна порівнювати з балами за 2011 рік та попередні роки. Порівняння з року в рік будуть можливі, починаючи з 2012 року. Методологія Методологія включає 4 базових кроки: вибір джерел даних, стандартизація джерел даних, зведення стандартизованих даних та повідомлення про ступінь неточності. 1. Вибір джерел даних ІСК спирається на ряд доступних джерел, які досліджують сприйняття корупції. Кожне джерело оцінюється відповідно до критеріїв, вказаних нижче. З кожною установою, яка надає дані, було встановлено контакт для верифікації методології, яка використовується для генерації балів, та для отримання дозволу на оприлюднення стандартизованих балів з кожного джерела поряд зі зведеними балами індексу. A) Надійний набір даних та методологія з авторитетної установи: Необхідно, щоб ми довіряли достовірності даних, які використовуємо. Таким чином, кожне джерело повинно брати початок з професійної установи, яка чітко документує свої методи збору даних. Ці методи повинні бути обгрунтованими методологічно, наприклад, якщо надається експертна надумка, нам необхідно підтвердження кваліфікації експерта, або коли проводиться опитування бізнесу – підтвердження того, що воно репрезентативне. B) Дані стосуються корупції в державному секторі: Питання або аналіз повинні стосуватися сприйняття рівня корупції саме у державному секторі. Питання може стосуватися визначеного «типу» корупції (наприклад, дрібна корупція), та, якщо це доречно, ефективності попередження корупції, оскільки це можна використати як показник рівня
1
ТЕХНІЧНИЙ ОПИС МЕТОДОЛОГІЇ
TRANSPARENCY INTERNATIONAL ІНДЕКС СПРИЙНЯТТЯ КОРУПЦІЇ 2015
сприйняття корупції в країні. . С) Кількісна гранулярність: Різні види шкал, які використовуються джерелами даних повинні враховувати значну диференціацію даних (принаймні, 4-бальна шкала) щодо рівнів сприйняття корупції в різних країнах, з тим щоб їх можна було трансформувати у шкалу ІСК від 0 до 100. D) Порівнюваність між країнами: Оскільки в ІСК країни порівнюються одна з одною, джерела даних також повинні порівнюватися між країнами, а не бути специфічними для певної країни. Джерело повинно вимірювати однакові показники в кожній країні за однаковою шкалою. E) Набір даних на багато років: Ми хочемо мати змогу порівнювати бали країн, та індекс взагалі, з ріку в рік. Таким чином, джерела, які охоплюють сприйняття корупції в єдиному відрізку в часі, та не розроблені з метою повторюватися протягом часу, виключаються зі списку. 2. Стандартизація джерел даних Після цього кожне джерело стандартизується для сумісності з іншими доступними джерелами з метою зведення зі шкалою ІСК. В процесі стандартизації всі джерела даних конвертуються в шкалу від 0 до 100, де 0 – найвищий рівень сприйняття корупції, а 100 – найнижчий. В будь-якому джерелі, де низькі бали відповідають низькому рівню корупції, необхідно спочатку змінити шкалу на протилежну. Це робиться шляхом помноження кожного балу в наборі даних на -1. Кожен бал потім стандартизується (до балу z) шляхом віднімання середнього арифметичного та ділення на стандартне відхилення. В результаті отримується набір даних, який центровано відносно нуля зі стандартним відхиленням 1. Для того, щоб ці бали z можна було порівнювати між наборами даних, нам необхідно визначити середнє арифметичне та параметри стандартного відхилення як глобальні параметри. Таким чином, коли набір даних охоплює обмежене коло країн, ми приписуємо бали всім тим країнам, яких бракує у відповідному наборі даних. Ми приписуємо значення, яких бракує, для країн, яких бракує, в кожному наборі даних, використовуючи пакет статистичного програмного забезпечення STATA, і більш конкретно, команду ‘impute’. Ця команда виконує оцінку відсутніх значень для країн у кожному наборі даних за допомогою регресійного аналізу джерел даних ІСК, які мають більше 50% значень. Це за виключенням даних Bertelsmann Foundation’s Transformation Index, який не використовується для визначення значень індикаторів Сталого Управління Фундації Бертелсмана, тому що ці два джерела даних відносяться до різних країн. Середнє арифметичне та стандартне відхилення обраховуються як середнє повних наборів даних та використовуються як параметр стандартизації вихідних даних. Важливо, що повні набори даних з оціненими значеннями використовуються тільки для підрахунку цих параметрів, а значення, що було оцінено не використовуються в якості вихідних даних для підрахунку балів країн в ІСК. Оскільки це перший рік використання цієї методології, 2012 рік буде визначено як вихідний рік. У наступні роки (після 2012 року), середнє та параметри стандартного відхилення, що використовуються для стандартизації, будуть мати такі ж значення, визначені для вихідного індексу 2012 року. Використовуючи однакові параметри рік від року, ми можемо порівнювати ці стандартизовані та трансформовані бали протягом часу. Коли в індексі будуть
2
ТЕХНІЧНИЙ ОПИС МЕТОДОЛОГІЇ
TRANSPARENCY INTERNATIONAL ІНДЕКС СПРИЙНЯТТЯ КОРУПЦІЇ 2015
з’являтися нові джерела, для відповідного відображення змін протягом часу, вказані обчислення забезпечиватимуть відповідність нових джерел з вихідними параметрами 2012 року. Спочатку відбувається оцінювання ситуації, чи мала місце глобальна зміна середнього та стандартного відхилення з 2012 року, а потім для трансформації нового набору даних використовуються ці нові значення, які могли змінитися з 50 на 20. Z бали потім масштабуються до діапазону 0-100 шкали ІСК. При цьому використовується проста формула, яка встановлює середнє значення стандартизованого набору даних до приблизно 45, а стандартне відхилення до приблизно 20. Будь-які бали, які виходять за рамки від 0 до 100, обмежуються до 0 та 100 відповідно. 3. Зведення трансформованих даних Бали кожної країни в ІСК обчислюються як середнє число всіх наявних балів для тієї країни (примітка, ми не використовуємо ніякі приписані значення як бал для зведеного ІСК). Країна отримує бал лише за умови, що є принаймні три наявних джерела даних, з яких можна обчислити середнє число. 4. Повідомлення про ступінь неточності Бали ІСК представляються разом зі стандартною похибкою та довірчим інтервалом, який відображає зміну значення вихідних даних, які складають бал ІСК. Стандартна похибка обчислюється як стандартне відхилення трансформованих вихідних даних, поділених на квадратний корінь від кількості джерел. Викоритовуючи цю стандартну похибку, ми можемо обчислити 90% довірчий інтервал, припускаючи нормальний розподіл.
3