Президент России Дмитрий Медведев в разговоре с председателем ЦИКа Владимиром Чуровым назвал последнего волшебником, передает РИА Новости. "Мы обычно проводим конкурс социологических прогнозов. В данном случае десять ведущих социологических компаний России приняли участие... Победителями стали Институт социологических исследований и Фонд исследований проблем демократии - это по явке. Мой прогноз был самым точным", сказал Чуров. По его словам, он ошибся только на 0,2 процента. (Из новостей)
Волшебник-недоучка Находясь под впечатлением выборов-2011, я решил провести небольшой математический эксперимент. Хочу предложить Вашему вниманию, уважаемый читатель, результаты моделирования и их сопоставление с итогами работы ЦИК РФ.
Выборы в Модельном уезде Целью эксперимента являлось построение зависимости средней текущей явки от количества обработанных протоколов. Было произвольно определено, что в Модельном уезде проживает 21 940 избирателей, то есть людей, обладающих правом голоса. Избирательных участков в уезде всего 20, так что в среднем на каждый участок приходится по 1097 избирателей (21 940/20 = 1097). По окончании процедуры голосования каждая из 20-ти местных избирательных комиссий готовит свой протокол, в котором присутствуют такие две цифры как число избирателей (обладателей права голоса) и число явившихся на выборы. На каждом участке получаются свои цифры. Разумеется, в протоколах полным-полно и другой информации - о том какая партия сколько голосов получила, но для целей нашего математического эксперимента это абсолютно не важно и поэтому распределение голосов по партиям мы не рассматриваем. Каждая из 20-ти местных избирательных комиссий по готовности отправляет свой протокол в ЦИК Модельного уезда с помощью системы ГАС "Модельные выборы". Результаты постепенно накапливаются и в любой момент, ну скажем, после получения 10 протоколов (50 % от их общего количества) можно рассчитать промежуточное значение явки избирателей как частное текущей суммы проголосовавших и среднего числа избирателей, соответствующего обработанному количеству протоколов. Это и есть средняя текущая явка избирателей. Когда обработка протоколов закончена (в Модельном уезде - все 20 штук или 100 %), то средняя текущая явка достигает своего окончательного значения и тотчас перестаёт быть текущей и становится просто средней явкой избирателей по соответствующей территории (в данном случае - по уезду) или - для краткости - явкой избирателей. Окончательные результаты выборов в Модельном уезде оказались таковы: проголосовало всего 11 700 человек (из 21 940 избирателей), то есть средняя явка по уезду составила (11700/21940)·100 = 53.3 %. Оказалось, что изменение средней текущей явки в зависимости от количества обработанных протоколов выглядит так, как показано на рис. 1 (избиратель Модельного уезда видел режиме реального времени по телевизору, как на графике появляются очередные точки).
2
Рис. 1. Зависимость средней текущей явки от количества обработанных протоколов (процесс передачи протоколов случаен) Наблюдаются колебания средней текущей явки (случайных значений) в некоторой полосе (в нашем эксперименте - от 40 до 60 %), причём колебания поначалу весьма значительные. По мере увеличения количества обработанных протоколов (накопления суммы проголосовавших и нарастающего усреднения данных) колебания средней текущей явки становятся всё менее заметными. В конце концов, после ввода результатов последнего, 20-го протокола, возникает последняя точка, соответствующая 100 %-ной обработке протоколов (в нашем эксперименте получилось 53.3 %), через которую параллельно оси абсцисс можно провести линию средней явки (на рис. 1 - фиолетовая линия). Получившиеся в нашем эксперименте точки с помощью статистики описываются линейным уравнением (на рис. 1 - синяя линия) с коэффициентом корреляции (КК) равным 0.242. Похожий результат будет получаться при любом произвольном (случайном) порядке "закачки" протоколов в систему ГАС "Модельные выборы". Их можно отправить с 1-го по 20-й (как это было уже сделано, см. рис. 1), можно с 20-го по 1-ый (рис. 2а), можно сначала только чётные номера, потом - нечётные (рис. 2б), можно с № 11 по № 20 и затем с № 10 по № 1 (рис. 2в), - словом как угодно, в любой комбинации элементов (перестановке).
КК = 0.578
КК = 0.049
КК = 0.477
а
б
в
Рис. 2. Варианты зависимости средней текущей явки от количества обработанных протоколов (процесс передачи протоколов случаен)
3 Картинку с чётким трендом (см. рис. 3) можно получить только тогда, когда придать неслучайность процессу передачи протоколов. Например, собрать все 20 протоколов вместе, рассортировать их по числу проголосовавших, а затем отправлять их, начиная с протокола с наименьшим числом проголосовавших и заканчивая наибольшим.
Рис. 3. Зависимость средней текущей явки от количества обработанных протоколов (процесс передачи протоколов систематизирован) И для такого варианта статистика отыщет подходящее линейное уравнение, только коэффициент корреляции окажется побольше (0.992). В контексте нашего эксперимента этот коэффициент является математически строгой мерой неслучайности (искусственности) выбранного варианта "закачки" протоколов в систему ГАС "Модельные выборы". Чем больше искусственности, тем ближе коэффициент к 1. Когда мы отправляли протоколы в произвольном порядке, коэффициент корреляции был низок (от 0.049 до 0.578), но как только упорядочили "хаос" - он подскочил до 0.992. Ну а теперь из Модельного уезда переместимся в российскую реальность...
4
Выборы 2011 года в России Сведём в табл. 1 предварительные результаты голосования на выборах-2011 в Госдуму официальные данные ЦИКа, транслировавшиеся в реальном времени (в Приложении 1 приведены скриншоты трансляции).
ЦИК РФ, также как и ЦИКа Модельного уезда, для простоты восприятия представляет сведения о количестве обработанной информации в виде процента обработанных протоколов УИК. Однако информация о средней текущей явке скрыта и даётся отдельно (торжественно оглашается время от времени одним из высших чиновников ЦИК РФ). Чтобы перейти от процента обработанных "протоколов УИК" к соответствующей средней сумме избирателей достаточно этот процент умножить на число граждан РФ, обладающих избирательным правом (109 238 480 чел. согласно официальным данным ЦИК) и поделить на 100. Чтобы найти значение средней текущей явки остаётся поделить текущую сумму проголосовавших на среднее число избирателей, соответствующее обработанному количеству протоколов и умножить на 100. Всё просто, хотя, может быть, и не очевидно. Дополним табл. 1, сделав её несколько более информативной:
А теперь "выведем на экран" картинку (см. рис. 4), аналогичную той, которую своим избирателям предоставляет ЦИК Модельного уезда.
5
Рис. 4. Зависимость средней текущей явки от количества обработанных протоколов по официальным данным ЦИК РФ за 4-5 декабря 2011 г. (прямая трансляция) (фиолетовая линия - линия средней явки по РФ, объявленная ЦИК РФ (60 %))
Надеюсь, Вы не удивлены, уважаемый читатель. Что ж, давайте корректно и спокойно разберёмся с тем, что всё это означает. 1) Зависимость средней текущей явки от количества обработанных протоколов, построенная на основании официальных данных ЦИК РФ, описывается линейным уравнением (синяя линия) с очень высоким коэффициентом корреляции (0.999). Это означает, что процесс ввода протоколов в систему ГАС "Выборы" носил неслучайный характер. 2) Теоретически зависимость с таким ярко выраженным трендом (сравн. рис. 3 и рис. 4) ЦИК РФ мог получить, только собрав все 94 873 протокола (общее количество избирательных участков, образованных в РФ, согласно официальной информации ЦИК РФ) и предварительно рассортировав их перед передачей в систему ГАС "Выборы" по возрастанию числа проголосовавших. Однако такой возможности у ЦИК РФ не было, поскольку к 22:00 мск 4-го декабря 2011 года (началу онлайн-трансляции предварительных результатов выборов) на европейской территории РФ (самой населённой части страны) 2 часа назад (в 20:00 мск) ещё только начался подсчёт голосов.
Отсюда следует первый, математически обоснованный вывод: показанные ЦИК РФ в прямом эфире цифры взяты не только из "обработанных протоколов УИК". При этом нельзя сказать какая доля реальных данных присутствует в продемонстрированных ЦИК РФ результатах. В настоящее время на сайте ЦИК для всех желающих уже размещена "стационарная" информация о результатах выборов в виде "Сводной таблицы предварительных итогов голосования", в которой можно найти данные по регионам и РФ в целом. В соответствии с географическими особенностями расположения РФ передача протоколов избирательных участков должна была вестись 4-5 декабря 2011 г. с учётом поясного времени. Сначала должна была поступить информация из Дальневосточного федерального округа (мск+8, мск+7, мск+6), затем из Сибирского (мск+5, мск+4, мск+3), а затем из всех остальных федеральных округов (мск+2, мск, мск-1). И, таким образом, у нас есть
6 возможность проведения простейшей реконструкции процесса передачи протоколов в систему ГАС "Выборы" (см. табл. 3).
А теперь совместим реконструкцию (красный цвет) с предыдущей картинкой:
Рис. 5. Сравнение зависимостей средней текущей явки от количества обработанных протоколов по официальным данным ЦИК РФ за 4-5 декабря 2011 г. (прямая трансляция) и данным, опубликованным на официальном сайте ЦИК РФ Таким образом, мы видим, что официальные "стационарные" данные (на сайте ЦИК) и не менее официальные "динамические" (прямая трансляция) резко различаются друг от друга (в области 40-60 % обработанных голосов расхождение составляет 4.2 - 4.8 млн. голосов избирателей).
Отсюда следует второй, тоже математически обоснованный вывод: один из официальных вариантов ошибочен. А ошибки такого масштаба в таком важном деле как выборы в Госдуму РФ при современном уровне развития информационных технологий недопустимы. Следует признать, что коллектив ЦИК РФ не справился со своей профессиональной задачей. А теперь давайте ещё раз воспользуемся официальными "стационарными" данными ЦИК и выясним для себя раз и навсегда как должна на самом деле выглядеть зависимость
7 средней текущей явки от количества обработанных протоколов, если процесс передачи протоколов действительно случаен. Обращу Ваше внимание, уважаемый читатель, на то, что в данном случае неважно насколько официальные данные ЦИК, размещённые на сайте комиссии, соответствуют действительности - была ли явка 20 или 80 % - речь идёт только о развитии действительно случайного процесса во времени. Для этого рассортируем все 135 регионов РФ случайным образом, например, по алфавиту - от Адыгея (республика) до Ярославская (область) (см. рис. 6):
Рис. 6. Вид зависимости средней текущей явки от количества обработанных протоколов при случайном процессе передачи информации (использован массив данных, опубликованных на сайте ЦИК РФ) Всё так, как и должно быть - что для 20 протоколов Модельного уезда, что для 94 873 протоколов РФ. Коэффициент корреляции равен здесь 0.149. Всё по науке.
*** В заключение, уважаемый читатель, позволю себе ещё одну реконструкцию, математически менее обоснованную, но зато более художественную. Первые результаты голосования, поступившие из ДФО и СФО, оказались, по-видимому, неожиданными для руководства РФ. Отсюда - часовая заминка с началом прямой трансляции и проскок (пусть и не в явном виде) - я уж не знаю по недомыслию или из-за цейтнота начального значения средней текущей явки на уровне 40 %. Эта цифра, на мой взгляд, похожа на правду. Конечное значение явки избирателей (60 %) - следствие "госзаказа" (50 % - за "Единую Россию", 50 % - за все остальные партии) тоже информативно. Я не политолог, поэтому не могу объяснить почему "госзаказ" оказался именно таким (а не 60 % за "ЕР" к 40 % за всех остальных, например). Из сопоставления начального и конечного значений явок (40 и 60 %) следует, что "Единая Россия" приписала себе около 20 % голосов избирателей (т.е. около 20 млн.), которые на самом деле на избирательные участки не явились.
8 Тогда, если из 30 млн. голосов, полученных "Единой Россией" согласно итоговым данным ЦИК, вычесть 20 млн. приписок, то истинный результат этой партии - около 10 млн. избирателей по всей РФ, что соответствует 25 % при 40 %-ной реальной явке (округляем общее число избирателей РФ до 100 млн.). Теперь, собственно, реконструкция. Жители Дальнего Востока и Сибири, злоупотребив своим географическим положением, первыми из граждан России 4 декабря 2011 г. смогли (точнее - успели!) передать свой пламенный цифровой привет (25 % за "Единую Россию" при 40 %-ной явке) руководству РФ. Руководство подумало и вызвало "волшебника": - Сделай 50 на 50. "Волшебник" начал считать: 10 млн. избирателей в целом по РФ наберём (если экстраполировать дальневосточно-сибирские проценты на всю страну), но у других партий будет 30 млн. Значит надо добавить ещё 20 млн. избирателей, чтобы было 50 на 50 %, согласно пожеланиям заказчика. Какая при этом получается общая явка? 10 млн. есть + 20 млн. припишем + 30 млн. за другие партии = 60 млн., т.е. 60 %. - Ответ готов, шеф! - Волшебник! Ну а позже начался "сеанс чёрной магии" в зале заседаний ЦИК, причём цифирь, являемая в прямом эфире народу, скорее всего, рассчитывалась без всякой системы ГАС "Выборы" на ноутбуке в соседней комнате. Тайное рано или поздно становится явным. Рано или поздно, но и заказчику, и "волшебнику" и тому, кто сидел за ноутбуком, придётся давать показания в суде. Каком? Зависит от нас, уважаемый читатель. А пока истинное положение вещей примерно таково: 10 млн. избирателей "за", 30 млн. - "против", 60 млн. - безмолвствуют. Алексей Афиногенов 11.12.2011 12:11
9 ПРИЛОЖЕНИЕ
04.12.11 22:00
04.12.11 23:00
10
05.12.11 00:00
05.12.11 1:00
11
05.12.11 10:00