Анализ итогов голосования в Госдуму 04.12.2011 г.

Dec 14, 2011 21:36

Не так давно ассоциация "Голос" выложила у себя подробные данные по выборам в Госдуму в удобном для обработки виде.
Проанализируем их. Самым рациональным способом отображения картины выборов, на мой взгляд, является изображение гистограмм количества бюллетеней, отданных за определённую сторону, отложенную на оси явки в соответствующих этим бюллетеням УИК.

Получается следующая картина: (Вся Россия без некоторых комиссий /по которым нет подробной информации/, 95 065 участков, 109 025 750 избирателей).
Горизонтальная ось - явка, показанная на конкретном участке, (число найденных в ящиках бюллетеней к числу зарегистрированных избирателей на участке), по данным Центризбиркома.
Вертикальная ось - процентное отношение числа бюллетеней за определённую партию в интервале +-0,5% от изображенного процента к общему числу бюллетеней в ящиках по России. (Кроме последней точки, которая соответствует попаданию от 99,5 до 100%).



Что мы видим:
Во-первых, кривая глобальной явки (тёмно синяя линия) имеет умеренно колоколообразный вид, и не падает до нулевых значений в правой части. Это говорит о том, что на большинстве участков [показанная] явка укладывается в диапазон 40-70%.
Рядом изображённая (тонкая черная линия) кривая распределения количества участков по явке показывает, что эта часть графика формировалась, в основном, участками большой численности (кривая участков лежит ниже кривой бюллетеней), а участки с малой и большой явкой сформированы более мелкими участками.

Во-вторых, виден различный характер кривых за партии (цветные линии). Площадь под каждой кривой определяет суммарный процент за соответствующую партию, если просуммировать все кривые, то получится кривая распределения показанной явки.
Видно, что форма кривой ЕР отличается от форм кривых за другие партии, а её максимум также соответствует большему проценту явки.
Предположительно, это объясняется добавлением дополнительных бюллетеней на некоторых участках. С точки зрения теории вероятностей, при увеличении явки проценты за партии должны примерно одинаково увеличиваться у всех. Это может быть не так при наличии особых участков, например спецучреждений и воинских частей, где будет другая явка и другое распределение предпочтений. Будем считать, что таких участков не так много, а основное искажение картины произошло за счёт искусственного добавления голосов за счёт вброса дополнительных бюллетеней или приписок в итоговых протоколах.

В-третьих. Видны скачки кривых явки и голосов на некоторых круглых процентах, перед которыми (и, в меньшей степени, за ними) наличествуют провалы. Особенно это заметно на кривой ЕР. Они объясняются (считаем наличие приписок априори верным) тем, что при переписывании бюллетеней для увеличения показателей ЕР психологически человек склонен к круглым цифрам (в данном случае это касается процента явки). Поскольку скачки выражены не очень сильно и компенсируются рядом лежащими провалами, не будем в дальнейшем на этом останавливаться, считая это дополнительным подтверждением фальсификаций.

Попробуем оценить искажение, внесённое приписками, отталкиваясь от того, что при отсутствии фальсификаций распределение голосов носило бы гауссовский, колокообразный характер. Для этого аппроксимируем, подгоним предполагаемую гауссовскую кривую под имеющиеся данные.
Если пронормировать проценты за партии (брать в качестве знаменателя не общую явку, а суммарное количество бюллетеней за соответствующую партию, то получим следующую живописную картину:




Во-первых, интересно, что проценты всех партий, кроме ЕР, сохранив подобие кривой явки, легли выше её в (диапазоне наибольшей явки, 25-65%). А ЕР ниже. Это означает, что после увода участков со вбросами в область более высоких процентов, остались участки с более честными итогами. Результат ЕР (смотреть надо от кривой глобальной явки) уменьшился примерно на 40%, это можно считать (грубо) максимальным значением величины фальсификаций.
С процентами остальных партий всё ещё интереснее. Они не легли на одну линию, некоторые лежат выше, другие ниже остальных. Причём ниже всех лежит кривая недействительных бюллетеней, которая, по логике, статистически должна соответствовать кривой явки. Чем отличается учёт недействительных бюллетеней от учёта прочих голосов? Тем, что эти бюллетени, с точки зрения махинаторов, им неинтересны. Их количество вычитается из числа найденных в ящиках и никак не влияет на проценты партий, использовать их вместо действительных, подложив в нужную пачку за партию можно, но уж очень небезопасно. Выяснится при любой проверке. Таким образом, число недействительных бюллетеней примерно соответствует их действительному числу. Почему кривые за партии легли выше кривой недействительных? Это можно объяснить переписыванием голосов за партии в пользу одной известной. Поскольку кривые нормированы, уменьшенный (за счёт переписанных в пользу ЕР голосов) при больших показанных явках процент даёт увеличение остальных там, где этого не делалось.
Интересно, что наиболее "социально далёкими" для узурпаторов от партии власти являются Яблоко и СР, а самыми "социально близкими" - КПРФ и ЛДПР. С которыми, впрочем, тоже не особо церемонились.

Во вторых. Можно заметить, что в диапазоне малых явок кривые примерно соответствуют левому крылу гауссианы. Можно использовать этот факт для подбора кривой с подходящими характеристиками.
Более интересно наличие некоторой "стабильной" точки, лежащей в области 65-66 процентов явки. Это точка, в которой не поменялось число бюллетеней - сколько пришло через комиссии с малой исходной явкой, столько и ушло с таким исходным процентом в область с более высокой явкой. Можно использовать эту точку для фиксации правого крыла гауссовского распределения явки.

Третьей величиной, которую можно использовать для уточнения кривой (поскольку через начало и конец гауссианы можно провести целое семейство удовлетворительно соответствующих кривых) можно считать совокупный процент вброшенных голосов. Это будет разница площадей, находящихся между кривой явки и гауссианой. Всё что ниже - уменьшение явки относительно расчётного из-за обеднения при переходе участков в другие процентные категории, всё что выше - увеличение из-за вброса и настоящих голосов из участков с ранее меньшей явкой. Это с одной стороны. С другой, площади под кривыми соответствуют совокупной явке. Разница между ними будет добавленными голосами. Эти две величины при правильном подборе гауссианы должны совпасть. Для упрощения вида объединим все бюллетени, за исключением ЕР. Получается следующая картина:



Можно сказать, что нарушения происходили уже при небольших, порядка 35%, показателях явки, массовые искажения были в районе максимальной явки.
Из текущего анализа следует, что было вброшено порядка 6% (от списочного количества, 6 млн.) бюллетеней, Что увеличило результат ЕР на 5,5%.
Надо иметь в виду, что увеличение за счёт переписывания голосов оппонентов данным анализом не учтено, Это может дополнительно увеличить масштабы искажения реальной картины голосования.

Архив с файлами (для Excel 2007, 45 Мб).

В следующих постах разберём итоги голосования в наиболее интересных регионах страны.

статистика, модели, выборы, исследования

Previous post Next post
Up