Под катом - моя статья о выборах из газеты "Троицкий Вариант" (
http://trv.nauchnik.ru/40N.pdf,
вариант в HTML на новом сайте газеты) в том виде, как она была опубликована в блоге "Эха Москвы" (
http://www.echo.msk.ru/blog/echomsk/631692-echo), с мелкими техническими исправлениями. Авторство подводки - ТрВ.
Важное дополнение (май 2011 г.): подробные официальные результаты выборов различных уровней теперь собраны в удобном для обработки виде на сайте
http://stat.golos.org.
EchoMSK :
Математика выборов 03.11.2009 | 13:32
Оригинал:
«ТРОИЦКИЙ ВАРИАНТ. НАУКА» Политика не относится к основным сферам, которые призван освещать «Троицкий вариант».
У газеты совсем другие точки приложения сил, например просветительство, борьба с невежеством и мракобесием. Однако политика зачастую вторгается именно в эти сферы со своими грязными башмаками, ложью и невежеством. Естественно, эти случаи являются предметом нашего дотошного анализа.
Именно таким случаем являются выборы последних лет, причем год от года результаты выглядят все более вопиющими.
Человеку, имеющему хотя бы общее представление о статистике и обладающему здравым смыслом, достаточно посмотреть на график, чтобы понять: на выборах этого года в Москве имела место массовая беззастенчивая фальсификация (более чем на двух третях участков), а на некоторых участках фальсификация была чудовищной.
При этом официальные лица, глазом не моргнув, заявляют, что выборы были честными, а все сомнения в этом - на руку врагам. Конечно, эти самые официальные лица понимают, что им не верят не только образованные люди, но и огромное число простых людей. Им хорошо бы получить поддержку титулованных ученых - чтобы было чем заткнуть всяких там математиков, биологов и физиков, по роду деятельности хорошо знающих статистику и измывающихся над ЦИК.
Видимо, именно за этим Владимир Чуров обратился в Президиум РАН, выступив там с докладом «Избирательный процесс: теория, практика и научное сотрудничество».
К чести членов Президиума, восторженной ответной реакции докладчик не получил.
При обсуждении доклада академик Александр Дмитриевич Некипелов сказал, что «в докладе определены очень интересные направления сотрудничества с РАН и сферы, организующие выборную систему в стране. Всего за 15 лет проделана очень большая работа и достигнуты впечатляющие результаты. Есть проблема доверия населения к институту выборов. В этом направлении делается очень много, но все эти действия не слишком убеждают. Например, в Москве примерно в 16.00 была явка 5%, а к концу голосования - около 35%.
Институт выборов необычайно важен в условиях демократической системы. В связи с этим очень важна роль общественных наук. Владимир Евгеньевич и его коллеги многое делают, чтобы поднять институт выборов на должную высоту. Хотелось бы, чтобы последовали дальнейшие контакты с представителями общественных наук, чтобы определить конкретные темы нашего сотрудничества».
Президент РАН академик Юрий Сергеевич Осипов поблагодарил автора доклада и сообщил, что «в структуре РАН имеется институт, который занимается разработкой системы выборов с высокой степенью защиты информации.
РАН имеет отношение и к разработке системы ГЛОНАСС, здесь мы тоже можем вам помочь. Для того, чтобы повысить уровень доверия населения, необходимо привлекать высокообразованных социологов и статистиков».
Следуя указаниям президента РАН, ТрВ публикует статью математика Сергея Шпилькина о статистическом анализе результатов выборов.
СТАТИСТИЧЕСКОЕ ИССЛЕДОВАНИЕ РЕЗУЛЬТАТОВ РОССИЙСКИХ ВЫБОРОВ 2007-2009 гг.
Избирательная система РФ в цифрах
Общее количество зарегистрированных в РФ избирателей составляет около 100 млн человек (величина варьирует от одних выборов к другим, причем не всегда понятным образом).
Общее количество избирательных участков в стране составляет немного менее 100 тыс. Таким образом, в среднем на один избирательный участок приходится примерно 1000 человек. Типичный размер избирательного участка в городах - 1500-2500 избирателей, в сельской местности - несколько сотен. Существуют «закрытые» участки (военные части, больницы, тюрьмы, суда торгового флота), в которых обычно немного избирателей и высокая (до 100%) явка.
Участковые избирательные комиссии (УИК) подчинены территориальным избирательным комиссиям (ТИК); их в РФ примерно 2750. При проведении голосований по мажоритарной системе формируются избирательные округа: в небольших субъектах Федерации - по одному, в крупных - по несколько; на выборах в Госдуму 2007 г. их было 153 в РФ, в том числе 10 в Москве, на выборах в Мосгордуму 2009 г. - 17 (в Москве).
Начиная примерно с 2003 года (с выборов в Государственную Думу 4-го созыва) все результаты выборов с детализацией вплоть до избирательных участков публикуются
на сайте ЦИК.
Введение
Тема статистического анализа результатов выборов вновь стала популярной в связи с недавними выборами в Мосгордуму.
Как и после федеральных выборов 2007-2008 года, отношение к самой идее статистического анализа выборов неоднозначное. Некоторые эксперты вообще высказываются в том духе, что неспециалистам в эту тему соваться не стоит. Так,
вице-президент Центра политической конъюнктуры Виталий Иванов говорит: «Не надо математикам со своими моделями лезть в политику, анализировать выборы, придумывать какие-то свои версии. Это просто смешно, когда математик рассуждает о выборах. Давайте еще биолога спросим! Или узнаем, что по поводу результатов выборов думает физик-ядерщик! У них, наверное, тоже найдутся идеи, как высчитать, какой на самом деле должен быть результат. Я считаю, всерьез обсуждать здесь нечего!».
У автора по этому вопросу другое мнение.
Пока для результатов выборов не введена какая-либо специальная суверенная арифметика, любой человек имеет право анализировать эти результаты и делать свои выводы. На самом деле статистические подходы к анализу результатов выборов в России используются с начала 1990-х годов, с тех самых пор, как появились свободные выборы. Среди основополагающих работ на эту тему (большая подборка ссылок на различные материалы приведена в (1)) можно отметить ис- следования А.А. Собянина и В.Г.Суховольского (2). В настоящее время исследованиями на эту тему занимаются М. Мягков, П. Ордешук и Д. Шакин (3), У. Мебейн (4), А. Любарев и А.Бузин (5). После федеральных выборов 2007-2008 года также вышла статья председателя ЦИК В. Чурова с соавторами (6), оппонирующая книге Мягкова, Ордешука и Шакина и публикациям автора настоящей статьи в Livejournal. Хороший обзор результатов недавних выборов с точки зрения теории вероятностей написал А. Шень (7).
В этой статье я хотел бы предложить вниманию читателей результаты своих исследований статистики выборов, начатых после выборов в Государственную Думу РФ в декабре 2007 г.
Материалом для исследования являются исключительно данные голосований по избирательным участкам, территориальным комиссиям, округам и субъектам Федерации, полученные с сайта Центризбиркома. По сути каждые выборы представляют собой гигантский эксперимент, дающий огромный (N~106 чисел для федеральных выборов, ~105 чисел для выборов в Москве) полный (без пропусков) структурированный массив данных. При этом количество отсчетов данных N настолько велико, что этот массив можно разбивать на большое количество подкатегорий, и каждая из этих категорий будет по-прежнему содержать статистически значимое количество отсчетов данных. Эта работа не строгое статистическое исследование, а скорее поиск «срезов» данных, позволяющих выявить интересные особенности выборов.
Статистические особенности результатов российских выборов 2007-2009 гг.
Первой и наиболее заметной особенностью выборов последних лет является зависимость результатов голосования от явки.
Для наглядности начнем сразу с конкретных примеров.
Рис. 1. Голосование избирателей за партии на выборах в Государственную Думу РФ 2007 г. Данные по избирательным округам субъектов РФ.
Рис. 2. То же самое голосование, данные по территориальным избирательным комиссиям.
Рис. 3. Голосование избирателей за кандидатов на выборах Президента РФ 2008 г. Данные по субъектам Федерации.
Рис. 4. Голосование избирателей за партии на выборах в Московскую городскую думу 2009 г. Данные по избирательным участкам.
На рис. 1-4 приведены диаграммы распределения голосов за различные кандидатуры (партии - на выборах в представительные органы, кандидатов - на президентских выборах) на думских выборах 2007 г., президентских выборах 2008 г. и выборах в Мосгордуму 2009 г. на различных уровнях детализации данных. На всех графиках по оси абсцисс отложена явка в процентах, а по оси ординат - процентная доля избирателей, проголосовавших за данную кандидатуру, от общего числа зарегистрированных избирателей (списочного состава) на избирательных участках с такой явкой (явка округляется вниз до целого числа процентов).
Все четыре диаграммы, несмотря на то, что относятся к разным выборам и имеют разную степень детализации, обладают общими особенностями.
a) При малых явках имеется более или менее выраженный участок, где результаты разных кандидатов растут пропорционально друг другу (точки ложатся на прямые, проходящие через начало координат).
Это означает, что при изменении явки количество голосующих за все кандидатуры растет пропорционально, а процентные доли сторонников разных партий среди пришедших на выборы остаются постоянными.
b) При дальнейшем росте явки количество голосующих за все кандидатуры, кроме кандидатуры власти, остается постоянным, а все дополнительные голоса, возникающие от прироста явки, отходят к кандидатуре власти.
c) Наконец, при высоких явках доли голосов за все кандидатуры, кроме кандидатуры власти, начинают падать, а все потерянные ими голоса вкупе с дополнительными голосами от роста явки отходят к кандидатуре власти.
Поведение a) соответствует так называемому «правилу Собянина-Суховольского», предложенному еще в 1990-е годы в качестве критерия честного подсчета голосов на выборах (см. (1)).
Оно возникает, например, если вероятность прихода избирателей на участок не зависит от их политических предпочтений.
Поведение b) можно объяснить различными способами.
Одно возможное объяснение: избиратели оппозиционных кандидатов демонстрируют на выборах высокую активность и в большинстве случаев приходят на выборы все до одного, а избиратели кандидатуры власти пассивны, и их доля среди пришедших голосовать меняется в широких пределах.
Другое объяснение: начиная с некоторой явки, весь прирост явки и все дополнительные голоса, поданные за партию власти, являются результатом вброса, приписок или административного давления (последний вариант в некотором смысле смыкается с первым объяснением - если избиратели кандидатуры власти ходят на выборы из-под административной палки).
Наконец, поведение с) может быть объяснено, например, тем, что избирательные участки с высокой явкой находятся в местностях или местах, где за кандидатуру власти голосуют охотно, а за остальных кандидатов - мало и редко.
Другое возможное объяснение - отъем голосов у «прочих» кандидатов и приписки в пользу кандидатуры власти.
Чтобы понять, какие из этих механизмов больше соответствуют действительности, обратимся к другим особенностям статистики голосований.
Распределение избирательных участков по явке
Хотя явка не является официальным отчетным параметром и не фигурирует в итогах выборов, публикуемых избирательными комиссиями, неформально к ней относятся очень внимательно.
Это дает порой весьма неожиданные результаты.
На рис. 5 приведено распределение избирательных участков по явке на думских выборах 2007 г.
По оси абсцисс отложена явка в процентах, по оси ординат - количество избирательных участков, показавших такую явку (с округлением вниз, до ближайшего целого числа процентов).
Рис. 5. Выборы в Государственную Думу РФ 2007 г. Распределение избирательных участков по явке.
Первое, что бросается в глаза, - это необычная форма распределения в целом.
Помимо основного максимума в районе 55%, распределение имеет «плечо» со стороны больших явок и резкий пик вблизи 100%.
Хотя пик у 100% в основном обусловлен небольшими избирательными участками, общее число избирателей, проголосовавших на участках со 100%-ной явкой, составляет ни много ни мало 1,5 млн человек! Для объяснения столь необычной формы распределения избирательных участков по явке обычно используется тезис, что страна неоднородна и существуют территории, для которых характерны высокая явка и одновременно высокий уровень голосования за кандидатуру власти (например, сельская местность).
Такая мысль проводится,
например, в статье В. Чурова с соавторами (6); там же фактически признается наличие «регионов особой электоральной культуры» (читай - несвободного волеизъявления), где явка и процент голосования за властную кандидатуру могут доходить до 100%. Насколько справедлива эта аргументация - вопрос спорный; для сравнения приведем распределение избирательных участков по явке на выборах в немаленькой стране Польше (рис. 6). Здесь распределение разительно отличается от российского и гораздо больше соответствует здравому смыслу.
Рис. 6. 2-й тур выборов Президента Польши, 2005 г. Распределение избирательных участков по явке.
Однако у распределения на рис. 5 есть и вторая замечательная особенность: пики на значениях явки 60, 70, 75, 80, 85, 90, 95%.
Появление таких пиков нелегко объяснить статистическими механизмами, но очень просто - человеческой психологией и стремлением показать «красивые» цифры в отчете. Это означает, что явка на выборах была предметом манипуляций и отчетным параметром, а сами результаты выборов по крайней мере частично сформированы административным воздействием.
Более того, манипуляции не возникают сами по себе «снизу» - значит, было как минимум «молчаливое согласие» между теми, кто их непосредственно реализовал (на уровне избирательных участков), и теми, кто их принимал (на уровне территориальных избирательных комиссий и выше).
Рис. 7. Выборы Президента РФ 2008 г. Распределение избирательных участков по явке.
На президентских выборах 2008 г. странности распределения избирательных участков по явке только усилились (рис. 7).
Начальный пик вообще пропал, а «плечо» превратилось в «плато» с мощными пиками на красивых значениях явки.
Чтобы лучше понять механизм появления подобных распределений, сделаем следующее.
Разделим явку на две составляющие: явку избирателей, голосующих за кандидатуру власти, и явку избирателей, голосующих за других кандидатов, и посмотрим на распределения избирательных участков по этим двум показателям. Если вклад обеих составляющих явки в «странности» распределения по полной явке одинаков, мы можем ожидать, что распределения по обеим составляющим будут подобны, если нет - будут различия.
На рис. 8 приведены соответствующие графики для президентских выборов 2008 г. (распределение по полной явке то же, что и на рис. 7).
Итак, распределение участков по явке избирателей, проголосовавших за «другие» кандидатуры, похоже на обычное нормальное распределение, за исключением добавочного «плеча» на малых явках, которое естественно связать с вышеупомянутыми «регионами особой электоральной культуры».
В то же время распределение по явке избирателей, проголосовавших за Дмитрия Медведева, выглядит в высшей степени нетривиально. Возникает ощущение, что механизмы, управляющие явкой избирателей Дмитрия Медведева, с одной стороны, и избирателей других партий - с другой, радикально различаются.
Подобная картина наблюдается и на других выборах. Для примера, на рис. 9 приведены аналогичные распределения для выборов 2009 г. в Мосгордуму. Картина та же: распределение по явке избирателей «остальных» партий похоже на обычное гауссово, а распределение по явке избирателей «Единой России» не похоже вообще ни на что разумное.
Рис. 8. Выборы Президента РФ 2008 г. Распределения избирательных участков по явке избирателей, проголосовавших за Дмитрия Медведева, по явке избирателей, проголосовавших за другие кандидатуры, и по общей явке.
Рис. 9. Выборы в Московскую городскую думу 2009 г. Распределения избирательных участков по явке избирателей, проголосовавших за «Единую Россию», по явке избирателей, проголосовавших за другие кандидатуры, и по общей явке.
Зависимость статистических характеристик выборов от способа голосования
Предшествующее рассмотрение наводит на мысль, что голосование за кандидатуру власти и голосование за остальные кандидатуры управляются разными механизмами.
К счастью, наша избирательная система дает возможность практически «чистой» проверки этого предположения. Эта возможность связана с комплексами автоматической обработки избирательных бюллетеней (КОИБ), которыми оборудуется часть избирательных участков.
Очень удобна в этом смысле Москва, где КОИБами на выборах последних лет оснащается около 30% участков. При этом КОИБы распределяются по районам города достаточно широко и бессистемно и каждый раз по-новому, так что можно считать, что контингенты избирателей на участках с КОИБ и без них одинаковые (единственное исключение - «закрытые» участки, где КОИБы не ставятся, но в Москве на таких участках избирателей немного).
Сравним результаты голосований в Москве на участках с КОИБ и без. На рис. 10 приведены распределения избирательных участков Москвы по явке на выборах в Государственную Думу РФ 2007 г.
Рис. 10. Выборы в Государственную Думу РФ 2007 г. Распределение избирательных участков г. Москвы по явке.
Распределения схожи между собой и похожи на нормальное (гауссово), хотя для участков без КОИБ есть «хвост» в сторону высоких явок.
Однако численные результаты выборов ощутимо различаются:
Таким образом, наличие КОИБ снижает явку и почему-то долю голосов за «Единую Россию».
На президентских выборах 2008 г. различие между двумя типами участков значительно усилилось.
Рис. 11. Выборы Президента РФ 2008 г. Распределение избирательных участков г. Москвы по явке.
Распределения выглядят так, будто вообще относятся к разным территориям.
Распределение участков с КОИБ еще сохраняет колоколообразную форму, хотя и обзавелось изрядным «хвостом» к высоким явкам. Участки же без КОИБ распределены по какому-то самобытному закону. При низких явках просматривается сходство с участками без КОИБ, но затем начинаются замечательные пики на «круглых» и «полукруглых» значениях с кульминацией на 80%-ной явке. Результаты голосования тоже различаются существенно:
То есть наличие КОИБ на участках в среднем снизило явку на 14% и долю голосов за кандидатуру власти на 7,7%.
Рис. 12. Выборы в Московскую городскую думу 2009 г. Распределение избирательных участков Москвы по явке.
И в довершение картины - выборы в Мосгордуму в 2009 г.
Распределения участков с КОИБ и без опять радикально различаются. Результаты голосования тоже различаются, но не так сильно, как на предыдущих выборах. Такое ощущение, что КОИБы «приручили»:
Количественная оценка аномалий
Из предыдущих двух глав видно, что с точки зрения статистики выборов избиратели кандидатуры власти и избиратели всех остальных кандидатов на российских выборах последних лет ведут себя совершенно по-разному: приходят на избирательные участки не по закону нормального распределения, а по своим особым законам, имеют особую склонность к голосованию на участках с высокой явкой, по-разному голосуют на участках с автоматическими сканерами бюллетеней и без них.
Вообще говоря, науке известны подобные явления.
Самый известный пример - жидкий гелий, ведущий себя при температуре ниже температуры фазового перехода как смесь двух компонент - нормальной и сверхтекучей, которая отличается совершенно экзотическими свойствами: способна протекать через мельчайшие щели, утекать из сосуда по капиллярной пленке и т.п. Избиратели кандидатур власти своими экзотическими привычками во многих отношениях напоминают сверхтекучую компоненту жидкого гелия: например, склонность голосовать при высокой явке является несомненным аналогом бозеконденсации.
Этот вопрос несомненно заслуживает дополнительного изучения, хотя и выходит за рамки данной статьи.
Если же отбросить фантастические гипотезы, самым разумным объяснением такого поведения избирателей, голосующих за кандидатуры власти, представляется то, что часть голосов за такие кандидатуры получена в результате манипуляций - от административного давления вроде «не будете голосовать как надо - отключим газ (не привезем дров, закроем магазин, уволим по статье)» до вбросов и приписок.
Тогда возникает вопрос: можно ли, опираясь только на статистические данные, определить, чему равна эта часть голосов (назовем ее аномальной составляющей голосов за кандидатуру власти, в противоположность нормальной, полученной в результате свободного волеизъявления граждан)?
Понятно, что в общем случае задача неразрешима: если статистические данные выборов подделаны полностью и не имеют никакого отношения к реальным результатам голосования, восстановить реальные результаты невозможно.
С другой стороны, некоторые признаки (постоянство долей голосов за «прочие» партии при изменении явки на рис. 1-4, подобие распределений участков при низких явках на рис. 11) показывают, что в официальных результатах голосования есть реальная составляющая.
Попробуем определить «нормальную» и «аномальную» части голосов за кандидатуры власти, используя эти реальные данные как эталон.
В связи с этим можно высказать несколько наводящих соображений.
Мы видели, что голосование за разные партии существенно зависит от явки. Кроме того, очевидно, что простое вбрасывание/приписывание голосов за кандидатуру власти (самый простой вид манипуляции) на конкретном избирательном участке приводит к смещению этого избирательного участка вместе со всеми его данными (и реальными, и фальсифицированными) в сторону более высоких явок. В результате на низких явках должны оставаться участки с нефальсифицированными данными.
Далее, можно предполагать, что голоса вбрасываются только за кандидатуру власти, а у остальных кандидатур они остаются неизменными либо, при более злостных манипуляциях, отбираются. Поэтому можно попробовать использовать в качестве эталона данные участков с невысокой явкой, а также данные голосований за «прочие» кандидатуры.
В соответствии с этими соображениями исследуем распределения голосов за разные кандидатуры в зависимости от явки на избирательном участке.
На рис. 13 показано такое распределение для думских выборов 2007 г. По оси абсцисс отложена явка в процентах, по оси ординат - суммарное количество голосов за различные кандидатуры на участках с данной явкой (явка округляется вниз, до ближайшего целого, т.е. голоса суммируются по интервалам в 1%). Дополнительно показано распределение суммы голосов за все партии, кроме «Единой России».
Из рис. 13 видно, что распределения по явке голосов за все партии, кроме «Единой России», с хорошей точностью подобны (это подтверждается, если нормировать их на суммарное распределение голосов «прочих» партий: полученные нормированные распределения практически постоянны в широком диапазоне явок), и только распределение голосов за ЕР ведет себя по-другому.
При этом при невысоких явках (где-то до 55%) оно также подобно распределению голосов за «прочие» партии и лишь затем начинает отклоняться вверх от общей тенденции. Естественно предположить, что это отклонение и представляет собой «аномальную» часть голосов за ЕР, а «нормальная» часть голосов за ЕР должна быть распределена подобно распределениям голосов за все остальные партии. Сформулируем это предположение математически. Представим распределение голосов за ЕР в виде: (все голоса за ЕР) = С * (голоса за все партии без ЕР) + (аномальная часть голосов за ЕР), где С - подгоночный коэффициент, подбираемый так, чтобы при невысоких явках (где, как говорилось выше, должны оставаться только «честные» участки) аномальная часть была по возможности близка к нулю. Эмпирическим путем выясняется, что такое представление действительно возможно.
Рис. 13. Выборы в Государственную Думу РФ 2007 г. Распределение голосов за партии по явке.
Рис. 14. Выборы в Государственную Думу РФ 2007 г. Разделение голосов за «Единую Россию» на «нормальную» и «аномальную» части.
Видно, что голоса за ЕР действительно удается разделить так, что «нормальная» часть подобна распределению голосов за другие партии, а «аномальная» часть близка к нулю ниже определенного значения явки (примерно 52%).
Выше этой пороговой явки аномальная часть начинает резко и устойчиво расти.
Понятно, что выбор подгоночного коэффициента С сопряжен с некоторым произволом; в данном случае он выбран так, чтобы аномальная часть была везде положительна.
Рис. 15. Выборы в Государственную Думу РФ 2007 г. Разделение голосов за КПРФ на «нормальную» и «аномальную» части.
Для контроля методики полезно попытаться разделить на «нормальную» и «аномальную» части голоса какой-либо другой партии, которую мы не подозреваем в применении административного ресурса.
На рис. 15 приведено такое разделение для голосов за КПРФ на тех же думских выборах 2007 г. Видно, что «аномальная» составляющая голосов, если и присутствует, интегрально значительно меньше, чем у ЕР, что задним числом оправдывает наш подход.
Теперь, имея разделение голосов за «Единую Россию» на «нормальную» и «аномальную» части, можно задаться вопросом: какими были бы результаты думских выборов 2007 года в отсутствие «аномального» вклада в голосование за ЕР?
Для показанного выше разделения количество «нормальных» голосов за «Единую Россию» составляет 30,7 млн, «аномальных» - 13,8 млн. Отбросив «аномальные» голоса за ЕР, получим следующие гипотетические результаты выборов:
Таким образом, «Единая Россия» при гипотетическом «скорректированном» голосовании по-прежнему имела бы в парламенте большинство, но уже не конституционное.
Естественно, скорректированные результаты зависят от выбора подгоночного коэффициента в разделении на «нормальную» и «аномальную» части, однако варьирование этого коэффициента в разумных пределах, при которых «аномальная» часть голосов на рис. 13 остается близкой к нулю при явках ниже порога, изменяет количество мандатов ЕР в Думе не более чем на ±1%, так что оценку можно считать корректной.
Таким же образом можно разделить на «нормальную» и «аномальную» части голоса за Дмитрия Медведева на президентских выборах 2008 г. (рис. 16):
Рис. 16. Выборы Президента РФ 2008 г. Разделение голосов за Д. Медведева на «нормальную» и «аномальную» часть.
Такое разделение дает 37,8 млн «нормальных» и 14,8 млн «аномальных» голосов за Медведева; гипотетические скорректированные результаты выборов выглядят следующим образом:
Наконец, разделим на «нормальную» и «аномальную» части голоса за список «Единой России» на недавних выборах в Мосгордуму:
Рис. 17. Выборы в Мосгордуму 2009 г. Разделение голосов за «Единую Россию» на «нормальную» и «аномальную» части.
Скорректированные итоги выборов выглядят следующим образом:
Можно отметить, что скорректированные оценки явки и процента голосов за «Единую Россию» лучше согласуются с числами, которые дают различные наблюдатели, чем официальные результаты.
Заключение
При всех недостатках современной российской выборной системы у нее есть несомненное достоинство - открытость данных.
Надеюсь, эта статья и изложенные в ней подходы привлекут к анализу выборной статистики общественный интерес.
Автор хотел бы выразить благодарность всем читателям блога
podmoskovnik.livejournal.com за многочисленные плодотворные обсуждения, а также А.Е. Любареву и А.Ю. Бузину, посвятившим автора-дилетанта в историю вопроса.
Литература
1.
www.vibory.ru 2. Собянин А.А., Суховольский В.Г.
Демократия, ограниченная фальсификациями: Выборы и референдумы в России в 1991-1993 гг. М., 1995
3. M. Myagkov, P. Ordeshook, D. Shakin, The Forensics of Election Fraud: Russia and Ukraine, Cambridge University Press, 2008; см. также
vote.caltech.edu 4. Mebane, Walter R., Jr., and Kirill Kalinin 2009.
«Comparative Election Fraud Detection».
5. Бузин А.Ю., Любарев А.Е. Преступление без наказания. Административные технологии федеральных выборов 2007-2008 годов. Группа Компаний «Никколо М», Панорама, 2008
6. Чуров В.Е., Арлазаров В.Л., Соловьев А.В.
Итоги выборов. Анализ электоральных предпочтений.
7. Шень А.
Выборы и статистика: казус «Единой России» (2009).
Некоторые массивы выборных данных, использованные в статье, размещены на
сайте Независимого института выборов.
С автором статьи можно связаться по электронной почте podmoskovnik@gmail.com или через его блог podmoskovnik.livejournal.com.
P.S.
Когда верстался номер, пришло сообщение о том, что на участке №192 в Хамовниках, где голосовал глава «Яблока» Сергей Митрохин с семьей и где по официальным результатам не было подано ни одного голоса за «Яблоко», в соответствии с решением Хамовнического суда был произведен пересчет бюллетеней.
В результате пересчета среди 87 бюллетеней, ранее засчитанных КПРФ, было найдено 16 бюллетеней за «Яблоко», 3 бюллетеня за ЛДПР и 1 за «Патриотов России». Среди 29 бюллетеней за «Справедливую Россию» было найдено 2 недействительных. Среди 904 бюллетеня за «Единую Россию» неправильно подсчитанных обнаружено не было.
Таким образом, среди 116 бюллетеней, поданных за оппозиционные партии, оказалось 22 неверно учтенных, а среди 904 бюллетеней за ЕР - ни одного.
Нетрудно подсчитать, что вероятность такого события, в предположении, что при изначальном подсчете все бюллетени учитывались одинаково тщательно и пересчет выполнен точно, составляет
(116!*998!)/(94!*1020!)
т.е. примерно 2,5 на 10 в минус 22-й степени.
Российская избирательная система еще раз подтвердила, что для нее нет непреодолимых препятствий в теории вероятностей.
Сергей Шпилькин
Оригинал:
«ТРОИЦКИЙ ВАРИАНТ. НАУКА»