Построил распределения для президентских выборов, аналогичные тем, которые строились для думских. Есть интересные вещи, интересно так же смотреть, как кардинально изменились некоторые картинки с прошлых выборов.
нет, там про комбинаторную природу пиков на круглых числах. Во-первых у меня здесь про это ни слова, во-вторых, гистограммы у меня взвешенные и от этого не страдают и в-третьих, было показано, что пики от ~65% на думских одной комбинаторикой не объясняются.
По этим выборам я пока ничего не строил и не пытаюсь оспорить что-то. Просто имейте в виду, что взвешенность гистограмм в принципе не уберёт пики. Вот почему.
Как я писал, ожидаемая величина пика определяется суммой гармонического ряда 1/3+1/5+1/7+…+1/(число_УИКов+1). Он характерен тем, что большая часть суммы сосредоточена в первых слагаемых, но и сумма последних не мала. Если убрать из этой суммы УИКи, где меньше 100 человек, она будет равна примерно 1.15 вместо 3.09. Это для примера на пике 50%. 65% - это 13/20. При описанных в моём исследовании условиях ровно 65% ожидается примерно на 37 УИКах, то есть всё равно пик. Пик на 66.6% не объясняется красотой этого числа никак, только статистикой.
Проблема анализа выборов вообще в том, что невозможно построить точную модель, соответствующую по всем параметрам самим выборам. Приходится строить убогие модели (равновероятные, с гауссианами и т.д.) и показывать что-то на них.
ну вот на последней картинки видны пики на 75, 80, 85, 90. Там, как я понимаю, от комбинаторики ещё меньше вклад.
Про модель - совершенно верно. Однако мы можем замечать колоссальные различия там, где их быть не должно: например на участках с КОИБами и без, в Москве и МО на думских, в разных регионах. И для их объяснения без фальсификаций приходится изобретать разные модели для каждого случая, что, естественно, неприемлимо.
Кстати, я никак не могу понять, чем объясняется левый хвост у чистых распределений.
Во многих городах на этих выборах опробовали в массовом порядке технологию раздувания явки за счёт голосования вне помещения избирательного участка и по открепительным.
Вот в качестве примера Самара: Горизонтальная ось - процент голосов по открепительным и в переносных урнах от числа всех обнаруженных в урнах бюллетеней, по вертикальной оси - процент, полученный кандидатами, тоже от числа всех обнаруженных в урнах бюллетеней. Площадь пузырьков соответствует числу голосов за кандидата на участке (только их масштаб разный на разных диаграммах).
А разве не будет наглядным старая-добрая зависимость процента голосов за кандидата на участке от явки на участке? На ней точки лежат на горизонтальных прямых для "честных" и на возрастающей - для "нечестного". Суть увеличение явки и голосов "нечестному" за счет непришедших. Здесь же - то же самое: растут явка и голоса, но за счет специально обученных обезьян. На гистограммах это видно плохо, ибо не два дико разнесенных гаусса с серединами на 35 и 70% как в декабре.
смотря что хочется увидеть. Гистограммы хороши тем, что они показывают вклад. Т.е. если на этих взвешенных двумерных гистограммах не видно наклонного хвоста, значит он имеет небольшой вклад.
Специально обученные обезьяны, как я уже писал, не увеличивают явку, если их добавляют в доп. списки. У меня есть графики профилей 2д распределений, будет время - выложу. Хотя я не нахожу их очень интересными.
Comments 14
Reply
Reply
http://vvaf.livejournal.com/885.html
Reply
Reply
Как я писал, ожидаемая величина пика определяется суммой гармонического ряда 1/3+1/5+1/7+…+1/(число_УИКов+1). Он характерен тем, что большая часть суммы сосредоточена в первых слагаемых, но и сумма последних не мала. Если убрать из этой суммы УИКи, где меньше 100 человек, она будет равна примерно 1.15 вместо 3.09. Это для примера на пике 50%.
65% - это 13/20. При описанных в моём исследовании условиях ровно 65% ожидается примерно на 37 УИКах, то есть всё равно пик.
Пик на 66.6% не объясняется красотой этого числа никак, только статистикой.
Проблема анализа выборов вообще в том, что невозможно построить точную модель, соответствующую по всем параметрам самим выборам. Приходится строить убогие модели (равновероятные, с гауссианами и т.д.) и показывать что-то на них.
Reply
Про модель - совершенно верно. Однако мы можем замечать колоссальные различия там, где их быть не должно: например на участках с КОИБами и без, в Москве и МО на думских, в разных регионах. И для их объяснения без фальсификаций приходится изобретать разные модели для каждого случая, что, естественно, неприемлимо.
Кстати, я никак не могу понять, чем объясняется левый хвост у чистых распределений.
Reply
Вот в качестве примера Самара:
Горизонтальная ось - процент голосов по открепительным и в переносных урнах от числа всех обнаруженных в урнах бюллетеней, по вертикальной оси - процент, полученный кандидатами, тоже от числа всех обнаруженных в урнах бюллетеней. Площадь пузырьков соответствует числу голосов за кандидата на участке (только их масштаб разный на разных диаграммах).
Путин и Зюганов:
( ... )
Reply
На ней точки лежат на горизонтальных прямых для "честных" и на возрастающей - для "нечестного". Суть увеличение явки и голосов "нечестному" за счет непришедших. Здесь же - то же самое: растут явка и голоса, но за счет специально обученных обезьян.
На гистограммах это видно плохо, ибо не два дико разнесенных гаусса с серединами на 35 и 70% как в декабре.
Reply
Специально обученные обезьяны, как я уже писал, не увеличивают явку, если их добавляют в доп. списки.
У меня есть графики профилей 2д распределений, будет время - выложу. Хотя я не нахожу их очень интересными.
Reply
Leave a comment