11. изменение списочного состава и все-все-все

Jan 22, 2012 03:42

внутренний чехов задушил внутреннего толстого и я решил что процент постов про выборы честно будет сделать большим, раз уж больше ничего интересного пока не написать, так что п 11 в отдельном посте, остальные приведу в порядок может позже.

С 2007 года произошли всякие демографические изменения в стране и они, вероятно, могли отразиться и на выборах.


По данным последней переписи, численность населения по регионам с 2002 по 2010 гг менялась по-всякому, отразилось ли это на списочном составе? Взяв среднее по ТИКам, которые не поменяли названий с 2007 года, по каждому региону, сравним его с данными переписи по различию 2002-2010:


Прибавка списочного состава избирателей к уровню 2007, от населения 2010 года в процентах от 2002.
Корреляция вполне себе хорошая, два выбивающихся региона - это Ингушетия и, внезапно, Ульяновская область.
В общем, видим, отражается (отражаются, очевидно, в первую очередь миграции и смертность, а естественный прирост, только в той мере, в какой его темпы повторяют цифры 18-летней давности, и вообще, все сложно, но в грубом приближении сойдет).
upd: сразу, чтоб не гуглить: в 11-м году прибавилось в связи с достижением совершеннолетия (~1993 г. р.) существенно меньше народу, чем в 2007 (~1989 г. р.), так что, несмотря на различные тенденции с миграциями и естественным приростом, избирателей: по идее, должно было стать меньше, по сравнению с 2007 годом, что, в общем-то, и видно.
А теперь, как эти изменения связаны с явкой и голосами за ЕР
я сравниваю проценты, а не абсолютные значения, изменение считаю так: (после - до)/(после + до), так что отсутствие изменений - это 0, ТИК возник заново - это 1, ТИК исчез - это -1, на деле значения в более скромном диапазоне, конечно. вначале я неправильно посчитал, но теперь вроде все правильно.
Если брать прям все участки, то между изменением списочного состава и изменением голосов за ЕР есть хорошая положительная корреляция, а между изменением списочного состава и изменением явки - отрицательная:




Изменение голосов за ЕР от изменения списочного состава и изменение голосов за ЕР от изменения списочного состава. Часть точек подрезана для масштаба, но в целом. По Спирману хорошая положительная корреляция со значимостью p < 2.2e-16 для ЕР и отрицательная со значимостью p = 3.903e-07 для явки. Если убрать Северный Кавказ, где явка под 100 как была, так и осталась (это горозонтальный хвост справа в середине), то для EР p становится 1.300e-06, а для явки p = 7.307e-13, все равно очень хорошо.
Явка и голоса за ЕР меняются очень скоррелированно, даже картинку не буду вешать. Еще есть по Спирману корреляция между изменением списочной численности избирателей и самой численностью (маленькие ТИКи чаще уменьшаются, большие чаще увеличиваются), но там картинка некрасивая, и эта зависимость не очень четкая.
Ну и фигли это все значит? По крайней мере интересно.
UPD:
Если смотреть на корреляцию между голосами за ЕР и явкой по муниципальным образованиям и небольшим регионам (уровень над ТИКами), то ее сила, в свою очередь, отрицательно связана со средним значением изменения численности ТИКов (можно было взять просто регионы, там то же самое, но их меньше):


Это зависимость коэффициента корреляции Спирмана (между голосами за ЕР и явкой внутри муниципальных образований и небольших регионов) от модуля среднего изменения списочной численности избирателей по ТИКам (в тех же рамках, шкала логарифмическая). (модуль потому, что любые изменения списочной численности влияют на значение явки). p = 1.418e-08 (если не модуль, то p = 0.0007). Если брать настоящие регионы, то выходит так же, только точек меньше.
UPD: 
Если смотреть отдельно Питер, то с явкой там та же зависимость:


Здесь нет ТИКов 10, 22 и 24, которые то ли совсем не соответствуют нумерации 2007 (как 22), то ли как-то странно изменились, что списочный состав изменился очень сильно. Корреляци и с ними, впрочем, есть. Так p = 0.013. А вот с изменением ЕР видимой корреляции нет.
Город-герой Москва и Нижегородская область значимых корреляций не показывают (ранее облажался и в Москве нашел что-то такое, но теперь ошибку исправил).
UPD:
Кое-где совпали количественно и по номерам УИКи (всего пять с половиной тыщ участков в 38 регионах, негусто). Для участков видна та же отрицательная связь между изменением явки и списочного состава:


p = 8e-07
Но связи с ЕР, в отличие от ТИКов в целом, не наблюдается вообще. довольно слабая:


p = 0.01955. Можно заметить что облако слегка перекошено влево.

задрот, прокрастинация, выборы, gnu r, wishful thinking

Previous post Next post
Up