Реконструкция итогов выборов 2024 г. интегральным методом Шпилькина: tov

tov_y

Реконструкция итогов выборов 2024 г. интегральным методом Шпилькина

Mar 25, 2024 23:18

По сети как пожар распространилось странное суждение, что будто бы реконструкция итогов выборов, основанная на гипотезе взаимной независимости общей явки избирателей и результата кандидатов и анализе распределения избирателей по значениям данных величин, более известная как метод Кислинга-Шпилькина, может видеть только вбросы голосов, но не позволяет выявлять их переброс. Это - что-то из области околонаучного фольклора. Да, ни С.Шпилькин, ни его последователи не использовали эту гипотезу для реконструкции явки избирателей (а без её истинного значения таки не посчитать переброс), поскольку пользовались дифференциальным видом распределения, на основе которого это делать очень неудобно. Но сравнивание графиков дифференциального распределения представляется априори неудачной идеей, поскольку дифференцирование - шумная операция, да и сам вид графиков зависит от выбора бина. Наглядность здесь была принесена в жертву практичности.

Далее выполняется реконструкция на основе интегральных распределений, для которой нет указанных проблем. Конечно, пилу Чурова мы тут не увидим, однако для её отлова лучше подходят совсем другие методы.

Неприятной особенностью прошедшего электорального мероприятия стало наличие большого числа регионов с дэг, которое искажает итоги выборов на обычных участках, в силу чего требуется их восстановление. Ранее я описал две его разных схемы ( 1 и 2). Реконструкция выполняется для каждой из них.

Для реконструкции результата власти участки сортируются в порядке возрастания общей явки избирателей. В этом ряду с накоплением суммируются количества избирателей, проголосовавших против кандидата власти и за него. Зависимость между этими суммами должна быть прямой пропорциональностью, коль скоро результат власти не зависит от общей явки. Если имело место её завышение, то при продвижении по ряду отсортированных участков они становятся всё более подозрительными. Заведомо достоверны только те участки, которые относятся к линейному участку зависимости, угловой коэффициент которого k реконструирует результат власти как k/(1+k).

Для реконструкции явки избирателей участки сортируются в порядке возрастания результата кандидата власти. В этом ряду с накоплением суммируются количества избирателей, оставшихся дома и пришедших на участки. Зависимость между этими суммами должна быть прямой пропорциональностью, коль скоро общая явка не зависит от результата власти. Если имело место его завышение, то при продвижении по ряду отсортированных участков они становятся всё более подозрительными. Заведомо достоверны только те участки, которые относятся к линейному участку зависимости, угловой коэффициент которого k реконструирует явку избирателей как k/(1+k).

Полная симметрия подходов!

Поскольку и абсцисса, и ордината известны с погрешностью, но зато соизмеримы, для анализа зависимости используется регрессия Деминга (без весов), минимизирующая разброс точек в направлении, перпендикулярном регрессионной прямой (а не по ординате). Для зависимости y = k·x при условии k > 0 она даёт k = p + (1+p2)½, где p = 〈y2 − x2〉 / 2〈xy〉. Качество регрессии, измеряемое отношением разбросов точек вдоль σ∥ и поперек σ⊥ прямой, даётся формулой (σ∥/σ⊥)2 = 〈(k·y + x)2〉 / 〈(k·x − y)2〉. Там, где достигается максимум отношения σ∥/σ⊥, и лежит граница между достоверными и подозрительными участками. При этом, чтобы не вводить ограничения на минимальное количество достоверных участков, устанавливается дополнительное требование: все точки, соответствующие подозрительным участкам должны лежать над регрессионной прямой.

На графиках сохранена только каждая 64-я точка (иначе они сливаются в сплошной рукав).

Для схемы 1:

Для схемы 2:

Без учёта 4 невнятных субъектов, для которых до сих пор нет данных по участкам, официальный результат кандидата власти составляет 86,3/86,9%, а его реконструкции 80,4/81,5% с поправкой на дэг по схемам 1/2 соответственно. Аналогичные показатели для общей явки избирателей - 77,1% против 67,2/67,3%, а для явки за власть - 66,4/66,9% против 54,0/54,7%. Не следует удивляться разным официальным успехам кандидата власти при разных схемах поправки на дэг, поскольку одна из них игнорирует политический выбор дэгенерировавших избирателей, а другая его учитывает.

Для достоверных участков можно дополнительно рассмотреть зависимость между накопленными количествами избирателей, проголосовавших против кандидата власти хоть как-то и выбравших конкретную альтернативу (другие кандидаты или испорченный бюллетень). Здесь уже абсциссу можно считать известной точно и пользоваться обычной регрессией для определения коэффициента прямой пропорциональности, который даёт долю голосов против власти, приходящихся на каждую альтернативу. Так реконструируются результаты новолюда 7,7/6,9%, коммуниста 5,4/5,0%, жириновца 3,5/3,8% и противовсеха 3,0/2,3% для схем 1/2 соответственно. Хотя погрешность, связанная с поправкой на дэг, довольно высока, второе место новолюда не вызывает сомнений.

Общий объём фальсификаций в пользу кандидата власти составляет 13,5/13,2 млн голосов, в т.ч. вброс 10,7/10,6 и переброс 2,8/2,6. Если реконструированные проценты механически распространить и на 4 невнятных субъекта (там всё равно никто ничего не считал), то общий объём фальсификаций увеличится до 18,0/17,1 млн голосов, включая вброс 14,9/14,8 и переброс 3,1/2,3. Учёт невнятных субъектов увеличивает оценку общего объёма фальсификаций на 4,5/3,9 млн голосов при том, что номинально к этим субъектам приписаны 4,8 млн избирателей.

К сожалению, пока не найдена универсальная схема поправки на дэг, не удастся избежать некоторого разнобоя в цифрах. Но уж чего точно не надо делать, так это рассматривать субъекты порознь, отделяя цифровых козлищ от аналоговых агнцев. Во-первых, у нас получится много разных видов козлищ, которых невозможно будет скрестить не только с агнцами, но и с друг другом, а во-вторых, базовое предположение о взаимной независимости результатов и явки лучше выполняется для страны в целом, чем для отдельных субъектов. Их индивидуальные особенности, которые могут привести к возникновению корреляций между этими величинами, частично взаимно компенсируются. Кроме того, для некоторых субъектов вообще нет достоверных участков, в силу чего реконструкция для них, взятых отдельно, невыполнима в принципе.