В этом посту я хочу описать, как мы можем взять исключительно официально озвученные результаты референдума о статусе Крыма в 2014, проделать нехитрый математический анализ, и убедиться в том, что с этими официальными цифрами что-то сильно неладно.
Если вы придерживаетесь мнения, что референдум был честный, что он совершенно точно отражает тогдашние настроения крымского населения - хочу попросить вас непредвзято рассмотреть изложенные в моём посту факты, я постараюсь изложить их как можно проще. Гарантирую, что в таком случае вы и сами убедитесь в том, что результаты референдума в городе Севастополе были попросту нарисованы, т.е. подогнаны под заранее выдуманные кем-то цифры, и не имеют отношения к тому, как крымчане реально голосовали тогда на избирательных участках. Что именно следует из "рисования" результатов референдума 2014 года в самом пророссийском городе Крыма уж решайте сами.
Дисклеймер: пост берет всю основную аргументацию из
давнишнего поста ув. Александра Киреева (
kireev). Однако я неоднократно убеждался, что сжатое и сухое изложение фактов в том посту выглядит сложным и оттого неубедительным для многих людей, так что решил сделать свой пост, где я изложу математическую сторону вопроса подробнее.
Каковы официальные данные?
Итак, обратимся к официальным документам. Вот сканы протокола городской комиссии по проведению общекрымского референдума об итогах голосования в пределах города Севастополя от 17 марта 2014 года:
скан 1,
скан 2 (взяты они
отсюда). Эти же цифры подтверждаются
видеозаписью, на которой их 17 марта 2014 года озвучивает Валерий Медведев, председатель городской избирательной комиссии Севастополя.
Вот эти цифры:
- Количество участников референдума, включенных в списки в Севастополе: 306 258
- Количество участников референдума, получивших бюллетени (т.е. явка): 274 101
Из них:
- за воссоединение Крыма с Россией проголосовало: 262 041
- за статус Крыма как части Украины проголосовало: 9 250
- Недействительных бюллетеней: 2 810
Как я и сказал выше, руководствоваться я буду только этими официально озвученными цифрами. Итак, что же с ними не так?
Попадание в десятые доли процента
Явка
Для начала, разделим кол-во бюллетеней (274 101) на кол-во зарегистрированных избирателей (306 258), дабы получить явку. Примечание: символ (1) означает "уравнение 1"
(1) 274101 / 306258 = 0.89500029387
Вы обратили внимание на сразу три нуля после 0.895? Естественно, ровно 0.8950000000% тут иметь невозможно, ибо кол-во избирателей -- целое число, никакие "полтора землекопа" тут недопустимы. Однако 274 101 избиратель -- наиболее близко к цифре явки ровно в 89.5%, иллюстрация для понимания:
Убедимся в этом:
274100 / 306258 = 0.89499702864 | abs(0.8950000000 - 0.89499702864) = 0.00000297136
274101 / 306258 = 0.89500029387 | abs(0.8950000000 - 0.89500029387) = 0.00000029387 (наименьшая разница!)
274102 / 306258 = 0.89500355909 | abs(0.8950000000 - 0.89500355909) = 0.00000355908
А ведь последние цифры (т.е. в данном случае 101) такого большого количества избирателей полностью случайны. Это очевидно исходя просто из здравого смысла: есть множество факторов которые влияют на избирателей и то, придут ли они голосовать -- у кого-то ребенок заболел, кто-то ногу сломал, и т.д., и т.п. Так что могло выйти не 274 101, а 274 847 или 274 361 или 274 793. Этот факт (случайность последних цифр при большом количестве избирателей) подтвержден эмпирически, и используется статистиками для поисков статистических аномалий, которые могут свидетельствовать о фальсификациях выборов.
Тут я описал это подробней. Важное уточнение -- для первых цифр таких чисел закономерности другие (см.
Закон Бенфорда), но мы говорим о последних цифрах, они случайны и должны быть распределены более-менее равномерно.
Итак, с учетом вышенаписанного, какая у нас вероятность столь красивого попадания в одну десятую процента с точностью до человека? Ответ простой -- надо посчитать сколько людей до следующего кратного 1/10 значения процента, и разделить единицу на это число. Это и будет наша вероятность.
Следующий красивый десятичный процент, это 89.6%
274407 / 306258 = 0.89599945144
Разница между реальным количеством бюллетеней и числом нужным для следующего красивого десятичного процента:
(2) 274407 - 274101 = 306
Иллюстрация:
Итак, вероятность указанного выше попадения в красивый десятичный процент -- 1/306. Запомним эту цифру.
Голоса за вхождение в состав России
Теперь, вычислим какую долю от количества бюллетеней (274 101) составляют голоса "за" Россию (262 041)
(3) 262041 / 274101 = 0.95600161984
Снова нули после десятичной доли процента! Повторюсь, ровно 0.9560000000% тут иметь невозможно, ибо кол-во избирателей -- целое число, никакие "полтора землекопа" тут недопустимы. Однако 262 041 избиратель -- наиболее близко к идеально круглой цифре голосов "за" в 95.6%.
Убедимся в этом:
262040 / 274101 = 0.95599797155 | abs(0.9560000000 - 0.95599797155) = 0.00000202844
262041 / 274101 = 0.95600161984 | abs(0.9560000000 - 0.95600161984) = 0.00000161984 (наименьшая разница!)
262042 / 274101 = 0.95600526813 | abs(0.9560000000 - 0.95600526813) = 0.00000526813
Опять посчитаем вероятность такого. Следующий красивый десятичный процент, это 95.7%
262315 / 274101 = 0.95700125136
Разница между реальным количеством голосов "за Россию" и следующим красивым десятичным процентом:
(4) 262315 - 262041 = 274
Итак, здесь вероятность попадения в красивый десятичный процент -- 1/274. Запомним и эту цифру.
Голоса "за Украину"
За статус Крыма как части Украины проголосовало (9 250), то есть, на первый взгляд, вышеуказанных странностей нет:
(5) 9250 / 274101 = 0.03374668461
Однако, если разделить эти голоса не на общее кол-во бюллетеней, а на голоса "за Россию" -- мы снова попадаем в точную долю процента (правда сотую, 3.53%) с точностью до человека!
(6) 9250 / 26204 = 0.35299954205 (сравнивать с 9249 и 9251 уже не буду, но можете проверить сами.)
Вы, конечно, скажете -- что за нонсенс, зачем вообще делить голоса "за" Украину на голоса "за" Россию?! А это, в числе прочего, мы обсудим ниже, в последнем разделе.
И прежде чем продолжить, стоит указать, что кол-во недействительных бюллетеней (2 810) обязано быть равным кол-ву общих бюллетеней, минус голоса "за Россию" и "за Украину". Так что тут, с учетом (5), никаких красивых попаданий в проценты уже можно не ожидать.
А зачем мы вообще высчитали какие-то вероятности?
Сначала укажу на очевидное -- сама по себе низкая вероятность еще не значит, что события не являются случайными. Так, вы можете бросить монету десять раз. И есть вероятность того, что десять раз подряд выпадет решка -- (1/2)^10 = 0.00098. Она низка, но никаких фальсификаций тут не было, просто игра случая.
Так для чего же мы вычисляли выше вероятности попаданий в проценты? А очень просто -- события с низкой вероятностью можно по умолчанию считать случайным, если у нас нет альтернативного обьяснения низкой вероятности произошедших событий.
Например, предположим, что монету десять раз подкидывали не мы. Что это сделал другой человек, причем не на наших глазах. Этот человек уверяет нас, что он подкинул монету десять раз, и десять раз подряд выпала решка. Этот человек отказывается предоставить видеозапись своих бросков. И, наконец, этот человек выиграет у нас крупную сумму денег, если мы поверим, что он и впрямь получил десять решек подряд.
Как видим, тут у нас появляется альтернативное объяснение декларируемого результата: нам попросту врут. Мы можем довольно уверенно отвергнуть базовое предположение, "человеку и впрямь просто повезло", обвинить того во лжи -- и есть лишь 0.00098 вероятность того, что мы обвиняем этого человека напрасно (это в статистике называется р-значением). Вы бы отдали кому-то крупную сумму денег, если шансы того, что вас не обманывают, лишь ~один на тысячу? Я -- нет.
И важное уточнение -- как вы уже должны были понять из примера выше, 100% доказательств вранья данными вероятностными методами мы получить не можем попросту принципиально. Теоретически возможно даже кинуть сто миллиардов решек подряд, пусть вероятность этого имеет такое количество нулей, что мама не горюй. Однако повторюсь, если вероятность случайности декларируемых результатов событий ничтожно мала -- большинство здравомыслящих людей обвинит шулера во вранье, и правильно сделает.
Небольшое отступление -- выше я на пальцах обьяснил концепты нулевой и альтернативной гипотез в статистическом анализе. Если вам интересно разобраться далее, можете глянуть википедию:
проверка статистических гипотез,
нулевая гипотеза.
Почему я считаю результаты референдума в Севастополе нарисованными
Итак, вот мы снова можем вернуться к результатам референдума в Севастополе. Напомню, исходя из (2) вероятность той конкретной явки -- 1/306, исходя из (4) вероятность того конкретного количества голосов "за Россию" -- 1/274.
Для начала, наша базовая (нулевая) гипотеза здесь -- референдум был честный, эти вероятности получились случайно. В силу того, что последние цифры явки и последние цифры голосов "за Россию" по идее не должны зависеть друг от друга (ибо с чего оно так будет?), можно при первом приближении высчитать и общую вероятность того, что обе эти цифры получились совершенно случайно:
(7) (1/306) * (1/274) = 0.000012.
Шанс меньший, чем один на восемьдесят три тысячи.
Но, как я сказал выше, сама по себе низкая вероятность еще ничего не значит. Как и в примере с монетами, нужна альтернативная гипотеза того, почему здесь вышло столь точное попадание в десятые доли процента.
И она у меня есть. Дело в элементарной человеческой психологии. Если кто-то заранее собирается получить на выборах "нужный" результат, и доводит до исполнителей требуемые цифры оного -- то разве будет неправдоподобным предположение, что эти цифры именно так и выглядели, два требуемых процента с десятыми долями? Мол, пусть явка будет 89.5%, пусть голоса "за Россию" будут 95.7%. И чересчур аккуратные исполнители подгоняют явку и голоса "за Россию" до требуемого процента, с точностью до человека.
Итак, стало быть у нас есть две конкурирующие версии:
Версия 1: референдум в городе Севастополь был честный, попадание в десятые доли процентов случайное, с вероятностью ~один на восемьдесят тысяч.
Версия 2: референдум в городе Севастополь честным не был, просто результаты подогнали к заранее спущенным (и весьма большим, стоит отметить) процентам явки и голосов "за".
Вы бы отдали кому-то крупный выигрыш, если вероятность того, что вас не обманывают меньше, чем один на восемьдесят тысяч? Причем вероятность эта прямо следует из слов того же человека, который хочет ваши деньги? Я -- нет.
Что еще свидетельствует о фальсификации?
В принципе, достаточно уже и вышеописанного. Но тут вкратце отмечу дополнительные аргументы в пользу версии о тотальной фальсификации результатов референдума в Севастополе.
Во-первых, давайте вспомним то, что я написал выше о голосах "против" (уравнение 6). Ведь там мы опять видели всё то же странное попадание в проценты, в тот раз в сотые (что обьяснимо тем, что значение процента было однозначным). Укладывается ли это в нашу альтернативную гипотезу, т.е. "выборы сфальсифицированы"? Да! Ибо можно сделать предположение, что фальсификаторы при вычислении количества голосов, требуемых для нарисованного заранее процента, ошиблись -- и попросту умножили этот процент не на ту графу (т.е. на кол-во бюллетеней "за Россию", вместо общего числа бюллетеней). Это очередное красивое попадание в проценты, кстати, уменьшает вероятность случайности таких результатов референдума ещё ниже одного шанса на восемьдесят три тысячи.
Во-вторых, в Донецкой Народной Республике, по странному стечению обстоятельств, наблюдаются ровно те же статистически аномальные попадания в десятые доли процентов -- и в
выборах в Верховный Совет ДНР, и в
выборах главы ДНР. Объясняется ли это нашей альтернативной гипотезой, в которой некто заранее спускает проценты результатов голосований на отторженных от Украины территориях? Да, конечно.
В-третьих, данные голосования в крымском референдуме, разбитые по участковым избирательным комиссиям, за восемь прошедших лет так и не были опубликованы. По российским выборам такие цифры есть -- и с помощью статистического анализа там можно узреть весьма любопытные статистические аномалии, и даже приблизительно вычислить реальные результаты (
пример). А вот по крымскому референдуму опубликованы только общие финальные цифры, которые и разбирались в этом посту. Впрочем, как вы уже поняли, и их оказалось достаточно.
Такие дела (с)