Володинские 62,2% в Саратове: математическое доказательство фальсификации для чайников

Sep 23, 2016 16:12


Последние дни много веселья про результаты выборов в Саратове, где более чем на четверти участков результат Единой России оказался ровно 62,2% с точностью плюс-минус несколько сотых процента. Вот тут наглядно. Особой пикантности придает тот факт, что в Думу от Саратовской области баллотировался Володин - зампред президентской администрации, куратор ( Read more... )

выборы, фальсификации

Leave a comment

gegmopo4 September 23 2016, 18:46:42 UTC
Я получил 8⋅10⁻⁷⁰. Для 142 участков получилось бы 6⋅10⁻¹¹².

>>> from math import *
>>> n = 346; p = 0.034; lp = log(p); lq = log(1-p)
>>> fsum(exp(lgamma(n+1) - lgamma(n-k+1) - lgamma(k+1) + lp*k + lq*(n-k)) for k in range(107, n+1))
8.285006699539168e-70
>>> fsum(exp(lgamma(n+1) - lgamma(n-k+1) - lgamma(k+1) + lp*k + lq*(n-k)) for k in range(142, n+1))
6.276112471949274e-112

Reply

dr_blastarr September 25 2016, 09:42:47 UTC
Это число мне гораздо больше нравится - в сравнении с количеством атомов в нашей галактике (10^68). Жаль, до Вселенной не дотягивает (от 10^78 до 10^82).
Когда говоришь человеку, что вероятность результата в Саратове в 100 раз меньше, чем вероятность вытащить один помеченный атом из всей кучи атомов в нашей галактике, то это производит впечатление.

Reply

gegmopo4 September 25 2016, 11:54:05 UTC
Замечу, что я поленился пересчитывать вероятность одиночного попадания в 3,4%, а просто взял её из поста. Если учесть округление (вероятность может быть от 3,35% до 3,45%), то получаем результат в диапазоне от 2⋅10-70 до 3⋅10-69. То есть порядок тот же.

Значительное различие с итоговым результатом в посте вероятно обусловлено плохой точностью функции BINOMDIST в Excell. Excell не предназначен для сверхточных вычислений.

Reply

barouh September 25 2016, 12:23:38 UTC
Эксель для сверхточных вычислений действительно не предназначен - и просто отказывается считать вероятности для более чем 46 попаданий. Я делал оценку через экспоненциальный тренд - но он ложится на известные точки не идеально. Сейчас посмотрел внимательнее: если считать тренд не для вероятности, а для ее десятичного логарифма, то идеально ложится полиномиальный (биномиальный) тренд - R^2 там 0,99998 (против 0,991 для линейного тренда десятичныз логарифмов). При экстраполяции к x=107 получается примерно 10-80 - близко к вашей оценке

Чайниковский вопрос: а откуда в ваших формулах берутся логарифмы при расчете вероятности?

Reply

gegmopo4 September 25 2016, 13:06:59 UTC
Изначально я записал просто через факториалы. Но где-то там у меня выскакивавало исключение из-за переполнения или потери точности, поэтому я переписал через логарифмы и гамма-функцию. Впрочем, сейчас повторил с факториалами - и получил тот же результат.
>>> from math import *
>>> n = 346; p = 0.034; q = 1-p
>>> fsum(factorial(n) / (factorial(n-k) * factorial(k)) * p**k * q**(n-k) for k in range(107, n+1))
8.28500669953993e-70

Видать где-то ошибся в первый раз. Скорее всего записал тогда выражение как n! / (n-k)! / k!, а не n! / ((n-k)! k!).

Reply


Leave a comment

Up