Человек психологически склонен при выдумывании целочисленных величин предпочитать круглые числа, а при выдумывании процентных - проценты без десятых долей (круглые промилле). В большом массиве данных это может быть обнаружено с помощью статистических методов.
Анализируются следующие электоральные характеристики: участие избирателей в выборах, общая явка избирателей и результат кандидата власти. Размер избирательного участка не рассматривается, т.к. в последнее время его почти не выдумывают. Для участия в выборах из анализа исключаются участки размером до 30 человек, для явки избирателей - участки с её абсолютным значением. Электронное и зарубежное голосование не рассматривается, 4 новых субъекта с неопределелённым границами, населением, правовым статусом и итогами выборов - тоже. Итого имеются h = 3 набора данных по N = 85 субъектам с детализацией до избирательных участков, взятые
отсюда (107,8 млн избирателей, 91 673 участков).
В качестве нулевой гипотезы принимается утверждение, что избытка круглых значений нет. Рассчитывается её значимость α, т.е. вероятность ошибочно отклонить эту гипотезу, хотя на самом деле она верна. Для удобства представления результатов значимость домножается на размер выборки N и приводится десятичный показатель этого произведения. Его отрицательные значения свидетельствуют об отсутствии статистически значимого выдумывания. В силу случайного стечения обстоятельств для каждой электоральной характеристики (в каждом столбце таблицы) может встретиться в среднем одно положительной значение (такие значения имеются и в отрезанной части таблицы в столбцах, соответствующих отдельным электоральным характеристикам). Каждая единица, добавляемая к показателю, соответствует уменьшению вероятности отсутствия выдумывания на порядок.
−lg(α·N) для основных электоральных характеристик № Субъект
федерации Участие
в выборах Явка
избирателей Результат
власти Все
вместе
1 Краснодарский кр. 3,5 71,4 18,2 92,5
2 Московская обл. 0,1 14,6 26,6 41,4
3 Ростовская обл. 0,1 20,8 9,2 30,4
4 Дагестан 6,6 16,4 5,8 29,2
5 Татарстан -0,6 22,2 1,1 23,2
6 Самарская обл. 1,7 7,2 8,2 17,9
7 Нижегородская обл. -0,5 6,5 8,7 15,4
8 Санкт-Петербург -0,6 10,6 2,5 13,5
9 Ставропольский кр. -1,1 4,7 7,9 12,4
10 Брянская обл. -0,9 11,9 0,4 12,3
11 Ленинградская обл. 1,6 6,1 2,8 11,6
12 Башкортостан 2,9 3,6 -0,1 7,6
13 Белгородская обл. 4,3 0,9 1,0 7,5
14 Ямало-Ненецкий а/о -1,7 4,5 3,5 7,5
15 Тульская обл. -1,3 5,4 1,9 7,2
16 Воронежская обл. -0,8 3,2 3,1 6,8
17 Хакасия -0,3 6,0 -1,5 5,6
18 Пензенская обл. -1,7 5,6 0,0 5,3
19 Тверская обл. 1,8 3,1 -1,7 4,7
20 Челябинская обл. 5,0 -0,4 -1,8 4,3
21 Липецкая обл. 2,3 0,2 -1,8 2,4
22 Тамбовская обл. -0,3 -0,6 1,2 2,2
23 Крым 2,3 -1,5 -0,5 2,1
24 Тюменская обл. 0,8 -0,3 -0,6 1,8
25 Кемеровская обл. -0,2 1,3 -1,3 1,7
26 Тыва -1,2 1,0 -0,4 1,4
27 Волгоградская обл. 0,8 -0,3 -1,6 0,9
28 Приморский кр. 0,6 -1,6 -0,4 0,7
29 Сахалинская обл. -1,3 -1,3 1,2 0,6
30 Мурманская обл. -1,9 -1,8 2,3 0,6
31 Новгородская обл. 0,2 0,1 -1,9 0,5
32 Камчатский кр. -1,8 -1,6 1,4 0,2
33 Астраханская обл. -1,7 0,2 -0,6 0,1
34 Пермский кр. -1,2 1,0 -1,9 0,1
35 Иркутская обл. 0,4 -0,7 -1,9 0,0
Вероятность того, что выдумывания нет ни для одной из рассматриваемых электоральных характеристик αc, равна ξh = ∏c=1hαc. Эту величину можно сделать сколь угодно малой и без фальсификаций, просто увеличивая число сомножителей h. Поэтому для её содержательной интерпретации необходима поправка на множественность испытаний, выполняемая по формуле α̃ = ξh·eh(−ln(ξh)), где eh(t) = ∑c=1h−1tc/c! - экспонента, урезанная до h первых членов разложения в ряд. Строки таблицы отсортированы по убыванию показателя объединённой значимости −lg(α̃·N), приведённому в последнем столбце. В силу того, что значимость каждой отдельной гипотезы, рассматриваемая как случайная величина, является дискретно-распределённой, приведённый расчёт точен только для бесконечного числа участков, а при конечном оценивает объединённую значимость сверху (а её показатель - снизу), т.е. имеется риск преуменьшить общий масштаб фальсификаций, но нет риска обвинить в них ложно.
Пусть круглое значение электоральной характеристики в регионе с n участками зафиксировано на k участках. Гипотеза о естественности этого результата значима на уровне α = ∑i=knPni, где Pni - вероятность получить ровно i круглых значений из n. Она находится с помощью итерационного процесса Pji = Pj−1i−1·rj + Pj−1i·sj, где индекс j нумерует участки, а rj и sj = 1−rj - доли круглых и некруглых значений характеристики для участка j. Краевые условия Pj−1 = Pjj+1 = 0, начальное условие P00 = 1.
Для целочисленных характеристик r ≡ 1/10 и r ≡ 9/10, так что можно сразу вычислить Pni = Cnirisn−i. А для процентных характеристик, возникающих как дроби a/b с целыми числителями и знаменателями, доли rj и sj для каждого участка j вычисляются перебором по всем допустимым числителям aj при фактическом знаменателе bj. Для результата допустимы все 0 ≤ a ≤ b, а для явки - только 0 < a < b (при нулевой явке не определён результат кандидатов, а абсолютная явка может быть признаком спецучастка).