вынося из комментариев к
http://kireev.livejournal.com/698414.html?thread=11988014#t11988014 (ответ mi_b)
-------
Прошу прощения - у меня было впечатление (возможно, ошибочное), что Вы профессионально связаны со статистикой и финансами, поэтому я написал недостаточно подробно и отчётливо. Попытаюсь исправиться, и заранее прошу прощения за занудство.
1. Статистические "доказательства" по своей природе не могут быть абсолютными - но, тем не менее, статистика предоставляет различные средства перекрёстной проверки гипотез, если их формулировать отчётливо и осознавать их природу.
2. Различия в результатах голосования на разных участках, вообще говоря, могут быть связаны с разными факторами:
а) случайные колебания в отсутствие каких-то систематических причин расхождений (которые были бы, даже если разбить людей на произвольные группы размера участков)
б) различия в составе жителей участков (их профессиональное, социальное положение, уровень доходов и пр.)
в) различия, связанные с локальными событиями (погода, наличие информации о месте голосования, его доступность и пр.)
г) различия, связанные с фальсификацией результатов того или иного вида (вбросы, неправильный подсчёт и пр.)
2. Гипотезы эти различны, и возможны перекрёстные проверки, позволяющие оценить их правдоподобие. Эти проверки разные для разных видов гипотез. Чтобы оценить а, можно посчитать типичные случайные отклонения для данных размеров участка (и они окажутся существенно меньшими наблюдаемых). Чтобы оценить б, есть разные методы. Можно ожидать, что состав жителей и их предпочтения во многом остаются постоянными от одних выборов к другим, и сравнить результаты выборов разных лет в одном и том же месте. Можно сравнить результаты участков, находящихся географически близко (в большинстве случаев состав населения там не сильно отличается). Последний способ годится также и для в; важная разница между б и в состоит в том, что в случае в нет априорных причин для связи между явкой и голосованием за т.н. "единую россию". Наконец, гипотезу г можно проверять, наблюдая корреляцию с факторами, имеющими отношение непосредственно к подсчёту, типа наличия наблюдателей или КОИБ (автоматических сканеров для бюллетеней).
3. "Оживляж" типа "весёлые и грустные" [см. обсуждение по указанной ссылке] хорош, если он позволяет наглядно изложить ситуацию, не искажая её по существу. Но Вы используете эту терминологию и в ситуации б, и в ситуации в, что затрудняет обсуждение. (Изменение названий партий в этом отношении безвредно.)
4. В статистических обсуждениях прошлых выборов (см. их резюме, опубликованное в ЖЖ,
http://www.cmi.univ-mrs.fr/~ashen/elections.pdf) упоминались разнообразные статистические данные, с которыми, если я правильно помню, Вы тоже знакомились и высказывали свои соображения. Примитивизировать обсуждение доводами типа "2. Я видел в жизни много бимодальных распределений, так что что демонстрирутеся синенькой картинкой, мне неясно" [
http://oude-rus.livejournal.com/540865.html] не стоит (хотя, возможно, оба Ваших замечания и справедливы). В частности, процедура предположительного выделения "нормальной компоненты" подробно обсуждалась в прошлых обсуждениях (Шпилькин, Пшеничников).
5. Сама постановка вопроса о "доказательствах фальсификаций" требует уточнения: нас интересует не вопрос о их существовании (вероятно, это так для любых выборов в любых странах), а оценка их размеров. Проблема с отчётами наблюдателей в том, что в силу небольшого количества отчётов и их произвольного распределения по участкам трудно оценить размер фальсификаций. В этих выборах по сравнению с предыдущими было преимущество в том отношении, что были предприняты некоторые шаги в сторону составления более представительной выборки по участкам (проект "Гражданин наблюдатель" - было выбрано 5% участков по Москве - первый в округе и иногда ещё один более или менее случайно взятый, как я понял). Соответственно, теперь возможна перекрёстная проверка: можно применить (без изменений) статистическую оценку реального голосования (обсуждавшимися на прошлых выборах методами) и данные по этим выборочным участкам (тем из них, где комиссия и наблюдатели согласны с результатами). Надеюсь, что эта работа будет доведена до конца, пока что можно только грубо сравнить "синенькую картинку" и данные по явке и голосованию с этих контрольных участков - они ближе друг к другу, чем к официальными результатам.