?

Log in

Графики по президентским выборам

Построил распределения для президентских выборов, аналогичные тем, которые строились для думских. Есть интересные вещи, интересно так же смотреть, как кардинально изменились некоторые картинки с прошлых выборов.



Исходные данные


https://github.com/evgeny-boger/rus-elections-stats/

Дисклеймер


... для кургиняновцев и прочих антиоранжистов и сторонников идеи о фальсификации фальсификаций.

Эти выборы очень отличаются от предыдущих и по масштабу фальсификаий, и по местам, и по способам. Переписывание протоколов, которое прекрасно ловилось по наблюдательским копиям и явно проявлялось на графиках, повсеместно не практиковалось. Зато практиковались (по крайней мере в Москве) другие, в том числе новые методы: массовое голосование по открепительным, в т.ч. неоднократное, голосование по доп. спискам. Надо понимать, что допсписки от предприятий "с непрерывным циклом" не увеличивают явку, т.к. общее количество избирателей по спискам считается с учётом доп. списков. Поэтому такие махинации практически не проявляются на соответствующих графиках. Идеи, как такое можно увидеть на апостериорных данных, очень приветствуются.

Я попробую выдвигать гипотезы, которые бы наиболее просто объясняли данные, когда смогу придумать. Комментарии на эту тему приветствуются, однако прошу не забывать, что альтернативные гипотезы должны описывать всю совокупность наблюдений и данных лучше, чем уже предложенные.

Московская область


2D гистограмма


процент за Путина-процент явки, взвешенная на списочную численность избирателей. Данные по всем УИКам.



Распределение по явке


Гистограмма, взвешенная на списочную численность избирателей на участке, данные по всем УИКам.


Распределение по проценту голосов за Путина


Гистограмма, взвешенная на списочную численность избирателей на участке, данные по всем УИКам.


Комментарии


В целом неплохо. Есть слабо выраженные признаки вбросов - положительная корреляция между процентом за Путина и явкой. Видна ассиметрия обоих распределений - правое "плечо" гауссового "колокола" слишком высокое. В целом, напоминает графики по думский по мособласти. Совсем ада не видно.

Москва


2D гистограмма




Распределение по явке




Распределение по проценту голосов за Путина




Комментарии


Чистые распределения, если массовые вбросы и были, то их не заметно на графиках (например поддельные подписи в доп-список вписывали). Видно, что не было переписывания протоколов, ни с нуля (как на думских в москве), ни с перекидыванием голосов между кандидатами (как тогда же в питере). Такой наглости и ада, как на думских, нет даже близко.

Свердловская область


2D гистограмма




Распределение по явке




Распределение по проценту голосов за Путина




Комментарии


А вот и чуродейства. Вбросов не видно, два горба за путина видно. 2д-пятно слишком широкое по вертикали. Один знакомый из Екатеринбурга сказал, что это очень странно, т.к. в городе стоят КОИБы. Решили проверить отдельно город.


Екатеринбург


2D гистограмма




Распределение по явке




Распределение по проценту голосов за Путина




Комментарии


Вот и оказалось, что первый пик - от города. Объяснение про разные настроения в городе и в селе не очень правдоподобные, т.к. в свердловской области полно ещё немаленьких городов, а во-вторых, такого расслоения в других регионах не обнаружено.



Санкт-Петербург


2D гистограмма




Распределение по явке




Распределение по проценту голосов за Путина




Комментарии


Чудеса образца прошлых выборов, в СПБ мало что изменилось. Видны вбросы (не очень много) и значительное количество тупо переписанных бюллетеней с 80% за Путина. Как и на прошлых выборах, отбирали у других кандидатов: явка не пострадала.

Вологодская область


2D гистограмма




Распределение по явке




Распределение по проценту голосов за Путина




Комментарии


Приличная ассиметрия вправо у распределения голосов за Путина. На результат оно правда не очень повлияло, максимум процента 4. UPD: вообще есть вероятность, что это всё-таки второй горб на 60% по путину. Надо проверять.

Вся страна


2D гистограмма




Распределение по явке




Распределение по проценту голосов за Путина



Комментарии


В целом картинки по стране лучше, чем на прошлых выборов. Огромный хвост у распределений, впрочем, всё равно присутствует.

пост обновляется. идеи приветствуются

Comments

здорово.
А долгопу отдельно могешь?
Анализ аналогичных графиков по думским выборам, объяснение одного из феноменов.
http://vvaf.livejournal.com/885.html
нет, там про комбинаторную природу пиков на круглых числах. Во-первых у меня здесь про это ни слова, во-вторых, гистограммы у меня взвешенные и от этого не страдают и в-третьих, было показано, что пики от ~65% на думских одной комбинаторикой не объясняются.
По этим выборам я пока ничего не строил и не пытаюсь оспорить что-то. Просто имейте в виду, что взвешенность гистограмм в принципе не уберёт пики. Вот почему.

Как я писал, ожидаемая величина пика определяется суммой гармонического ряда 1/3+1/5+1/7+…+1/(число_УИКов+1). Он характерен тем, что большая часть суммы сосредоточена в первых слагаемых, но и сумма последних не мала. Если убрать из этой суммы УИКи, где меньше 100 человек, она будет равна примерно 1.15 вместо 3.09. Это для примера на пике 50%.
65% - это 13/20. При описанных в моём исследовании условиях ровно 65% ожидается примерно на 37 УИКах, то есть всё равно пик.
Пик на 66.6% не объясняется красотой этого числа никак, только статистикой.

Проблема анализа выборов вообще в том, что невозможно построить точную модель, соответствующую по всем параметрам самим выборам. Приходится строить убогие модели (равновероятные, с гауссианами и т.д.) и показывать что-то на них.
ну вот на последней картинки видны пики на 75, 80, 85, 90. Там, как я понимаю, от комбинаторики ещё меньше вклад.

Про модель - совершенно верно. Однако мы можем замечать колоссальные различия там, где их быть не должно: например на участках с КОИБами и без, в Москве и МО на думских, в разных регионах. И для их объяснения без фальсификаций приходится изобретать разные модели для каждого случая, что, естественно, неприемлимо.

Кстати, я никак не могу понять, чем объясняется левый хвост у чистых распределений.
75% = 3/4
80% = 4/5
85% = 17/20
90% = 9/10

Чем меньше знаменатель у несократимой дроби, равной какому-то проценту, тем больше величина ожидаемого пика.
Вот про разницу участков с КОИБами и без - тут можно анализировать. Кстати, как узнать, что на участке стоял КОИБ?
Фразу про "левый хвост" не понял.
примерно никак. Общего списка нет, насколько я знаю, в каждом регионе отдельным указом этот список устанавливается. После думских силами энтузиастов пытались составить список, про эти выборы не знаю.

Я имею в виду, что распределение имеет более длинный и пологий хвост слева, чем нормальное. Возможно, это артефакт из-за взвешивания.
если речь о графике с процентом за Путина в Москве, например, то объяснить его можно тем же, чем объясняют правый хвост.
главный аргумент против «последователей Гаусса» — это то, что есть участки, на которых люди склонны голосовать за текущую власть, например, районы с министерским жильём. Есть ещё дома, где 70% жильцов чекисты и милиционеры.
Так вот, асимметрия в правую сторону может возникнуть из-за районов компактного проживания «оппозиционеров». Например, это общаги МГУ, где ЕдРо по 20% набирает. В новых домах, вероятно, квартиры покупает молодёжь, которая склонна голосовать за Прохорова, а пенсионеров там мало. Вполне логично, что в таких домах всё равно находятся сторонники Путина, поэтому хвост не тяготит к 0%, а просто делает правый уклон более пологим.

Но вообще, главное палево в том, что по сравнению с прошлыми выборами правый хвост сильно видоизменился в сторону облегчения. Это опровергает все опровержения чуровцев: участков сконцентрированной поддержки явно не так много)
Вы тут забываете, что в гистограмме бины по пол-процента, а это значит, что в 55.0 попадут 11/20, 6/11, так и куча чисел с больши́ми простыми знаменателями. Вероятно, если гипотеза eugenyboger верна, многие комиссии рапортуют о результате, чуть большем, чем ровно [10, 11, 12 …] / 20, тогда это попадёт в пики гистограммы, но не будет «красивым числом». В общем, постройте более подробные гистограммы в районе факторов 5%, чтобы опровергнуть или частично подтвердить комбинаторную гипотезу.

Ну и чтоб два раза не вставать, vvaf, Ваша модель до смешного грубая. Конечно, распределение числа проголосовавших на участке никак не равномерное. Даже если убрать первые 100, это будет далеко от истины. Что Вам мешает запустить симуляцию с коэффициентами, равными количеству участков с данным числом проголосовавших? Ну и желательно для каждого участка процент за едро / явку тоже полагать не равномерной, а соответствующей данным, хотя последнее может и не изменит результат серьёзно.
Пики получаются именно из-за в точности равных значений. Если посмотрите на мои графики, до 50% и после 50% (как и других красивых чисел) график идёт ровно примерно под одним и тем же наклоном.
Я уже написал, что модель грубая. Построите лучшую модель - спасибо вам. Мне лично не хватает времени, я уже думал об этом. Цель того, что я написал - показать, как в принципе получаются пики. Неравномерность, очевидно, увеличит пики в районе большей плотности вероятности и уменьшит в районе меньшей.
Во многих городах на этих выборах опробовали в массовом порядке технологию раздувания явки за счёт голосования вне помещения избирательного участка и по открепительным.

Вот в качестве примера Самара:
Горизонтальная ось - процент голосов по открепительным и в переносных урнах от числа всех обнаруженных в урнах бюллетеней, по вертикальной оси - процент, полученный кандидатами, тоже от числа всех обнаруженных в урнах бюллетеней. Площадь пузырьков соответствует числу голосов за кандидата на участке (только их масштаб разный на разных диаграммах).

Путин и Зюганов:


Путин - крупнее:


Зюганов - крупнее:



Имеем два кластера на участках с небольшим процентом проголосовавших вне помещения и по открепительным, и размазанный хвост из довольно большого числа участков, где доля голосов, полученная от "больных" и "приезжих" доходит до 15%, 25% и выше, причём чем эта доля выше, тем выше результат Путина и ниже результат Зюганова.

Верхний путинский кластер на нормальных показателях доли проголосовавших вне помещения и по открепительным одновременно отличается очень высокой явкой и территориально локализован в тех районах, которые отличились на декабрьских выборах неправдоподобно высокой явкой, очень высоким результатом ЕР и очень низкими результатами других партий. Т.е. имеет место повторение декабрьских фальсификаций, заключающихся в переброске голосов от оппозиции к власти, совмещённой с добавлением голосов за кандидата власти, повышающим явку.

Что-то подобное имеет место в Волгограде и в Нижнем Новгороде. Хорошо бы все города проверить.

(Анонимно)

А разве не будет наглядным старая-добрая зависимость процента голосов за кандидата на участке от явки на участке?
На ней точки лежат на горизонтальных прямых для "честных" и на возрастающей - для "нечестного". Суть увеличение явки и голосов "нечестному" за счет непришедших. Здесь же - то же самое: растут явка и голоса, но за счет специально обученных обезьян.
На гистограммах это видно плохо, ибо не два дико разнесенных гаусса с серединами на 35 и 70% как в декабре.
смотря что хочется увидеть. Гистограммы хороши тем, что они показывают вклад. Т.е. если на этих взвешенных двумерных гистограммах не видно наклонного хвоста, значит он имеет небольшой вклад.

Специально обученные обезьяны, как я уже писал, не увеличивают явку, если их добавляют в доп. списки.
У меня есть графики профилей 2д распределений, будет время - выложу. Хотя я не нахожу их очень интересными.

Сентябрь 2013

Вс Пн Вт Ср Чт Пт Сб
1234567
891011121314
15161718192021
22232425262728
2930     
Разработано LiveJournal.com