?

Log in

No account? Create an account

Выборы-выборы

UPD: В связи с публикацией на Ленте, подкорректировал текст. Выводы по этим картинкам отличаются от того, что написал Андрей Коняев, дописал частично в текст.



Просто картинки:
Вся россия:

Процент за единую россию от явки (график взвешен на размер участка).


Наблюдаем вбросы, реальный результат за ЕдРо - середина по вертикали большого эллиптического пятна снизу и слева (нормальная составляющая). Итого 30%.


Если эту картинку нарезать на полоски по явке (т.е. распределение процента за едро на участках с определённым процентом голосов), каждую такую картинку описать гауссианом и нарисовать получившиеся центры получится следующее:

Т.е. при явке <50% наблюдается обратная корреляция между процентом за едро и явкой, потом поведение внезапно меняется



Явка (репрезентативнее следующая картинка)


Взвешенная на количество избирателей на участке явка




Теперь смотрим на "регионы с особой электоральной культурой": Хабаровск, Киров и Вологду (области целиком). Список произвольный.

Хабаровск, мало вбросов, похоже довольно большой процент за едро. Кривые почти гауссовы:





Киров, чуть больше вбросов





Вологда:





Сволочи в общем.
По такому случаю предлагаю пойти 5ого, в понедельник сюда http://5dec.org/

UPD: Новые данные, Москва и область:

Москва, самые чудеса:


Тоже самое, только в цветах (чем краснее точка, тем больше таких УИКов)


Взвешенная явка:


Обратите внимание на два гаусса. Это разительно отличается от картинок по другими регионам: в хороших регионах один обычный "колокол" (мало фальсификаций), в плохих - длинный правый хвост (вброс). В москве ДВА независимых распределения, как будто москва разделена на две статистически разные части. При этом не географически, а как-то ещё. Простейшее этому объяснение состоит в том, что второй гаусс (и широкое пятно над нормальным пятном на двумерной гистограмме - первой картинке) есть результат случайно нарисованных результатов. Вброс, как я говорил, приводит к правому хвосту на гистограмме и вытянутому лучу на двумерных графиках (см. самую первую картинку в посте).

Это всё поразительным образом согласуется с множеством рассказов о результатах по участкам в Москве, которые совершенно отличались от наблюдательских.

UPDATE:
И трёхмерная картинка (двумерная гистограмма, только отрисованная в 3д) для убедительности:


Гипотеза про два гауссиана:
Первый - это обычное голосование граждан, естественно обусловленное влиянием множества случайных факторов.
Второй - из нарисованных протоколов, которые рисовали председатели УИКов по дороге в ТИКи. Т.е. это в каком-то смысле случайное голосование председателя УИКа, обусловленное влиянием многих случайных факторов (ну остатками совести например). Т.е. тоже нормально распределённое. Это косвенно подтверждает то, что второй гауссиан значительно шире по явке, чем по проценту за едро. Т.е. на какой-то процент всё-таки люди ориентировались.




Область, не вбросили:






==========

Все результаты в экселе-читаемом виде, номера полей как в цик, первый столбец - код региона
https://raw.github.com/evgeny-boger/rus-elections-stats/master/plots/duma2011/results.csv.gz

Поля посмотреть тут например: http://www.vologod.vybory.izbirkom.ru/region/region/vologod?action=show&root=352000016&tvd=2352000326463&vrn=100100028713299®ion=35&global=true&sub_region=35&prver=0&pronetvd=null&vibid=2352000326463&type=242


Скрипты, чтобы забирать данные: https://raw.github.com/evgeny-boger/rus-elections-stats/master/plots/duma2011/get_data.py и чтобы рисовать https://raw.github.com/evgeny-boger/rus-elections-stats/master/plots/duma2011/plot_results.py (нужен ROOT).


Про предыдущие выборы:

http://esquire.ru/elections
http://trv-science.ru/2009/10/27/statisticheskoe-issledovanie-rezultatov-rossijskix-vyborov-2007-2009-gg/


См. также
http://eugenyboger.livejournal.com/4664.html

и много красивых хороших данных у разных людей:

http://oude-rus.livejournal.com/541842.html
http://kobak.livejournal.com/101512.html
http://oude-rus.livejournal.com/542821.html
http://shipilev.livejournal.com/95401.html#cutid1
</lj_cut>

Comments

Страница 1 из 2
<<[1] [2] >>
Круто! Осталось немного дополнить и можно публиковаться в арХиве ;)
Узнаю рутовые гистограммы)
"Явка" по английски - "turnout"

мгимо финишед?
ага, спасибо, сейчас исправлю. Словарь не помог

(Анонимно)

А можно такой же анализ для других партий сделать? Мне кажется сравнение будет более наглядно
нагляднее не будет. При вбросе абсолютные значения за другие партии остаются на месте, процент за них очевидно понижается. Короче там такая же картинка, только наклон вниз, а не вверх.
Все таки математика -- величайшая наука. Способность абстрагироваться позволяет ей с точностью часов доказать самые, казалось бы, сложные вещи. Жаль, конечно что данные нельзя было анализировать в потоке,и нет распределения результатов по времени. Можно было бы понять как голосуют пенсионеры, стремящиеся на избирательный участок первыми и обычные граждане...

Спасибо!

оффтопик

> Все таки математика -- величайшая наука.

Вы ошибаетесь. Математика - вообще не наука, поскольку не отвечает ряду требований, типа проверяемости экспериментом. Говорю, как математик.
попробуйте вот это на распределнии количества голосов за ЕР по УИК
http://ru.wikipedia.org/wiki/%D0%97%D0%B0%D0%BA%D0%BE%D0%BD_%D0%91%D0%B5%D0%BD%D1%84%D0%BE%D1%80%D0%B4%D0%B0

я так понимаю, что нарисованные цифры должны выпасть, а вбросы останутся.
интересно, не знал о таком. Википедия говорит, что

> Benford's law can only be applied to data that are distributed across multiple orders of magnitude.

а для абсолютных количествах голосов это не так.

Можно конечно посмотреть на ТИКи, выдвигалась версия, что результаты по УИКам возможно иногда рисовались в зависимости от результатов других УИКов, чтобы подогнать процент на ТИКе к нужному.

А % за едро относительно проголосовавших или относительно списочного состава?
относительно количества действительных бюллетеней

(Анонимно)

Гипотеза

Второй гауссиан в явке по Москве действительно требует объяснения. Нарисовать его "по команде" довольно сложно. Его появление может быть связано с изменением способа вбросов. Если карусельщику выдают пустой бюллетень и он имеет возможность самостоятельно поставить галку, некоторые "несознательные" карусельщики могут ставить галку не за ЕдРО или могут портить бюллетень - все равно никто не узнает. Тогда мог бы получиться второй гауссиан за счет карусельщиков которые таки поставили галку за ЕдРо. Т.е. запланированные вбросы получили некоторую случайную поправку которая сделала из вброшенных бюллетеней второй гауссиан.

Похоже, количество вбросов было запланированной величиной, ~15% судя по вершинам гауссианов. На это указывает само наличие второго гауссиана, вместо размазанного "хвоста" с пиками на круглых числах, как на прошлых выборах.

Re: Гипотеза

я думаю, что со вторым гауссианом всё гораздо проще.

Первый - это обычное голосование граждан, естественно обусловленное влиянием множества случайных факторов.
Второй - из нарисованных протоколов, которые рисовали председатели УИКов по дороге в ТИКи. Т.е. это в каком-то смысле случайное голосование председателя УИКа, обусловленное влиянием многих случайных факторов (ну остатками совести например). Т.е. тоже нормально распределённое. Это косвенно подтверждает то, что второй гауссиан значительно шире по явке, чем по проценту за едро. Т.е. на какой-то процент всё-таки люди ориентировались.
Это красиво.
Но немного вопросов.
Можно ли сделать вывод, что вбросы происходили только в Москве? И как тогда одна Москва подняла процент едра с 25-30% до 49%? Всё-таки она пока не превосходит по количеству всю остальную страну, к тому же даже без поддержки области.
нет, можно сделать вывод, что вбросы происходили везде: где-то меньше, где-то больше. Вбросам соответствует наклонный участок на 2D гистограмме, который соединяет нормальное пятно снизу с нормальным пятном республик в районе 100% (верхний угол).

В Москве как раз кроме обычной составляющей вбросов присутствует вторая нормальная составляющая, которую я могу объяснить нарисованными протоколами.

Вклад Москвы действительно не очень велик. Реальный результат по Москве 17%-22%, фальсификации дали 30%, это чуть более миллиона голосов. Всего едро получило 30млн голосов, т.е. фальсификации в Москве добавили около двух процентов. Которые возможно дали едру простое большинство в Думе.

В общем большого смысла в том, что происходило в Москве искать не стоит, как не было в общем смысла делать из 33% на этих выборах 50%, а на прошлых из 45% - 65%.

Просто в Москве фальсификации были беспрецедентно наглые и сильно наглее, чем в среднем по стране.

(Анонимно)

статистика

если такой умный и есть столько
данных покажи кол-во участков с фальсификацией
и без на карте России.
Полезно будет посмотреть, прежде чем делать
выводы.
И почему считается, что вбрасывала едро,
а не другие партии ?

Re: статистика

Выводы прекрасно получается делать и без этого. Опять же вы вполне можете сделать это сами, вооружившись экселем и данными в машиночитаемом виде, которые я выложил.

Если отвечать на ваш провокационный комментарий серьёзно, то вбрасывали за едро, т.к. видна положительная корреляция между процентом за едро и явкой. Если бы вбрасывали за другую партию, корреляция была бы отрицательная. Я естественно не могу вам сказать по картинкам вбрасывала едро, оппозиция, наймиты империализма или кто-то ещё, но вбрасывали определённо в пользу едра.

Посчитать фальсификации по регионам не так просто, потому что характер фальсификаций не везде одинаковый (см. данные Москвы). Автоматически я бы не взялся это делать, а вручную на все регионы у меня времени нет. Скажите, какие именно вас интересует - посчитаю.
Можно такие же картинки по другим партиям, для примера?
можно, но вечером

(Анонимно)

спасибо за данные а то уже 7 часов с сайта качаю и все думаю как обрабатывать а тут на такое наткнулся ))))

(Анонимно)

Подскажи пожалуйста

какая версия ROOTа нужна?

У меня такое сообщение

Processing get_data.py...
Error: Missing one of '{' expected at or after line 39.
Error: Unexpected end of file (G__fignorestream():3) C:\root\bin\get_data.py(110)
*** Interpreter error recovered ***
Spasibo!
Лень думать, но разве предположение о том, что электорат едро в среднем более активно посещает выборы (условно говоря если человек за едро, то приходит на выборы с вероятностью 90%, а если против - то 40%) не объяснит структуру из самого первого графика без привлечения предположения о вбросах?
Про московские гауссианы - те сообщения о фальсификации результатов, что я видел, вроде явку как раз не затрагивали, перераспределяли голоса в рамках явки. Так что два пика на гистогорамме явки можно объяснить либо вбросами на части участков примерно 20% бюллетеней, либо тем, что в москве почему-то на половине участков за едро 60%, а на половине - 30. Пика соответсвующего подделки протоколов я не вижу, он бы соответсвовал низкой явке при высоком проценте за едро..
Во-первых, это убийственная гипотеза для власти - Вы предлагаете 40% неявившихся отнести к противникам ЕР :)
Во-вторых... при рассмотрении диапазона явок ДО 53% корреляция между явкой и голосами за ЕР не просматривается.
но ведь это ничего не доказывает: едро просто агитировало лучше там, где предполагалась большая явка.
вы сами в это верите? Что значит "предполагалось"? И вообще, мне всегда казалось, что когда на баннере написано "иди и голосуй за едро", так это и за то и за другое агитация.

В общем бремя доказательства на мне не лежит, а самое простое объяснение с большой вероятностью есть объяснение верное.

(Анонимно)

статистика

И так --- все значительно проще
Статистика хорошо, а мат модель лучше.
Были бы данные составил мат модель.
Избирательная компания (где я проживаю)
была очень грязной , но голосование
было чистое. И я не сомневаюсь, что
(где проживаю) все чисто прошло. Да не нравиться,
но это не означает, что надо строить барикады.
Очень сильно не хочется революций и
тот кто кричит фальсификация сам (вор).
--
Картинки хорошие, умные --> можно уже пробовать
составить математическую модель в EXEL.




Re: статистика

это в стихах, или у вас просто экран узкий?
Я правильно понял, что я вор?
Вы вообще нормальны?
Страница 1 из 2
<<[1] [2] >>

Сентябрь 2013

Вс Пн Вт Ср Чт Пт Сб
1234567
891011121314
15161718192021
22232425262728
2930     
Разработано LiveJournal.com