?

Log in

Выборы-выборы

UPD: В связи с публикацией на Ленте, подкорректировал текст. Выводы по этим картинкам отличаются от того, что написал Андрей Коняев, дописал частично в текст.



Просто картинки:
Вся россия:

Процент за единую россию от явки (график взвешен на размер участка).


Наблюдаем вбросы, реальный результат за ЕдРо - середина по вертикали большого эллиптического пятна снизу и слева (нормальная составляющая). Итого 30%.


Если эту картинку нарезать на полоски по явке (т.е. распределение процента за едро на участках с определённым процентом голосов), каждую такую картинку описать гауссианом и нарисовать получившиеся центры получится следующее:

Т.е. при явке <50% наблюдается обратная корреляция между процентом за едро и явкой, потом поведение внезапно меняется



Явка (репрезентативнее следующая картинка)


Взвешенная на количество избирателей на участке явка




Теперь смотрим на "регионы с особой электоральной культурой": Хабаровск, Киров и Вологду (области целиком). Список произвольный.

Хабаровск, мало вбросов, похоже довольно большой процент за едро. Кривые почти гауссовы:





Киров, чуть больше вбросов





Вологда:





Сволочи в общем.
По такому случаю предлагаю пойти 5ого, в понедельник сюда http://5dec.org/

UPD: Новые данные, Москва и область:

Москва, самые чудеса:


Тоже самое, только в цветах (чем краснее точка, тем больше таких УИКов)


Взвешенная явка:


Обратите внимание на два гаусса. Это разительно отличается от картинок по другими регионам: в хороших регионах один обычный "колокол" (мало фальсификаций), в плохих - длинный правый хвост (вброс). В москве ДВА независимых распределения, как будто москва разделена на две статистически разные части. При этом не географически, а как-то ещё. Простейшее этому объяснение состоит в том, что второй гаусс (и широкое пятно над нормальным пятном на двумерной гистограмме - первой картинке) есть результат случайно нарисованных результатов. Вброс, как я говорил, приводит к правому хвосту на гистограмме и вытянутому лучу на двумерных графиках (см. самую первую картинку в посте).

Это всё поразительным образом согласуется с множеством рассказов о результатах по участкам в Москве, которые совершенно отличались от наблюдательских.

UPDATE:
И трёхмерная картинка (двумерная гистограмма, только отрисованная в 3д) для убедительности:


Гипотеза про два гауссиана:
Первый - это обычное голосование граждан, естественно обусловленное влиянием множества случайных факторов.
Второй - из нарисованных протоколов, которые рисовали председатели УИКов по дороге в ТИКи. Т.е. это в каком-то смысле случайное голосование председателя УИКа, обусловленное влиянием многих случайных факторов (ну остатками совести например). Т.е. тоже нормально распределённое. Это косвенно подтверждает то, что второй гауссиан значительно шире по явке, чем по проценту за едро. Т.е. на какой-то процент всё-таки люди ориентировались.




Область, не вбросили:






==========

Все результаты в экселе-читаемом виде, номера полей как в цик, первый столбец - код региона
https://raw.github.com/evgeny-boger/rus-elections-stats/master/plots/duma2011/results.csv.gz

Поля посмотреть тут например: http://www.vologod.vybory.izbirkom.ru/region/region/vologod?action=show&root=352000016&tvd=2352000326463&vrn=100100028713299®ion=35&global=true&sub_region=35&prver=0&pronetvd=null&vibid=2352000326463&type=242


Скрипты, чтобы забирать данные: https://raw.github.com/evgeny-boger/rus-elections-stats/master/plots/duma2011/get_data.py и чтобы рисовать https://raw.github.com/evgeny-boger/rus-elections-stats/master/plots/duma2011/plot_results.py (нужен ROOT).


Про предыдущие выборы:

http://esquire.ru/elections
http://trv-science.ru/2009/10/27/statisticheskoe-issledovanie-rezultatov-rossijskix-vyborov-2007-2009-gg/


См. также
http://eugenyboger.livejournal.com/4664.html

и много красивых хороших данных у разных людей:

http://oude-rus.livejournal.com/541842.html
http://kobak.livejournal.com/101512.html
http://oude-rus.livejournal.com/542821.html
http://shipilev.livejournal.com/95401.html#cutid1
</lj_cut>

Comments

Страница 1 из 2
<<[1] [2] >>
Круто! Осталось немного дополнить и можно публиковаться в арХиве ;)
Узнаю рутовые гистограммы)
"Явка" по английски - "turnout"

мгимо финишед?
ага, спасибо, сейчас исправлю. Словарь не помог

(Анонимно)

А можно такой же анализ для других партий сделать? Мне кажется сравнение будет более наглядно
нагляднее не будет. При вбросе абсолютные значения за другие партии остаются на месте, процент за них очевидно понижается. Короче там такая же картинка, только наклон вниз, а не вверх.
Все таки математика -- величайшая наука. Способность абстрагироваться позволяет ей с точностью часов доказать самые, казалось бы, сложные вещи. Жаль, конечно что данные нельзя было анализировать в потоке,и нет распределения результатов по времени. Можно было бы понять как голосуют пенсионеры, стремящиеся на избирательный участок первыми и обычные граждане...

Спасибо!

оффтопик

> Все таки математика -- величайшая наука.

Вы ошибаетесь. Математика - вообще не наука, поскольку не отвечает ряду требований, типа проверяемости экспериментом. Говорю, как математик.
попробуйте вот это на распределнии количества голосов за ЕР по УИК
http://ru.wikipedia.org/wiki/%D0%97%D0%B0%D0%BA%D0%BE%D0%BD_%D0%91%D0%B5%D0%BD%D1%84%D0%BE%D1%80%D0%B4%D0%B0

я так понимаю, что нарисованные цифры должны выпасть, а вбросы останутся.
интересно, не знал о таком. Википедия говорит, что

> Benford's law can only be applied to data that are distributed across multiple orders of magnitude.

а для абсолютных количествах голосов это не так.

Можно конечно посмотреть на ТИКи, выдвигалась версия, что результаты по УИКам возможно иногда рисовались в зависимости от результатов других УИКов, чтобы подогнать процент на ТИКе к нужному.

А % за едро относительно проголосовавших или относительно списочного состава?
относительно количества действительных бюллетеней

(Анонимно)

Гипотеза

Второй гауссиан в явке по Москве действительно требует объяснения. Нарисовать его "по команде" довольно сложно. Его появление может быть связано с изменением способа вбросов. Если карусельщику выдают пустой бюллетень и он имеет возможность самостоятельно поставить галку, некоторые "несознательные" карусельщики могут ставить галку не за ЕдРО или могут портить бюллетень - все равно никто не узнает. Тогда мог бы получиться второй гауссиан за счет карусельщиков которые таки поставили галку за ЕдРо. Т.е. запланированные вбросы получили некоторую случайную поправку которая сделала из вброшенных бюллетеней второй гауссиан.

Похоже, количество вбросов было запланированной величиной, ~15% судя по вершинам гауссианов. На это указывает само наличие второго гауссиана, вместо размазанного "хвоста" с пиками на круглых числах, как на прошлых выборах.

Re: Гипотеза

я думаю, что со вторым гауссианом всё гораздо проще.

Первый - это обычное голосование граждан, естественно обусловленное влиянием множества случайных факторов.
Второй - из нарисованных протоколов, которые рисовали председатели УИКов по дороге в ТИКи. Т.е. это в каком-то смысле случайное голосование председателя УИКа, обусловленное влиянием многих случайных факторов (ну остатками совести например). Т.е. тоже нормально распределённое. Это косвенно подтверждает то, что второй гауссиан значительно шире по явке, чем по проценту за едро. Т.е. на какой-то процент всё-таки люди ориентировались.
Это красиво.
Но немного вопросов.
Можно ли сделать вывод, что вбросы происходили только в Москве? И как тогда одна Москва подняла процент едра с 25-30% до 49%? Всё-таки она пока не превосходит по количеству всю остальную страну, к тому же даже без поддержки области.
нет, можно сделать вывод, что вбросы происходили везде: где-то меньше, где-то больше. Вбросам соответствует наклонный участок на 2D гистограмме, который соединяет нормальное пятно снизу с нормальным пятном республик в районе 100% (верхний угол).

В Москве как раз кроме обычной составляющей вбросов присутствует вторая нормальная составляющая, которую я могу объяснить нарисованными протоколами.

Вклад Москвы действительно не очень велик. Реальный результат по Москве 17%-22%, фальсификации дали 30%, это чуть более миллиона голосов. Всего едро получило 30млн голосов, т.е. фальсификации в Москве добавили около двух процентов. Которые возможно дали едру простое большинство в Думе.

В общем большого смысла в том, что происходило в Москве искать не стоит, как не было в общем смысла делать из 33% на этих выборах 50%, а на прошлых из 45% - 65%.

Просто в Москве фальсификации были беспрецедентно наглые и сильно наглее, чем в среднем по стране.

(Анонимно)

статистика

если такой умный и есть столько
данных покажи кол-во участков с фальсификацией
и без на карте России.
Полезно будет посмотреть, прежде чем делать
выводы.
И почему считается, что вбрасывала едро,
а не другие партии ?

Re: статистика

Выводы прекрасно получается делать и без этого. Опять же вы вполне можете сделать это сами, вооружившись экселем и данными в машиночитаемом виде, которые я выложил.

Если отвечать на ваш провокационный комментарий серьёзно, то вбрасывали за едро, т.к. видна положительная корреляция между процентом за едро и явкой. Если бы вбрасывали за другую партию, корреляция была бы отрицательная. Я естественно не могу вам сказать по картинкам вбрасывала едро, оппозиция, наймиты империализма или кто-то ещё, но вбрасывали определённо в пользу едра.

Посчитать фальсификации по регионам не так просто, потому что характер фальсификаций не везде одинаковый (см. данные Москвы). Автоматически я бы не взялся это делать, а вручную на все регионы у меня времени нет. Скажите, какие именно вас интересует - посчитаю.
Можно такие же картинки по другим партиям, для примера?
можно, но вечером

(Анонимно)

спасибо за данные а то уже 7 часов с сайта качаю и все думаю как обрабатывать а тут на такое наткнулся ))))

(Анонимно)

Подскажи пожалуйста

какая версия ROOTа нужна?

У меня такое сообщение

Processing get_data.py...
Error: Missing one of '{' expected at or after line 39.
Error: Unexpected end of file (G__fignorestream():3) C:\root\bin\get_data.py(110)
*** Interpreter error recovered ***
Spasibo!
Лень думать, но разве предположение о том, что электорат едро в среднем более активно посещает выборы (условно говоря если человек за едро, то приходит на выборы с вероятностью 90%, а если против - то 40%) не объяснит структуру из самого первого графика без привлечения предположения о вбросах?
Про московские гауссианы - те сообщения о фальсификации результатов, что я видел, вроде явку как раз не затрагивали, перераспределяли голоса в рамках явки. Так что два пика на гистогорамме явки можно объяснить либо вбросами на части участков примерно 20% бюллетеней, либо тем, что в москве почему-то на половине участков за едро 60%, а на половине - 30. Пика соответсвующего подделки протоколов я не вижу, он бы соответсвовал низкой явке при высоком проценте за едро..
Во-первых, это убийственная гипотеза для власти - Вы предлагаете 40% неявившихся отнести к противникам ЕР :)
Во-вторых... при рассмотрении диапазона явок ДО 53% корреляция между явкой и голосами за ЕР не просматривается.
но ведь это ничего не доказывает: едро просто агитировало лучше там, где предполагалась большая явка.
вы сами в это верите? Что значит "предполагалось"? И вообще, мне всегда казалось, что когда на баннере написано "иди и голосуй за едро", так это и за то и за другое агитация.

В общем бремя доказательства на мне не лежит, а самое простое объяснение с большой вероятностью есть объяснение верное.

(Анонимно)

статистика

И так --- все значительно проще
Статистика хорошо, а мат модель лучше.
Были бы данные составил мат модель.
Избирательная компания (где я проживаю)
была очень грязной , но голосование
было чистое. И я не сомневаюсь, что
(где проживаю) все чисто прошло. Да не нравиться,
но это не означает, что надо строить барикады.
Очень сильно не хочется революций и
тот кто кричит фальсификация сам (вор).
--
Картинки хорошие, умные --> можно уже пробовать
составить математическую модель в EXEL.




Re: статистика

это в стихах, или у вас просто экран узкий?
Я правильно понял, что я вор?
Вы вообще нормальны?
Посчитайте Нижний Новгород и область пожалуйста.
Молодец. Хорошая мысль все объяснить с точки зрения математики.
Можно я со своими цифрами вмешаюсь в ученый диспут? В Колпинском районе Санкт-Петербурга особо не заморачивались, а просто перерисовали протоколы. В таблицах - сборка "Было" - как в протколах", "Стало" -как отрисоввали, кто погаже - до 1009 годосов отобрали и на педросов перекинули, а кто-то - Слава Героям! - отказался и пробил свой протокол. На них и стоит Россия!
Итоги жульничества и воровства: выборы 04.12.2011г. Ч.9 -12 ,
Голосование в ГД РФ и ЗС СПб по 34 УИК Колпинского района СПб.
http://olga-andronova.livejournal.com/74967.html
http://olga-andronova.livejournal.com/75205.html
http://olga-andronova.livejournal.com/75409.html
http://olga-andronova.livejournal.com/75546.html
комментарий - http://olga-andronova.livejournal.com/75930.html



--
С уважением,
шикарно! я минуту назад построил Питер, там всё получше, чем в москве, но есть странный второй пик в процентах за едро по типу московского. Но он не сдвинут по явке!

Я правильно понимаю, что во всех случаях, описанных в вашем ЖЖ, голоса перерапределялись между кандидатами и явка не изменялась? Это бы просто прекрасно совпало с моими выводами

(Анонимно)

Магнитогорск

Евгений, спасибо большое за расчеты и выводы. Не могли бы Вы показать Магнитогорск? Тут действительно высокая поодержка Путина (=единой России) интересно как будет выглядеть распределение. Спасибо!

Re: Магнитогорск

добавил в http://eugenyboger.livejournal.com/5057.html

У меня для вас плохие новости: возможно поддержка не такая и высокая.
Корреляция между явкой и ПЖИВ может объясняться тем, что скажем участок в воинской части. Явка 100%, все честно голосуют за ПЖИВ, и никаких вбросов. Диагональ межну 30% и 100% - это когда воинская часть не имеет своего участка, а приходит голосовать на гражданский участок. Доля солдат среди гражданских избирателей - определяет положение точки на диагонали

А что с другими партиями???

Предлагается для чистоты эксперимента построить такие же графики для других партий - СР и коммунистов, например.

Re: А что с другими партиями???

Еще предложение: вычислить по графикам вероятные реальные результаты выборов с погрешностями для всех партий и опубликовать в отдельном посте. Можно как вцелом по России, так и для нескольких интересных регионов. Просто табличкой цифр, как у ВЦИК, для более широкой публики.
А вообще, откуда дровишки? В смысле исходные данные? Ссылка даётся на какой-то левый сайт по айфоновскому софту. Существуют ли доказательства что цифры взяты у Цика, а не созданы генератором случайных чисел?
Это сайт компании, в которой я соучредитель и по-совместительству имею доступ к серверам. Просто так было удобнее выложить и постоянно обновлять.

Данные с сайта ЦИК, получены скриптом get_data.py, на который ссылка в посте. Скачайте, запустите и проверьте. К несчастью, ЦИК не предоставляет все данные в машиночитаемом виде одним файлом, потому что их сайт, как и большинство государственных сайтов в России, написан был с использованием жопы вместо рук.

Вы можете прогулятся по ссылкам снизу поста и скачать данные, полученные другим человеком другим методом с того же сайта ЦИК и сравнить с теми, которые анализирую я. Также вы можете выбрать в csv-файле любую строчку, ткнуть на ссылку, которая сохранена вторым полем и ведёт на сайт ЦИК и убедится, что данные верны.

И да, я продолжаю отвечать троллям, как будто они не тролли.

Выборы 2011

В Мособлаасти решили не подделывать голоса, поскольку и так этот раздел нашей территории вызвал бурю негодования, но провести едросов в облдуму по мажоритарной системе наш псевдо-губер одобрил. И теперь едросы в большинстве и при общаке - а вам господа вопрос - знаете ли вы, что есть Московская область, что в ней тоже живут люди и не отстойные и не полуграмотные.
см. результаты голосования 2011 на сайте центризбиркома
Thanks for posting this. I am currently in the process of also going through a very similar analysis, and hope to share it with the english-speaking community. I have just a few questions about the way ballots are handled. Especially, there seems to be a very strange relationship between the cast ballots and the valid ballots. If any english or german speakers have a few minutes to answer a few questions on Skype, I would be very grateful. Thanks, Alex Mellnik

Спасибо за размещение этого. Я американский физик и я в настоящее время в процессе также переживает очень похожи анализа, и надеюсь, поделиться ею с английского языка сообщества. Я только несколько вопросов о том, как бюллетени обработаны. Тем более, там, кажется, очень странные отношения между голосуют и действительных избирательных бюллетеней. Если какой-либо на английском или немецком языке есть несколько минут, чтобы ответить на несколько вопросов по Skype, я был бы очень благодарен. Спасибо, Alex Mellnik

Skype: a.r.mellnik

http://samarcandanalytics.com/elections/TwoRatios.png
http://samarcandanalytics.com/elections/Scatter%20plot%20with%20five%20regions.png
Страница 1 из 2
<<[1] [2] >>

Сентябрь 2013

Вс Пн Вт Ср Чт Пт Сб
1234567
891011121314
15161718192021
22232425262728
2930     
Разработано LiveJournal.com