виртуальный клуб Суть времени

О фальсификации фальсификации (Псковская область)

В последнее время в интернетах наблюдается активное бурление умов вокруг результатов выборов в Госдуму: были ли фальсификации, забудем ли, простим ли?

Это натолкнуло меня на мысль подготовить заметку о результатах выборов по нашему отдельно взятому региону (Псковской области), пользуясь широко разрекламированной в сети методикой анализа статистических данных за авторством Собянина-Суховольского и их идейного наследника Шпилькина. Впрочем, поскольку я пользовался также данными наблюдателей от нескольких партий, заметка получилась скорее о самой этой методике.

К истории вопроса

Очень многие доказывают наличие фальсификаций, строя графики по методике Собянина-Суховольского.[1] Методика подкупает простотой и наглядностью. Вкратце, для каждого избирательного участка нужно построить точку на графике, отложив по оси X явку, а по оси Y долю голосов за «Единую Россию» от общего числа зарегистрированных избирателей. Далее нужно интерполировать все точки прямой линией. Если линия не пройдёт через начало координат (а она не пройдёт через начало координат), можно смело писать разоблачительную статью.

В виде, близком к классическому – т.е. с построением тех самых линий – данная методика реализована Сергеем Шпилькиным в статье «Статистика исследовала выборы» в Газете.ру. Повышение процента за партию власти при повышении явки однозначно объясняется «вбросом»: «точка партии, за которую происходит «вброс»… сдвигается вправо по диагонали, а точки других партий – по горизонтали». Снижение процента за другие партии при повышении явки – «отбором голосов»: «Кроме групп точек, укладывающихся в картину добавления голосов за ЕР, появляются группы, в которых доли голосов за остальные партии резко понижены по сравнению с соседними участками, а доля голосов за ЕР увеличена еще больше. Это соответствует ситуации, когда ЕР добавляют голоса, а у других партий отнимают».

Вторая распространённая методика – анализ графиков распределения участков по явке и по проценту за разные партии. И тут у нас снова Сергей Шпилькин впереди планеты всей: «в целом его форма с хорошей точностью описывается известным из теории вероятностей т.н. нормальным, или Гауссовым, распределением… [Оно] типично для многих величин, которые зависят от множества случайных независимых факторов… К числу таких величин относятся в том числе и явка избирателей, и доля голосов, поданных за конкретную партию, если каждый избиратель принимает решение об участии в выборах и голосовании самостоятельно и независимо». В доказательство демократичности гауссианы в большинстве статей приводятся почему-то[2] одни и те же четыре графика явки: Мексика-2009, Польша-2007, Болгария-2009, Швеция-2010. Иногда к ним добавляют Украину-2004 – по одному из трёх туров тех самых президентских выборов.[3]

Не будем сейчас касаться результатов выборов по всей России (честно говоря, мне задача по-быстрому в одиночку обработать и интерпретировать массив результатов по без малого 95000 участкам кажется неподъёмной). Рассмотрим родную Псковскую область.

Исходные данные

Согласно официальным данным, результаты выборов по Псковской области таковы:

«Справедливая Россия» 16,41 %
ЛДПР 13,93 %
«Патриоты России» 0,9 %
КПРФ 25,13 %
«Яблоко» 5,1 %
«Единая Россия» 36,65 %
«Правое дело» 0,45 %

На территории области действовало 650 избирательных участков. Всего на них было зарегистрировано 581005 человек,[4] из них проголосовало 302767 (ещё 4391 испортили бюллетени), т.е. явка в среднем составила 52 %. По открепительным удостоверениям проголосовал 4731 человек, что составляет примерно 1,5 % от общего числа голосовавших.

Данные по избирательным участкам Псковской области можно добыть тут, там надо выбирать районные комиссии и тогда выпадет табличка с исходными данными по участкам района. Предупреждаю сразу, вёрстка таблиц на сайте сделана криво, чтобы перевести всё в excel придётся серьёзно повозиться.

Про псковские выборы

Сделаем график по описанной методике: по оси абсцисс отложим явку в процентах, по оси ординат – процент проголосовавших за партию от общего числа зарегистрированных избирателей.


Получилась до боли знакомая картинка. Мы видим, что процент за «Единую Россию» имеет явную корреляцию с явкой, а проценты за остальные партии, как будто, нет. Казалось бы, вот оно, ещё одно доказательство массового «вброса». Можно сразу вскакивать на стол, раскидывая ногами клавиатуру и чашку чая, и начинать скандировать «Не-забудем-не-простим!»

Однако, сдержим этот первый порыв и посмотрим на гистограмму распределения количества участков по явке:


Гистограмма сильно отличается от «нормальной»[5] гауссианы, явно виден длинный «хвост» и пара-тройка вторичных пиков: один повыше и несколько пониже (в интернетах эту часть графика любят называть «бородой Чурова»). По мнению Шпилькина и компании, всё это тоже явно свидетельствует о фальсификациях.[6]

Однако, глядя на эту двугорбую гистограмму пристальнее, можно додуматься до гениальной мысли. А вдруг население нашей области не совсем однородно? Вдруг жители нашей области делятся на две большие группы, которые и дают два больших «горба»?

Тут самое время вспомнить, что условия жизни в городе и на селе сильно отличаются. Можно ради интереса попробовать разделить участки на две группы: «городские» и «сельские».


Кажется, дело немного проясняется. У нас появилось две почти «правильных» колоколообразных линии с пиками в 50 и 60-65 % соответственно. Именно их сложение и даёт «горбатую» гистограмму общей явки.

Провал на «городской» линии и небольшой пик под ним на «сельской» обеспечены, как мы увидим чуть позже, тем, что я включил в группу «городских» не все избирательные участки в посёлках и крупных деревнях.

А откуда же пики около 80 и 90 % на «сельской» линии? Как мы поймём чуть позже, их дают относительно многочисленные, но небольшие по количеству избирателей участки.

Вот в этом самом месте нужно прерваться для одной очень важной оговорки. Дело в том, что, пойдя по методике, предлагаемой Собяниным, Суховольским и их идейным наследником Шпилькиным, мы незаметно для себя согласились на серьёзную манипуляцию с исходными данными: мы считаем не проголосовавших людей, а избирательные участки.

Для того, чтобы убедиться, насколько это влияет на результат, напомню, что Псковская область сильно урбанизирована: на «городских» участках зарегистрировано около 75 % всех избирателей, а на сельских, соответственно, всего около 25 %. На нашей же гистограмме синяя линия едва ли не больше красной. А это всё потому, что сельских участков по количеству действительно больше, чем городских. Просто средний размер городского участка – 1576 избирателей, а сельского – всего 378.

Откорректированный с учётом количества избирателей на участках график явки будет выглядеть совершенно иначе:


Огромный «хвост» сильно уменьшился. Пиков всё равно осталось два, но «горб» от сельских участков «усох». Небольшие пики около 80 и 90 % на «сельской» линии почти растворились, а вот незаметные на прошлом графике пики около 70 и 90 % на «городской» линии, наоборот, выросли.

Попробуем теперь посмотреть, как же выглядит наш график явки и процентов за партии по участкам на относительно более однородном материале. Данные по участкам в городских поселениях:


Как легко убедиться, задранный вверх «хвост» на самом первом нашем графике целиком сформирован за счёт «сельских» участков. На основной же массе «городских» участков явка колеблется в пределах 40-55 %. Процент проголосовавших за ту или иную партию тоже примерно одинаков по большинству участков (а на нашем графике с процентом от общего числа зарегистрированных – доли, соответственно, медленно и равномерно возрастают).

Из общей картины выбивается несколько участков с явкой более 65 % (именно они дают три всплеска в конце «городской» линии). Но если посмотреть на их расположение,[7] мы сразу увидим, что это не обычные городские участки. Эти участки (я их подписал на графике) обслуживают совершенно особые территории с особым типом явки: военные городки, больницы, дом престарелых.[8]

Из вышесказанного неминуемо вытекает нижеследующее:

1) Население (сиречь электорат) Псковской области неоднородно территориально, социально и даже демографически.[9] При этом разные его группы имеют тенденцию в отношении к голосованию действовать сходно внутри групп и различно между этими группами.

2) Для условного соответствия тенденциям в электоральном поведении населения можно выделить: а) «Городские» избирательные участки. Кроме расположенных в собственно городах сюда можно также отнести избирательные участки, расположенные в де-юре деревнях, но де-факто пригородах (Писковичи, Родина, Серёдка, Тямша, Черёха), посёлках и посёлках городского типа (Карамышево, Переслегино, Сосновый Бор), особо крупных деревнях (Старый и Новый Изборски,[10] Городок, Ершово, Заплюсье, Заполье, Неёлово, Полоное, Соловьи, Усть-Долыссы и др.). Наверняка, я «потерял» ещё пару-тройку посёлков и крупных деревень, что будет вносить в графики некоторые искажения. б) Т.н. «особые» участки. В нашем случае эти участки расположены на городской территории в больницах, доме престарелых, военных городках. в) Менее однородную группу «сельских» участков.

3) Выявленные типы участков отличаются количеством, размером и тенденциям в электоральном поведении избирателей.

«Городские» участки многочисленны и имеют большой размер (в среднем 1 участок на 1576 человек). Избиратели ходят на них не очень активно. И это понятно. Ведь в городе, чтобы проголосовать, нужно затратить массу энергии: выключить телевизор, встать с дивана, под дождём (а погода 4 декабря была мерзопакостная) тащиться на участок, там стоять в очереди. Всё это предполагает наличие определённой мотивированности.

«Особых» участков мало, зато на них зарегистрировано помногу человек. Средний размер участка в военном городке, например, составляет 2390 избирателей (в полтора раза больше типичного «городского»). Явка там либо просто высокая, либо очень высокая. Нужно отметить, что на таких участках избиратели изначально замотивированы (пусть и отрицательно – пожеланиями командования или комиссией с урной, ходящей по палатам) и, наоборот, энергию приходится затрачивать тем, кто голосовать не хочет. Тут, конечно, можно поговорить о «добровольно-принудительном» характере явки,[11] однако, отметим, что принуждение к явке ещё не означает принуждения к голосованию за определённую партию. И действительно, участки в военных городках, например, демонстрируют удивительно высокий процент голосов за ЛДПР: 26,8 % против средних по области 13,9 %. Можно предположить, что этот результат обеспечили бойцы, голосующие назло «шакалам».

Рассмотрим теперь оставшуюся группу – «сельские» участки. Они относительно многочисленны, но имеют небольшие размеры – от 990 до 80 избирателей на участок, но основная масса участков имеет размер в 200-400 человек. Явка по «сельским» участкам в среднем выше, чем по «городским» и составляет 60-70 %.[12] При этом наблюдается тенденция: чем участок меньше, тем явка на нём выше (см. следующий график).


И это тоже неудивительно. На селе иные, чем в городах, условия жизни, иной состав населения, иные взаимоотношения между людьми, иной, наконец, даже механизм работы самого участка. Если в городах, посёлках и крупных деревнях участки стационарные, то мелкие сельские участки, объединяющие от пяти до десяти-пятнадцати деревень с небольшим количеством жителей – передвижные. В этом плане мелкие сельские участки напоминают участки «особого» типа с добровольно-принудительной явкой: когда комиссия с урной сама приходит к тебе домой, проще проголосовать, чем отказаться.

График явки и процентов за партии по «сельским» участкам выглядит похоже на самый первый – «фальсификационный»: процент за «Единую Россию» имеет явную корреляцию с явкой, для процентов за остальные партии эта зависимость выражена гораздо слабее, а уж у «Яблока» процент так и вообще падает.[13]


Однако мы уже установили, что имеет место корреляция между размером участка и явкой, т.е. участки с самой высокой явкой и самым высоким процентом за «Единую Россию» – самые маленькие. Что, помимо прочего, для нашей области означает, что населены они преимущественно возрастными людьми (при том на 3/4 женщинами) и расположены в самых дальних и глухих деревнях, куда вряд ли могла добраться агитация каких-либо других партий.

Если же мы рассмотрим распределение участков (с учётом количества избирателей) по процентам за партии, то обнаружится, что в подавляющем большинстве сельских поселений за «Единую Россию» голосовало не более 30-35 % от зарегистрированных избирателей:


На небольших участках с большим процентом за «Единую Россию», образующих пышный задранный хвост на графике по методике Собянина-Суховольского, как видим, зарегистрировано меньшинство сельского населения.

Вместо заключения

Дабы не довольствоваться одними косвенными свидетельствами, я в процессе написания этой заметки позвонил в Псковский обком КПРФ[14] и поинтересовался у них о данных, полученных наблюдателями непосредственно в ходе выборов. Так вот, в ходе выборов в Госдуму VI созыва (обращаю внимание, что на митингах требовали переголосования только по этим выборам, не по выборам в областные собрания) по области была зафиксирована масса мелких нарушений (типа не снятой до сих пор агитации за известно кого), но ни одного крупного, могущего серьёзно повлиять на исход голосования. Соответственно, по результатам выборов в Госдуму[15] областным отделением КПРФ в прокуратуру не подано ни одного заявления.

Чтобы не показаться пристрастным, я связался и с общественной приёмной самой ркуопожатной партии области – «Яблока». Так вот, несмотря на громкие заявления, что мол, «идёт фальсификация голосования, в том числе в Псковской области», мне ответили: работы по сбору и обобщению материалов о нарушениях, конечно, в полном разгаре, но данных для обращения в прокуратуру пока нет.

Таким образом, можно сказать, что прямыми данными о фальсификациях на выборах в Госдуму VI созыва местные политические партии не обладают. Косвенные данные, даваемые анализом избирательной статистики, также не позволяют с уверенностью говорить о «вбросах» на территории Псковской области.[16]

Но что же тогда можно говорить с уверенностью?

А вот что: самая распространённая в российском Интернете методика для быстрого, простого и дающего наглядные результаты анализа выборов, изначально предложенная господами А.А. Собяниным, В.Г. Суховольским и их идейным наследником Сергеем Шпилькиным, раскрученная к выборам «оппозиционной» и всяческой «респектабельной» прессой, и подхваченная блогерами (многие из которых вполне искрене старались разобраться что к чему) – некорректна. Некорректна, поскольку базируется на одной серьёзной манипуляции с исходными данными и ряде явных и неявных допущений.

1) Во-первых, как мы уже говорили, ещё на этапе обработки исходных данных происходит серьёзно влияющая на результат трансформация: вместо избирателей начинают считаться избирательные участки. Это очень сильно увеличивает роль мелких (особенно мелких сельских) участков и, наоборот, занижает роль многолюдных городских.

2) Во-вторых, большим допущением является предположение, что «правильное» распределение явки и процента голосов по избирательным участкам всегда должно отражаться именно гауссианой. Выборы – сложный социальный процесс, а отнюдь не случайное подбрасывание монетки. Более того, даже для того, чтобы получить хоть и не совсем симметричную, но более-менее ровную линию нужно, как минимум, чтобы все «бросания монетки» происходили в идентичных условиях. Тут мы переходим к следующему допущению.

3) В-третьих, в основе «анализов» фальсификаций лежит неявное предположение, что выборка содержит однородный материал, т.е., попросту, что на анализируемых территориях или избирательных участках примерно в равных долях сгруппированы люди разного социального и материального положения. В случае же с выборкой по всей России это предположение трансформируется в совсем уж абсурдное: что все регионы России развиваются одинаково и равномерно, что у нас нет центров сосредоточения материальных благ в виде столиц и мегаполисов, нет регионов-доноров и дотационных регионов. Неудивительно, что господин Шпилькин не решается сказать подобное вслух. На графике же по неоднородной выборке будет по нескольку разных «облачков» для разных районов, а линия распределения участков по явке приобретёт «ненормальный» вид с «горбами» и пиками.

4) Наконец, в-четвёртых, предположение, что процент голосов за каждого из кандидатов действительно всегда независим от явки является, мягко говоря, спорным. Оно подразумевает, что каждый из пришедших к урне одинаково активен и политически сознателен, т.е. явился туда потому, что разделяет взгляды одного из кандидатов.[17] Это ещё более-менее работает для относительно однородных участков города Пскова, но уже не работает для сельских (особенно мелких) и участков «особого типа».

Более того, ряд граждан попробовали применить эту методику к результатам выборов в немецкий Бундестаг 2002 года, израильский Кнессет 2009 года, парламент Великобритании 2010 года и – о чудо! – там тоже выявились массовые фальсификации. Очевидно, Великобритания, Германия и Израиль более не соответствуют высоким стандартам демократии! Нужно срочно провести погром с требованием ликвидации английской монархии и отстваки Меркель и Переса!

Таким образом, мы можем заключить, что имеем дело с методикой, специально сконструированной для того, чтобы даже на заведомо более-менее достоверном материале показать «вбросы» и «массовые фальсификации».

Примечания:

[1] Рукопожатную книжку этих авторов (Собянин, кстати, не тот), рассказывающую, как злобные коммуняки в 1993 году отобрали все голоса у «Демократического выбора России» и подбросили их ЛДПР, можно почитать на сайте Института прав человека. Для тех, кому не хочется вот так вот сразу нырять в мутный поток правозащитного сознания, краткую выжимку разместили на сайте ассоциации «Голос».

[2] Точнее, как раз понятно, почему: большинство блогеров, анализирующих фальсификации, использует примеры из статей Сергея Шпилькина потому, что познакомилось с методикой посредством его статей. А уж о том, чтобы к выборам данная методика стала известна многим позаботились наша «оппозиционная» (Газета.ру, «Независимая газета», «Эхо Москвы», ассоциация «Голос» и даже официальный сайт КПРФ) и «респектабельная» (например, журнал «Эсквайр», «Троицкий вариант», «Голос ислама» и куча других) пресса.

[3] Ирония ситуации заключается в том, что в украинском сегменте Интернета по ровно тому же графику распределения участков по явке ровно теми же методами доказываются, наоборот, адские фальсификации на этих выборах. См., например, тут.

[4] Спасибо Свободе и Рынку, из-за них наша область за 20 лет «похудела» почти на четверть. Прошу, тем не менее, обратить на число избирателей особое внимание: согласно данным последней переписи на территории Псковской области проживало около 598000 человек электорального возраста, в списки же избирателей их внесено на 17000 меньше. Если сравнить число избирателей на городских и сельских участках и данные Переписи 2010 года по городской и сельской местности, то окажется, что большaя часть этих неучтённых избирателей приходится на сельскую местность.

[5] Используя этот математический термин для обозначения гауссианы, разоблачители фальсификаций играют на оттенках значения слова нормальный в обычной речи, смешивая нормальный 'обычный, распространённый' и нормальный 'предписанный, правильный'.

[6] Подробнее хотя бы в том же «Эсквайре».

[7] Данные о местоположении избирательных участков и обслуживаемой ими территории можно скачать вот тут.

[8] УИК № 28, расположенный в Корытово на улице Яна Райниса, приводит меня в замешательство: никак не могу вспомнить, что там такое могло бы дать высокую явку. В том районе два коттеджных посёлка (побогаче и победнее), Зеленхоз, оптовые склады, кладбище. Разве что туда водили голосовать солдат с расположенного неподалёку стрельбища?

[9] Сельское население Псковской области более возрастное, чем городское. Так, если в городах пенсионеры составляют около 26 % от всего населения электорального возраста, то на селе – почти 37 %. При этом если среди людей «рабочего» возраста соотношение женщин и мужчин почти 1:1, то среди пенсионеров доминируют (в соотношении 3:1) женщины. Подробнее: Возрастно-половой состав населения по районам Псковской области. 2010: Статистический сборник. – Псков, 2010.

[10] С удивлением обнаружил, что один из древнейших русских городов в материалах ТИК проходит именно как деревня – даже не посёлок или село.

[11] Обращаю ваше внимание, что статья 32 Конституции РФ и ФЗ-51 гарантируют право на прямое свободное тайное волеизъявление на выборах, про свободу не участвовать там нет ни слова :)

[12] Тут есть ещё один момент, осложняющий расчёт явки. Как мы уже говорили ранее, основная часть «недоучёта» в 17000 потенциальных избирателей приходится на сельскую местность (а это почти 10 % сельского населения). Если часть из них была добавлена в избирательные списки уже по ходу голосования, это могло немного завысить явку.

[13] Вообще, интересная тенденция: чем в более богатом регионе и в более респектабельном и благополучном районе расположен участок, тем на нём больше электората (но всё равно в пределах 5-7 %, конечно) выбирает Гришу Явлинского – сказывается оторванность от народа-то :)

[14] Нужно ли объяснять, что сделал я это не только и не столько из политических симпатий. Просто это самая крупная политическая организация в нашей области (после, конечно, сами знаете какой партии :), и у неё имелись силы и средства направить наблюдателей на каждый избирательный участок.

[15] Снова обращаю внимание: не по выборам в областное собрание (по которым они судятся с великолукскими депутатами-единороссами), а именно по выборам в Госдуму VI созыва.

[16] Для не совсем внимательно прочитавших вся статью вновь обращаю внимание и всячески подчёркиваю: в данном случае речь идёт только и исключительно о рассматриваемом материале – т.е. о результатах голосования на избирательных участках Псковской области, не других регионов, и не России в целом.

[17] Сергей Шпилькин и сам сомнительность предположения видит. Вот, например, он пишет в журнале «Эсквайр»: «возможно, электорат всех партий, кроме «Единой России», ходит на выборы активно и голосует в полном составе уже при невысокой явке, а те, кто поддерживают единороссов, ходят на выборы неохотно, и их активность варьирует в широком диапазоне, влияя на явку». Потом, правда, со смехом отметает данное предположение как абсурдное и утверждает, что иных объяснений, кроме «вброса» – нет.