KARTz.RU
кушаешь морковь – встанет вновь и вновь

Про статистику и вбросы

Декабрь 10th, 2011


Сейчас многие, в том числе Лёня Каганов, изучают картины распределения голосов по участкам и оценивают корреляции голосов и явки.

Меня немного смутила Лёнина формулировка «это как раз доказано уже сто лет математикой и мировым опытом, учите матчасть». Готов поспорить, никто не внял совету и матчасть учить не побежал. При обсуждении поднялись разговоры о точной науке и прочее…

Центральную предельную теорему мы изучали на третьем курсе. То есть граждане до 20 лет её не знают, а старше 20 лет её знают… от силы пара процентов.

Большинство же обывателей, увидев, скажут: «Нормальное такое распределение».

По физике: есть ряд теорий, которые в области малых и средних энергий приводят к одинаковым результатам (хотя результаты не всегда однозначно интерпретируются), но существенно расходятся в области высоких энергий. Получается, что все эти теории бездоказательны. Вот очкастые дядьки от бессилия и гоняют протоны по кругу в коллайдере. Для расчёта водопровода подходит почти любая теория. Но они, кроме всего прочего, предполагают немного разное развитие событий через десяток миллиардов лет. Например, если вселенная расширяется с ускорением, то её ожидает неминуемый пипец, даже если кому-то удастся улететь от взорвавшегося солнца. Так что про какое-то однозначное отражение природы говорить тут нельзя.

По математике: тоже есть проблемы. Можно напомнить о теоремах Геделя, но упонимание их всуе – это дурной тон. Вместо этого порекламирую один бложек, автор которого говорит «слово «очевидно» означает «могу доказать за 30 секунд»» my-tribune.blogspot.com Это в тему строгих обоснований, телефактов и Малахова, по аналогии «всем известно» должно означать «найду достоверный источник за 30 секунд».

Не обещая попробую сам выкачать данные с изберкома и проверить их на соответствие центральной предельной теореме. Хотя я уже писал в своём уютном бложике довольно грубую оценку происходящего:

«Не хочу делать никаких скоропалительных выводов, но как математик скажу, что вероятность возникновения такой картины распределения голосов без вброса нескольких миллионов «правильных» бюллетеней примерно такая же, как вероятность самопроизвольного зарождения жизни из неживой материи. Вот только жизнь зародилась 1 раз за 13 миллиардов лет, а такая картина с голосами возникает каждые 2 года.»


Filed under: Без рубрики | Метки: ,
Декабрь 10th, 2011 23:20:47

Похожие посты:
7 comments

admin
11/12/2011

А я не математик. Но математикой мне ебли мозг пять лет. ?? центральными предельными теоремами – тоже.
?? глядя на график, лично я не могу сказать с ходу – сфальсифицированы выборы или нет, а главное, не могу доказать. Я очень рада, что вы поняли, что именно я имею в виду))))) Более того, этого не в состоянии сходу доказать Н?? ОД??Н известный мне математик. Как минимум, пока не выкачает данные ??зибиркома …. и бла бла бла. ?? совершенно очевидно, что сам график по себе действительно ничего не доказывает. (обратите внимание, я пишу НЕ увидеть, НЕ сделать вывод, НЕ предположить, а ДОКАЗАТЬ, понимаете?)
Но Леня у нас может все. Вести программу по скаченной из инета бумажке, писать у себя в блоге, что нас пожрет антиматерия из коллайдера и, наконец, высокомерно плодить заявления про гауссово распределение, не приведя ни единого доказательства. Почему? А потому, что он НЕ МОЖЕТ. Мог бы – сел бы, да посчитал.
Вот с таким же П??ЗДОБОЛЬСТВОМ, тупостью и высокомерием я столкнулась несколько лет назад. Хорошо, я узнала заголовок текста, который сама же и дала и была готова к этой тупости, от чего Леня и разнервничался.
Можно сколько угодно кидаться друг в друга ссылками на вики. Приятно, наконец, читать, Ваши собственные мысли) Удивлена) ?? рада)
С удовольствием посмотрю Ваши рассчеты)))) Честно)
?? респект за инициативы там…))))


admin
11/12/2011

Строго доказать (как и опровергуть) факт вброса/приписок по статистическим данным нельзя. Это примерно как утверждать, что яркая точка на фотографии ночного неба – это чайник Рассела. Есть некая вероятность, что это именно чайник, а не битый пиксел и не выбросы отходов жизнедеятельности с МКС, эта вероятность существенно зависит от множества факторов. ?? обратная задача не всегда имеет единственное решение, так что 100% бывает только в редких случаях. Вот эту вероятность можно оценить с определённой погрешностью. А о доказательсте речи не идёт.

Что касается Лёни, вот эта картинка отлично иллюстрирует его методы kuryokhin02su1.jpg

?? для балланса надо что-то глупое сказать: гыгы, не особо надеялся, что кто-то осилит.


admin
11/12/2011

Когда человек делает выбор, то на этот выбор можно влиять. Как специалист в области социологии (круто и вовремя ввернул), можно легко представить, что даже не подделывая биллютени, можно существенно влиять на результаты. Я еще раз говорю, что я не утверждаю, что фальсификации не было, я говорю, что обыкновенную теорию вероятности под сознательный выбор (а тем более выбор под давлением) нельзя с уверенностью применять. Что, если монетку подбрасывает фокусник с поставленной рукой, где даже при большой выборке вероятность перестает быть 50/50.
Еще один недостаток данного графика, с моей точки зрения, это то что он указывает % голосов, а не их количество. Приблизительно количество У??К (на память) составляло 95000+. ??з графика мы можем проследить, что приблизительно в 5000 У??К результат составил от 90% до 100%. Но если предположить, что в отличии от других, на этих У??К было зарегистрировано по 5 человек избирателей (жители крайнего севера, уделенные армейские части и подразделения) и их работа и доход напрямую завистят от партии власти, то так ли удивителен данный выбор?
??мхо, но выборка из количества голосов на количество участков была бы наглядней, чем % соотношение.


admin
12/12/2011

В связи с благоприятным климатом для использования информационного повода, не могу удержаться от беглого психо-лингвистического анализа текста:
1. Мы видим использование в качестве аргумента сомнительной ссылки из не менее сомнительного источника, отличающегося резко толерантным отношением к популизму, а также, весьма толерантым отношением к продвижению в топы рейтигозависимых и абсолютно непрофессиональных людей. Яркий пример тому – Артемий Лебедев. Безусловно, следует не забывать и о гражданине США Алексее Навальном, приобретающим все большую популярность среди неокрепших умов.
2. Откровенно негативная экспрессивная окраска текста, содержащая жаргонизмы (в том числе, мат) в адрес собеседника или оппонента.
3. Ключевые слова-синонимы, как-то: мандавошка, хомяк, идиот в адрес оппонентов.
4. ??спользование тропов в подписях и внутри текста.
5. Небольшое количество напечатанных слов по отношению к обильному количеству цитат.
6. Прием давления, заключающийся в прямых оскорблениях собеседника, скрыто или прямо несогласного с точкой зрения автора.
7. Принцип выстраивания предложений таким образом, чтобы собеседник додумывал ответ. В маркетинге называется зачином. В интернетах – троллингом.
8. Прием Спама (постинг нескольких сообщений подряд, либо ведение монолога в одной теме, не дожидаясь подключения в диалог других собеседников)
9. Типичная претенциозность заявлений, без достаточных знаний по теме и слабость доказательств, обильно заменяемых лингвистически-экспрессивным заявлениями в адрес собеседников.

Данный анализ позволяет мне сделать предположение, что имеет место фальсификация ника, используемого другим пользователем вышеупомянутого форума, отличающимся подобным стилем письма. ??ли же, предположить еще более неприятный вариант: раздвоение личности у субъекта (альтер-эго), требующее автономной реализации на форуме, в качестве поддержки основному. К сожалению, доказать, даже имея одинаковый айпи адрес с обеих ников, эту теорию невозможно.

Теперь надо сказать что-нибудь глупое. Процитирую:
«Высококачественный мастеринг в условиях евроремонта» (с) Данное «гениальное» высказывание авторства как раз того самого субъекта, которого я в раздвоении личности и плодах в виде «странников» и подозреваю))))

по поводу грибов. Курехин, вечная ему память, сам того не подозревая, предсказал эпоху этих идиотов. Жаль, что он шутил. А они – нет.


admin
12/12/2011

«Беглый анализ «научного мнения» Леонида.
??так, рассмотрим поведение самой функции плотности вероятности (которая имеет форму колокола, про которую он говорит).
Что я думаю?
Чтобы ее применять, нужно чтобы как минимум два условия:
1) непрерывность – не выполняется, так как число избирателей конечно, следовательно ни о каких идеальных формах верхушек колокола не может быть и речи в любом случае.
2) равновероятность – тоже не выполняется, из-за того что так уж получилось что Homo Sapiens обладают сознанием.
НО, тем не менее, даже учитывая эти погрешности, то что у ЕДРА нет подобия колокола – это плохой знак, очень плохой, к сожалению.
На первый взгляд, в чем-то он прав.
Если отделиться от терминов этих, я объясняю что это за функция (на физике решали задачки):
У тебя есть замкнутая система, в которой молекулы предоставлены сами себе и беспорядочно движутся. Если ты построишь график, сколько молекул имеют какую-либо скорость, то у тебя получится идеальный колокол (ну при условии что молекул в системе over9000 и она предоставлена сама себе).
Смотрим на наш случай. Понятно, что если брать 2-3 участка в одном городе, то график будет выглядеть, как обычная горизонтальная прямая. Но с увеличением кол-ва рассматриваемых участков будет наблюдаться увеличение разброса, и график постепенно будет становится колоколом. Вопрос: почему этот разброс может не увеличивается? Ответ: либо мало кол-во избирателей, либо система сама себе не предоставлена. 1-ый вариант мы пока не рассматриваем.) Хорошо, система не предоставлена сама себе.
Теперь идут чисто мои размышления, которые к математике отношения не имеют. Получается интересная картина. Если бы рез-ты фальсифицировали на каждом участке, то график все таки был колоколом (ведь разброс бы в таком случае сохранялся, значит чтобы этот колокол испоганить и сделать его прямым, нужно добавлять голоса ТОЛЬКО на тех участках где за едро голосуют неудовлетворительно). ?? это, в принципе, реализовать возможно. Логика-то очевидна: в конце дня после предварительного подсчета, если едро отстает – добавить немного голосов, если на этом участке за едро голосовали нормально – голоса не добавлять (чтобы не казалось подозрительным).
Со 100% уверенностью фальсификацию признать нельзя, конечно же, ведь это все только приближения.
Однако, следует учесть даже в этом приближении, что о спланированной фальсификации в целом по графику судить нельзя. Если она и была, то на отдельных участках.
Бросается красивыми заумными терминами в данной ситуации – тоже не очень хорошо)).
Таковой ситуация покажется на первый взгляд даже человеку, имеющему неплохое образование. ??менно, на первый. ?? именно из-за того, что сбивает с толку Гауссово распределение. Далее.
Допустим у нас мнение по стране касательно Едра очень различно. Например на востоке 100 участков сказали у них 1%, 100 участков сказали 2%,…. 100 участков сказали у них 50% и мы получим эту идеальную прямую горизонтальную. Согласны?
Если фальсифицировать результаты там где голосов мало, то начнет образовывается колокол, так как кол-во участков с данным числом голосов уменьшиться, а кол-во участков с большим числом голосов увеличится.
Поэтому вообще ничего нельзя сказать касательно фальсификации.
График показывает только то, насколько стабильно мнение о партии по стране: идеальный колокол – значит мнение стабильно и везде одинаково
Это одно уравнение с двумя неизвестными: если поймем как распределено мнение по стране («на самом деле») – поймем есть ли фальсификация, и наоборот: если узнаем есть ли фальсификация (другими средствами, разумеется, имея объекивные данные в цифрах) – тогда и поймем правильно ли этот график показывает распределение мнений.
Так что ответить на вопрос этот нельзя никак вообще: либо да, либо нет (равновероятно), данных мало.
Гауссово распределение же только с толку сбивает. У меня оно ассоциируется с частицами из физики – сразу, вроде похоже на нашу ситуацию, но нет, здесь все сложнее. ?? во втором приближении становится ясно, что нельзя сказать однозначно» (с).


admin
12/12/2011

Lu Alex
«Если 2-3 участка взять с одинаковым чилом голосов, то это – всего лишь точка, а не прямая. ?? добавление голосов на тех участках, где их было мало – приведет лишь к обострению колокола, а не к его спрямлению.
Ну суди сама: правая часть графика у тебя отвечает за малочисленност
показать полностью..»Если 2-3 участка взять с одинаковым чилом голосов, то это – всего лишь точка, а не прямая. ?? добавление голосов на тех участках, где их было мало – приведет лишь к обострению колокола, а не к его спрямлению.
Ну суди сама: правая часть графика у тебя отвечает за малочисленность голосов. Если ты там начнешь увеличивать их, будет расти вверх средняя часть графика, а по месту наоборот падать.
Твимс (теория вероятностей и математической статистики) – срашная штука) Там вот так вот вроде бы все очевидно (на что и начинают давить дилетанты от науки, стараясь навязать свою точку зрения неразобравшимся с ходу в вопросе людям), но если присмотреться – все на самом деле по-другому.
Что нужно делать специально, чтобы получить ту «неведомую штуку», именуемую графиком Едра, я не знаю. Самое простое, что можно предположить и чтобы отказаться от всех вопросов, это как раз: все супер, фальсификации нет, просто мнение распределено неравномерно по стране.» (с)


admin
12/12/2011

Я не знаю, кто такой Леня и чем он провинился, ссылку на его жж дала только потому, что в его посте есть ссылки отсылающие к другим записям.
Есть куча примеров графиков из других стран, которым свойственно нормальное распределение. У нас же все через жопу. ?? если стопроцентный результат на большом кол-ве участков можно списать на сизо, пожарные части и подобные организации, то больше всего, конечно, радует «любовь к круглым цифрам».
Я не волшебник, как Чуров, и не могу предсказать как повлияет вся эта ситуация на нашу страну, скорее всего ничего хорошего не предвидится. Но меня радует, что народ вышел. Радует потому, что последние годы у нас развилась полная апатия к голосованию, ведь каждый понимал, что его голос не имеет смысла.

Leave a Reply