fair_lady: (smile)
[personal profile] fair_lady
Есть прекрасная байка про статистику: на экзамене студентам дают таблицу с двумя столбиками данных: поголовье аистов в деревне Гадюкино и рождаемость в ней же. Взаимосвязь по формулам просчитывается как сильная. Тем, кто напишут, что есть корреляция между этими двумя показателями - ставят двойку.
Потому что корреляция - это когда, изменение одного фактора ведет за собой изменение другого. При явно совпадающих показателях, корреляция между которыми противоречит здравому смыслу, стоит посмотреть не зависят ли они от какого-то общего фактора. В приведенном примере таблица была корректной: аисты гнездятся на крышах. Появлялась в деревне новая изба - появлялось на ней гнездо, увеличивалось поголовье аистов, а вскоре и дети начинали рождаться, ведь. чем больше семей - тем выше рождаемость.

Date: 2014-05-11 09:21 am (UTC)
andrzejn: (Default)
From: [personal profile] andrzejn
Погоди, а разве корреляция - это не наличие взаимосвязи по формулам? Другое дело, что корреляция ещё не означает причинной связи между параметрами.

Date: 2014-05-11 12:27 pm (UTC)
From: [identity profile] fair-lady.livejournal.com
В случае, если изменение одной случайной величины не ведёт к закономерному изменению другой случайной величины, но приводит к изменению другой статистической характеристики данной случайной величины, то подобная связь не считается корреляционной, хотя и является статистической

Date: 2014-05-11 10:19 am (UTC)
From: [identity profile] bibehb.livejournal.com
Корреляция - это сугубо математическое понятие, абстракция, если угодно. Именно, что зависимость между двумя столбиками цифр.
Опять же, нельзя сказать "есть корреляция" или "нет корреляции". Корреляция всегда есть.

Только корреляция - это, как я уже сказал, математическая абстракция. Если коэффициент корреляции близок (по модулю) к 1, то между двумя колонками есть зависимость. Если близок к 0, то зависимости нет. Все просто.

PS. Пример с аистами - очень хороший, эталонный, я бы сказал.

Date: 2014-05-11 12:26 pm (UTC)
From: [identity profile] fair-lady.livejournal.com
В случае, если изменение одной случайной величины не ведёт к закономерному изменению другой случайной величины, но приводит к изменению другой статистической характеристики данной случайной величины, то подобная связь не считается корреляционной, хотя и является статистической

Date: 2014-05-12 12:24 am (UTC)
From: [identity profile] don-sera.livejournal.com
> Опять же, нельзя сказать "есть корреляция" или "нет корреляции". Корреляция всегда есть.

Мудры были те люди, Биб, которые тебе диплом о высшем образовании не дали ))))

Date: 2014-05-11 11:10 am (UTC)
From: [identity profile] zloradskij.livejournal.com
>Потому что корреляция - это когда, изменение одного фактора ведет за собой изменение другого.

неа, корелляция - это корелляция. а то, что ты сказала - каузация.

Date: 2014-05-11 12:26 pm (UTC)
From: [identity profile] fair-lady.livejournal.com
В случае, если изменение одной случайной величины не ведёт к закономерному изменению другой случайной величины, но приводит к изменению другой статистической характеристики данной случайной величины, то подобная связь не считается корреляционной, хотя и является статистической

Я вот это имела в виду, мне кажется, что я просто другими словами написала?

Date: 2014-05-11 12:59 pm (UTC)
From: [identity profile] zloradskij.livejournal.com
Приведенная тобой цитата оговаривает случай, когда изменение величины А не связано с величиной Б, но приводит к изменению другой статистической характеристики данной случайной величины. Т.е. изменение А вызывает изменение не значения Б, a напр, дисперсии Б.

Если А и Б (аисты и рождаемость) изменяются вместе, то налицо корелляция, независимо от причинно-следственных связей между ними.

Прич-след связи между величинами определяются спец. стат. методами, ни в коем случае корелляцией, а напр. Причинность_по_Грэнджеру
Edited Date: 2014-05-11 01:05 pm (UTC)

Date: 2014-05-11 01:31 pm (UTC)
From: [identity profile] fair-lady.livejournal.com
Вот ты сам понял, что написал? То есть, изменение поголовья аистов приведет к изменению рождаемости по-твоему?
Корреляция - это зависимость между двумя случайными событиями, которая проявляется в том, что условная вероятность одного из них при наступлении другого отличается от безусловной вероятности.
Я попыталась изложить такое своими словами - получилось плохо. Корреляция - это в первую очередь взаимосвязь именно между двумя событиями, когда изменение одной величины закономерно приводит и к изменению другой. Закономерно.

Date: 2014-05-11 01:45 pm (UTC)
From: [identity profile] fair-lady.livejournal.com
Я уже сказала, что неверно выразилась про причинно-следственный характер!!! Но закономерное изменение одной величины при изменении другой таки предполагает, что в данной выборке взаимосвязь есть.

Опять таки про аистов: что, изменение поголовья аистов закономерно приведет к изменению рождаемости в конкретной деревне Гадюкино, по которой мы статистику рассматриваем?

Date: 2014-05-11 02:01 pm (UTC)
From: [identity profile] zloradskij.livejournal.com
Математического определения понятия "закономерно" я не видел, а какой бытовой смысл ему ты придаешь, я не знаю.

Математических оснований для такого вывода нет. Основанием для него было бы доказательство наличия причинно-следственной связи. Но корелляция в описанном случае тем не менее самая настоящая, а приведенная в посте байка правдоподобна лишь для гуманитариев.

Date: 2014-05-11 02:41 pm (UTC)
From: [identity profile] fair-lady.livejournal.com
Я экономист. Нас таки на народное хозяйство готовили. Кстати, поплавок у меня инженерный. )))

Так если ты не видел математического определения этого понятия, чего ж ты мне ссылку на вики даешь, ге оно упоминается?

А что, математики имеют дело с голыми рядами цифр? У нас все задачи на статистику были с описанием. И такие штучки вроде тех аистов тоже были, вроде трех-четырех рядов вроде: доходы населения по региону, количество населения, рост цен, объем товарооборота по разным группам товаров. Нужно было смотреть, что с чем коррелирует, именно проверяя ряды здравым смыслом, конечная цель этого вроде как была такая, что если корреляции между покупкой соли и ростом доходов не было, то при росте доходов в регион больше соли завозить не надо, а нужно при росте населения, с которым коррелирует, а вот золото и ковры нужно завозить пропорционально и росту доходов, и росту населения. В-общем, просто посчитать по формуле ряды цифр было точно недостаточно для решения задачи.

Date: 2014-05-11 02:53 pm (UTC)
From: [identity profile] zloradskij.livejournal.com
Там в вики еще слово "пожар" упоминается, только его мат. определения я не видел.

Да, имеют. Потому что здравый смысл субъективен, а цифры - объективны.

Не воспринимай сказанное мной как личную нападку, но в описанном в посте примере налицо именно корелляция, независимо от какие задачи про соли ты решала ранее. Дискуссию на этом прекращаю за бесперспективностью, если не убедил - спрашивай у математиков.

Date: 2014-05-11 03:05 pm (UTC)
From: [identity profile] fair-lady.livejournal.com
А ты мне ещё таки скажи не в порядке дискуссии, а в порядке общего развития, математики вот эти корреляции вообще без названий обсчитывают? Потому что зачем они тогда?
В мире ж нынче столько всего происходит, что получить похоже изменяющиеся ряды данных достаточно просто, что-нибудь с чем-нибудь уж точно будет коррелировать по твоему определению, нельзя же говорить, что это взаимосвязанные величины? Или можно?
Вот здесь http://mi3ch.livejournal.com/2559227.html как правильно говорить: корреляция есть?
Я не буду спорить,я уточнить хочу!

Date: 2014-05-11 03:38 pm (UTC)
From: [identity profile] zloradskij.livejournal.com
Все, что кроме цифр - это уже не статистика, а интерпретация статистики и соотв. есть работа аналитика, а не математика. Вот он уже может и даже обязан уместно привносить в выкладки то, что его научили считать адекватным здравым смыслом.

> В мире ж нынче столько всего происходит, что получить похоже изменяющиеся ряды данных достаточно просто, что-нибудь с чем-нибудь уж точно будет коррелировать по твоему определению, нельзя же говорить, что это взаимосвязанные величины? Или можно?

Твое заблуждение, как я подозреваю, состоит в том, что ты придаешь неоправданно сакральное значение словам "стат. взаимосвязь". На самом деле в устах математика оно не означает взаимосвязи в мирском/бытовом смысле слова. Так, напр. кривые среднегодовых температур планеты и атак пиратов действительно демонстрируют более-менее сопадающий тренд верх. Соотв. налицо весьма высокая корелляция этих величин и стат. взаимосвязь их же. Только, говоря это, математик имеет в виду лишь что кривые вместе растут/падают или наоборот в той или иной степени. Ничего более. Никаких далеко идущих выводов о реально существующей технической взаимосвязи глоб. потепления и пиратства из этого не следует.

> Вот здесь http://mi3ch.livejournal.com/2559227.html как правильно говорить: корреляция есть?

Коэффициент корелляции - это число от -1 до 1. Точно так же, как коэфф. IQ - число от 0 до 100. Ложные или истинные могут быть воображаемые причинности между величинами. Поэтому говорить есть/нет вообще некорректно, ведь он же сука всегда есть! Правильно говорить так: коэфф. корелляции между А и Б составляет 0.76 или хотя бы "коэф. корр. существенно выше/ниже нуля".
Митрич - гуманитарий и поэтому название его поста математически бессмысленно. Правильно было бы назвать его "ложные причинности".

Date: 2014-05-11 03:43 pm (UTC)
From: [identity profile] fair-lady.livejournal.com
Не любишь ты гуманитариев.... да помню я про тот коэффициент, просто опять же мне запомнилось, что слабая корреляция - это не корреляция.
Наверное, я просто запомнила, что мы писали "коэфф корреляции такой-то, взаимосвязи нет"... боюсь, преподавателя уже не спросить.
Спасибо, в-общем.

Date: 2014-05-11 03:54 pm (UTC)
From: [identity profile] zloradskij.livejournal.com
Очень даже люблю и ценю! В рамках своих компетенций гуманитарии незаменимы. Особенно в области искусств и культуры, важнейшими отраслями каковой обоснованно считаются тяжелый металл, кулинария и стриптиз.

Date: 2014-05-11 02:51 pm (UTC)
From: [identity profile] anatol-olegych.livejournal.com
По-русски в википедии этой статьи нет, но вот ссылка на англ:

http://en.wikipedia.org/wiki/Spurious_relationship

Там как раз в качестве spurious correlation приводится соотношение между аистами и рождаемостью. Важный пункт -- это именно таки корреляция.

Date: 2014-05-11 03:10 pm (UTC)
From: [identity profile] fair-lady.livejournal.com
Так может быть в русском варианте ложная корреляция как раз интерпретируется как "нет корреляции"? Особенно в предмете "статистика народного хозяйства"? Потому что я точно помню, что у нас были задачи именно на вот такие явные, но ложные корреляции, мы считали, что коэффициент корреляции высокий, но взаимосвязи нет.

Date: 2014-05-11 03:23 pm (UTC)
From: [identity profile] anatol-olegych.livejournal.com
Вот другая англ заметка -- как раз из ВУЗа:
http://pignottia.faculty.mjc.edu/math134/classnotes/storks.pdf
Там подчеркивается наличие сильной положительной корреляции между аистами и младенцами

Spurious или нет -- это другое дело. Но корреляция.

Что по-русски другая терминология -- может быть, хотя такая большая разнмца все же удивительна.

Date: 2014-05-11 03:27 pm (UTC)
From: [identity profile] fair-lady.livejournal.com
Вот даже не знаю, либо это опять параллельная вселенная (ложная память), либо у нас в вузе всё так упростили ((( Либо я автоматически перевела обратно и то, то мы писали "взаимосвязи нет" расценила как "корреляции нет" ((((

Date: 2014-05-11 03:17 pm (UTC)
From: [identity profile] fair-lady.livejournal.com
Не справилась я с английской статьей (((( Уловила, что с аистами в моей редакции звучит лучше )))

Date: 2014-05-12 12:19 am (UTC)
From: [identity profile] don-sera.livejournal.com
Видела уже? http://mi3ch.livejournal.com/2559227.html

"количество людей, утонувших в бассейне
и количество фильмов, в которых снимался Николас Кейдж"

и т.д.

upd а, вижу, что видела ))
Edited Date: 2014-05-12 12:26 am (UTC)

Date: 2014-05-12 01:23 am (UTC)
From: [identity profile] fair-lady.livejournal.com
Да оттуда и вытащила.

Из учебника по статистике.

Date: 2014-05-12 12:39 am (UTC)
From: [identity profile] don-sera.livejournal.com
"Основываясь на коэффициентах корреляции, вы не можете строго доказать причинной зависимости между переменными однако можете определить ложные корреляции, т.е. корреляции, которые обусловлены влияниями "других", остающихся вне вашего поля зрения переменных.

Лучше всего понять ложные корреляции на простом примере. Известно, что существует корреляция между ущербом, причиненным пожаром, и числом пожарных, тушивших пожар. Однако эта корреляция ничего не говорит о том, насколько уменьшатся потери, если будет вызвано меньше число пожарных. Причина в том, что имеется третья переменная (начальный размер пожара), которая влияет как на причиненный ущерб, так и на число вызванных пожарных. Если вы будете "контролировать" эту переменную (например, рассматривать только пожары определенной величины), то исходная корреляция (между ущербом и числом пожарных) либо исчезнет, либо, возможно, даже изменит свой знак.

Основная проблема ложной корреляции состоит в том, что вы не знаете, кто является ее агентом. Тем не менее, если вы знаете, где искать, то можно воспользоваться частные корреляции, чтобы контролировать (частично исключенное) влияние определенных переменных".


"Вообще говоря, конечная цель всякого исследования или научного анализа состоит в нахождение связей (зависимостей) между переменными. Философия науки учит, что не существует иного способа представления знания, кроме как в терминах зависимостей между количествами или качествами, выраженными какими-либо переменными.

Таким образом, развитие науки всегда заключается в нахождении новых связей между переменными. Исследование корреляций по существу состоит в измерении таких зависимостей непосредственным образом."

Date: 2014-05-12 01:27 am (UTC)
From: [identity profile] fair-lady.livejournal.com
Чего-то я точно помню, что у нас на вот именно на этот пункт напирали, а вон истинный математик в комментах выше пишет, что они до практики не опускались, посчитали коэффициент корреляции между обезличенными рядами цифр - и хватит.
Page generated Jul. 5th, 2025 08:59 am
Powered by Dreamwidth Studios