Entry tags:
чтоб в комментах не пропало
Есть прекрасная байка про статистику: на экзамене студентам дают таблицу с двумя столбиками данных: поголовье аистов в деревне Гадюкино и рождаемость в ней же. Взаимосвязь по формулам просчитывается как сильная. Тем, кто напишут, что есть корреляция между этими двумя показателями - ставят двойку.
Потому что корреляция - это когда, изменение одного фактора ведет за собой изменение другого. При явно совпадающих показателях, корреляция между которыми противоречит здравому смыслу, стоит посмотреть не зависят ли они от какого-то общего фактора. В приведенном примере таблица была корректной: аисты гнездятся на крышах. Появлялась в деревне новая изба - появлялось на ней гнездо, увеличивалось поголовье аистов, а вскоре и дети начинали рождаться, ведь. чем больше семей - тем выше рождаемость.
Потому что корреляция - это когда, изменение одного фактора ведет за собой изменение другого. При явно совпадающих показателях, корреляция между которыми противоречит здравому смыслу, стоит посмотреть не зависят ли они от какого-то общего фактора. В приведенном примере таблица была корректной: аисты гнездятся на крышах. Появлялась в деревне новая изба - появлялось на ней гнездо, увеличивалось поголовье аистов, а вскоре и дети начинали рождаться, ведь. чем больше семей - тем выше рождаемость.
no subject
Корреляция - это зависимость между двумя случайными событиями, которая проявляется в том, что условная вероятность одного из них при наступлении другого отличается от безусловной вероятности.
Я попыталась изложить такое своими словами - получилось плохо. Корреляция - это в первую очередь взаимосвязь именно между двумя событиями, когда изменение одной величины закономерно приводит и к изменению другой. Закономерно.
no subject
Значительная корреляция между двумя случайными величинами всегда является свидетельством существования некоторой статистической связи в данной выборке, но эта связь не обязательно должна наблюдаться для другой выборки и иметь причинно-следственный характер. Часто заманчивая простота корреляционного исследования подталкивает исследователя делать ложные интуитивные выводы о наличии причинно-следственной связи между парами признаков, в то время как коэффициенты корреляции устанавливают лишь статистические взаимосвязи.
no subject
Опять таки про аистов: что, изменение поголовья аистов закономерно приведет к изменению рождаемости в конкретной деревне Гадюкино, по которой мы статистику рассматриваем?
no subject
Математических оснований для такого вывода нет. Основанием для него было бы доказательство наличия причинно-следственной связи. Но корелляция в описанном случае тем не менее самая настоящая, а приведенная в посте байка правдоподобна лишь для гуманитариев.
no subject
Так если ты не видел математического определения этого понятия, чего ж ты мне ссылку на вики даешь, ге оно упоминается?
А что, математики имеют дело с голыми рядами цифр? У нас все задачи на статистику были с описанием. И такие штучки вроде тех аистов тоже были, вроде трех-четырех рядов вроде: доходы населения по региону, количество населения, рост цен, объем товарооборота по разным группам товаров. Нужно было смотреть, что с чем коррелирует, именно проверяя ряды здравым смыслом, конечная цель этого вроде как была такая, что если корреляции между покупкой соли и ростом доходов не было, то при росте доходов в регион больше соли завозить не надо, а нужно при росте населения, с которым коррелирует, а вот золото и ковры нужно завозить пропорционально и росту доходов, и росту населения. В-общем, просто посчитать по формуле ряды цифр было точно недостаточно для решения задачи.
no subject
Да, имеют. Потому что здравый смысл субъективен, а цифры - объективны.
Не воспринимай сказанное мной как личную нападку, но в описанном в посте примере налицо именно корелляция, независимо от какие задачи про соли ты решала ранее. Дискуссию на этом прекращаю за бесперспективностью, если не убедил - спрашивай у математиков.
no subject
В мире ж нынче столько всего происходит, что получить похоже изменяющиеся ряды данных достаточно просто, что-нибудь с чем-нибудь уж точно будет коррелировать по твоему определению, нельзя же говорить, что это взаимосвязанные величины? Или можно?
Вот здесь http://mi3ch.livejournal.com/2559227.html как правильно говорить: корреляция есть?
Я не буду спорить,я уточнить хочу!
no subject
> В мире ж нынче столько всего происходит, что получить похоже изменяющиеся ряды данных достаточно просто, что-нибудь с чем-нибудь уж точно будет коррелировать по твоему определению, нельзя же говорить, что это взаимосвязанные величины? Или можно?
Твое заблуждение, как я подозреваю, состоит в том, что ты придаешь неоправданно сакральное значение словам "стат. взаимосвязь". На самом деле в устах математика оно не означает взаимосвязи в мирском/бытовом смысле слова. Так, напр. кривые среднегодовых температур планеты и атак пиратов действительно демонстрируют более-менее сопадающий тренд верх. Соотв. налицо весьма высокая корелляция этих величин и стат. взаимосвязь их же. Только, говоря это, математик имеет в виду лишь что кривые вместе растут/падают или наоборот в той или иной степени. Ничего более. Никаких далеко идущих выводов о реально существующей технической взаимосвязи глоб. потепления и пиратства из этого не следует.
> Вот здесь http://mi3ch.livejournal.com/2559227.html как правильно говорить: корреляция есть?
Коэффициент корелляции - это число от -1 до 1. Точно так же, как коэфф. IQ - число от 0 до 100. Ложные или истинные могут быть воображаемые причинности между величинами. Поэтому говорить есть/нет вообще некорректно, ведь он же сука всегда есть! Правильно говорить так: коэфф. корелляции между А и Б составляет 0.76 или хотя бы "коэф. корр. существенно выше/ниже нуля".
Митрич - гуманитарий и поэтому название его поста математически бессмысленно. Правильно было бы назвать его "ложные причинности".
no subject
Наверное, я просто запомнила, что мы писали "коэфф корреляции такой-то, взаимосвязи нет"... боюсь, преподавателя уже не спросить.
Спасибо, в-общем.
no subject