чтоб в комментах не пропало
May. 11th, 2014 07:26 pm![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Есть прекрасная байка про статистику: на экзамене студентам дают таблицу с двумя столбиками данных: поголовье аистов в деревне Гадюкино и рождаемость в ней же. Взаимосвязь по формулам просчитывается как сильная. Тем, кто напишут, что есть корреляция между этими двумя показателями - ставят двойку.
Потому что корреляция - это когда, изменение одного фактора ведет за собой изменение другого. При явно совпадающих показателях, корреляция между которыми противоречит здравому смыслу, стоит посмотреть не зависят ли они от какого-то общего фактора. В приведенном примере таблица была корректной: аисты гнездятся на крышах. Появлялась в деревне новая изба - появлялось на ней гнездо, увеличивалось поголовье аистов, а вскоре и дети начинали рождаться, ведь. чем больше семей - тем выше рождаемость.
Потому что корреляция - это когда, изменение одного фактора ведет за собой изменение другого. При явно совпадающих показателях, корреляция между которыми противоречит здравому смыслу, стоит посмотреть не зависят ли они от какого-то общего фактора. В приведенном примере таблица была корректной: аисты гнездятся на крышах. Появлялась в деревне новая изба - появлялось на ней гнездо, увеличивалось поголовье аистов, а вскоре и дети начинали рождаться, ведь. чем больше семей - тем выше рождаемость.
no subject
Date: 2014-05-11 03:38 pm (UTC)> В мире ж нынче столько всего происходит, что получить похоже изменяющиеся ряды данных достаточно просто, что-нибудь с чем-нибудь уж точно будет коррелировать по твоему определению, нельзя же говорить, что это взаимосвязанные величины? Или можно?
Твое заблуждение, как я подозреваю, состоит в том, что ты придаешь неоправданно сакральное значение словам "стат. взаимосвязь". На самом деле в устах математика оно не означает взаимосвязи в мирском/бытовом смысле слова. Так, напр. кривые среднегодовых температур планеты и атак пиратов действительно демонстрируют более-менее сопадающий тренд верх. Соотв. налицо весьма высокая корелляция этих величин и стат. взаимосвязь их же. Только, говоря это, математик имеет в виду лишь что кривые вместе растут/падают или наоборот в той или иной степени. Ничего более. Никаких далеко идущих выводов о реально существующей технической взаимосвязи глоб. потепления и пиратства из этого не следует.
> Вот здесь http://mi3ch.livejournal.com/2559227.html как правильно говорить: корреляция есть?
Коэффициент корелляции - это число от -1 до 1. Точно так же, как коэфф. IQ - число от 0 до 100. Ложные или истинные могут быть воображаемые причинности между величинами. Поэтому говорить есть/нет вообще некорректно, ведь он же сука всегда есть! Правильно говорить так: коэфф. корелляции между А и Б составляет 0.76 или хотя бы "коэф. корр. существенно выше/ниже нуля".
Митрич - гуманитарий и поэтому название его поста математически бессмысленно. Правильно было бы назвать его "ложные причинности".
no subject
Date: 2014-05-11 03:43 pm (UTC)Наверное, я просто запомнила, что мы писали "коэфф корреляции такой-то, взаимосвязи нет"... боюсь, преподавателя уже не спросить.
Спасибо, в-общем.
no subject
Date: 2014-05-11 03:54 pm (UTC)