чтоб в комментах не пропало
May. 11th, 2014 07:26 pm![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Есть прекрасная байка про статистику: на экзамене студентам дают таблицу с двумя столбиками данных: поголовье аистов в деревне Гадюкино и рождаемость в ней же. Взаимосвязь по формулам просчитывается как сильная. Тем, кто напишут, что есть корреляция между этими двумя показателями - ставят двойку.
Потому что корреляция - это когда, изменение одного фактора ведет за собой изменение другого. При явно совпадающих показателях, корреляция между которыми противоречит здравому смыслу, стоит посмотреть не зависят ли они от какого-то общего фактора. В приведенном примере таблица была корректной: аисты гнездятся на крышах. Появлялась в деревне новая изба - появлялось на ней гнездо, увеличивалось поголовье аистов, а вскоре и дети начинали рождаться, ведь. чем больше семей - тем выше рождаемость.
Потому что корреляция - это когда, изменение одного фактора ведет за собой изменение другого. При явно совпадающих показателях, корреляция между которыми противоречит здравому смыслу, стоит посмотреть не зависят ли они от какого-то общего фактора. В приведенном примере таблица была корректной: аисты гнездятся на крышах. Появлялась в деревне новая изба - появлялось на ней гнездо, увеличивалось поголовье аистов, а вскоре и дети начинали рождаться, ведь. чем больше семей - тем выше рождаемость.
no subject
Date: 2014-05-11 10:19 am (UTC)Опять же, нельзя сказать "есть корреляция" или "нет корреляции". Корреляция всегда есть.
Только корреляция - это, как я уже сказал, математическая абстракция. Если коэффициент корреляции близок (по модулю) к 1, то между двумя колонками есть зависимость. Если близок к 0, то зависимости нет. Все просто.
PS. Пример с аистами - очень хороший, эталонный, я бы сказал.
no subject
Date: 2014-05-11 12:26 pm (UTC)no subject
Date: 2014-05-12 12:24 am (UTC)Мудры были те люди, Биб, которые тебе диплом о высшем образовании не дали ))))