Чудеса Корреляции

Знаете ли вы, что чрезмерное употребление воды может привести к беременности, а чрезмерное отопление жилищ — к новому ледниковому периоду?


Сегодня, по случаю юбилея сайта, мы решили раскрыть вам секретный научный метод, с помощью которого вы сможете совершать десятки научных открытий не вставая с дивана (только тссссс, никому ни слова!).

Вот, к примеру, мои свежие научные открытия — десять минут и готово:

— Измерение выборки из 80 кошек показало, что кошки с бо́льшей массой тела имеют бо́льшую длину ушей. Это значит, что 99% массы кошек сосредоточено в ушах, и именно уши определяют массу тела.

— Причина беременности — употребление воды. Я обнаружил, что 100% беременных женщин употребляют воду. Значит, мужчины не беременеют, потому что у них аномалия усвояемости воды.

— Зимой у всех в Москве работает отопление. Значит, отопление способно вызвать в Москве зиму.

Звучит очень даже убедительно.

Метод, который лежит в основе всех трёх умозаключений — не такая уж и редкость, в определённых кругах. Он известен как отожествление корреляции и причинности.

Корреляция — это статистическая взаимосвязь между двумя переменными. Например, вот график из исследования кошачих ушей:

корреляция у кошек

Видно, что длина ушей изменяется вместе с массой тела. Две переменных связаны, и мы можем угадывать одну переменную по другой: скажем, если известно, что у кошки длинные уши, то я могу предположить, что она и весит много — и скорее всего не ошибусь.

Но если я скажу, что масса кошек сосредоточена в ушах, то это будет уже не просто корреляция, а причинность.

Причинность или причинно-следственная связь — частный случай корреляции, при котором связаны не только переменные, но и соответствующие им реальные признаки. Если в случае простой корреляции можно лишь угадывать массу по длине ушей, то при доказанной причинности можно говорить о том, что один признак непосредственно определяет собой другой. Например, если бы масса кошек действительно была бы сосредоточена в ушах, то мы могли бы не только предсказывать массу по ушам, но и контролировать массу, вытягивая кошкам уши.

Но мы с вами знаем, что это невозможно. Переменные длины ушей и массы тела может и связаны, но вот сама масса как физическая величина практически не зависит от ушей. Как и беременность от воды.

Во всех трёх своих «научных» исследованиях я применил один и тот же хитрый ход: я приравнял корреляцию к причинно-следственной связи. Этот ход — настоящий чемпион неправильной интерпретации данных: лучше него псевдонаука ещё не придумала.

Если две переменных взаимосвязаны, это ещё не значит, что один признак непосредственно влияет на другой.
Корреляция ≠ причинность!!!

Наш мозг инстинктивно ищет связи и логические объяснения событий. Когда мы видим связанные переменные, нам сразу хочется связать и признаки, которые под этими переменными скрываются. Когда говорят, что трое школьников, сдавших экзамены на высший бал, едят на завтрак овсяную кашу, нам начинает казаться, что овсянка — ключ к безграничному интеллекту. Когда говорят, что аж четверо из шести лучших актёров мира водят синюю машину, мы начинаем думать, что синий цвет — источник успеха.

Вот только сразу кидаться в продуктовый и сметать с прилавков овсянку не стоит. Мало того, что корреляция может вовсе не означать причинность, так причинностей ещё и существует несколько!

Допустим, есть два признака: высота шапки волшебника, и его магическая сила. Вот график:

корреляция - волшебник

Проще говоря, существует корреляция между высотой шапки и магической силой: чем сильнее волшебник, тем выше его шапка:

Если у Рона Шапка обычной длины, у Гарри - ещё длинее, то у Даблдора она пробивает потолок. А у немага Дадли шапка вообще никакая.

 

Зная корреляцию, мы можем угадывать силу волшебников по высоте их шапки — и наоборот. Но что до реальной взаимосвязи признаков — данный график может в равной степени означать любую из пяти(!) возможных ситуаций:

  1. Прямая причинно-следственная связь
  2. Непрямая причинно-следственная связь
  3. Циклическая, или взаимная причинно-следственная связь
  4. Общая причинно-следственная связь
  5. Корреляция без причинно-следственной связи

Рассмотрим каждый из них подробно:

а) Прямая причинно-следственная связь

Прямая причинность — это когда изменение в одном из коррелирующих признаков приводит к изменению в другом.

Допустим, шляпа волшебника является магической антенной — и чем выше антенна, тем легче волшебнику подключаться к энергии космоса. Признаки взаимосвязаны не только на графике, но и в реальном мире: один из них определяет другой.

Проверка: заменяем шапку на голове волшебника на шапку пониже — магическая сила падает; заменяем на более высокую — сила растёт.

Обратите внимание: прямая причинность может быть и обратной. Допустим, шапка волшебника не определяет его силу — сила наращивается через поедание особых грибов. Но при этом Орден Волшебников требует, чтобы высота шапки соответствовала силе волшебника. В таком случае, сила будет определять высоту шапки.

Проверка: кормим волшебника грибами перед сном. Утром он проснётся и почувствует, что стал в два раза сильнее, и побежит менять шапку. Магическая сила диктует высоту шапки.

А наоборот работать уже не будет: если подрезать ему шапку, то он не станет сильнее (его просто исключат из Ордена за дисциплинарные проступки).

Одна из самых частых ошибок в статистическом анализе — подмена причинности обратной ей. Как в случае с зимой и отоплением: в действительности, зимние морозы вызывают отопление, а не наоборот.

б) Непрямая причинно-следственная связь

Непрямая причинность — это когда первый признак влияет не на второй, а на некий третий, скрытый признак, а уже от третьего признака изменяется второй.

К примеру, от чрезмерной магической силы у волшебников сильнее растёт борода. А Орден требует, чтобы длина шляпы соответствовала длине бороды.

Проверка: кормим волшебника грибами перед сном. За ночь сила волшебника вырастёт, а вместе с ней отрастёт борода. Волшебник проснётся, посмотрится в зеркало, и побежит менять шляпу.

Q: В чём принципиальная разница между непрямой и прямой причинностями?

Разница в том, что мы можем вместо грибного ужина просто подстричь волшебнику бороду. Тогда ему придётся поменять шапку, но сила-то не поменяется. Магическая сила определяет высоту шапки не напрямую, а через «посредника». А значит, мы можем влиять на высоту шапки, меняя только посредника.

!!! Непрямая причинность также может быть обратной.

в) Циклическая причинно-следственная связь

Циклическая причинность — это когда оба признака взаимно влияют друг на друга.

Допустим, сила волшебников растёт от специальных тренирововок — а Орден требует, чтобы шапки соответствовали силе. Но при этом, в магических школах действует пропускная система: на самые продвинутые и эффективные уроки магии пускают только волшебников с высокими шапками. Поэтому, чем выше шапка волшебника, тем больше уроков ему доступно, и тем сильнее он становится.

В каком-то смысле, циклическая причинность  — это одновременно и прямая, и обратная причнности. Признак А влияет на признак Б, но и признак Б влияет на признак А.

Проверка: учим волшебника новым магическим приёмчикам — на следующий день он пойдёт менять шапку.
Проверка 2: даём волшебнику более высокую шапку — на следующий день его впустят на продвинутые курсы, и там он научится новым приёмчикам.

г) Общая причинно-следственная связь

Общая причнность — это когда некий третий признак определяет сразу оба коррелирующих признака.

Например, сила волшебников зависит от высоты над уровнем моря: чем выше волшебник уходит в горы, тем сильнее становится. При этом в его шапку встроен измеритель высоты — колпак вытягивается вверх от разреженного воздуха, чтобы волшебник всегда мог потрогать шляпу и понять, высоко ли он забрался. Таким образом, высота является причиной сразу и большой силы, и высокого колпака.

Проверка: спускаем волшебника на лифте на самый низ трёхкилометровой шахты — его сила пропадает полностью, а колпак сжимается в помпом так сильно, что у волшебника остаётся лысина на макушке. Или привязываем волшебника к баллистической ракете и запускаем. Где-нибудь над облаками сила волшебника станет как у Гэндальфа, Дарта Вейдера и Дамблдора вместе взятых, а колпак пробьёт дыру в Луне.

К слову, неспособность распознать общую причинность — она из самых частых ошибок в интерпретации данных. Если вы видите, что две переменных связаны, и даже меняются вместе — то это ещё не значит, что одна влияет на другую.

д) Корреляция без причинно-следственной связи

Корреляция без причинности — это когда признаки не связаны друг с другом ни прямо, ни через посредника, ни через общий признак. Вообще никак.

Другими словами, обычная случайность. Просто так вышло, что в нашу выборку попали только слабые волшебники с низкой шляпой и сильные с высокой — остальные почему-то не явились на наш соцопрос.

Примеры реальных корреляций, прочитанных мимо кассы:

Корреляция: Сон обутым коррелирует с головной болью на утро.
Мимо кассы: Сон в обуви вызывает головные боли (прямая причинность).
Объяснение: Утром после пьянки часты головные боли. При этом, пойти спать в обуви после пьянки более вероятно, чем в трезвый день. То есть, пьянка влияет и на головные боли, и на обувь во сне (общая причинность).

Корреляция: Дети, которые спят при свете чаще зарабатывают близорукость.
Мимо кассы: Невыключенный свет во время сна вызывает у детей близорукость (прямая причинность).
Объяснение: В действительности, близорукость — частично наследуемое заболевание, при этом близорукие родители чаще оставляют невыключенным свет у детей (чтобы самим лучше видеть). Таким образом, близорукость у родителей влияет как на близорукость у детей, так и на невыключенный свет (общая причинность).

Корреляция: Продажи мороженного коррелируют с частотностью смертей от утопления.
Мимо кассы: От мороженного люди тонут (прямая причинность).
Объяснение: Больше всего мороженного продаётся в жаркий сезон, когда люди много плавают. Чем больше они плавают, тем чаще они тонут (общая причинность, непрямая по одному направлению).

Так что не советую спешить с выводами, когда Вам покажется, будто между двумя явлениями есть взаимосвязь. И будьте внимательны с фактами из всяких новостей (особенно из яндекс.новостей). Уж они-то научат вас науке…


Рекомендуемое чтиво:

Где искать причинно-следственную связь?

Напишите, что вы думаете:

avatar
  Подписаться на обновления  
Оповещать о