Знаете ли вы, что чрезмерное употребление воды может привести к беременности, а чрезмерное отопление жилищ – к новому ледниковому периоду?
Сегодня, по случаю юбилея сайта, мы решили раскрыть вам секретный научный метод, с помощью которого вы сможете совершать десятки научных открытий не вставая с дивана (только тссссс, никому ни слова!).
Вот, к примеру, мои свежие научные открытия – десять минут и готово:
– Измерение выборки из 80 кошек показало, что кошки с бо́льшей массой тела имеют бо́льшую длину ушей. Это значит, что 99% массы кошек сосредоточено в ушах, и именно уши определяют массу тела.
– Причина беременности – употребление воды. Я обнаружил, что 100% беременных женщин употребляют воду. Значит, мужчины не беременеют, потому что у них аномалия усвояемости воды.
– Зимой у всех в Москве работает отопление. Значит, отопление способно вызвать в Москве зиму.
Звучит очень даже убедительно.
Метод, который лежит в основе всех трёх умозаключений – не такая уж и редкость, в определённых кругах. Он известен как отожествление корреляции и причинности.
Корреляция – это статистическая взаимосвязь между двумя переменными. Например, вот график из исследования кошачих ушей:
Видно, что длина ушей изменяется вместе с массой тела. Две переменных связаны, и мы можем угадывать одну переменную по другой: скажем, если известно, что у кошки длинные уши, то я могу предположить, что она и весит много – и скорее всего не ошибусь.
Но если я скажу, что масса кошек сосредоточена в ушах, то это будет уже не просто корреляция, а причинность.
Причинность или причинно-следственная связь – частный случай корреляции, при котором связаны не только переменные, но и соответствующие им реальные признаки. Если в случае простой корреляции можно лишь угадывать массу по длине ушей, то при доказанной причинности можно говорить о том, что один признак непосредственно определяет собой другой. Например, если бы масса кошек действительно была бы сосредоточена в ушах, то мы могли бы не только предсказывать массу по ушам, но и контролировать массу, вытягивая кошкам уши.
Но мы с вами знаем, что это невозможно. Переменные длины ушей и массы тела может и связаны, но вот сама масса как физическая величина практически не зависит от ушей. Как и беременность от воды.
Во всех трёх своих “научных” исследованиях я применил один и тот же хитрый ход: я приравнял корреляцию к причинно-следственной связи. Этот ход – настоящий чемпион неправильной интерпретации данных: лучше него псевдонаука ещё не придумала.
Если две переменных взаимосвязаны, это ещё не значит, что один признак непосредственно влияет на другой.
Корреляция ≠ причинность!!!
Наш мозг инстинктивно ищет связи и логические объяснения событий. Когда мы видим связанные переменные, нам сразу хочется связать и признаки, которые под этими переменными скрываются. Когда говорят, что трое школьников, сдавших экзамены на высший бал, едят на завтрак овсяную кашу, нам начинает казаться, что овсянка – ключ к безграничному интеллекту. Когда говорят, что аж четверо из шести лучших актёров мира водят синюю машину, мы начинаем думать, что синий цвет – источник успеха.
Вот только сразу кидаться в продуктовый и сметать с прилавков овсянку не стоит. Мало того, что корреляция может вовсе не означать причинность, так причинностей ещё и существует несколько!
Допустим, есть два признака: высота шапки волшебника, и его магическая сила. Вот график:
Проще говоря, существует корреляция между высотой шапки и магической силой: чем сильнее волшебник, тем выше его шапка:
Зная корреляцию, мы можем угадывать силу волшебников по высоте их шапки – и наоборот. Но что до реальной взаимосвязи признаков – данный график может в равной степени означать любую из пяти(!) возможных ситуаций:
- Прямая причинно-следственная связь
- Непрямая причинно-следственная связь
- Циклическая, или взаимная причинно-следственная связь
- Общая причинно-следственная связь
- Корреляция без причинно-следственной связи
Рассмотрим каждый из них подробно:
а) Прямая причинно-следственная связь
Прямая причинность – это когда изменение в одном из коррелирующих признаков приводит к изменению в другом.
Допустим, шляпа волшебника является магической антенной – и чем выше антенна, тем легче волшебнику подключаться к энергии космоса. Признаки взаимосвязаны не только на графике, но и в реальном мире: один из них определяет другой.
Проверка: заменяем шапку на голове волшебника на шапку пониже – магическая сила падает; заменяем на более высокую – сила растёт.
Обратите внимание: прямая причинность может быть и обратной. Допустим, шапка волшебника не определяет его силу – сила наращивается через поедание особых грибов. Но при этом Орден Волшебников требует, чтобы высота шапки соответствовала силе волшебника. В таком случае, сила будет определять высоту шапки.
Проверка: кормим волшебника грибами перед сном. Утром он проснётся и почувствует, что стал в два раза сильнее, и побежит менять шапку. Магическая сила диктует высоту шапки.
А наоборот работать уже не будет: если подрезать ему шапку, то он не станет сильнее (его просто исключат из Ордена за дисциплинарные проступки).
Одна из самых частых ошибок в статистическом анализе – подмена причинности обратной ей. Как в случае с зимой и отоплением: в действительности, зимние морозы вызывают отопление, а не наоборот.
б) Непрямая причинно-следственная связь
Непрямая причинность – это когда первый признак влияет не на второй, а на некий третий, скрытый признак, а уже от третьего признака изменяется второй.
К примеру, от чрезмерной магической силы у волшебников сильнее растёт борода. А Орден требует, чтобы длина шляпы соответствовала длине бороды.
Проверка: кормим волшебника грибами перед сном. За ночь сила волшебника вырастёт, а вместе с ней отрастёт борода. Волшебник проснётся, посмотрится в зеркало, и побежит менять шляпу.
Q: В чём принципиальная разница между непрямой и прямой причинностями?
Разница в том, что мы можем вместо грибного ужина просто подстричь волшебнику бороду. Тогда ему придётся поменять шапку, но сила-то не поменяется. Магическая сила определяет высоту шапки не напрямую, а через “посредника”. А значит, мы можем влиять на высоту шапки, меняя только посредника.
!!! Непрямая причинность также может быть обратной.
в) Циклическая причинно-следственная связь
Циклическая причинность – это когда оба признака взаимно влияют друг на друга.
Допустим, сила волшебников растёт от специальных тренирововок – а Орден требует, чтобы шапки соответствовали силе. Но при этом, в магических школах действует пропускная система: на самые продвинутые и эффективные уроки магии пускают только волшебников с высокими шапками. Поэтому, чем выше шапка волшебника, тем больше уроков ему доступно, и тем сильнее он становится.
В каком-то смысле, циклическая причинность – это одновременно и прямая, и обратная причнности. Признак А влияет на признак Б, но и признак Б влияет на признак А.
Проверка: учим волшебника новым магическим приёмчикам – на следующий день он пойдёт менять шапку.
Проверка 2: даём волшебнику более высокую шапку – на следующий день его впустят на продвинутые курсы, и там он научится новым приёмчикам.
г) Общая причинно-следственная связь
Общая причнность – это когда некий третий признак определяет сразу оба коррелирующих признака.
Например, сила волшебников зависит от высоты над уровнем моря: чем выше волшебник уходит в горы, тем сильнее становится. При этом в его шапку встроен измеритель высоты – колпак вытягивается вверх от разреженного воздуха, чтобы волшебник всегда мог потрогать шляпу и понять, высоко ли он забрался. Таким образом, высота является причиной сразу и большой силы, и высокого колпака.
Проверка: спускаем волшебника на лифте на самый низ трёхкилометровой шахты – его сила пропадает полностью, а колпак сжимается в помпом так сильно, что у волшебника остаётся лысина на макушке. Или привязываем волшебника к баллистической ракете и запускаем. Где-нибудь над облаками сила волшебника станет как у Гэндальфа, Дарта Вейдера и Дамблдора вместе взятых, а колпак пробьёт дыру в Луне.
К слову, неспособность распознать общую причинность – она из самых частых ошибок в интерпретации данных. Если вы видите, что две переменных связаны, и даже меняются вместе – то это ещё не значит, что одна влияет на другую.
д) Корреляция без причинно-следственной связи
Корреляция без причинности – это когда признаки не связаны друг с другом ни прямо, ни через посредника, ни через общий признак. Вообще никак.
Другими словами, обычная случайность. Просто так вышло, что в нашу выборку попали только слабые волшебники с низкой шляпой и сильные с высокой – остальные почему-то не явились на наш соцопрос.
Примеры реальных корреляций, прочитанных мимо кассы:
Корреляция: Сон обутым коррелирует с головной болью на утро.
Мимо кассы: Сон в обуви вызывает головные боли (прямая причинность).
Объяснение: Утром после пьянки часты головные боли. При этом, пойти спать в обуви после пьянки более вероятно, чем в трезвый день. То есть, пьянка влияет и на головные боли, и на обувь во сне (общая причинность).
Корреляция: Дети, которые спят при свете чаще зарабатывают близорукость.
Мимо кассы: Невыключенный свет во время сна вызывает у детей близорукость (прямая причинность).
Объяснение: В действительности, близорукость – частично наследуемое заболевание, при этом близорукие родители чаще оставляют невыключенным свет у детей (чтобы самим лучше видеть). Таким образом, близорукость у родителей влияет как на близорукость у детей, так и на невыключенный свет (общая причинность).
Корреляция: Продажи мороженного коррелируют с частотностью смертей от утопления.
Мимо кассы: От мороженного люди тонут (прямая причинность).
Объяснение: Больше всего мороженного продаётся в жаркий сезон, когда люди много плавают. Чем больше они плавают, тем чаще они тонут (общая причинность, непрямая по одному направлению).
Так что не советую спешить с выводами, когда Вам покажется, будто между двумя явлениями есть взаимосвязь. И будьте внимательны с фактами из всяких новостей (особенно из яндекс.новостей). Уж они-то научат вас науке…
Рекомендуемое чтиво:
Где искать причинно-следственную связь?