Знаете ли вы, что учёным не удалось доказать на 100%, что детей не приносят аисты?
Правда ли, что ящерицы с отброшенным хвостом бегают медленнее, чем ящерицы с целым хвостом?
Как ответить на этот вопрос? Ну конечно же провести эксперимент! Отловить 40 ящериц в лесу: 20 хвостатых, 20 бесхвостых – и устроить им забеги:
Замеряем результаты, заносим в таблицу и рисуем график:
Красивая картинка, не правда ли? Как говорится: “взаимосвязь на лицо”.
А может нет?
Q: Что? Почему это может нет?
Потому же, почему все люди пьют воду и рано или поздно умирают – но это не значит, что вода приводит к смерти. Потому же, почему на пик карьеры Николаса Кейджа пришлась самая высокая смертность людей от утоплений – но это не значит, что фильмы с Кейджем отрицательно влияют на плавучесть человеческого тела.
Потому что корреляция не означает причинность. То, что две переменные связаны ещё не означает, что один признак определяет другой.
Да, график с ящерицами красивый. Но где гарантия, что на скорость не влияет какой-то другой фактор? Может, двадцать самых медленных ящериц в лесу просто решили погулять без хвостов в это время года – а мы их и поймали? А может, ящерицы с хвостом быстрее потому, что они просто объелись в лесу каких-нибудь грибов со стероидами, а нам не сказали – а ящерицы без хвостов уже который год страдают от артрита?
И вообще, может у них потому и нет хвостов, что они самые медленные, и поэтому им эти хвосты пооттяпывали хищники: не наличие хвоста влияет на скорость, а скорость – на наличие хвоста.
Проблема в том, что ящерицы в двух группах – это разные ящерицы. И мало ли чем они отличаются друг от друга.
Как быть?
Решение 1: пусть ящерицы с хвостами и без будут одни и те же!
Можно попробовать взять 20 ящериц с хвостами, устроить им забег, потом ампутировать хвосты, и на следующий день повторить забег с ними же. В таком случае мы будем уверены, что различия между ящерицами типа артрита или физической подготовки уже не смогут повлиять на результат.
И снова статистический анализ покажет нам достоверную корреляцию.
Вот только использовав дважды одну и ту же выборку, мы может и убрали кучу засоряющих факторов из эксперимента, но добавили новые. Вдруг ящерицы устали? Вдруг постарели? Вдруг на второй день забегов они перестали бояться лаборатории и поэтому не пытались никуда быстро бежать.
Как ни крути, всегда будут засоряющие факторы, которые мы не сможем вычеркнуть из уравнения – и докажи попробуй, что они на исследуемые признаки не влияют.
Решение 2: по методике Скайнет.
Идеальным вариантом было бы задействовать машину времени: сначала потестировать выборку ящериц с хвостом, потом вернуться в прошлое в момент перед экспериментом, ампутировать ящерицам хвосты и повторить забеги. Таким образом, мы исключим из эксперимента максимум засоряющих факторов: нельзя будет списать результаты ни на усталось ящериц, ни на старость, ни на фазу лунного цикла. Мы используем одну и ту же выборку ящериц, в одном и том же физиологическом состоянии, в одинаковом возрасте с точностью до секунды, и проводим опыт в одном и том же месте в одно и то же время.
В каком-то смысле, эксперимент через машину времени – единственно возможный прямой метод проверки причинности, наиболее точно отражающий саму суть поставленной задачи. Ведь по большому счёту установление причинности сводится к ответу на единственный вопрос: “А что если бы?”
– А что если бы прямо сейчас у этой ящерицы не было хвоста – далеко б она убежала?
– А что если бы все эти люди никогда в жизни не пили лимонад – болели б они тогда гриппом?
– А что если бы Интернет никогда не изобрели – что было бы с уровнем образования в мире?
Учёные наблюдают различные феномены, протекающие при определённых условиях, и размышляют: а протекали бы они так же, если бы условия были другие? Является ли условие причиной того, что феномен протекает именно так, а не иначе?
Но и здесь не без подводных камней.
Первый камень: все факторы и признаки в природе неразрывно связаны друг с другом. Не получится ампутировать у ящерицы хвост, не повлияв при этом больше вообще ни на что: не причинив ей боль, не накачав анестезией, не испугав. Другими словами: невозможно изменить один признак, не изменив при этом и смежные ему – а значит, во время эксперимента нельзя будет с полной уверенностью сказать, что именно исследуемый признак влияет на исход.
Так мы максимум докажем, что ящерицы бегают медленнее, если ампутировать им хвост – но не влияние наличие хвоста в целом на скорость.
Второй камень: машины времени не существует. Получается, что единственно возможный прямой метод изучения причинности нам вообще недоступен – вот и приходится учёным изучать причинность, выполняя косвенные эксперименты и измерения.
Вывод получается удручающий: в статистике есть целая куча методов для установления корреляции, но не существует вообще метода для прямой проверки причинно-следственной связи.
Q: То есть, причинность установить вообще нельзя?
Может и так, но пусть вас это не смущает. Грамотно поставленный эксперимент даёт результаты с достоверностью до 99,9999% и выше – надёжность презерватива в тысячи раз меньше, но люди пользуются.
Такого уровня достоверности вполне достаточно, чтобы принимать серьёзные решения в прикладных сферах жизни. Так делают и делали лекарства, продукты питания, домá, машины, самолёты, ракеты. А что касается быта – так человек ежедневно берёт на веру и куда менее вероятные предположения!
Да, нельзя доказать на сто процентов, что следующий стакан воды вас не убьёт, но вряд ли вас это волнует.
Более того, доказательство – это всегда больше, чем просто статистика. Помимо экспериментальных данных, любое научное утверждение – а особенно в фундаментальных науках – также имеет мощное теоретическое подспорье. Правильно сформулированная гипотеза: такая, которая полностью согласуется с имеющимися научными теориями и имеет убедительное объяснение – она просто не может быть неверной. Чему эксперимент будет дополнительным подтверждением.
Рекомендуемое чтиво:
Узнайте всё про чудеса корреляции
Что делают учёные, чтобы увеличить достоверность эксперимента?