Зефирный тест – разоблачение, которое не состоялось

В 1960-70-х годах мир взорвал зефирный тест. Оказалось, что способность откладывать удовольствие в 4 года связана с успехами в будущем. В 2018 году теория просела – эксперимент повторили на другой выборке и опровергли результаты первоначального.

Но точно ли разоблачение состоялось? В 2019 году группа ученых оценила методологию и нашла там ошибки, так что не все просто. Результаты были опубликованы в Psychological Science, а мы рассказываем вам.

История про детей, зефирки и силу воли до сих пор популярна. В 1960-70-х годах психолог Уолтер Мишел предлагал четырехлетним малышам на выбор съесть одну зефирку сейчас или подождать 15 минут и получить две. Некоторые терпели, другие нет. А спустя годы выяснилось, что те, кто умел ждать, были успешнее по жизни, имели меньшие склонности к зависимостям и лучше сдавали SAT-тест («Scholastic Aptitude Test» – стандартизованный тест для приема в высшие учебные заведения в США, оценивающий грамматику, навыки анализа текста, математические способности и критическое мышление).

Так родилась легенда о том, что самоконтроль в четыре года предсказывает ваше будущее. Но в 2018 году грянул «переворот». Исследователи Уоттс, Дункан и Куан повторили анализ на гораздо большей и разнообразной выборке. Они сделали вывод, что связь между ожиданием и будущими достижениями оказалась в два раза слабее, чем в оригинале, а после учета статуса семьи, образования родителей и ранних когнитивных способностей и вовсе почти исчезла. Новости разлетелись: «Зефирный тест разоблачен!», «Воля ни при чем, все решает среда!». Но не торопимся хоронить классику.

Мишел и его коллеги изучали детей из привилегированной среды – в основном детей преподавателей и аспирантов Стэнфорда. Выборка была небольшой (около 90 человек), и корреляции получалась довольно значительной: около 0,42 для вербальной части SAT и 0,57 для математической. Уоттс же взял национальные данные США (более 900 детей), включая семьи с разным доходом и образованием родителей. Казалось бы, это серьезная проверка на прочность. Действительно, в их данных «чистая» корреляция составила всего 0,30, а после добавления контрольных переменных – почти ноль. Но тут в дело вступают Армин Фальк, Фабиан Коссе и Пиа Пингер, говоря, что не надо сравнивать яблоки с апельсинами и делать громкие выводы.

Что не так в методике

Первое и главное – сам тест на отсрочку удовольствия был разным. В оригинале дети ждали максимум 15 минут, и лишь очень немногие досиживали до конца (цензурирование было низким). У Уоттса же экспериментатор возвращался через 7 минут, и целых 55% детей дождались! Это сжало распределение способности ждать (стандартное отклонение 3 минуты против 6 в оригинале). Корреляция с любыми достижениями таким образом уменьшатся.

Фальк с коллегами провели симуляцию Монте-Карло. Они взяли истинные корреляции, как у Мишела (0,42 и 0,57), добавили 55% цензурирования и получили оценки 0,35 и 0,47. То есть почти ровно то, что увидели Уоттс и компания (0,30). Статистически эти цифры неотличимы друг от друга. То есть занижение результатов можно считать не опровержением, а техническим артефактом от недостаточности измерений.

Вторая проблема – контроль когнитивных способностей. Уоттс добавляет в регрессию ранние показатели интеллекта и утверждает, что связь пропадает. Но способности и самоконтроль развиваются совместно. Если ребенок уже в 3 года умеет ждать, он лучше концентрируется, дольше сидит за книжками, прилежней учится и лучше усваивает и демонстрирует знания и навыки. Включая эти тесты в качестве «контроля», мы вычитаем часть того самого эффекта, который хотим измерить. Это все равно что исследовать пользу спорта путем измерения уровня кислорода в крови – понятно, что они связаны, но оценка недостоверна.

Фальк и соавторы пошли другим путем. Они взяли данные Уоттса, но контролировали только то, что было определено до рождения ребенка: пол, расу, социально-экономический статус семьи, образование родителей. Все, что нельзя приписать влиянию самого малыша. Результат оказался совсем иным – связь между временем ожидания в 54 месяца и успеваемостью в 1 и 5 классах сократилась всего на треть, а не на две трети, как у Уоттса. И осталась высокозначимой (p < 0,001). Более того, если стандартизировать переменные в пределах той же самой выборки (только дети матерей без высшего образования), эффект становится еще заметнее.

Так что никакой «фальсификации» оригинальных исследований не произошло. Зефирный тест не развенчан – он просто оказался сложнее и тоньше, чем казалось исследователям.

Эта история – прекрасный пример того, как наука идет вперед через споры и критику. Работа Уоттса важна, она показала, что среда и семья имеют огромное значение для развития самоконтроля. Дети из неблагополучных семей действительно ждут меньше, и это не их вина, а следствие обстоятельств. Но утверждать, что способность к отсрочке удовольствия «ничего не предсказывает» – неправильно. Предсказывает, и довольно много, даже после учета самых разных факторов.

Более того, Фальк и коллеги подчеркивают, чтобы понять, как родительские инвестиции, когнитивные способности и самоконтроль переплетаются в динамике, нужны структурные модели и, главное, экспериментальные интервенции. Просто наблюдать за детьми недостаточно, нужно менять их среду, тренировать саморегуляцию и смотреть, что из этого выйдет.

Для читателей этой истории вывод в том, что не стоит воспринимать научные новости как «разоблачение всего, во что мы верили». Зефирный тест не умер. Он просто обрел новые нюансы, потерял однозначность. Умение ждать действительно важно, но оно само зависит от семей, школы и обстоятельств. И это не повод для фатализма, а повод задуматься о том, что мы можем сделать, чтобы развить навык терпения у своих детей? А заодно – не торопиться с выводами, когда очередное исследование обещает перевернуть все с ног на голову.

Текст: Дарья Тюльганова

Ссылка на источник

Просмотры: 6 367