Почему люди слышат то, что ждут услышать — ученые

Наш мозг не просто воспринимает речь, а угадывает слова.
bbernard/Shutterstock/FOTODOM

Каждый из нас хотя бы раз попадал в ситуацию, когда слышишь одну фразу, а собеседник уверяет, что говорил совсем другую, пусть и похожую по звучанию. Такие забавные «ослышки» называются мондегринами — этот термин придумала в 1954 году писательница Сильвия Райт, неверно расслышавшая строку из старинной шотландской баллады.

Подобные примеры кажутся просто курьезом, но на самом деле они указывают на фундаментальное свойство языка и человеческого восприятия. Мы не просто улавливаем звуки — мы сразу же их интерпретируем. И эта интерпретация сильно зависит от наших ожиданий. В обычном разговоре слова не звучат как отдельные, четко разделенные единицы: звуки накладываются друг на друга, сливаются и влияют один на другой в непрерывном потоке речи. Добавьте сюда шум, акцент или быстрый темп — и сигнал, достигающий уха, часто оказывается неполным или двусмысленным.

Эффект Ганонга

И все же мы редко замечаем, насколько сложна эта задача. Обычно мы понимаем речь быстро и довольно точно. Почему? Потому что мозг не ждет идеального акустического сигнала. Он активно восстанавливает смысл по обрывкам информации. Одно из самых наглядных подтверждений этого механизма — эффект Ганонга, впервые описанный американским психологом Уильямом Ганонгом-младшим в 1980 году. Его проанализировала лингвист Карен Столлзноу в журнале Psychology Today.

В классическом эксперименте участникам дают прослушать звук, который находится где-то посередине между двумя согласными, скажем, между «г» и «к». Затем этот неоднозначный звук помещают в разные словесные контексты. Если после него следует «-ифт», люди чаще слышат слово «подарок» (gift), а не бессмысленное «kift». Но если тот же самый звук стоит перед «-ис», слушатели склонны воспринимать его как «поцелуй» (kiss), а не как несуществующее «giss».

Иными словами, человек предвзято воспринимает знакомые, реальные слова. Мозг не просто расшифровывает звук — он выбирает наиболее вероятное осмысленное совпадение.

По словам Столлзноу, эффект Ганонга показывает, что восприятие речи нельзя объяснить только обработкой сигнала «снизу вверх» — от сырых сенсорных данных к смыслу. Оно зависит и от процессов «сверху вниз» — от наших знаний, ожиданий и контекста. Обработка снизу вверх — это когда вы пытаетесь разобрать слово в шумной комнате, улавливая отдельные звуки. Обработка сверху вниз опирается на уже имеющийся языковой опыт и понимание ситуации. В реальной жизни оба механизма работают одновременно. Но когда сигнал неоднозначен, именно ожидания направляют восприятие в сторону знакомых и осмысленных слов.

Испорченный телефон

Такое предпочтение реальных слов — не ошибка системы, а признак ее эффективности. Именно этот принцип лежит в основе эффекта «испорченного телефона», когда сообщение постепенно искажается при передаче от человека к человеку. Каждый новый слушатель невольно навязывает неясному сигналу привычную форму, знакомый смысл или стандартные словесные шаблоны.

В повседневной жизни речь почти никогда не бывает идеально чистой. Мозг ставит смысл выше акустической точности и быстро устраняет неопределенность, используя словарный запас и контекст. Именно поэтому мы способны понимать друга в шумном кафе или следить за разговором по плохо записанному телефонному звонку. Мозг постоянно заполняет пробелы.

Тот же механизм объясняет, почему иногда мы ошибаемся очень характерным образом. Эффект Ганонга тесно связан с другим явлением — фонематическим восстановлением. В таких случаях слушатели как будто слышат отсутствующие звуки, если вместо них возникает шум, кашель или треск помех. Даже если часть слова физически отсутствует, мозг может восстановить ее, если контекст достаточно ясно подсказывает осмысленную интерпретацию. И в случае эффекта Ганонга, и в случае фонематического восстановления восприятие определяется не только тем, что реально прозвучало, но и тем, что человек ожидает услышать.

Эффект Ганонга показывает: восприятие речи — это не пассивная запись звука, а активный процесс интерпретации. Мы не просто слышим язык — мы постоянно его достраиваем. Мозг в реальном времени сопоставляет сенсорный сигнал с языковыми знаниями и разрешает неоднозначность.

Чаще всего эта система работает блестяще. Иногда она порождает комичные ослышки вроде мондегринов. А иногда напоминает нам, что восприятие не бывает полностью объективным — оно всегда в некоторой степени сконструировано. Мы не всегда слышим именно то, что было сказано. Чаще мы слышим то, что ожидаем услышать.

Подписывайтесь и читайте «Науку» в MAX