Человеческий язык сложнее, чем нужно — и на то есть веские причины

Человеческий язык — явление сложное. Во всем мире говорят примерно на семи тысячах языков: на некоторых — всего несколько носителей, на других — китайском, английском, испанском и хинди — миллиарды людей. Несмотря на глубокие различия, все языки объединяет одна тенденция: они передают информацию, комбинируя отдельные слова в словосочетания, которые затем складываются в предложения. Каждая из этих единиц имеет собственное значение, а вместе они образуют понятное целое.
«На самом деле это очень сложная структура. Поскольку природа стремится к максимальной эффективности и экономии ресурсов, напрашивается закономерный вопрос: почему мозг кодирует языковую информацию таким, казалось бы, замысловатым способом, а не в цифровом виде, как компьютер?» — говорит профессор компьютерной лингвистики Михаэль Хан из Саарского университета.
Он изучил этот вопрос вместе со своим коллегой Ричардом Футрелом из Калифорнийского университета в Ирвайне, результатом чего стала статья в журнале Nature Human Behaviour.
Почему язык — не двоичный код
Кодирование информации классической двоичной последовательностью из нулей и единиц было бы, по крайней мере в теории, гораздо эффективнее, поскольку оно сжимает информацию намного плотнее, чем естественные языки. Так почему же мы все общаемся, образно говоря, не как R2-D2 из «Звездных войн», а так, как говорим? Хан и Футрел нашли ответ.
«Человеческий язык формируется под влиянием окружающей нас реальности. Если говорить о паре кошки с собакой, назвав их одним словом — никто бы не понял, что имеется в виду, поскольку это не встречается чьем-либо жизненном опыте. Даже если бы такое объединение технически сохранило исходные символы, вроде "кошбака", его обработка вызвала бы затруднения», — объясняет Хан.
Привычка мозга к знакомым паттернам
«Если кратко, нашему мозгу проще выбрать то, что может показаться более сложным путем», — резюмирует он.
Хотя информация и представлена не в максимально сжатой форме, вычислительная нагрузка на мозг оказывается гораздо ниже, потому что человеческий мозг обрабатывает язык в постоянном взаимодействии с привычной природной средой. Кодирование информации в чисто цифровом двоичном виде может казаться эффективнее, поскольку позволяет передать ее за меньшее время, но такой код был бы оторван от нашего реального опыта.
Хан приводит в пример ежедневную поездку на работу: «По привычному маршруту мы едем почти на автопилоте. Наш мозг точно знает, чего ожидать, поэтому усилий ему требуется намного меньше. Более короткий, но незнакомый путь утомляет сильнее, поскольку новая дорога требует от нас гораздо больше внимания».
Если говорить математически: «Число бит, которые нужно обработать мозгу, гораздо меньше, когда мы говорим привычным, естественным образом».
Как структура языка помогает пониманию
Таким образом, кодирование и декодирование информации в цифровом виде потребовало бы значительно больших когнитивных усилий как для говорящего, так и для слушающего. Вместо этого человеческий мозг постоянно вычисляет вероятности следования слов и фрагментов фраз друг за другом, и поскольку мы постоянно пользуемся родным языком, эти паттерны последовательностей глубоко укореняются, снижая вычислительную нагрузку еще сильнее.
«Когда я говорю по-немецки фразу “Die fünf grünen Autos” (“пять зеленых машин”), другой носитель немецкого почти наверняка поймет ее, тогда как “Grünen fünf die Autos” — нет», — приводит другой пример исследователь.
Он описывает, как происходит обработка этого предложения. Оно начинается с определенного артикля «Die» — и немецкоговорящий слушатель уже знает, что это слово, скорее всего, указывает на существительное женского рода единственного числа или существительное любого рода во множественном числе. Это позволяет мозгу сразу исключить существительные мужского или среднего рода в единственном числе. Схожим образом числительное «fünf» исключает неисчисляемые понятия вроде «любовь» или «жажда». Третье слово, «grünen», сообщает слушающему, что еще не прозвучавшее существительное будет во множественном числе и зеленого цвета. Это могут быть машины, но с тем же успехом — бананы или лягушки.
Только когда произносится последнее слово, «Autos», мозг разрешает оставшуюся неоднозначность. По мере развертывания фразы количество возможных интерпретаций сужается до тех пор, пока (в большинстве случаев) не остается единственный окончательный вариант. И перестановка всего одного слова рушит всю стройную логику предсказаний и взаимосвязей.
Что дальше
Хан и его американский коллега Футрел теперь продемонстрировали эти взаимосвязи математически. Их выводы могут оказаться ценными, например, для дальнейшего развития больших языковых моделей лежащих в основе генеративных систем ИИ, таких как ChatGPT или Microsoft Copilot.




