Лингвистика: от древней письменности до языка искусственного интеллекта

Наука
Язык — то, что отделяет человека от других видов. Это ключ к истории древних цивилизаций, средство идентификации и способ обучения искусственного интеллекта. Накануне Дня российской науки мы спросили ученых нашей страны, чем живет современная лингвистика.

В последнее время к лингвистике приковано внимание ученых других дисциплин: чтобы научить «разговаривать» искусственный интеллект, нужно понять, что такое язык, как он устроен, как ему учится человек. Однако в мире все еще существуют «загадочные письмена» древних цивилизаций, расшифровка которых — тоже задача для современных лингвистов. 

Максим Кронгауз
лингвист, доктор филологических наук, профессор РГГУ и НИУ ВШЭ

В области языка главным прорывом прошедшего года стала демонстрация ChatGPT и достижений искусственного интеллекта в сфере коммуникации, в порождении текстов.

И хотя это достижение не напрямую связано с лингвистикой, для меня оно находится где-то рядом с моей наукой. Использование нейронных сетей позволяет несколько отодвинуть теоретическую лингвистику и не использовать ее аппарат, но я бы считал, что мы все равно воспринимаем это как часть нашей науки, потому что это про язык, про общение. Это, конечно, гигантский скачок, причем скачок не только научный, но и психологический.

Примечателен сам факт: демонстрация ChatGPT и массовое обращение к нему. Сегодня очень многие люди постоянно общаются с ним, используют его для каких-то прикладных целей. То есть он стал уже частью профессиональной жизни многих людей. И, конечно, он влияет на все гуманитарные науки.

Я думаю, что в ближайшее время будут созданы отрасли социологии и психологии, связанные с искусственным интеллектом. Не психология искусственного интеллекта, а психология взаимодействия с искусственным интеллектом. Я думаю, что это можно считать главным событием последнего года по обсуждаемости и научной значимости.

И по перспективам в том числе! Мы понимаем, что до вытеснения естественного интеллекта из разных областей осталось уже совсем немного. Это касается нашего быта, нашего образования. Нейросети используют очень важные для гуманитарного образования приемы, связанные с написанием текста, с обработкой текста. Форма эссе в гуманитарном образовании стала одной из главных, но сегодня она практически обессмыслилась, потому что эссе может написать искусственный интеллект, и это будет не сильно отличаться от эссе, который написал бы человек. И сама идея обучения этому тоже основа гуманитарного образования, и она тоже теряет смысл, если это может делать ChatGPT. Написание текстов развивает мышление, но то, что произошло в этом году, неминуемо приведет к сильным изменениям в жизни человечества и в ближайшее время в образовании, и прежде всего — в гуманитарном.

Да, пока многое из того, что написано нейросетью, мы можем на глаз отличить от человеческого, хорошо написанного человеческого. Важно понимать, что плохой человеческий текст может быть существенно хуже порожденного нейросетью. Но в целом тексты, порожденные ботами, довольно пустые с содержательной точки зрения. Это касается и бесед, диалога с чатом. Но со временем и это меняется к лучшему, он обучается.

Очень важно, что человек тут же ощутил опасность происходящего. То есть просто сразу возникли огромное восхищение, огромная востребованность, но и страх. Человечество ощущает опасность, может быть, не вполне еще понимая, в чем эта опасность заключается.

И тут дело не в том, что нас кто-то завоюет. Тут все и проще, и страшнее. Если искусственный интеллект что-то делает существенно лучше человеческого интеллекта, то человек теряет мотивацию обучаться этому, и это может оказаться самой большой опасностью.

Соответственно, если чат будет лучше нас писать тексты, мы разучимся делать это сами. То есть потеряем множество важнейших компетенций, которые являлись частью человеческой культуры. Ну и человеческий мозг, обленившийся в этой ситуации, может потерять слишком много. И, соответственно, тогда не очень понятно, что останется человеку в качестве его самореализации, если все делается лучше другим способом.

Зато меня лично это стимулирует много и быстро писать, потому что я понимаю, что ценность моих текстов тоже может уменьшиться через некоторое время.

Думаю, что, если говорить о компьютерной лингвистике, в ближайшем будущем может резко улучшиться качество автоматического перевода, что тоже приведет к глобальным изменениям. Не нужно будет учить иностранные языки — английский, прежде всего. Мы получим прекрасный инструмент перевода и письменного и, возможно, устного.

Беда (и отчасти парадокс) в том, что чем больше наши успехи в области искусственного интеллекта, тем меньше мотивации напрягать и развивать естественный.

Дмитрий Петров
российский полиглот, синхронный переводчик, телеведущий-учитель реалити-шоу «Полиглот» на телеканале «Культура»

Среди самых важных достижений последнего года я бы отметил то, что лингвисты из Кельнского университета расшифровали древнюю кушанскую письменность. Эта система письма использовалась в некоторых частях Центральной Азии примерно между 200 г. до н.э. и 700 г. н.э. Кушаны основали империю, которая была богата монументальной архитектурой и произведениями искусства.

Кушанский шрифт не могли разгадать более 70 лет. Авторы недавнего открытия исследовали фотографии надписей, найденных в пещерах, а также символы на чашах и глиняных горшках из разных стран Центральной Азии, чтобы собрать воедино все кусочки головоломки.

Прорыв стал возможен благодаря царскому имени Вима Такто, а также титулу «Царь царей». Используя бактрийский параллельный текст (текст, размещенный рядом с переводом), лингвисты смогли выявить последовательность символов и определить фонетические значения отдельных символов.

Это открытие сделало понятным язык иранской группы, на котором говорили в Центральной Азии в начале нашей эры, и ответило на многие вопросы эволюции индоевропейских языков.

Андрей Кибрик
лингвист, доктор филологических наук, директор Института языкознания РАН, профессор филологического факультета МГУ

Одно из важнейших научных исследований в области языкознания последнего времени в нашей стране — продолжение работы по составлению списка языков России: проект «Языки России»

В первую очередь, список языков России нужен для составления статистики, связанной с языками, на которых говорят в нашей стране. Он также необходим для составления баз данных, энциклопедий и различных справочников. Кроме того, такой список полезен для решения вопросов в области языковой политики: необходимо знать, для каких языков стоит развивать литературную норму, какие языки нужно преподавать в школе, по каким языкам нужно выпускать учебную литературу, для каких языков актуальна разработка программ по поддержке и сохранению. Список языков России важен также для лингвистов и их исследований.

Это непростая задача, нужно учитывать много обстоятельств. Первая проблема заключается в разграничении языка и диалекта. Вторая проблема касается того, какие языки можно считать языками именно России. Для решения этого авторы предложили рабочие инструменты. Еще одним важным обстоятельством, которое следует учитывать при составлении и использовании списка языков России, является соотношение между языками и этническими группами (народами). Оно не является взаимно однозначным, часто одному народу соответствует несколько языков и наоборот — исследование этого очень интересно.

Кроме того, на острие лингвистики сейчас — взаимодействие ее со спектром когнитивных наук (психология, нейрофизиология), а также — освоение языка нейросетями. Еще 20 лет назад я работал с прообразом современных больших языковых моделей. Тогда ИИ был не таким продвинутым, но методы были похожие. Мы подготовили серию работ совместно с математиком, касающихся моделирования референциального выбора. Любопытно понять пределы возможностей методов ИИ, но есть проблема взаимодействия между инженерами и специалистами тех или иных областей.