Как изменилась лексика русского языка за последний век
Ко Дню словаря в «Яндексе» провели исследование и собрали множество примеров изменений, произошедших в лексике русского языка с первой половины XX века.
Материалом для исследования послужили статьи и комментарии на «Яндекс.Дзене» и тексты из собрания центра «Прожито» Европейского университета в Санкт-Петербурге — дневниковые записи, сделанные с 1900 по 1940 год. Аналитики компании вместе с лингвистами нашли такие слова, частотности или контексты употребления которых в двух корпусах сильно отличались. Например, раньше слово «питомец» означало подопечного, воспитанника, а сейчас — домашнее животное. «Ссылка» означала наказание в виде переселения в отдаленный регион, сейчас — встроенный в текст адрес для перехода на другую страницу.
«Слова не только уходят, язык постоянно пополняется новыми словами. И дело не только в том, что появляются вещи, которые надо как-то называть ("парковка", "кроссовки", "чипсы"). Есть и такие слова, к которым мы давно привыкли, но которых всего сто лет назад еще не было в русском языке — во всяком случае, они не встречаются в текстах из корпуса "Прожито"», — комментирует Борис Иомдин, ученый «Яндекса», заведующий сектором Института русского языка им. В. В. Виноградова РАН.
Авторы указывают, что не включили в список слова, связанные с исчезнувшими ("кучер") или появившимися явлениями ("интернет"). Кроме того, они учитывали жанровые отличия между дневниковыми записями и статьями на «Яндекс.Дзене».
«Бывают и другие изменения: слово не уходит, но сильно меняет свое основное значение. Чтобы найти такие примеры, аналитики "Яндекса" сравнивали лексические окружения каждого слова в двух корпусах, то есть проверяли, насколько изменился контекст его употребления», — продолжает Иомдин.
У исчезающих слов уменьшается число контекстов. «Например, прилагательное "тягостный" в современном языке связано в основном с эмоциональным состоянием: тягостными могут быть чувства, переживания, раздумья. Раньше же тягостным называли еще и положение, время, период жизни — сегодня бы мы использовали в этих контекстах слово "трудный". Тягостными иногда оказывались даже люди», — пишет Татьяна Резникова, научный сотрудник РАНХиГС и Центра междисциплинарных исследований человеческого потенциала НЦМУ.
Вместе с исследованием «Яндекс» опубликовал дата-сет, который содержит информацию, как менялся русский язык с первой половины XX века. Эти данные лингвисты смогут использовать в своих научных работах.
Списки дата-сета можно скачать по следующим ссылкам:
— 1000 уходящих и ушедших слов. Например, «балагурить», «даровой», «шкап» и «фанфаронство». К списку слов прилагаются примеры с годом использования.
«Апаш». Старуха баронесса содержит старшего брата героя Алеши — совершеннейшего апаша. 1913.
«Гикать». Тьма, морозный туман, красная озорь гикает. 1917.
«Кофей». В 12 выпил две чашки кофею, чаю, молока. 1908.
— 1000 слов — недавних приобретений. Например, заимствования («абьюзер», «ивент», «оффер») или разговорные слова («ваще», «глючить» и «лям»).