Почти человек? GPT-4 прошел тест Тьюринга

Ученые попросили людей поговорить с четырьмя собеседниками: человеком и различными типами языковых нейросетей.
Shutterstock

Тест Тьюринга позволяет оценить способность машины проявлять интеллект на уровне человека. Чтобы машина прошла тест Тьюринга, она должна быть в состоянии поговорить с кем-то, заставив думать, что она — человек.

Ученые повторили этот тест, попросив 500 человек поговорить с четырьмя собеседниками, среди которых,  собственно, человек, а также программа ИИ 1960-х годов ELIZA  и современные GPT-3.5 и GPT-4. Разговоры длились пять минут, после чего участники должны были определить, с кем они говорили: с человеком или с искусственным интеллектом. Исследование опубликовано на сервере препринтов arXiv, сообщает Live Science.

Обнаружилось, что участники в 54% случаев считали GPT-4 человеком. ELIZA, система, заранее запрограммированная на ответы, но не имеющая архитектуры нейронной сети, была признана человеком только в 22% случаев. GPT-3.5 набрал 50%, а человек-участник — 67%.

«Машины могут рассуждать, смешивая воедино правдоподобные обоснования вещей постфактум, как это делают люди. Они становятся все более хитроумными. Человеческие слабости и причуды проявляются в системах ИИ, что делает их более похожими на человека, чем предыдущие подходы, которые имели список готовых ответов», — рассказала Нелл Уотсон, исследователь искусственного интеллекта в Институте инженеров электротехники и электроники (IEEE).

Ученые также отметили, что существует обоснованная критика слишком упрощенного подхода к тесту Тьюринга, утверждая, что «стилистические и социально-эмоциональные факторы играют большую роль в прохождении теста Тьюринга, чем традиционные представления об интеллекте».