Изучение миллиона диалогов показало, о чем люди разговаривают с нейросетями

Shutterstock
Да, даже пошлые и агрессивные чатики попадают в выборку исследователей.

Ученые из Калифорнийского университета в Беркли (США) создали крупномасштабный набор данных из миллиона реальных диалогов, чтобы изучить, как люди взаимодействуют с большими языковыми моделями (LLM), такими как ChatGPT, пишет Tech Xplore. Они пока опубликовали статью на сервере препринтов arXiv.

Исследование показало, что к нейросетям обращаются люди со всего мира: диалоги происходили на 150 языках. Примерно половина всех разговоров с чат-ботами была сосредоточена на так называемых «служебных» темах, таких как компьютерное программирование, просьбы о помощи в написании текста или даже садоводство.

Самая популярная тема касалась устранения ошибок программного обеспечения и решения задач.

Но примерно 10% таких диалогов затрагивают «небезопасные» темы: о сексе и насилии. Например, часто люди просили чат-бота рассказать им эротические истории или участвовать в сексуальных ролевых играх.

Исследователи предполагают, что изучение реальных разговоров между LLM и людьми поможет производителям таких систем создать эффективные средства контроля, предназначенные для предотвращения «небезопасного» использования продуктов.