Нейросеть научили представлять то, чего она раньше никогда не видела
Студенты из Университета Южной Калифорнии (США) научили искусственный интеллект (ИИ) представлять объекты, которые нейросеть раньше не видела: другого цвета, формы и т. п.
Исследование было представлено на конференции International Conference on Learning Representations, коротко о нем рассказывает Science Alert.
ИИ способен придумать, например, человеческое лицо, которого на самом деле не существует, или даже попытаться шутить. Однако то, что для людей естественно — представить образ, — для нейросетей является непосильной задачей.
Если человеку объяснить, что такое кошка, он может легко представить себе кошку другого цвета, в другой позе или в другом окружении. Для ИИ это намного сложнее, даже его научить распознавать изображение кошки.
Чтобы научить нейросети воображению, исследователи придумали новый метод, позволяющий системам ИИ определять, как должен выглядеть объект, даже если система никогда раньше не видела ничего подобного.
«Люди могут разделить полученные знания по атрибутам — например, форме, позе, положению, цвету, — а затем рекомбинировать их, чтобы представить новый объект. Мы попытались смоделировать этот процесс с помощью нейронных сетей», — пояснили ученые.
Ключевым моментом является экстраполяция — возможность использовать большой банк обучающих данных (например, изображения автомобиля), чтобы затем выйти за рамки того, что показано на изображении. Для ИИ это сложно из-за того, что его обычно учат выявлять определенные закономерности, а не более широкие атрибуты.
Команда применила подход, аналогичный тем, которые используются для создания дипфейков, — разделение различных атрибутов образца (в дипфейках машина должна уметь разделять движения лица и идентичность лица).
Таким образом, если ИИ увидит красную машину и синий мотоцикл, он сможет «представить» себе красный мотоцикл, даже если он никогда не видел его раньше. Одним из основных нововведений в этой методике является обработка выборок в группах, а не по отдельности, а также построение семантических связей между ними в процессе. Затем ИИ может распознавать сходства и различия в образцах, которые он видит, используя эти знания для «представления» чего-то совершенно нового.
По словам исследователей, тот же подход может быть применен в области медицины и беспилотных автомобилей: ИИ сможет «вообразить» новые лекарства или визуализировать новые дорожные сценарии, которым он не был специально обучен.