Новая нейросеть поможет понять собаку, расшифровывая собачий лай

А еще она обнаружила у разных пород свои «акценты».
Shutterstock

Используя машинное обучение, ученые смогли успешно расшифровать значение вокализации собак. Авторы еще не рецензированного исследования, вышедшего в препринте, записывали лай, рычание, вой и скулеж 74 домашних собак в разных ситуациях.

Ученые выделили 14 различных типов вокализации собак, например, «позитивные визги» во время игры, «печальный/тревожный лай», «очень агрессивный лай на незнакомца».

Модель искусственного интеллекта Wav2Vec2 изначально была разработана для распознавания человеческой речи, а затем обучена на звуках собак. Неожиданно ИИ, «понимающий» и человеческую речь, смог успешно идентифицировать конкретных собак в 50% случаев, в то время как модели, обученные только на собачьих звуках, достигали успеха в 24%.

«Наши результаты показывают, что звуки и образы, полученные из человеческой речи, могут служить основой для анализа и понимания акустических паттернов других звуков, таких как вокализация животных», — пояснила автор исследования Рада Михалча из Мичиганского университета.

В следующем эксперимента нейросеть различала разные породы собак. Более половины участвовавших в исследовании собак были чихуахуа, и программа смогла правильно идентифицировать их по лаю примерно в 75% случаев.

Наконец, ИИ предъявили незнакомые ему собачьи звуки, чтобы он их интерпретировал, в соответствии с обнаруженными ранее 14 типами. ИИ достиг успеха в 62,2% случаев. Некоторые звуки давались легче. Например, модель смогла правильно идентифицировать 90,7% злобного ворчания и только 45,26% негативных визгов.