«Умные» наушники позволят владельцам выбирать, какие звуки они хотят слышать
Команда под руководством исследователей из Вашингтонского университета (Сиэтл, США) разработала алгоритмы для искусственного интеллекта, которые позволят пользователям выбрать, какие звуки они хотят слышать, а какие следует заглушить, сообщается на сайте университета.
— Большинство тех, кто пользовался наушниками с шумоподавлением, знают, что иногда может быть жизненно важным услышать в нужное время определенный сигнал. Например, кому-то захочется «отключить» автомобильные гудки за окном на время работы, но не во время прогулки по оживленным улицам. Однако люди не могут выбирать, какие звуки глушат их наушники, — пояснили важность разработки в пресс-службе.
Чтобы сделать наушники «умными» и обучить фильтровать звуки, а не полностью заглушать их, разработаны алгоритмы глубокого обучения искусственного интеллекта. Такой «семантический слух» требует беспроводной привязки наушников к смартфону, на котором с помощью голосовых команд или специального приложения можно будет выбрать, какие звуки пропускать. Сейчас предусмотрены 20 категорий: сирены, детский плач, речь, щебетание птиц и другие.
Одна из проблем, которую необходимо решить для реализации такой технологии — очень быстрая обработка аудиоинформации искусственным интеллектом.
— Проблема в том, что звуки, которые слышат пользователи наушников, должны синхронизироваться с их визуальными ощущениями. Вы не можете услышать чей-то голос через две секунды после того, как он заговорит с вами. Это означает, что нейронные алгоритмы должны обрабатывать звуки менее чем за сотую долю секунды, — говорит профессор Вашингтонского университета Шьям Голлакота.
Кроме того, система должна сохранять возможность «объемного» слуха — ведь звуки с разных направлений и расстояний наше ухо слышит по-разному.
Система «семантического слуха» уже была протестирована в разных условиях: в офисах, на улицах и в парках. Она смогла распознать сирены, щебетание птиц, сигналы тревоги и другие звуки, удаляя при этом все остальные реальные шумы. Но в некоторых случаях программа с трудом разделяла звуки, имеющие много общих свойств: например, пение и человеческую речь. Однако обучение искусственного интеллекта на большем количестве реальных данных может улучшить эти результаты.