Новая технология имитирует любой человеческий голос
До сих пор даже самые адаптированные компьютерные голоса, такие как Siri или Google Assistant, было трудно спутать с человеческим. Их технология состояла в комбинировании предзаписанных слов и фраз. Монреальский стартап Lyrebird представил новую разработку на основе нейросетей: она способна копировать нашу речь, соотнося звуковые записи и их транскрипции.
Новая технология учится произношению букв, фонем и слов любым голосом по аудиозаписям. Из “услышанных” записей она синтезирует новые предложения, добавляя в них разные интонации и даже эмоции. Разработчики Lyrebird из Университета Монреаля утверждают, что технология самообучается, прослушивая и генерируя голоса. После накопления определенной базы, она сможет копировать человеческий голос из одноминутной записи. На презентации ученые продемонстрировали искусственный диалог голосами Дональда Трампа, Хиллари Клинтон и Барака Обамы.
Вполне резонно встает вопрос об этичности использования подобной технологии. Создатели пока что планируют применять Lyrebird для создания компьютерных ассистентов, записи аудиокниг и помощи людям с ограниченными возможностями.