Новости

Новая технология имитирует любой человеческий голос

До сих пор даже самые адаптированные компьютерные голоса, такие как Siri или Google Assistant, было трудно спутать с человеческим. Их технология состояла в комбинировании предзаписанных слов и фраз. Монреальский стартап Lyrebird представил новую разработку на основе нейросетей: она способна копировать нашу речь, соотнося звуковые записи и их транскрипции.

Новая технология учится произношению букв, фонем и слов любым голосом по аудиозаписям. Из “услышанных” записей она синтезирует новые предложения, добавляя в них разные интонации и даже эмоции. Разработчики Lyrebird из Университета Монреаля утверждают, что технология самообучается, прослушивая и генерируя голоса. После накопления определенной базы, она сможет копировать человеческий голос из одноминутной записи. На презентации ученые продемонстрировали искусственный диалог голосами Дональда Трампа, Хиллари Клинтон и Барака Обамы.

Вполне резонно встает вопрос об этичности использования подобной технологии. Создатели пока что планируют применять Lyrebird для создания компьютерных ассистентов, записи аудиокниг и помощи людям с ограниченными возможностями.

 

Читайте также
Как наивное человечество познакомилось с радиацией
Как наивное человечество познакомилось с радиацией
125 лет назад мир впервые узнал о радиации.
Антибиотики перестают помогать, но есть дурнопахнущая альтернатива
Антибиотики перестают помогать, но есть дурнопахнущая альтернатива
Микробы внутри нас весят 3 кг и выполняют функции отдельного органа.
«Идея
«Идея "натуральной" еды — одна из самых вредных ошибок»
Сложная химия в вашей тарелке: как полюбить консерванты, заменители и Е-шки.