Выбор фона:
/ Новости сайта / Наука и Технологии / Новый речевой синтезатор пособен воспроизвести любой голос
07.05.2017

Новый речевой синтезатор пособен воспроизвести любой голос

Оценка: 5.0    1971 1 Наука и Технологии
09:40
Практически все существующие на данный момент виртуальные ассистенты, какими бы продвинутыми функциями они ни обладали, имеют крайне странный «машинный» голос, который ни с чем не спутаешь. Происходит это от того, что голосовые синтезаторы используют для речи набор заранее записанных фраз, звуков и их комбинаций. Как полагают некоторые эксперты в этой области, улучшения качества звучания можно добиться при помощи использования искусственного интеллекта, что и продемонстрировала компании Lyrebird из Монреаля. Их разработка может воспроизвести голос любого человека.

Для подражания голосу системе достаточно лишь нескольких секунд аудиозаписи голоса требуемого человека, на основе которых и будет создан звуковой фрагмент. Точное подражание голосу возможно благодаря использованию нейронных сетей на основе искусственного интеллекта, работающих по тем же принципам, что нейронные сети человеческого мозга. ИИ учится распознавать особенности речи человека, а затем эти данные уже используются для синтеза искусственного голоса. Сейчас работа новой системы все еще не лишена недостатков: есть проблемы с разборчивостью произносимой речи, присутствуют «голосовые артефакты» и некоторые другие признаки, указывающие на то, что слова произносит машина. Однако все они могут быть легко устранены в будущем, ведь уже сейчас система работает в режиме реального времени. Как утверждает один из авторов проекта Хосе Сотело,

«Наша программа обучалась на большом количестве аудиофрагментов выступлений тысяч различных людей. Полученная информация сжимается до вида своего рода «голосовой ДНК», которая является цифровым ключом. Затем на основе этого ключа система может воспроизводить любые слова, даже те, которые не были задействованы в процессе обучения».

Сами авторы проекта прекрасно понимают, что при должном уровне развития этой технологии не избежать проблем с безопасностью. К примеру, для обхода систем идентификации пользователя по голосу. Представители компании Lyrebird сравнивают свое изобретение с изобретением фотошопа. После создания пакета программ от Adobe стало сложно доверять изображениям на экране. Теперь же доверять нельзя и голосу.

«Мы понимаем, что из-за высокого уровня развития современных технологий такой голосовой синтезатор появился бы на свет рано или поздно. Мы призываем всех начать отказываться от принятия в качестве доказательств различных аудиозаписей, а также использования средств защиты на основе голоса».

В любом случае пока что беспокоиться рано, ведь система очень сырая, а в «синтетических» голосах все еще звучат «роботизированные нотки». Ознакомиться с тем, как система Lyrebird воспроизводит голоса Барака Обамы, Дональда Трампа и ряда других политических деятелей, вы можете по этой ссылке.


 


Поделитесь в социальных сетях

Комментарии 1

+1  
Arwis 07.05.2017 14:08 [Материал]
Вот! Хорошая новость! Теперь голосом любого человека можно "сказать" любую фигню... и доказывай после этого, что ты не верблюд! smile
"Мы призываем всех начать отказываться от принятия в качестве доказательств различных аудиозаписей, а также использования средств защиты на основе голоса"
Авторы средств защиты среагируют быстро, а вот судебная система..
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]

Похожие материалы

Разговоры у камина
Календарь
Последние комментарии
Земля может устойчиво поддерживать только около 2,5 миллиардов человек — человечество уже более чем в три раза превысило естественный предел
Мрачная перспектива на будущее: всё население будет вытеснено в зоны компактного проживания( страна (от Везунчик)
На Фарерских островах за один день убили 706 дельфинов, нарушая собственные правила и законы
ну тогда не удивляйтесь, если дельфины начнут массово убивать людей находящихся в морях и океанах... (от Alexeyy)
Румынские археологи нашли 6000-летнее здание площадью 350 квадратных метров без следов жилья, но с ритуальными предметами
Мегаструктуры... При въезде в любое захудалое село и сейчас можно наблюдать мегаструктуры в виде анг (от Везунчик)
Звон в ушах? Ваше спящее сознание будят — проснитесь!
ничего себе поворот событий... уже достал генератор - начну каждую частоту "испытывать" на (от Alexeyy)
Земля может устойчиво поддерживать только около 2,5 миллиардов человек — человечество уже более чем в три раза превысило естественный предел
Человечество развивается не сообразуясь с разумом все надежды на то что есть умные люди и они что-ни (от Везунчик)