Microsoft разработала искусственный интеллект VALL-E, имитирующий человеческий голос на основе 3-секундного оригинала
24.01.23
Microsoft представила новую модель искусственного интеллекта под названием Vall-E. Она базируется на технологии EnCodec, которую Meta анонсировала в октябре 2022 года.
Microsoft называет VALL-E «языковой моделью нейронного кодека». Этот искусственный интеллект способен имитировать любой человеческий голос, к тому же для этого ему нужно прослушать всего три секунды оригинального голоса.
ИИ разбивает информацию на компоненты и синтезирует вариации его звучания в разных фразах, в результате чего может точно воспроизводить тембр и эмоциональный тон говорящего.
Для обучения Vall-E компания Microsoft использовала записи 60 тысяч часов разговоров, записавших более 7 тысяч реальных людей. В основном для этого брали аудиокниги из библиотеки LibriVox.
Примеры имитации голосов Vall-E можно послушать на GitHub.
Microsoft говорит, что Vall-E можно использовать как инструмент преобразования текста в голос, способ редактирования языка и систему создания аудио, соединив его с другими генеративными ИИ.
вологість:
тиск:
вітер:
Вселенная Fallout в 2024 году: от игр к сериалу
Как вселенная игр Fallout получила через десятки лет свой сериал и вновь попала на пик популярности
IDC: Apple больше не лидер рынка смартфонов, Samsung вернула себе первое место по доле
Apple IDC Samsung смартфонПо данным IDC поставки смартфонов Apple упали примерно на 10% в первом квартале 2024 года из-за обострения конкуренции с другими производителями
Подробности о смартфоне Tecno Camon 30 Premier — будет действительно доступный флагман?
MediaTek Tecno Андроид смартфонСмартфон Tecno Camon 30 Premier работает на процессоре MediaTek Dimensity 8200 Ultra. Установлена Android 14 из коробки.