Microsoft разработала искусственный интеллект VALL-E, имитирующий человеческий голос на основе 3-секундного оригинала
24.01.23
Microsoft представила новую модель искусственного интеллекта под названием Vall-E. Она базируется на технологии EnCodec, которую Meta анонсировала в октябре 2022 года.
Microsoft называет VALL-E «языковой моделью нейронного кодека». Этот искусственный интеллект способен имитировать любой человеческий голос, к тому же для этого ему нужно прослушать всего три секунды оригинального голоса.
ИИ разбивает информацию на компоненты и синтезирует вариации его звучания в разных фразах, в результате чего может точно воспроизводить тембр и эмоциональный тон говорящего.
Для обучения Vall-E компания Microsoft использовала записи 60 тысяч часов разговоров, записавших более 7 тысяч реальных людей. В основном для этого брали аудиокниги из библиотеки LibriVox.
Примеры имитации голосов Vall-E можно послушать на GitHub.
Microsoft говорит, что Vall-E можно использовать как инструмент преобразования текста в голос, способ редактирования языка и систему создания аудио, соединив его с другими генеративными ИИ.
вологість:
тиск:
вітер:
Обзор смартфона Tecno Spark 20 Pro+: рестомод
Обновлённая серия смартфонов Tecno Spark 20 Pro+ состоит из трех моделей. Сегодня расскажем про топовою, которая к тому же, отличается по стилю от младших
SSD MSI Spatium M580 Frozr со скоростью до 14,6 Гбайт/с оснащаются огромным радиатором
MSI SSD комплектующиеВ основе NVMe-SSD накопителей MSI Spatium M580 Frozr лежит платформа Phison E26 с буфером DRAM и микросхемы 3D NAND TLC производства Micron.
MiJia Smart Audio Glasses с воздушной проводимостью звука и автономностью до 24 часов стоят $83
Xiaomi очкиMiJia Smart Audio Glasses получили шесть разных оправ, акумулятор обеспечивающий автономность в сутки и технологию воздушной проводимости звука