Нейросеть научили копировать голос при синтезе текста в речь
04.09.19
Группа разработчиков создала алгоритм для синтеза текста в речь на основе нейросетевых моделей Tacotron 2 и WaveNet. Алгоритмы могут создавать голос, имитирующий говорящего по фрагменту стороннего аудиофайла. Результаты работы опубликованы на arxiv.org в июне 2018 года, открытый исходный код размещён на площадке GitHub.
Для работы алгоритма нужно два аудиофайла: один с примером голоса, который необходимо скопировать, и второй с фразой, которую этим голосом нужно произнести. После этого алгоритм почти в реальном времени преобразует голос из второго аудиофайла. В итоге. получает голос похожий на тон говорящего из первого файла.
вологість:
тиск:
вітер:
Обзор умных часов BlackView W60: месяц в защите
Когда казалось, что китайские производители уже не могут удивить нас оснащением за низкую цену, появляются смарт-часы BlackView W60 с огромным аккумулятором, фонариком и вменяемым интерфейсом
Игра Fallout 4 получила большое обновление. Добавлена поддержка Steam Deck и релиз в Epic Games Store
Fallout игры обновлениеКомпания Bethesda выпустила некстген-обновление для популярной постапокалиптической ролевой игры Fallout 4. Он актуальне для версии которая запускается на PlayStation 5 и Xbox Series
100-дюймовый телевизор Redmi Max TV 2025 оснащается панелью до 240 Гц и HyperOS на борту
Redmi Xiaomi телевизорXiaomi представила новую версию своего смарт-телевизора Redmi Max. Основным обновлением стал 100-дюймовый дисплей, который по умолчанию поддерживает обновление с частотой 144 Гц, но может быть увеличен до 240 Гц