Алгоритм Google DeepMind читает по губам лучше человека

 | 08.00

google-deepmind

Искусственный интеллект Google DeepMind, разработанный совместно с учеными Оксфордского университета, научился понимать речь, наблюдая за артикуляцией говорящего. Результат оказался лучше, чем у профессионального сурдопереводчика.

Совсем без человека не обошлось. Google DeepMind обучали с помощью 6 популярных телешоу (BBC Breakfast, Newsnight, Question Time), вышедших в эфир с 2010 по 2015 год. За все время алгоритм изучил около 5 тыс. часов видео или около 118 тыс. предложений.

Эффективность алгоритма после эксперимента составила 46,8% слов, в то время как профессиональный переводчик, считывающий речь по губам, не ошибся в 12,4%.Такого результата удалось достичь, благодаря применению продвинутой системы чтения по губам LipNet.

Команда DeepMind сообщает, что их разработка может иметь множество применения. Начиная от помощи людям с нарушениями слуха до управления голосовыми помощниками Siri и Alexa.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *