Команда «Голос!»: обзор голосовых сервисов

 | 13.03

Читайте в этой статье:

Google Now

Siri

S-Voice

Dragon Dictation и Dragon Search

Еще совсем недавно возможность голосового общения с компьютером была чем-то из разряда фантастики. Сегодня же сходу можно вспомнить множество сфер, где технологии распознавания речи применяются уже в полной мере. Например, в военной авиации такие системы устанавливаются на боевые истребители F-16, «Мираж», F-35 «Молния» и др. Также распознавание речи используется во многих современных автомобилях (правда, в основном премиум-сегмента) и для работы с навигационными сервисами, — Lexus, BMW, MercedesBenz и др. Да что там дорогие автомобили! Функции голосового управления (пока только для английских версий) есть в операционных системах Microsoft, начиная с Windows Vista (http://www.microsoft.com/enable/products/windowsvista/speech.aspx), а также Apple Mac OS X (http://www.apple.com/ru/accessibility/voiceover/).

Из разряда приятного дополнения распознавание речи все больше становится обязательной функцией для некоторых устройств. Например, компания Intel сделала наличие голосового управления новым условием для следующего поколения ультрабуков — . Но пока мы только ожидаем новое поколение ультрабуков, попробуем разобраться, какую из голосовых возможностей мы можем использовать уже сегодня в наших смартфонах и планшетах.

Голос всесильного поиска

Google Now

Функция голосового поиска была в мобильных сервисах Google уже давно. Теперь же (начиная с операционной системы Android 4.1) эти возможности интегрированы в некий персональный ассистент — Google Now. Приложение умеет искать ближайшие объекты (например, магазины или рестораны), показывать прогноз погоды, прокладывать маршрут в указанное вами место и кое-что другое. Максимум от этого сервиса могут получить активные пользователи сервисов Google и в частности Googl+, но другим пользователям он также будет небезынтересен. Сервис облачный, поэтому вам понадобится подключение к Интернету.

Нужно отдать должное Google Now: распознавание происходит очень хорошо. Осипший голос или дефекты речи — практически не проблема. А самое классное то, что распознаются более чем 25 языков, не считая десятка вариаций английского и испанского. Также хорошо распознаются и русский с украинским.

Единственное но: приложение полностью ориентировано на онлайновые сервисы и никак не взаимодействует с тем, что есть в вашем смартфоне.

Google Now

Разработчик: Google

Сайт: www.google.com/landing/now/

Доступна для Android 4.1+

+ большое количество поддерживаемых языков

+ агрегирует данные сервисов Google

— нет голосового управления смартфоном

Яблочная подруга

Siri

Сегодня, только ленивый не слышал про возможности голосовой помощницы «Сири». Владельцы яблочных устройств могут получить рекомендацию по заведениям, написать в социальную сеть, запускать приложения и даже заставить ее называть себя «Императором всея Руси». J

Как и многие проекты, Siri изначально была программным продуктом отдельно скачивающимся из Apple Store. А с 28 апреля 2010 года была куплена Apple. Затем разработчики доводили идею до совершенства, объединившись с исследователями из «Центра Искусственного Интеллекта» (SRI). Последний спонсировался DARPA, приложившей руку и к развитию Глобальной сети.

Из языков поддерживаются английский, испанский, итальянский, китайский, корейский, немецкий, французский и японский. Поскольку в концепции использовались слова «искусственный» и «интеллект», Siri не только применяет аппаратные механизмы для распознавания голоса, но и сохраняет речевые интонации. Поэтому со временем проблем с пониманием вашего вопроса будет становиться все меньше. Программа умеет не только отвечать на ваши поисковые запросы «где поесть?» или «куда сходить вечером?», но и управлять вашим яблочным смартфоном.

Сфера компетенции ограничивается как языками, так и географией. Siri может проложить маршрут или найти близлежащий объект только в США. Она использует для этого поисковую систему Yelp, полноценно доступную только там.

Siri

Автор: Siri Inc.

Разработчик: Apple Inc.

Сайт разработчика: www.apple.com/ios/siri

Доступна для iPhone 4S/5, iPad3/4/mini, iPod Touch 5

+ интегрирована в ОС

+ высокое качество распознавания текста

ограниченные географией сервисы

Голос Samsung

S-Voice

Видео о том, как говорит S-Voice нового Samsung Galaxy SIV по-русски:

Примечательно, что, не дождавшись встроенной альтернативы Siri для Android, Samsung запустил собственный сервис, доступный, правда, только на ограниченных моделях устройств южнокорейского производителя. Речь идет о сервисе SVoice, работающем на движке Vlingo (www.vlingo.com/), компании, совсем недавно объединившейся с Nuance — самым именитым разработчиком голосовых сервисов и не только.

«Девушка» SVoice, в общем-то, похожа по характеру с «яблочной» помощницей. Занимается она тем же: дает рекомендации заведений, обновляет статусы в социальных сетях, прокладывает маршруты, следит за вашим календарем, запускает приложения и звонит названным контактам. Говорит она тоже почти на тех же языках — английском, испанском, итальянском, корейском, немецком, французском и с недавних пор — русском. А вот японцам и китайцам пообщаться со смартфоном на родных языках не получится. Пользователям наших широт придется общаться с ней пока только на русском языке и иметь в виду, что славянские фамилии и имена программа распознает на слух не очень хорошо. Легче уж найти контакт самому, чем объяснить программе, кого ты имеешь в виду. J Да, и этот сервис доступен далеко не всем владельцам смартфонов Samsung, а только обладателям Galaxy SIII, Note II, Note 10.1, SIII mini и Galaxy Stellar.

S-Voice

Платформа: Android 4.0

Автор: Samsung

Разработчик: Samsung

Сайт разработчика: www.samsung.com/global/galaxys3/svoice.html

Доступна для Samsung Galaxy SIII, Note II, Note 10.1 и SIII mini и Galaxy Stellar.

+ интегрирована в ОС

поддержка небольшого количества языков

— поддержка ограниченого числа моделей устройств

Драконья речь

Dragon Dictation

Dragon Search

Еще одна попытка создать надежный и понятливый голосовой сервис от компании Nuance (www.nuance.com). В портфолио компании числятся бесспорно революционные ввод Т9 и swype-клавиатура. Первый был актуальным при вводе с кнопок на далеко еще не сенсорных телефонах, а вторая — для ввода без отрыва пальца от сенсорного экрана.

Dragon Dictation предназначена для ввода сообщений и последующей их отправки по SMS, Facebook или Twitter. Надиктованное сообщение можно сохранить как заметку. Распознавание речи — дело, бесспорно, тонкое. В настройках — 36 языков, в том числе русский и украинский. Ошибки в процессе распознавания встречаются редко, но звезд программа с неба не хватает. Пользоваться данным сервисом приемлемо, если у вас есть время отвлекаться на правку текста. Но безотказным этот вариант не будет, если пользоваться им за рулем.

Вторая программа — Dragon Search — является электронным помощником по поиску. Используя опять-таки голосовой ввод, она начнет искать по Сети сайты, фото, видео и отдельно на Youtube, Twitter и Wikipedia. Причем места поиска выбираются в удобной горизонтальной прокрутке.

Обе программы можно «поднатаскать», сразу исправляя неправильно распознанные слова. В дальнейшем они «привыкнут» к вашему произношению и ошибок будет меньше. Интуитивный и лаконичный интерфейс с необходимыми нам языками — явные плюсы. Ах да, пока что программы есть только на iOS, но разработчики обещают выпустить версии и для других платформ.

Dragon Dictation

Dragon Search

Разработчик: Nuance Mobile Solutions

Сайт разработчика: www.nuance.com

Адрес в Apple store:

Dragon Dictation www.itunes.apple.com/us/app/dragon-dictation/id341446764?mt=8

Dragon Search www.itunes.apple.com/ru/app/dragon-search/id341452950?mt=8

Оценка:

+ большое количество языков

+ бесплатная

неточное распознавание речи

Подытоживая вышесказанное, мы отметим, что, с одной стороны, технологии, как и полагается, не стоят на месте. Если у вас нет возможности купить флагманский смартфон, скачайте приложение, которое «оживит» ваш аппарат. С другой стороны, сколько ни оживляй, но доведения до совершенства взаимопонимания с цифровым интеллектом нужно еще подождать. Тем более в вопросе распознавания родной речи, которой могут похвастаться пока только продукты Dragon. Однако не стоит унывать, раз за дело взялись такие гиганты, как Intel и Google.

Robo User
Web-droid editor

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *