Голосовое управление компьютерной техникой – возможность, доступная некогда только в фантастических фильмах. Но с некоторых пор она стала реальностью практически для всех операционных систем. И за право первенства здесь борется целый ряд компаний. Среди них числятся Apple, Google, Microsoft и Yandex. Есть и другие разработчики. Но они, как правило, ограничиваются небольшим количеством приложений без плотной интеграции с возможностями операционных систем.
Голосовой поиск Google и сервисы управления доступны для платформ iOS и Android, а также браузера Google Chrome. Для активации сервиса необходимо нажать на значок микрофона или произнести «О’кей Google». Подробная инструкция по использованию голосового поиска расположена по следующему адресу.
Определенная часть голосовых функций в Android будет работать, только если установлена версия операционной системы, начиная от 4.4 и выше. Также требуется приложение Google версии 3.5 или более поздней и включенные подсказки Google Now.
Помимо функции поиска в Интернете доступны следующие возможности:
работа с календарем, будильниками и напоминаниями – установка будильника, создание напоминания, создание мероприятия в «Google Календаре», просмотр предстоящих платежей;
голосовой набор номера, отправка SMS и электронных писем;
геолокация – поиск маршрута и мест, находящихся поблизости;
различные языковые функции, включая перевод фраз на другой язык, конвертацию единиц измерения, поиск определений слов и решение несложных математических задач.
Среди сторонних приложений, работающих с функцией голосового поиска, числятся такие, как Shazam, Telegram, WhatsApp, Viber и ряд других.
Для браузера Chrome доступен гораздо более скромный набор возможностей, что вполне объяснимо.
Языковые возможности голосового поиска в настольной версии браузера включают в себя следующее:
поиск фильмов;
поиск мест поблизости;
подсчет чаевых;
перевод слов и фраз;
поиски определений слов;
конвертацию единиц измерения;
решение несложных математических задач;
Возможности голосового поиска Google для iOS фактически совпадают с возможностями, доступными для Android – естественно, с поправкой на соответствующие приложения.
На сегодняшний день доступны
работа с календарем и напоминаниями – создание напоминания, создание мероприятия в «Google Календаре», проверка расписания;
поиск информации по мультимедийному контенту в Интернете и на устройстве;
геолокация – поиск маршрутов, мест и планирование поездок;
информационные возможности, идентичные тем, что доступны для браузера Google Chrome.
Microsoft
Здесь все просто: голосовой поиск Cortana, который корпорация внедрила практически во все свои новейшие устройства и версии ОС, на русском пока не доступен. Информация о возможности появления русскоязычного сервиса самая противоречивая: одни источники утверждают, что перевод уже идет полным ходом, другие выражают сомнения в том, будет ли вообще когда-то реализована эта функция для русского языка. В англоязычной версии Cortana для поиска в Интернете работает с сервисом Bing. В случае, если поиск ведется в браузере, поисковый сервис можно переключить (например, на Google). Работать с языковым движком Cortana умеют далеко не все браузеры – если Firefox поддерживает эту возможность напрямую, то для Chrome требуется установка сторонних расширений. Любопытно, что Cortana была названа в честь героини серии компьютерных игр Halo.
В целом возможности продвинутого голосового поиска и управления, предоставляемые Microsoft, для российской аудитории неактуальны. Базовые команды управления устройством при этом могут быть доступны, но их возможности весьма ограничены.
Apple
Siri – пожалуй, самый известный «голосовой помощник» в мире. Что и неудивительно: Apple числится среди пионеров внедрения технологий text-to-speach и speach-to-text. Подобные возможности были доступны для пользователей Apple задолго до начала эры мобильных технологий и были реализованы еще в семействе операционных систем MacOS Classic 90-х годов XX века. Впрочем, Siri имеет весьма слабое отношение к «классической традиции». Это современный голосовой движок, ориентированный на плотную интеграцию с различными сервисами, доступный для платформы iOS.
Siri доступна на смартфонах Apple, начиная с iPhone 4s и планшетах (начиная с iPad Mini). Поддержка русского языка этим голосовым помощником появилась относительно недавно. По некоторой информации, «русская» Siri способна цензурировать ответы, даваемые пользователю. В целом, мобильный голосовой помощник Apple не лишен чувства юмора.
По умолчанию Siri способна работать с большим количеством приложений, включая FaceTime, Mail, сообщения, календарь, напоминания, заметки, контакты, таймер, поиск в Интернете, Facebook, Twitter и ряд других.
В Mac OS возможности использования голосовых сервисов реализованы достаточно скромно. Большая часть функций доступна через сервис «Диктовка». Пользователю предоставляется возможность надиктовывать текст и управлять компьютером при помощи голосовых команд.
Yandex
Yandex – одна из немногих отечественных компаний, занимающихся разработкой общедоступных языковых сервисов. «Сердцем» технологии является Yandex.SpeechKit, доступный для платформ iOS, «Андроид» и Windows Phone 8. Практически все мобильные приложения компании (включая «Яндекс.Браузер», «Яндекс.Город», «Яндекс.Карты», «Яндекс.Навигатор») поддерживают возможности голосового поиска и управления. Помимо этого, с Yandex.SpeechKit умеют работать и несколько сотен сторонних приложений, а наличие соответствующего API позволяет интегрировать сервис практически в любую программу (прочем, подобные возможности есть и у Google).
Отличительная особенность голосовых сервисов Yandex – высокая точность распознания слов на русском языке: более 84% для обычных запросов и более 94% для запросов, связанных с геолокацией.
Подводим итоги
Сравнивать системы голосового поиска и управления, разрабатываемые разными компаниями, – занятие неблагодарное. Разница в аудитории и сфере применения голосовых сервисов не позволяет проводить прямые параллели. Впрочем, этот факт не мешает сделать несколько итоговых замечаний.
По широте присутствия на различных платформах первое место в списке голосовых сервисов принадлежит, естественно, Google. По широте возможностей – здесь, пожалуй, впереди будет Apple. А вот наилучшая поддержка русского языка, естественно, у Yandex.
Фото: Фото с сайта Shutterstock.com