Рынок голосовых помощников показывает опережающий рост и грозит переворотом в потребительских привычках. Россия на фоне успехов западных IT-гигантов и китайских корпораций остается в авангарде и выводит все новые качественные сервисы. О том, кто победит в борьбе за пользователя, почему "Алиса" – антагонист "Маруси" и что готовит к запуску Google, рассказали на конференции Conversations в Петербурге.
В Петербурге 27 июня стартовала вторая по счету конференция по разговорному AI для бизнеса и разработчиков Conversations, посвященная индустрии голосовых помощников, умных колонок и голосовых интерфейсов. В этом году в ней приняли участие более 300 разработчиков, более 450 представителей бизнеса, которые заслушают свыше 40 докладов и мастер-классов. Цифры и аналитику в том числе презентовали Google, "Яндекс", МТС, Mail.ru Group, Сбербанк, "Мегафон", Ready for Sky, Хоум Кредит банк и Ozon.
Лейтмотивом центральных докладов ключевых разработчиков была заявлена трансформация в цифровой экономике, сдвиг в потребительской парадигме, который вывел разговорный AI, голосовые помощники и в целом ввод запросов голосом в авангард технологического прогресса. Рост этого рынка, по заверению представителей IT-гигантов и локальных разработчиков, уже опережает темпы развития веб-технологий и взрыв на рынке смартфонов в 2000-х. Через несколько лет в мире будет больше 1 млрд умных колонок, ассистенты – в каждом смартфоне, а роботы в call-центрах – в каждой крупной компании, уверены они.
Голосовой бум
Сегодня мы находимся на пороге нового сдвига – в сторону голоса – и он очень многое будет менять на рынке, заверил Кирилл Петров, управляющий директор, сооснователь Just AI, открывая конференцию. Сдвиг в сторону голосового UX (пользовательского опыта) связан прежде всего с развитием технологий. Так, у Google в 2013 году количество ошибок в распознавании речи составляло 23%, через 6 лет этот показатель снизился до 4,9% для английского разговорного. Технологии распознавания речи вскоре дополнили синтезом, и началось активное внедрение готовых технологий и гаджетов на рынке – на Западе это бум популярности Alexa в экосистеме Amazon, последние несколько лет эстафету подхватили в Китае, напомнил Петров.
Так, в 2017 году в Китае было продано 1 млн устройств, в 2018 году – уже 20 млн, то есть это рост в 20 раз; в I квартале этого года из 31 млн проданных устройств половина приходится на Китай. Таким образом, на рынке уже 150 млн устройств, к концу года будет 250 млн, а через 2-3 года – 1 млрд, прогнозирует основатель Just AI. Для сравнения: сейчас продано около 5 млн очков и шлемов виртуальной реальности – за все время развития этого сегмента. В итоге рынок и экосистема голосовых помощников растет быстрее, чем рос веб, быстрее рынка смартфонов. Лидирует по темпам роста Китай – Alibaba, Xiaomi, Baidu, – половина продаж которого приходится на разговорный AI.
Ключевыми трендами становится интеграция голосовых помощников в экосистемы IT-корпораций, подключение ко все большему количеству устройств от производителей электроники, запуск помощников с умными экранами, внедрение в бизнес-процессы, запуск игровых голосовых квестов, голосовые сообщения вытесняют sms, а роботы начинают повсеместно использоваться для оповещения и рекламы банков, операторов, компаний.
В ближайшие несколько лет к этому процессу подключится и Европа, которая стала активно развиваться в этом направлении, Россия также не отстает в создании собственных платформ. "Алиса" – пока главный голосовой помощник в нашей стране: по заверениям "Яндекса", он установлен у 35 млн пользователей. При этом в России очень популярен ассистент от Google, только начали работу "Маруся" и "Олег", и еще запланированы два запуска ассистентов. "Это очень конкурентный рынок, на котором соперничают качественные проекты", – подчеркнул Петров.
На фото: Конференция Conversations-1
1 млрд вопросов и Duplex
В "Яндексе" подчеркнули: в России пользовались голосовыми помощниками в той или иной степени 86% пользователей интернета. "Алиса" уже перешагнула отметку в 1 млрд обращений ежемесячно. "Люди учатся тому, как правильно спросить. Люди приучаются работать с ассистентами, и эта цифра – 1 млрд запросов – говорит о том, что критическая масса пользователей достигнута, начинается новый этап интеграции этих сервисов", – заявил Даниил Колесников, глава маркетинга голосового ассистента "Алиса" в "Яндексе". Главными направлениями развития помощника от поисковика он назвал создание экосистемы "умный дом" на базе "Алисы", а также экспансию на авторынке: "Алиса" колоссально популярна как помощник в навигаторе для российских водителей", – подчеркнул Колесников.
Следующими этапами в развитии разговорного AI в компании он назвал выход из закрытого бета-тестирования технологии привязки аккаунта "Яндекса" с "Алисой" к бизнес-аккаунтам, а также открытое бета-тестирование системы навыков от "Алисы" Discovery. "Люди любят управлять голосом, но в этом и главная проблема – правильно говорить голосом. Пользователям приходится формулировать команды. Но это происходит так же, как происходило с интерфейсами смартфонов. В России это происходит очень быстро", – подчеркнул представитель "Яндекса".
В России сформировался беспрецедентный рынок по количеству и качеству работающих голосовых ассистентов, а также сопутствующей инфраструктуры, подтвердил Андрей Липатцев, development manager Google Assistant. Он подчеркнул, что корпорация уделяет особое внимание локализации сервиса в России, где помощник от Google был официально представлен только в 2018 году. Когда в России начнутся продажи гаджетов от Google, умной колонки Home в частности, он уточнить не смог. "Это не имеет принципиального значения, главное – интеграция помощника в экосистему", – пояснил он. Сейчас в мире работают более 1 млрд устройств с доступом Google Assistant, больше 10 тыс. устройств для умного дома от 1,5 тыс. производителей, помощник доступен более чем в 80 странах на 20 языках. По прогнозам Google, в ближайшие 3-4 года на рынке будет больше 500 млн умных колонок и экранов от разных производителей. "Мы увидим рост, который превзойдет все наши ожидания. Этот рост более впечатляющий, чем у веба в свое время. И чем больше устройств, тем качественнее отзыв и обратная связь с разработчиками", – подчеркнул Липатцев.
Упомянул представитель Google и об актуальных разработках IT-гиганта в этом направлении. Одной из ключевых технологий он назвал Duplex on the web. Это выполнение действий на сайтах самим помощником: ассистент от лица пользователя проходит все этапы на сайте сторонней компании, например маркетплейса, вплоть до транзакции. Пообещали в Google и бесшовность исполнения запросов с поиском с помощью машинного обучения: помощник понимает операции и запросы в поиске, выводит их в диалог с пользователем и запоминает повторяющиеся запросы.
На фото: Конференция Conversations-2
"Милая, посмотри, что на сберкнижке"
Представили на конференции свои кейсы крупнейшие игроки рынка и локальные разработчики. Сбербанк, в частности, заявил о работе собственной системы голосовых помощников, способных обрабатывать в сутки свыше 600 тыс. запросов. При этом 37% от всех звонков в банк – это полная автоматизация от звонка и до окончания запроса, подчеркнули в финорганизации. Для улучшения работы помощника разрабатываются сценарии. Если пользователи не попадают в сценарий, то отрабатывается диалог до запроса и перевод к оператору. Как утверждают в Сбербанке, 3,7 млн уникальных предиктивных сценариев-запросов в месяц обслуживаются именно голосовыми ботами (это, например, вопросы о пособиях, одобрение кредита).
Клиенты не всегда способны определить, кто именно общается с ними – оператор или бот. "Бабушки, то есть люди пожилого возраста, не чувствуют разницу, говорят: "Доченька, милая, посмотри, что на моей сберкнижке", – отметила Мария Кудряшова, представитель голосового направления в Сбербанке. В качестве примера общения клиентов с ботами она показала переписку с чат-ботом. "Для соединения со специалистом достаточно произнести "оператор", – пишет робот клиенту. "А смысл? Я робота хочу", – отвечает тот. "Ваши вкусы весьма специфичны, но о вкусах не спорят", – парирует робот.
Сложно организовать именно простую болтовню помощника с пользователем, признается представитель Ready for Sky (разработка экосистемы “умной техники” для Redmont). "Мы придерживаемся двух направлений: исследование и партнерство. Может, мы и выйдем на уровень экосистем Google и Яндекс, но для создания таких помощников нужны соответствующие ресурсы", – отметил он. Андрей Степанов, ответственный за разработку помощника "Олег" для Tinkoff, говорит, что над собственным продуктом они работали с 2016 года, рассматривали варианты использования уже существующих помощников, однако «осенью 2018 года поняли, что нам другие облачные решения не нужны». В итоге после разработки собственного алгоритма распознавания речи за несколько лет в банке за 9 месяцев проработали следующий этап, синтез речи, и подготовили продукт к запуску. На вопрос: "Чем же Олег отличается от робота в call-центре или Алисы" – Степанов ответил: "Это не оператор call-центра. Это ваш друг, который умеет все. Это в первую очередь лайфстайл-помощник". "К тому же мы знаем про пользователя то, что не знает Яндекс", – добавил он.
"Мы, сами того не замечая, уже постоянно используем голосовых помощников в повседневной жизни. На пробежке я получаю данные от помощника в часах Garmin, музыку мне ставит второй помощник, а звонок в банк переводит меня на третьего", – рассказал на конференции Станислав Милых из "МегаФона". Говоря о разработке собственного помощника "Елена", он отметил, что за несколько лет конверсия робота стала больше, чем у человека-оператора. "Робота просто невозможно смутить. Клиент 3 раза сказал нет, но робот все же убедил его подключить услугу», – пояснил Милых, добавив, что 65% клиентов не захотели сказать "оператор" и решили проблему с помощью голосового помощника.
О процессе разработки и выпуска готового продукта на фабриках в Азии, например, для того же "Мегафона" или Яндекса рассказали в NotAnotherOne. Там пообещали, что на российском рынке скоро появятся новые устройства с голосовыми помощниками, в том числе, "умные" экраны. На вопрос, как в России организовать производство таких гаджетов и как идет их продвижение, в компании признали, что пока производство потребительской электроники на отечественном рынке развито слабо и без зарубежных фабрик не обойтись. "Например, видеорегистратор с голосовым помощником: сложно конкурировать с дешевыми моделями за 3-4 тыс., в такую цену встроить помощника нельзя, поэтому продвижение продукта на рынке идет медленно", – пояснила Вера Козырь. Впрочем, некоторые компании в России заказывают колонки в КНР, но ставят собственную оболочку, пояснила представитель компании Ксения. Например, Rooobo (работает с Just AI) специализируется на "умных" колонках для детей. Помощник "Емеля" или более новая версия Pudding развлекают, рассказывают сказки, умеют поворачиваться на звук и отвечают на простые вопросы. Впрочем, не только, на вопрос: "Что такое пудинг?" помощник ответил, что "пудинги занимаются межгалактическим туризмом".
Вопрос про товарища майора
Обсудили на круглом столе конкуренцию, будущее голосовых помощников и вопросы безопасности данных пользователей. В "Яндексе" заявили прямо – "Алиса" уже стала ключевым продуктом компании, платформой для дальнейших разработок и внедрений. "Мы никого не опасаемся. Конкуренция разгоняет рынок. Придут коллеги из Китая – замечательно, будем работать вместе. Ввод в любом случае будет голосовым, а вот вывод – на любых каналах. Это значит, что тот, кто сможет построить универсальную платформу для войс-приложений, тот и сможет выиграть в конкурентной борьбе. Именно на этом этапе и будет идти борьба", – подчеркнул представитель "Яндекса" Даниил Колесников.
Он рассказал, что разработчики, создавая "Алису", вдохновлялись фильмом "Она" Спайка Джонза, именно голос Татьяны Шитовой, озвучивающий робота в этом фильме, стал голосом "Алисы". В свою очередь, в Mail.ru Group раскрыли историю создания голосового помощника "Маруси". По словам Алексея Кривенкова, разработчик "Маруси" еще 10 лет назад издала книгу, русский киберпанк с главной героиней Марусей, по мотивам которой позже сняли фильм. Антагонистом Маруси в этой книге была Алиса. «Мы хотели создать дружественного, открытого помощника. Это остроумный и образованный школьник. А не персонаж, который со всеми знаниями интернета тебя поучает, как Алиса. Это скорее Лилу из "Пятого элемента", пояснил Кривенков.
Модератор дискуссии, сооснователь Just AI Кирилл Петров поднял тему приватности данных, включив отрывок из аудиокниги "1984" Джорджа Оруэлла. "Вопрос про товарища майора. Как жить, зная, что колонка может передавать данные третьей стороне? "Есть те, кто боится, а есть те, кто понимает, что польза превышает неудобства. Поставщики решений будут работать над приватностью в любом случае. Это вопрос личного отношения к гаджетам", – ответил представитель Mail.ru Group. "Мы очень внимательно относимся к безопасности данных. Более того, в "Станции" даже есть возможность физически обесточить микрофон. Эти опасения – психологического характера, обусловленные спецификой страны. Это психологический фактор, который c развитием технологии сойдет на нет", – добавили в "Яндексе".