Государственный фонд фондов
Институт развития Российской Федерации

Media Review

Голос на экспорт

06.09.2016
Источник: Коммерсантъ

«Яндекс» планирует экспортировать свои речевые технологии за пределы России. Для этого компания наняла топ-менеджера американского разработчика лингвистического и графического софта Nuance Виталия Юрченко. Объем рынка технологий, распознающих голос, может вырасти в ближайшие годы до $10 млрд, прогнозируют эксперты.

«Яндекс» нанял Виталия Юрченко — бывшего регионального директора американской Nuance в России и СНГ, разрабатывающей лингвистическое и графическое ПО, сообщили «Ъ» в «Яндексе». Господин Юрченко возглавил департамент развития бизнеса речевых технологий и продуктов Yandex SpeechKit. «В Европе и США уже начались встречи», — уточнили «Ъ» в компании. На первом этапе переговоры идут об интеграции речевых технологий «Яндекса» в автопром. В конце августа «Яндекс» подписал соглашение с КамАЗом, объявил о работе с Toyota, ранее встроил свой «Навигатор» в Honda и начал переговоры с другими автопроизводителями.

Сейчас обсуждается работа над проектами, связанными с connected cars («подключенные автомобили») и голосовым управлением автомобилем. «Речь идет о мировых производителях», — подчеркивают в «Яндексе», не раскрывая названий компаний — потенциальных партнеров. Кроме того, команда Yandex SpeechKit договорилась об интеграции голосового комплекса в коллцентры с несколькими российскими банками. «Соглашения на финальной стадии подписания», — утверждают в «Яндексе».

«Яндекс» представил собственный комплекс речевых технологий SpeechKit в 2013 году, с тех пор он используется в его навигационных, картографических и поисковых сервисах. Речевые технологии понимают смысл слов, а также не только слушают человека, но и отвечают ему с помощью технологии синтеза речи. SpeechKit распознает речь на русском, украинском, английском и турецком языках. Только за год — с лета 2015 года по лето 2016 года — SpeechKit распознал почти 1,2 млрд голосовых запросов, которые суммарно длились 1,677 млн часов. Качество распознавания зависит от тематики запроса: для географических названий оно составляет 95%, для коротких текстов — 88%, для текстов вроде заметок и SMS — 82%.

По словам главы Yandex SpeechKit Дениса Филиппова, речевые технологии «Яндекса» сегодня могут использоваться уже не только в массовых сервисах и приложениях. «Объемы поисковых данных и инфраструктура для работы с нейронными сетями позволяют «Яндексу» выйти на перспективный B2B-рынок с охватом различных сфер бизнеса в телекоммуникациях, медицине, автопроме, мобильной связи и даже для управления бытовыми устройствами, — рассчитывает он. — На этом рынке могут существовать как стандартные бизнес-модели (оплата по числу голосовых запросов, приобретение лицензий на продукты), так и перспективные модели (оплата за результат по итогам KPI)».

Рынок речевых технологий и голосового управления переживает значительный подъем, сегмент растет по всему миру, соглашается гендиректор «Центра речевых технологий» Дмитрий Дырмовский. По его словам, направление востребовано во многих отраслях — от банков до потребительской электроники. «Особенно большой потенциал мы видим в развитии голосовых ассистентов и «интернета вещей"», — говорит он.

Голос — это данные, а «Яндекс» — одна из тех редких компаний, которая способна производительно работать с огромными их массивами, рассуждает управляющий портфелем Фонда развития интернет-инициатив Сергей Негодяев. По его словам, по мере удешевления вычислительных мощностей, роста скоростей передачи данных в сетях и появления все более сложных алгоритмов обработки Big Data голосовые интерфейсы управления могут стать массовыми. «Корпорации ежегодно тратят десятки миллиардов долларов на содержание колл-центров. По мере развития речевых интерфейсов они готовы будут перенаправить свои бюджеты на автоматизацию работы с клиентами», — продолжает господин Негодяев, добавляя, что через пять-шесть лет аналитики обещают мировому рынку распознавания речи объем $5-10 млрд.


Место проведения: