Голосовые помощники-«полиглоты»: новый рынок для ИИ

Современные голосовые помощники могут отвечать на вопросы пользователей, делать заказы, сообщать о прогнозе погоды и т. д. Однако они до сих не могут вести полноценную беседу, как люди. В частности, голосовые помощники не могут легко воспринимать все акценты, быстро переходить с одного языка на другой и т. д. Именно в этом направлении будут в ближайшее время развиваться системы с элементами искусственного интеллекта (ИИ). Расходы на развитие когнитивных систем значительно вырастут и могут достичь среднегодового темпа роста 54,4% к 2020 г.
В качестве примера можно привести разработки компании Microsoft (MSFT, NASDAQ), которая «учит» голосовых помощников быстро переключаться между языками, понимать акценты, диалекты и особенности произношения. Microsoft запустила проект Mélange в Индии, где местные жители часто почти одновременно используют хинди и английский язык. Индия – крупный рынок, и продвижение голосового помощника Cortana от Microsoft будет зависеть от его умения легко переходить между двумя популярными в стране языками. Новая технология обеспечит быстрое внедрение голосовых помощников, так как проблема многоязычности актуальна для большинства стран.

Сейчас Cortana доступен в Windows 10 и на некоторых смартфонах, работающих под управлением Windows. У голосового помощника около 140 млн активных пользователей в месяц и около 500 млн устройств, работающих в Windows 10.

Скорее всего, усовершенствование голосовых помощников для понимания разновидностей человеческой речи, потребует немало времени, так как необходимо собрать большой набор данных для анализа и машинного обучения. В настоящее время разработчики изучают сообщения соцсети Twitter, где люди используют разговорную речь, сленг, смешанные языки и т. д. Данные помогут выяснить, в каких случаях двуязычные люди переходят с одного языка на другой, какую лексику используют в разных ситуациях. Эти сведения позволят обучить голосовые помощники и приблизить их общение к естественному.