Голосовые помощники – новая точка роста технологических компаний

Голосовые помощники с элементами искусственного интеллекта (ИИ), распознающие речь, значительно усовершенствовались с момента своего первого появления. Теперь они гораздо лучше понимают пользователей и совершают меньше ошибок. Прогресс в технологии ускоряет ее коммерциализацию.

Крупнейшие технологические компании запустили коммерческие версии голосовых помощников. На рынке представлены: Alexa от лидера интернет-торговли Amazon.com Inc. (AMZN, NASDAQ), Google Assistant от корпорации Alphabet Inc. (GOOGL, NASDAQ), Siri от одной из крупнейших IT-компаний Apple Inc. (AAPL, NASDAQ), Cortana от лидера в области программного обеспечения Microsoft Corporation (MSFT, NASDAQ). Такие помощники могут осуществлять поиск в интернете по голосовому запросу, напоминать о событиях, отвечать на вопросы, включать музыку и т. д. Алгоритмы распознавания голоса также начинают использоваться в мультимедийных системах автомобилей, видеоиграх, сервисах поддержки пользователей и т. д.

В ходе опроса руководителей компаний, 32% респондентов сказали, что программы распознавания голоса, такие как Siri от Apple, Google Assistant от Alphabet Inc., Alexa компании Amazon.com являются наиболее часто используемыми на рабочем месте сервисами. Предполагается, что к 2020 г. такие технологии будут обслуживать 85% запросов клиентов компаний.

Существующие сейчас программы – Alexa, Siri, Cortana, Google Assistant – уже могут выполнять многие задачи и начинают приносить доход.

Однако распознавание голоса у современных программ все еще несовершенно, в частности, голосовой помощник не понимает вопроса, если пользователь говорит слишком быстро или с акцентом. Именно высокий процент ошибок в распознавании пока является одним из самых серьезных ограничений для развития. Нейронные сети, на основе которых работают помощники, могут лучше распознавать речь при наличии огромной базы данных. Поэтому успех в этой сфере напрямую связан с созданием массива голосов на разных языках, диалектах и с разными акцентами.

Крупнейшие компании, такие как Amazon.com, Apple, Microsoft, Google и китайская компания Baidu давно приступили к сбору образцов человеческой речи. Microsoft привлекла добровольцев для записи образцов повседневной речи по всему миру. Например, благодаря приложению для игровой приставки Xbox компания собрала большой массив данных на португальском языке в Бразилии для локальной версии голосового помощника Cortana. Baidu собирает образцы для каждого диалекта в Китае. Google также собирает десятки тысяч звуковых фрагментов длиной от двух до пяти секунд. В настоящее время разработчики стремятся к тому, чтобы сократить количество ошибок в распознавании речи до 1% и менее. После этого начнется быстрая экспансия технологии на мировой рынок.

В решении проблем распознавания речи в шумовом потоке также намечены определенные положительные сдвиги. Например, Microsoft тестирует технологию, которая может отвечать на запросы путешественников, игнорируя шум громкоговорителей и транспорта на вокзалах и в аэропортах. Подобная технология также используется в автоматизированной системе заказа для сети быстрого питания McDonald's.

Amazon проводит испытания голосового помощника в автомобилях, совершенствуя возможности Alexa по работе в условиях дорожного шума и при открытых окнах.

Системы распознавания речи открывают новые возможности для бизнеса. Так, цифровой помощник Cortana в будущем году станет доступным для производителей устройств. Компания Harman International Industries Inc. уже использует Cortana в управляемых голосом устройствах. Банк Capital One Financial Corp. использует цифровой помощник Microsoft, чтобы помогать клиентам управлять деньгами, а Expedia Inc. разработала на базе Cortana бота для заказа отелей.


Размещённая в данном разделе информация и материалы носят справочно-информационный характер, адресован клиентам ООО ИК «Фридом Финанс», не является индивидуальной инвестиционной рекомендацией, не является предложением инвестировать в акции иностранных компаний.. Финансовые инструменты либо операции, упомянутые в данном обзоре, могут не соответствовать Вашему инвестиционному профилю и инвестиционным целям (ожиданиям). В информации, указанной в данном обзоре, не принимаются во внимание Ваши личные инвестиционные цели, финансовые условия или нужды. Определение соответствия финансового инструмента либо операции инвестиционным целям, инвестиционному горизонту и уровню допустимого риска является Вашей задачей. ООО ИК «Фридом Финанс» не несет ответственности за возможные убытки инвестора в случае совершения операций, либо инвестирования в упомянутые в данном разделе финансовые инструменты, и не рекомендует использовать указанную информацию в качестве единственного источника информации при принятии решения.

ООО ИК «Фридом Финанс» оказывает услуги заключения расчетных внебиржевых форвардных контрактов, базовым активом которых могут являться инструменты, размещаемые на торгах иностранных организаторов торгов, согласно пункта 4 Указания Банка России от 16.02.2015 N 3565-У "О видах производных финансовых инструментов" в Порядке оказания услуг по заключению договоров, являющихся производными финансовыми инструментами (Приложение №5 к Регламенту обслуживания Клиентов ООО ИК «Фридом Финанс», далее — Порядок) и в соответствии со Стандартными условиями форвардного контракта на цену иностранного финансового инструмента (Тип «IPO») (Приложение №2 к Порядку). Согласно ч. 2 ст. 1062 ГК РФ требования граждан, связанные с участием в сделках, предусматривающих обязанность стороны или сторон сделки уплачивать денежные суммы в зависимости от изменения цен на ценные бумаги, курса валюты, подлежат судебной защите только при условии их заключения на бирже. ООО ИК «Фридом Финанс» не оказывает услуги приобретения иностранных ценных бумаг, упомянутых в данном обзоре, за счет клиентов, не являющихся квалифицированными инвесторами.

ООО ИК «Фридом Финанс». Лицензия № 045-13561-100000 на осуществление брокерской деятельности, срок действия лицензии не ограничен.