Сражение на рынке голосовых ассистентов внезапно вышло на совершенно новый уровень. Microsoft купила компанию Semantik Machines, которая разрабатывает системы искусственного интеллекта, способные воспринимать человеческую речь и поддерживать естественную беседу. Об объединении говорится в заявлении Microsoft. Сумму сделки компания не раскрывает, но пресса уже окрестила это слияние одним из самых важных для Microsoft шагов в направлении развитии ее сервисов, построенных вокруг нейросетей и прочего машинного обучения.
Тут интересны несколько нюансов. По мнению журналистов, самое ценное в Semantik Machines – это команда, состоящая из видных экспертов в области искусственного интеллекта. Особенно заметен Ларри Гиллик: бывший топ-менеджер Apple, который занимался созданием Siri. А еще там те, кто учил Google-ассистента, профессора университетов Беркли и Стэнфорд. В общем, натуральная dream team.
Другой момент: Microsoft обещает, что технологии Semantik Machines будут использованы для развития голосового помощника Cortana (которая сможет научиться разговаривать с людьми на языке, более похожем на человеческий), и, что, вероятно интереснее, будут интегрированы в Microsoft Azure.
Это облачная платформа для разработчиков и одновременно, облачная же инфраструктура. То есть условно законченное решение для развития самых разнообразных сервисов. Там уже есть инструменты для создания чат-ботов. А теперь они вероятно, станут еще и свободно говорящими. Иными словами, голосовые технологии будут тиражировать и продавать всем желающим.
Надо заметить, что следующий рубеж для индустрии голосовых помощников обозначил Google всего пару недель назад, продемонстрировав новую функцию Assistant: Duplex. На конференции для разработчиков компания показала, как Assistant звонит в парикмахерскую и в ресторан, инициирует и поддерживает естественный диалог. Эта демонстрация поразила (и немного напугала) журналистов и конкурентов. Но сейчас удивление первых дней сменилось скепсисом: сразу несколько изданий написали о том, что презентация и разговоры бота с людьми, вероятно, не были экспромтом. Ресурс Мэшабл выяснил, в какой именно ресторан звонил Assistant, журналисты обратились туда за подробностями, и персонал не смог ответить на все вопросы.
Впрочем, не так важно насколько академически достоверной была демонстрация Google Duplex. Важнее то, что у Semantik Machines на сайте есть фактически аналогичный сценарий, пример функции "Консьерж", которая способна бронировать столики в ресторане по просьбе пользователя. И ради этого в том числе Microsoft, очевидно, и купил звездную команду разработчиков нейросетей и голосовых ботов.
И еще немного про тренировку нейросетей: Исследователи компании Nvidia заставили компьютер учиться прямо у людей, наблюдая за ними. Корпорация выпустила короткое видео, в котором показала, как искусственный интеллект сначала анализирует действия человека с разными кубиками, а затем повторяет их.
Для выполнения задачи нейросеть раскладывает ее на шаги и поочередно выполняет каждый из них. Например, положить желтый кубик на красный, зеленый на желтый, синий на зеленый.
Если задача прервана, робот может продолжить ее с нужного места. По словам исследователей, всё это заметно упрощает процесс обучения роботов рутинным задачам, не требующим особой вариативности.
Что любопытно, эти кубики и машинки на видео нереальны, они часть компьютерной симуляции. В Nvidia говорят, что такой подход позволяет машине учиться быстрее, чем при использовании физических объектов: с ними работать сложнее, и вероятность ошибки машины больше. В общем, большой брат следит и учится.