Новая система распознавания речи, разработанная инженерами Microsoft, "достигла паритета с человеком". "Это историческое достижение", — так оценил прорыв руководитель исследовательского подразделения Microsoft Research Сюэдун Хуан.

Читайте также: Приложение "Яндекс.Диктовка" превратит речь в текст

Новая технология расшифровывает речь с очень высокой точностью: частота ошибок неправильного определения слов не превышает 5,9%, пишет The Verge. Как говорят в компании, процент погрешности "примерно сравним" с операторами-профессионалами, которые вводят текст под диктовку.

Система Microsoft задействует нейронные модели языка, которые группируют слова по общности словообразовательных признаков. Разработка может быть использована для улучшения качества распознавания речи Cortana — голосовой ассистентки на Windows-устройствах и игровых консолях Xbox One, — а также в софте, преобразовывающим речь в текст.

Читайте также: Искусственный интеллект Google совершил прорыв в синтезе речи

Несмотря на впечатляющий результат, система Microsoft нуждается в доработке. Во-первых, она должна быть отлажена на сложных ситуациях из реальной жизни, в самых разных условиях (на улице, в метро), с учетом тембровой вариативности, особенностей произношения и т.д. Во-вторых, соответствующим образом должна быть обучена Cortana, которая должна не только правильно "слышать" произнесенные человеком фразы, но и понимать их смысл.

Источник: The Verge