Компания Nuance — фактически монополист на рынке технологий распознавания голоса — официально объявила о своем пришествии в Россию. Нашим пользователям компания может быть знакома по голосовой помощнице Siri в iPhone.

Дело в том, что компания Siri построила свой одноименный продукт на базе технологии Nuance еще до того, как Apple купила эту самую компанию. А в целом широкой общественности в России компания неизвестна, однако ее технологии по распознаванию речи стоят в контакт-центрах "Аэрофлота" и в приложениях AnyWayAnyDay.

Осенью прошлого года Nuance бесплатно выкатила на российский рынок мобильные приложения Dragon Dictation, которое преобразует речь в текст на экране, и Dragon Search, который позволяет просто надиктовать поисковый запрос и найти любую информацию и ответы.

Приложения были доступны абсолютно бесплатно, правда, дело тут не в благотворительности. Во-первых, компания показывала российским разработчикам приложений свои возможности, и во-вторых, технология изучала русский язык.

"В первый раз, когда вы только устанавливаете Dragon на компьютер, точность и правильность воспроизводимых слов будет на уровне примерно 80 процентов. Затем вы тренируете свою программу! После года использования корректность воспроизводимого текста составит примерно 95%", — пояснил вице-президент направления решений для персональных компьютеров Nuance Фредерик Делахайс.

На этом этапе программа способна переводить из голоса в текст 120 слов в минуту, кроме того Dragon прекрасно распознает особые словосочетания, аббревиатуры, просторечные сокращения или слова-паразиты пользователя.

Вообще у Nuance есть довольно много голосовых решений — облачные для мобильных, десктопные для тех, кто работает с большим количеством документов — в пример приводят врачей и юристов, большие промышленные компании, где нужны call-центры.

"Это решение существует уже больше года на русском рынке и довольно высокого качества для русского языка. Если мы говорим о десктопном варианте, а не об облачном, то эти продукты намного шире. Они дополняют функционал распознавания, как например, редактирование, исправление ошибок, управление самим компьютером, даже форматирование текста", — уточняет представитель компании Nuance Communications Виталий Юрченко.

Как это будет работать с русским языком пока не совсем понятно, большинство продуктов Nuance запустятся на нашем рынке в 2013 году. И это будет только отправная точка: чем больше и чаще пользователь будет использовать эти голосовые возможности (например, в машине Dragon Drive), тем лучше технология будет работать.

Стоит оговориться, что есть в Nuance и продукты для распознавания печатного текста: здесь они конкурируют с Abbyy, которая до сих пор безраздельно властвовала в нашей стране со своим Fine Reader. По слухам, она подумывала и о распознавании речи, но опасалась Nuance.

Последняя, кстати, славится своим агрессивным стилем по отношению к соперникам. Nuance ("Нюанс") скупил большинство конкурирующих проектов, а тех, кто не хотел продаваться, как например проект Vlingo, сначала замучил исками, а потом поглотил.

* * *

Яндекс запустил персональный поиск. Он предлагает пользователям подсказки и ответы, учитывая их личные интересы и предпочтения. Технология работает так: Яндекс пытается понять, что интересует пользователя, анализируя его поисковое поведение — о чем человек спрашивает, на какие сайты переходит, нужны ли ему ответы на английском. Эти данные учитываются при выборе подсказок и формировании результатов поиска.

Так, по запросу "пряничный человечек" молодым родителям Яндекс предложит американскую сказку — аналог нашего Колобка, а пользователю, который часто просматривает кулинарные сайты, Яндекс предложит рецепты пряников.

Таким образом, качество поиска для конкретного человека резко возрастает. Пользователь сразу получает тот ответ, который нужен именно ему, и экономит свое время.

"Это машинное обучение. Выглядит оно примерно так. Каждый пользователь, который залогинен, получает уникальный идентификатор. И мы аккумулируем некоторое количество знаний по поводу того, какие запросы задавались из этого браузера, на какие ответы из этой выдачи переходили. Исходя из этого машинным обучением получаем некий профиль, который позволяет нам выдавать более точный результат. Если человек не залогинен, то профиль привязан к браузеру", — рассказывает директор по распространению технологий компании Яндекс Григорий "Бобук" Бакунов.

По умолчанию персонализация работает для всех пользователей поиска. И чем больше запросов задает человек, тем лучше поиск его понимает. Отключить персональный поиск тоже можно, это легко сделать в настройках сервиса.

Что касается столь популярной темы о социальной составляющей поиска, то у Яндекса сформировался свой взгляд на этот вопрос. Специалисты компании попытались сегментировать людей в группы по запросам и выбору ответов, получилось примерно 400 тысяч групп. В каждой примерно по 10 человек.

"Этот эксперимент про 400 тысяч групп показал, что большинство людей не интересуются отношением своих друзей к чему бы то ни было. Ваши интересы пересекаются процентов на 5-8, все остальное, что ты ищешь в поиске, не связано с твоими друзьями", — делает вывод директор по распространению технологий компании Яндекс Григорий "Бобук" Бакунов.