Доказана реализуемость устройства, генерирующего речь из мыслей

Группа нейроучёных из США опубликовала в журнале Nature статью, описывающую созданную ими технологию для генерации речи с нормальной скоростью (100 слов в минуту и более) на основе сигналов мозга. По мнению авторов, необходимые для её практического применения разработки находятся "в пределах досягаемости", что даёт надежду потерявшим способность говорить пациентам.

Группа нейроучёных из США опубликовала в журнале Nature статью, описывающую созданную ими технологию для генерации речи с нормальной скоростью (100 слов в минуту и более) на основе сигналов мозга. По мнению авторов, необходимые для её практического применения разработки находятся "в пределах досягаемости", что даёт надежду потерявшим способность говорить пациентам.

Авторы уточняют, что созданная ими система не превращает завершённые фразы в мысли, а скорее озвучивает то, что человек намерен сказать. В нынешнем виде применение разработки Гопалы Ануманчипалли, Эдварда Чанга и их коллег из Университета Калифорнии в Сан-Франциско крайне сложно технически, возможно только на здоровых, способных говорить пациентах и требует хирургического вмешательства. Поэтому в экспериментах участвовали люди, уже имевшие вживлённые в мозг по различным медицинским показаниям большие группы электродов (см. фото к статье).

Участников попросили зачитать вслух несколько сот фраз, при этом записывая определяемые электродами мозговые сигналы. Затем удалось создать систему, которая, преобразовывая записи мозговой активности в команды для компьютерной, анатомически подробной модели человеческого речевого аппарата, производила достаточно чёткую, хотя и с ошибками, речь.

Таким образом, учёные доказали, что возможно создать систему, преобразующую мозговую активность в речь со скоростью на порядок более высокой, чем это удаётся существующим приборам, в которых пациент выбирает буквы на экране движениями глаз или концентрируясь на них мысленно. Кроме того, она до определённой степени позволяет воспроизвести интонации человеческого голоса, сделав синтезированную речь более эмоциональной.