Проект кафедры истории медицины Московского государственного медико-стоматологического университета им. А.И. Евдокимова

Создан нейроинтерфейс для распознавания речи парализованных людей

15 ноября 2022

Ученые из США разработали нейроинтерфейс, позволяющий распознавать речь парализованных больных и людей с проблемным речевым аппаратом с высокой точностью. Установка ошибается лишь в 6% случаев, что ускоряет процесс озвучивания, пишут ученые в журнале Nature Communications.

За последние годы ученые создали несколько десятков нейроинтерфейсов, трансформирующих активность мозга пациентов в устную или письменную речь. Они состоят из набора имплантированных в мозг электродов и позволяют парализованному человеку двигать курсор мыши по экрану компьютера, нажимать им на кнопки виртуальной клавиатуры, а также рисовать буквы на экране. Такой подход упрощает процесс набора текста и позволяет быстро декодировать слова и предложения с минимумом ошибок. Это позволяет паралитикам общаться с окружающими людьми.

Новая система опирается на радиотелефонный фонетический алфавит, который международные организации используют для точной передачи букв латинского алфавита. Для этого каждый символ кодируют коротким английским словом: символ f обозначают словом foxtrot (фокстрот), а букву u - словом uniform (униформа).

Ученые предположили, что всплески активности мозга, вызванные мыслями о конкретном слове, можно будет распознать при помощи нейросети. Чтобы проверить эту идею команда имплантировала электроды в мозг парализованного добровольца и записала сигналы мозга, которые возникали когда пациент произносил кодирующие буквы фонетического алфавита слова.

При помощи полученных данных специалисты обучили нейросеть. Она различала кодовые слова в режиме реального времени и использовала их для составления слов и предложений. Чтобы повысить качество работы системы ученые настроили ее таким образом, что она игнорировала все сигналы, не совпадающие со встроенным словарем из 1,1 тыс. самых употребимых слов английского языка.

Метод позволил добровольцу произносить по несколько слов в минуту и совершать при этом минимальное число ошибок. Специалисты надеются, что высокая скорость и точность работы их системы сделает жизнь немых и парализованных пациентов более комфортной уже в ближайшие годы.

По материалам сайта ТАСС