Речевой аппарат, разработанный совместной группой нейробиологов, нейрохирургов и инженеров Университета Дьюка, может переводить сигналы мозга человека в то, что он пытается сказать.
Новая технология, представленная 6 ноября в журнале Nature Communications, может помочь людям, неспособным говорить из-за неврологических расстройств, вновь обрести способность общаться с помощью интерфейса "мозг-компьютер".
"Существует множество пациентов, страдающих от изнурительных двигательных расстройств, таких как ALS (боковой амиотрофический склероз) или синдром блокировки, которые могут нарушать их способность говорить", - сказал Грегори Коган, доктор философии, профессор неврологии в Медицинской школе Университета Дьюка и один из ведущих исследователей, участвовавших в проекте. "Но существующие средства, позволяющие им общаться, как правило, очень медленные и громоздкие".
Представьте себе прослушивание аудиокниги на половинной скорости. В настоящее время наилучшая скорость декодирования речи составляет около 78 слов в минуту. Люди же произносят около 150 слов в минуту.
Отставание между скоростью произнесения и декодирования речи отчасти объясняется тем, что на тонкую бумагу, которая располагается на поверхности мозга, можно наклеить сравнительно небольшое количество датчиков мозговой активности. Меньшее количество датчиков дает меньше информации для декодирования.
Для того чтобы преодолеть прежние ограничения, Коган объединил усилия с сотрудником Института наук о мозге Дьюка Джонатаном Вивенти, доктором философии, чья лаборатория биомедицинской инженерии специализируется на создании высокоплотных, ультратонких и гибких датчиков мозга.
В рамках этого проекта Вивенти и его команда разместили 256 микроскопических датчиков мозга на куске гибкого медицинского пластика размером с почтовую марку.
Нейроны, находящиеся на расстоянии всего одной песчинки друг от друга, могут проявлять совершенно разную активность при координировании речи, поэтому для точного прогнозирования предполагаемой речи необходимо различать сигналы от соседних клеток мозга.
После изготовления нового имплантата Коган и Вивенти объединились с несколькими нейрохирургами Университетской больницы Дьюка, включая Дерека Саутвелла, доктора медицины, доктора философии, Нандана Лада, доктора медицины, доктора философии, и Аллана Фридмана, доктора медицины, которые помогли набрать четырех пациентов для тестирования имплантатов. В ходе эксперимента исследователям пришлось временно поместить устройство в мозг пациентов, которым проводилась операция на головном мозге по другому поводу, например, для лечения болезни Паркинсона или удаления опухоли. Коган и его команда были ограничены во времени, чтобы испытать свое устройство в операционной.
"Мне нравится сравнивать это с пит-командой NASCAR", - сказал Коган. Мы не хотим добавлять дополнительное время к операционной процедуре, поэтому мы должны были войти и выйти в течение 15 минут". Как только хирург и медицинская бригада сказали "Поехали!", мы бросились в бой, и пациент выполнил задание".
Задание представляло собой простую процедуру прослушивания и повторения. Участники слышали ряд бессмысленных слов, таких как "ава", "куг" или "вип", а затем произносили каждое из них вслух. Прибор регистрировал активность речедвигательной коры головного мозга каждого пациента, координируя работу почти 100 мышц, двигающих губами, языком, челюстью и гортанью.
После этого Сусеендракумар Дурайвел (Suseendrakumar Duraivel), первый автор нового доклада и аспирант факультета биомедицинской инженерии Университета Дьюка, получил нейронные и речевые данные из операционной и ввел их в алгоритм машинного обучения, чтобы проверить, насколько точно он может предсказать, какой звук был произнесен, основываясь только на записях активности мозга.
Для некоторых звуков и участников, например, /g/ в слове "gak", дешифратор в 84% случаев правильно определял первый звук в строке из трех, составляющих данное бессмысленное слово.
Однако при выделении звуков в середине или в конце бессмысленного слова точность снижалась. Также затруднения возникали, если два звука были похожи, например, /p/ и /b/.
В целом дешифратор был точен в 40% случаев. Это может показаться скромным результатом, но он весьма впечатляет, если учесть, что для подобных технических упражнений по преобразованию речи в мозг требуется несколько часов или дней работы с данными. Однако алгоритм декодирования речи, который использовал Дурайвел, работал всего с 90 секундами речевых данных, полученных в ходе 15-минутного теста.
Дурайвел и его наставники с нетерпением ждут возможности создания беспроводной версии устройства благодаря недавно полученному гранту в размере 2,4 млн. долл. от Национального института здравоохранения.
"Сейчас мы разрабатываем такие же записывающие устройства, но без проводов", - сказал Коган. "Вы сможете передвигаться, и вам не придется привязываться к электрической розетке, что очень интересно".
Хотя их работа вселяет оптимизм, до появления речевого протеза Вивенти и Когана на прилавках магазинов еще далеко.
"Мы находимся на том этапе, когда скорость речи все еще значительно ниже, чем у естественной речи, - сказал Вивенти в недавней статье о технологии, опубликованной в журнале Duke Magazine, - но вы можете увидеть траекторию, по которой вы сможете к ней прийти".
https://earth-chronicles.ru/news/2023-11-08-175374