Новая портативная система ИИ умеет превращать мысли в текст

Специальная программа считывает и расшифровывает электрические сигналы мозга.
Shutterstock

Соединенная с искусственным интеллектом портативная система, не требующая хирургической операции для установки, позволяет мысленно надиктовывать текст, сообщается на сайте Сиднейского технологического университета (Австралия).

«Эта технология способна помочь людям, которые не могут говорить из-за болезни или травмы, например, перенесшим инсульт или парализованным. Они получат возможность общаться. Устройство также может обеспечить беспрепятственную связь между людьми и машинами, например бионической рукой или роботом», — говорится в сообщении.

Прототипы устройств для преобразования сигналов мозга в языковые единицы уже имеются. Однако они или требуют хирургического вмешательства для имплантации электродов в мозг, или сканирование проходит аппаратом МРТ, что дорого, сложно и непригодно для использования в повседневной жизни. И все равно эти методы преобразуют сигналы мозга в написанные слова с трудом, требуя дополнительных средств, таких как как айтрекинг.

Новую систему разработали ученые из Центра искусственного интеллекта GrapheneX-UTS, созданного при университете. Она состоит из программного обеспечения, включая искуственный интеллект, и датчиков электроэнцефалограммы (ЭЭГ), собранных в подобие шапочки.

Датчики считывают электрическую активность мозга через кожу головы с помощью электроэнцефалограммы. Сигнал ЭЭГ сегментируется на отдельные блоки, и их анализирует модель искусственного интеллекта DeWave, разработанная в Центре. Соответственно, если в это время человек мысленно читает текст, то искусственный интеллект распознает сегменты сигнала ЭЭГ как фрагменты текста, и печатает его.

При этом система, получая новые данные ЭЭГ, продолжает обучаться. Так, есть несовершенства в «переводе» некоторых слов: существительные нередко заменяются синонимами, так как, вероятно, схожие слова вызывают схожий сигнал в мозге. На данный момент точность распознавания текста составляет 40%, но ученые работают над тем, чтобы довести ее до 90% — как в современных программах распознавания речи.

«Это новаторская попытка преобразования необработанных волн ЭЭГ сразу в языковые единицы, что знаменует собой значительный прорыв. Мы первые, кто включил методы дискретного кодирования в процесс перевода активности мозга в формат текста. Интеграция с большими языковыми моделями также открывает новые горизонты в нейробиологии и искусственном интеллекте», — говорит директор Центра Си Ти Лин.