ИИ создал несуществующий в природе белок, имитировав 500 млн лет эволюции

Нейросеть разработала новую «живую» молекулу, открывая большие перспективы в медицине.
EvolutionaryScale

Модель искусственного интеллекта сымитировала полмиллиарда лет молекулярной эволюции, чтобы создать код ранее неизвестного белка, пишет Live Science. Ученые считают, что новый светящийся белок, подобный тем, что встречаются у медуз и кораллов, может помочь в разработке новых лекарств. Научная статья вышла в Science.

Белки — это одна из основных составляющих жизни, выполняющая различные функции в организме, такие как построение мышц и борьба с болезнями. Белки состоят из цепочек молекул, называемых аминокислотами, последовательность которых задается генами. Чтобы ESM3 могла понять белки, исследователи вводили в модель информацию о ключевых свойствах белков: аминокислотной последовательности, структуре и функции в виде ряда букв.

Смоделированная молекула, названная esmGFP, существует только в виде компьютерного кода, но содержит план ранее неизвестного типа зеленого флуоресцентного белка.

Последовательность, определяющая esmGFP, лишь на 58% схожа с ближайшим известным флуоресцентным белком — вариантом, найденным у анемонов Entacmaea quadricolor. Остальная часть последовательности уникальна и потребовала бы для естественного возникновения 96 различных генетических мутаций, что заняло бы более 500 миллионов лет. ЕsmGFP и ИИ-модель ESM3, создавшую его, представили исследователи из компании EvolutionaryScale.

ESM3 заполняет пробелы в неполном коде, предоставленном исследователями, быстро «перебирая» разные пути, варианты и этапы.

«Мы обнаружили, что ESM3 осваивает основы биологии и может генерировать функциональные белки за пределами пространства, исследованного эволюцией», — говорит Алекс Райвз, соавтор исследования и соучредитель EvolutionaryScale.

Команда обучала ESM3 на данных о 2,78 миллиардах белков, существующих в природе. Затем исследователи случайным образом скрывали части белка, и ESM3 заполняла пробелы, основываясь на полученных знаниях.

Тиффани Тейлор, эволюционный биолог из Университета Бата (Великобритания), рецензируя исследование, отметила: «ИИ-модели, такие как ESM3, позволят сделать прорыв в инженерии белков. Однако попытки смоделировать 500 миллионов лет эволюции сосредоточены на отдельных белках и не учитывают многочисленные стадии естественного отбора, которые в конечном итоге создают жизнь. Инженерия белков, управляемая ИИ, вызывает интерес, но возможно, мы слишком самонадеянны, предполагая, что сможем превзойти те процессы, которые природа  оттачивала миллионы лет».