Машинное обучение раскрывает рецепт создания искусственных белков
Белки необходимы для жизни клеток, выполняя сложные задачи и катализируя химические реакции. Ученые и инженеры давно пытаются использовать эту силу, создавая искусственные белки, которые
Белки необходимы для жизни клеток, выполняя сложные задачи и катализируя химические реакции. Ученые и инженеры давно пытаются использовать эту силу, создавая искусственные белки, которые могут выполнять новые задачи, такие как лечение болезней, улавливание углерода или сбор энергии, но многие процессы, предназначенные для создания таких белков, медленны и сложны, с высокой частотой отказов.Команда исследователей из Притцкеровской школы молекулярной инженерии (PME) Чикагского университета разработала процесс, основанный на искусственном интеллекте, который использует большие данные для разработки новых белков. Разрабатывая модели машинного обучения, которые могут анализировать информацию о белках, собранную из геномных баз данных, исследователи обнаружили относительно простые правила проектирования для создания искусственных белков. Когда команда сконструировала эти искусственные белки в лаборатории, они обнаружили, что они выполняют химические функции настолько хорошо, что они соперничают с теми, которые найдены в природе."Мы все задавались вопросом, как такой простой процесс, как эволюция, может привести к такому высокоэффективному материалу, как белок",-сказал Рама Ранганатан, профессор Джозефа Ригенштейна на кафедре биохимии и молекулярной биологии, Притцкеровской молекулярной инженерии и Колледжа. "Мы обнаружили, что данные генома содержат огромное количество информации об основных правилах строения и функционирования белков, и теперь мы можем использовать правила природы для создания белков самостоятельно."Результаты исследования были опубликованы 24 июля в журнале Science.Использование искусственного интеллекта для изучения правил проектированияБелки состоят из сотен или тысяч аминокислот, и эти аминокислотные последовательности определяют структуру и функцию белка. Но понять, как именно построить эти последовательности для создания новых белков, было непросто. Прошлые работы привели к методам, которые могут определять структуру, но функция была более неуловимой.За последние 15 лет Ранганатан и его коллеги поняли, что базы данных генома-которые растут экспоненциально-содержат огромное количество информации об основных правилах структуры и функционирования белков. Его группа разработала математические модели, основанные на этих данных, а затем начала использовать методы машинного обучения, чтобы выявить новую информацию об основных правилах проектирования белков.Для этого исследования они изучили семейство метаболических ферментов chorismate mutase, тип белка, который важен для жизни многих бактерий, грибов и растений. Используя модели машинного обучения, исследователи смогли выявить простые правила проектирования этих белков.Модель показывает, что просто сохранение аминокислотных позиций и корреляций в эволюции пар аминокислот достаточно для предсказания новых искусственных последовательностей, которые будут обладать свойствами семейства белков."Мы обычно предполагаем, что для того, чтобы построить что-то, вы должны сначала глубоко понять, как это работает", - сказал Ранганатан. "Но если у вас достаточно примеров данных, вы можете использовать методы глубокого обучения, чтобы изучить правила проектирования, даже если вы понимаете, как он работает или почему он построен таким образом."Затем он и его коллеги создали синтетические гены для кодирования белков, клонировали их в бактерии и наблюдали, как бактерии затем создавали синтетические белки, используя свои обычные клеточные механизмы. Они обнаружили, что искусственные белки выполняют ту же каталитическую функцию, что и естественные белки хоризматической мутазы.Платформа для понимания других сложных системПоскольку правила проектирования настолько относительно просты, число искусственных белков, которые исследователи потенциально могли бы создать с их помощью, чрезвычайно велико. - Ограничения гораздо меньше, чем мы могли себе представить, - сказал Ранганатан. "В правилах проектирования природы есть простота, и мы считаем, что подобные подходы могут помочь нам найти модели для проектирования в других сложных системах в биологии, таких как экосистемы или мозг."Хотя искусственный интеллект раскрыл правила проектирования, Ранганатан и его сотрудники до сих пор не до конца понимают, почему модели работают. Далее они будут работать, чтобы понять, как именно модели пришли к такому выводу. -Нам еще многое предстоит сделать, - сказал он.В то же время они также надеются использовать эту платформу для разработки белков, которые могут решать насущные социальные проблемы, такие как изменение климата. Ранганатан и ДОЦ. Профессор Эндрю Фергюсон создал компанию Evozyne, которая будет коммерциализировать эту технологию с применением в энергетике, окружающей среде, катализе и сельском хозяйстве. Ранганатан работал с польским центром предпринимательства и инноваций Учикаго, чтобы подать патенты и лицензировать ИС для компании."Эта система дает нам платформу для рационального конструирования белковых молекул таким образом, о котором мы всегда мечтали", - сказал он. - Он не только научит нас физике работы белков и их эволюции, но и поможет найти решения таких проблем, как улавливание углерода и сбор энергии. Более того, исследования белков могут даже помочь нам понять, как на самом деле работают глубокие нейронные сети, лежащие в основе современного машинного обучения."
Также по теме: