Белковые модели GPT свободно говорят на биологии / Новости

21 февраля 2023, 08:56 Новости 0

Рейтинг:
(0 / 5)

Искусственный интеллект уже сократил годы исследований в области белковой инженерии. Теперь ученые впервые синтезировали в лаборатории белки, предсказанные моделью искусственного интеллекта, и обнаружили, что они работают так же хорошо, как и их природные аналоги.

В исследовании использовалась языковая модель глубокого обучения для белковой инженерии под названием ProGen , которая была разработана компанией Salesforce AI Research в 2020 году. ProGen был обучен на 280 миллионах последовательностей сырых белков из общедоступных баз данных секвенированных природных белков для создания искусственного белка. последовательности с нуля.

Чтобы оценить, может ли ИИ генерировать функциональные искусственные белковые последовательности, исследователи добавили в модель 56 000 последовательностей из пяти различных семейств лизоцимов — ферментов , обнаруженных в человеческих слезах, слюне и молоке, способных растворять клеточные стенки определенных бактерий. . Точно настроенная модель произвела миллион последовательностей, из которых 100 были отобраны для создания искусственных белков для тестирования и сравнения с встречающимися в природе лизоцимами.

Исследователи надеются, что ProGen, генерирующий последовательности за миллисекунды, сможет создавать большие базы данных белков, которые могут превзойти встречающиеся в природе библиотеки.

Около 70 процентов последовательностей искусственных белков также сработали. Это, по словам Джеймса Фрейзера из Фармацевтической школы Калифорнийского университета в Сан-Франциско, одного из соавторов исследования, было «не просто одним или двумя нашими фаворитами, а фактически статистически значимым, большим их количеством». На самом деле, сообщает Фрейзер, активность натуральных белков была немного ниже, чем у искусственных. Последние также были активны, когда их сходство с природными белками составляло всего 31,4%. «Это говорит мне о том, что когда мы используем ProGen для создания искусственных последовательностей, эти белки имеют такой же хороший шанс быть активными, как если бы мы выбирали случайные природные белки из базы данных, — говорит он. большой прорыв». Другими словами, у исследователей теперь есть более широкие и глубокие возможности для проектирования белковой инженерии.

Хотя как физический, так и эволюционный подходы к дизайну белков до сих пор работали хорошо, по словам Фрейзера, эти методы были ограничены по масштабу и химической каталитической активности, которую проявляет белок. Это открывает новый способ конструирования белков с различными типами активности в областях белковой последовательности, которые эволюция еще не исследовала, добавляет он.

Ключевой особенностью ProGen является то, что его можно точно настроить с помощью тегов свойств, таких как семейство белков, биологический процесс или молекулярная функция. «Поэтому мы можем сказать: дайте нам [белковые последовательности], которые, например, с большей вероятностью будут термостабильными, с меньшей вероятностью будут взаимодействовать с другими белками или потенциально лучше работать в кислых условиях», — говорит Фрейзер. «Иметь такой контроль вместо того, чтобы начинать с естественной [белковой] последовательности и пытаться уговорить ее обладать этими свойствами… это большая мечта белковой инженерии».

Исследователи надеются, что с помощью ProGen, генерирующего последовательности за миллисекунды, можно будет создать большую базу данных для расширения разнообразия белковых последовательностей за пределы естественных библиотек. Это помогло бы найти белки, способные к новым каталитическим реакциям, связанным с активностью естественных белков. Например, говорит Фрейзер, «катализируя родственную реакцию, которая может иметь большое значение для разложения пластика… [или] для синтеза лекарства…. Возможность выйти в пространство последовательности увеличивает вероятность обнаружения этой новизны».

Он предсказывает, что следующим захватывающим шагом в этой области будет объединение языковых моделей глубокого обучения с другими подходами к инженерии белков, чтобы получить лучшее из обоих миров и помочь исследователям быстрее находить новые виды деятельности. В ближайшем будущем, по его словам, применение результатов этого исследования, вероятно, будет связано с созданием новых ферментов, которые могут быть полезны для создания более чистых низкомолекулярных лекарств, а также в естественном процессе удаления загрязнений из отходов. биоремедиация .

Нихил Найк , директор по исследованиям в SalesForce, говорит, что их цель состояла в том, чтобы продемонстрировать, что можно использовать модели с большим языком для решения проблемы дизайна белков, используя общедоступные данные о белках. «Теперь, когда мы продемонстрировали, что [ProGen] может генерировать новые белки, мы опубликовали модели, чтобы другие люди могли опираться на наши исследования».

Тем временем они продолжают работать над ProGen, устраняя ограничения и проблемы. Одним из них является то, что это очень зависимый от данных подход. «Мы исследовали включение структурной информации для улучшения дизайна последовательности», — говорит Найк. «Мы также изучаем, как улучшить возможности генерации, когда у вас не так много данных для определенного семейства белков или домена».

Комментарии отсутствуют

Миграция данных: ключевые аспекты и лучшие практики

Экосистема вокруг облака

Облачная оптимизация — как выглядит «правильный подход»?

Впереди голубое небо: 3 совета по управлению мультиоблачной средой

Перенос данных

Онлайн-миграция

3 типа стратегий миграции базы данных

4 типа миграции данных и как избежать риска для целостности ваших данных

Избавьтесь от боли в управлении данными

Что такое среда переноса данных?

Что такое миграция данных?

SCADA. Системы диспетчерского управления и сбора данных

КОМПЬЮТЕРИЗИРОВАННОЕ УПРАВЛЕНИЕ И МОНИТОРИНГ

Использование SCADA для адаптивного управления поливом — автоматический полив

Использование SCADA для адаптивного управления орошением

Безопасность системы SCADA

Анализ данных

Удовлетворены ли вы текущим управлением тревогами?

Измерение качества воды

Удивительные преимущества поддержки дополненной реальности

Управление взрывоопасными средами — услуги для опасных зон

ИИ, на котором сегодня основано приложение для изучения языков, завтра может изменить образование

Google и Microsoft борются за разработку поиска на основе искусственного интеллекта

Распознавание изображений имеет проблему с доходом

Дипфейки превращаются в кустарную индустрию

ИИ выходит на К-стрит: ChatGPT становится лоббистом

Худшее использование ИИ

Киберпреступность встречается с ChatGPT: берегись, мир

ИИ «Века мозга» обнаруживает ранние признаки болезни Альцгеймера

Играйте в бесконечные версии игры Pong, созданной искусственным интеллектом, на ходу

Оптический ИИ может удовлетворить ненасытные потребности в данных

Спрей Smart Skin считывает набор текста и жесты рук

Прогнозирование бедствий «Черного лебедя» с помощью ИИ

Роботы хватаются лучше

Полезен ли ИИ для здравоохранения?

Сон может уберечь ИИ от катастрофического забывания

Мода, генерируемая искусственным интеллектом, — следующая волна дизайна «сделай сам»

Роботы и ИИ могут оптимизировать литий-ионные батареи

5 ИИ-генераторов искусства, которые вы можете использовать прямо сейчас

Хакеры соревнуются, чтобы исказить распознавание лиц

Квантовые компьютеры

Новые рекорды для самых больших и самых маленьких компьютеров с искусственным интеллектом

Квантовые микроскопы могут сделать МРТ атомного масштаба

Слышали о графовых нейронных сетях?

Машинное обучение решит и квантовые проблемы

Встречайте ПК с открытым исходным кодом, который помещается в вашем кармане

Отделяем факты от шумихи вокруг квантовых вычислений

Кодирование сделало ИИ — как теперь ИИ изменит кодирование?

Обмен файлами сделает Интернет намного эффективнее

Наблюдение за беременностью дома с помощью смартфона