Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

Как машинное обучение помогает при разработке лекарств?

Иришка Беккер
  ·   · 757
Openstack DevOps and IBM/Informix Certified DBA...  · 12 янв 2022
Применение подходов машинного обучения для открытия лекарств
========================
Подходы машинного обучения могут применяться на нескольких этапах раннего обнаружения лекарств для:
Предсказать целевую структуру
Определите и оптимизируйте «попадания»
Исследуйте биологическую активность новых лигандов
Модели дизайна, которые предсказывают фармакокинетические и токсикологические свойства кандидатов в лекарства
=========================
Прогнозирование вызванных лекарствами изменений в экспрессии генов с помощью глубокого обучения
=========================
DeepCE, новая компьютерная модель глубокого обучения, разработанная исследователями из Университета штата Огайо, помогает прогнозировать корреляции между экспрессией генов и реакцией на лекарства.
Используя модель, команда определила десять кандидатов на перепрофилирование лекарств от COVID-19. Два препарата (циклоспорин и анидулафунгин) получили одобрение регулирующих органов; остальные восемь в настоящее время находятся на стадии исследования и проходят испытания по различным показаниям.
DeepCE опирается на два основных источника общедоступных данных: L1000 и DrugBank.
L1000 — это хранилище данных, финансируемое Национальным институтом здравоохранения, которое предоставляет «сигнатуры лекарств» для проектов по поиску новых лекарств. Сигнатура лекарства определяется как изменение экспрессии гена в клетке, когда клетка подвергается воздействию лекарства. В настоящее время набор данных L1000 содержит более одного миллионы профилей генной экспрессии химически (малых молекул лекарства) нарушенных клеточных линий человека.Линии клеток представляют собой ткани органов, такие как почки и легкие.
===============
DrugBank содержит информацию о химической структуре и свойствах примерно 11 000 одобренных и исследуемых лекарств.
===============
Сравнивая данные L1000 с лекарственными соединениями, содержащимися в DrugBank, исследователи смогли предсказать влияние лекарства на разные клеточные линии и разные гены. Однако команда из Университета штата Огайо столкнулась с серьезной проблемой. Сигнатуры лекарств в L1000 не полные и охватывают лишь небольшую часть потенциальных соединений. Для генов, не представленных в L1000, команда использовала подход глубокого обучения. Модель DeepCE была обучена путем запуска всего набора данных L1000 с помощью алгоритма для конкретных химических соединений и их дозировок.
«Мы разработали модель глубокого обучения, DeepCE, используя нейронную сеть графа (преобразует химическую структуру каждого соединения в набор векторов, каждый из которых представляет локальную субструктуру атома), сеть внимания с несколькими головками (захватывает взаимодействия между наркотиками и генами и генами) и несколько сетей прямой связи для преобразования информации о химическом составе, генах и лекарствах в профиль экспрессии генов, вызванных лекарствами. Таким образом, мы смогли сравнить предсказанные профили экспрессии генов для всех 11 179 лекарств в DrugBank с профилями экспрессии генов COVID-19.
По словам Пинга Чжана, «этот метод позволяет своевременно переназначить лекарства для лечения неизвестных заболеваний, таких как COVID-19, что полезно в условиях нынешней пандемии коронавируса и в случае будущих чрезвычайных ситуаций в области общественного здравоохранения. Основываясь на теории соединения лекарств и болезней, как только мы получаем сигнатуры заболеваний у пациентов, инфицированных вариантами SARS-CoV-2, мы можем быстро переоценить наши прогнозы для получения более точных рекомендаций для новых групп пациентов».
==================
Расширение арсенала антибиотиков с помощью подходов глубокого обучения
==================
Быстрое появление устойчивых к антибиотикам бактерий вызывает глобальную обеспокоенность. В связи с этим возникает острая необходимость в открытии новых антибиотиков. Эксперты прогнозируют, что, если не будут предприняты какие-либо действия, к 2050 году лекарственно-устойчивые заболевания могут быть причиной 10 миллионов смертей ежегодно.
Чтобы решить эту проблему, группа исследователей из Массачусетского технологического института (MIT) обучила глубокую нейронную сеть, способную предсказывать молекулы с антибактериальной активностью. Выполняя прогнозы для нескольких химических библиотек, исследователи обнаружили новый антибиотик, который они назвали галицином.
Структура галицина отличается от обычных антибиотиков и проявляет бактерицидную активность в отношении широкого филогенетического спектра патогенов, включая Mycobacterium tuberculosis и резистентные к карбапенемам Enterobacteriaceae.
======================
Джонатан Стоукс, научный сотрудник Института Броуда Массачусетского технологического института и Гарварда, является ведущим автором исследования, которое недавно было опубликовано в Cell. Стоукс подробно рассказал о том, как они определили галицин: «Мы обучили модель глубокого обучения на наборе из ~ 2500 молекул тех, которые ингибируют рост кишечной палочки in vitro.
=======================
Эта модель изучила взаимосвязь между химической структурой и антибактериальной активностью таким образом, что позволила нам показать модельные наборы химических веществ, которые она никогда раньше не видела, и затем она могла делать прогнозы о том, обладают ли эти новые молекулы антибактериальной активностью против кишечной палочки или нет».
После обучения модель была протестирована в Центре перепрофилирования лекарственных средств Института Броуда, библиотеке, содержащей около 6000 соединений. Из библиотеки модель выбрала одну молекулу, галицин, которая, по прогнозам, обладала сильной антибактериальной активностью.
===================
Галицин, препарат, который первоначально исследовался как антидиабетический препарат, был протестирован на десятках бактериальных штаммов, и было обнаружено, что он действует против многих устойчивых к лекарствам бактерий, включая Clostridium difficile, Acinetobacter baumannii и Mycobacterium tuberculosis. Также было обнаружено, что галицин обладает низкой прогнозируемой токсичностью для человека.
Модели машинного обучения могут исследовать in silico большие химические пространства, которые могут быть утомительными и дорогими для исследования с использованием традиционных подходов.
По словам Стоукса, «МО как инструмент разработки лекарств, вероятно, будет играть важную роль в том, как мы будем находить новые антибиотики. Как инструмент прогнозирования, должным образом обученные модели позволят нам исследовать огромные химические пространства in silico, которые достаточно велики, чтобы мы не смогли бы эмпирически проверить это количество соединений в лаборатории.
В настоящее время мы можем проверить, возможно, несколько миллионов молекул в лаборатории в больших масштабах, по сравнению с предсказаниями in silico, которые достигают миллиардов соединений».
Подходы машинного обучения можно использовать на каждом этапе разработки лекарств. «Помимо химического прогнозирования для открытия новых антибиотиков на доклинической стадии, я считаю, что подходы машинного обучения могут оказаться полезными на каждом этапе разработки лекарств. делать разумные прогнозы на более поздних стадиях разработки лекарств», — сказал Стоукс.
===================
«Профилирование на основе изображений является мощным инструментом, потому что просмотр паттернов на изображениях может ускорить почти каждый этап конвейера разработки лекарств, от создания разнообразных, но компактных химических библиотек до первичных анализов скрининга, целевой деконволюции для фенотипических скринингов, идентификации биомаркеров и диагностики.
Недавно даже было показано, что он устраняет необходимость в первичном скрининге за счет виртуального предсказания некоторых видов биологической активности на основе существующих изображений», — пояснил Карпентер.
Из-за увеличения объемов изображений исследователи начали использовать стратегии машинного обучения, такие как глубокое обучение, чтобы улучшить извлечение соответствующих сигналов из профилей на основе изображений и ускорить поиск лекарств.
«Большинство экспериментов по доказательству основных принципов в полевых условиях использовали классические методы обработки изображений и машинного обучения, поэтому я думаю, что мы скоро увидим быстрое ускорение в этой области за счет применения методов глубокого обучения для извлечения признаков и прогнозирования», — сказал Карпентер.
====================
Захватывающие возможности, но понимание методологии является ключевым
=====================
Машинное обучение может помочь ученым и ускорить путь открытия лекарств. ОД в сочетании с экспертными знаниями может снизить уровень отсева и ускорить процесс поиска лекарств. Чжан подробно остановился на его потенциале: «Сотни миллионов потенциальных лекарств ждут открытия. Следующий великий противовирусный (или антидепрессант, или противовоспалительный) может уже находиться где-то в лаборатории, ранее упускаемый из виду так как требуется много времени, чтобы быть выбранным для некоторых показаний.
Глубокое обучение может сказать нам, какие соединения стоит протестировать».
=====================
ИИ предоставил захватывающие возможности для новых открытий в различных областях; однако внедрение этой технологии все еще невелико. Чтобы полностью раскрыть потенциал ИИ, потребуются обучение, доверие и координация между ключевыми заинтересованными сторонами.
=======================
April 16, 2021