Расшифровка "черного ящика" искусственного интеллекта - ученые получили неожиданные результаты
В мире лекарственных препаратов поиск наиболее эффективной молекулы лекарства подобен поиску иголки в стоге сена. При обилии доступных химических соединений ученые постоянно ищут эффективные действующие вещества для борьбы с болезнями. Чтобы помочь в этом поиске, все большую популярность приобретают приложения машинного обучения, в частности графовые нейронные сети (ГНС). Однако внутренняя работа этих систем искусственного интеллекта до сих пор оставалась загадкой.
Группа специалистов по химической информатике под руководством профессора д-ра Юргена Байората из Боннского университета совершила значительный прорыв в понимании того, как GNN работают при прогнозировании эффективности лекарств. Результаты исследования, недавно опубликованные в журнале Nature Machine Intelligence, показывают, что эти модели искусственного интеллекта в основном полагаются на запоминание существующих данных, а не на изучение конкретных химических взаимодействий.
Для обучения GNN используются графы, представляющие собой комплексы, образующиеся между белками и химическими соединениями. Эти графы состоят из узлов, представляющих объекты, и ребер, представляющих отношения между узлами. В случае комплексов белок-лиганд ребра соединяют узлы белка или лиганда, представляя их структуры или специфические взаимодействия.
Профессор Байорат объясняет: "То, как GNN получают свои предсказания, похоже на черный ящик, в который мы не можем заглянуть". Такая непрозрачность мешает исследователям полностью понять процесс принятия решений этими системами искусственного интеллекта.
Чтобы разгадать эту загадку, команда проанализировала, действительно ли GNN изучают взаимодействия между белками и лигандами, чтобы предсказать силу связывания активных веществ с целевыми белками. Полученные результаты свидетельствуют о том, что GNN в значительной степени полагаются на запоминание существующих данных, а не на изучение конкретных взаимодействий. Это означает, что GNN больше похожи на системы распознавания образов, распознающие сходство между новыми и известными соединениями, а не понимающие химию, лежащую в их основе.
Это открытие имеет большое значение для исследований в области создания лекарств. Понимание того, как работают системы искусственного интеллекта, имеет решающее значение для оптимизации их работы и обеспечения надежности прогнозов. Профессор Байорат подчеркивает: "Получив представление о внутреннем устройстве этих моделей ИИ, мы сможем повысить их эффективность и точность при выявлении потенциальных кандидатов в лекарственные препараты".
Этот прорыв способен произвести революцию в области поиска лекарств, поскольку позволит исследователям глубже понять, как системы искусственного интеллекта делают прогнозы. Объединив возможности машинного обучения с экспертными знаниями о химических взаимодействиях, ученые смогут ускорить поиск эффективных лекарств и потенциально спасти бесчисленное количество жизней.