Искусственный интеллект на службе астрономии
В наших попытках понять Вселенную мы становимся все более жадными, и наши наблюдения зачастую опережают наше понимание. Спутники передают нам сотни терабайт информации каждый год, а всего лишь один телескоп, который сейчас строят в Чили, позволит получать 15 терабайт снимков звездного неба каждую ночь. Человечество просто не в состоянии обработать такое количество информации. Как говорит астроном Карло Энрико Петрильо, «разглядывать картинки с галактиками – самая романтическая часть нашей работы. Проблема в том, чтобы сохранять концентрацию». Вот почему Петрильо обучил искусственный интеллект совершать за него эту работу – наблюдение.
Петрильо и его коллеги заняты поиском феноменов, которые, по сути, представляют собой «космические телескопы». Когда крупный объект (галактика или черная дыра) оказывается между удаленным источником света и наблюдателем на земле, он искажает пространство и свет вокруг него, образуя линзу, которая позволяет астрономам ближе увидеть очень старые, отдаленные части Вселенной, которые должны быть недоступны для наблюдения. Этот феномен называется гравитационной линзой, а такие линзы – ключ к пониманию того, из чего состоит Вселенная. Однако их поиск – это долгая и нудная работа.
И тут вступает в дело искусственный интеллект. И поиск гравитационных линз – это всего лишь начало. Как однажды сказал профессор Стэнфордского университета Эндрю Ын, искусственный интеллект способен автоматизировать все, «что может делать среднестатистический человек, […] менее чем за секунду размышлений». Менее секунды – это не то время, что кажется достаточным для раздумий, но когда речь идет об использовании огромных массивов данных, которые создает современная астрономия, это время на вес золота.
Астрономы, занимающиеся внедрением ИИ, не просто ищут способы заставить технологию сортировать данные. Они разрабатывают возможный радикально новый подход к научным открытиям, когда ИИ картографирует части вселенной, которых мы никогда не видели.
Но вначале – все-таки гравитационные линзы. Общая теория относительности Эйнштейна предсказала этот феномен еще в 1930-е годы, но первый образец нашли только в 1979 году. Почему? Космос очень, очень велик, и для того, чтобы его рассмотреть, человеку требуется очень много времени. Особенно если у него нет телескопа современного образца. И потому охота за гравитационными линзами была неблагодарным трудом.
«Линзы, которые нам сейчас известны, были найдены самыми разными способами, — говорит Лилия Уильямс, профессор астрофизики в университете Миннесоты. – Некоторые были открыты случайно, людьми, которые искали что-то совершенно иное. Были те, которые нашли люди, специально их искавшие, всего за пару-тройку наблюдений. Но остальные были найдены по счастливой случайности».
Просмотр изображений – это то, в чем искусственный интеллект очень хорош. И вот Петрильо и его коллеги в Бонне, Неаполе и Гронингене обратились к инструменту на основе ИИ, который так любят в Силиконовой долине. Это разновидность компьютерной программы, состоящая из цифровых «нейронов», смоделированных по типу мозговых, которые реагируют на входящий сигнал. Дайте таким программам (нейронным сетям) огромное количество данных, и они начнут выявлять закономерности. Особенно хорошо им удается обработка визуальной информации, и они используются во всех системах цифрового наблюдения – от камер в беспилотных авто до «Фейсбука» с его распознаванием и возможностью отмечать людей на фото.
Как описывается в недавно опубликованном докладе, применение этой технологии в охоте за гравитационными линзами оказалось на удивление простым. Вначале ученые использовали набор данных, чтобы обучить нейронную сеть, а это предполагало создание 6 миллионов изображений, которые показывали, как должны, а как не должны выглядеть гравитационные линзы. А затем нейросети скормили данные, позволив ей медленно выявлять закономерности. Немного итоговых настроек, и готово – вот она, программа, способная мгновенно вычислять гравитационные линзы.
«Очень классный специалист способен оценивать изображения со скоростью около тысячи в час», — говорит Петрильо. По его оценке, в случае с данными, которыми располагала эта команда ученых, получается одна линза на 30 000 галактик. И человек, работая без сна и отдыха неделю, сможет найти всего лишь пять или шесть линз. Для сравнения, нейросеть обрабатывает базу данных из 21 789 изображений всего за 20 минут. И это, как говорит Петрильо, возможно с использованием всего лишь одного процессора древнего компьютера. Так что время может быть сильно сокращено.
Однако нейросеть не обладает компьютерной точностью. Чтобы не проглядеть какие-то из линз, их параметры были заданы в довольно общем виде. Люди изучили 761 предложенных сетью «кандидатур», и после отсева общее число свелось к 56. Требуются дальнейшие наблюдения, чтобы подтвердить достоверность этих находок, и Петрильо предполагает, что настоящими окажутся около трети. Итого приблизительно получается одна линза в минуту. Сравните это примерно с сотней линз, обнаруженных всем научным сообществом за последние несколько десятилетий. Невероятный прогресс и прекрасный пример использования ИИ в астрономии.
Поиск этих линз крайне важен для понимания одной из самых больших загадок астрономии: из чего состоит наша Вселенная. Предполагают, что знакомые нам объекты (планеты, звезды, астероиды и т.д.) – это всего лишь 5 процентов физических объектов, а остальные 95 – это другие, необычные формы существования материи. Это такие гипотетические формы, как темная материя, которую мы никогда не наблюдали напрямую. Вместо этого мы изучаем гравитационное воздействие, которое она оказывает на остальную Вселенную, а гравитационные линзы служат одним из ключевых показателей.
А на что еще способен искусственный интеллект? Люди разрабатывают множество новых инструментов на его основе. Некоторые, как Петрильо, сосредоточились на идентификации, к примеру, при классификации галактик. Другие прочесывают огромные потоки данных в поисках любопытных сигналов, как, например, нейронная сеть, что фильтрует производимые человеком сигналы, которые засоряют информацию с радиотелескопов, таким образом помогая ученым сосредоточиться на потенциально интересных сигналах. Еще больше нейронных сетей используются, чтобы идентифицировать пульсары, определять местонахождение необычных экзопланет или повышать резкость изображений с телескопа с низким разрешением. Потенциальных сфер применения не счесть.
Такой всплеск частично вызван более общими трендами в аппаратном обеспечении, которые вызвали к жизни широкое применение ИИ, например, это удешевление компьютерной производительности. Однако изменилась и сама природа астрономии. Ученые больше не проводят бессонные часы безоблачными ночами, созерцая путь отдельных планет. Теперь это сложный алгоритм, который просеивает звездное небо по частям, оперируя огромными порциями данных, немыслимыми для ученых прежних времен. Лучше телескопы, больше возможностей для хранения данных – соответственно, больше данных для анализа, чем когда-либо.
Анализ огромных объемов данных – это сильная сторона ИИ. А мы можем научить его определять закономерности и затем заставить работать как прилежного ассистента с немигающим взором и неослабевающим вниманием.
Волнует ли астрономов то, что они настолько доверяют машине, которой может не хватать человеческой интуиции для обнаружения чего-то сенсационного? Петрильо говорит, что он не беспокоится: «В целом, люди более предвзяты, менее эффективны и более склонны к совершению ошибок, чем машины». С ним согласна и Уильямс: «Компьютер может пропустить что-то случайно, но никогда не будет делать это систематически». Пока мы знаем то, чего не знают они, мы можем применять автоматизированные системы без особого риска.
Для некоторых астрономов область потенциального применения ИИ выходит за пределы обычной сортировки данных. Они считают, что искусственный интеллект может использоваться для создания информации и восполнения пробелов, слепых пятен в наших исследованиях Вселенной.
Астроном Кевин Шавински и его команда, которая специализируется на изучении галактик и черных дыр, использовала ИИ для увеличения резкости размытых снимков с телескопа. Для этого они применили тип нейронной сети, которому отлично удается создание вариантов данных, которые в нее загружены. Это как искусный ремесленник, который может имитировать манеру знаменитого живописца. Такие нейронные сети называются генеративно-состязательными (или GAN, от generative adversarial networks), они, в частности, использовались для создания фейковых фото знаменитостей, фейковых аудио-диалогов с имитацией голоса и других подобных данных. Это один из богатейших пластов современного исследования ИИ, и для Шавински это означает, что можно добыть информацию, которой до того не существовало. Доклад, который он и его команда опубликовали в начале уходящего года, показывал, как можно использовать GAN для улучшения качества фотографий космоса. Ученые понизили качество массива снимков галактик, добавив шумы и размытия, а затем использовали сеть, натренированную на изображениях с телескопа, чтобы повысить их разрешение, после чего сравнили итог с оригиналом. Результаты оказались поразительно точными, достаточными, чтобы убедить Шавински, что ИИ обладает потенциалом для улучшения качества всех типов данных в астрономии.
Ученый говорит, что ему есть чем поделиться, но не может разглашать подробности до публикации результатов. Также он выражает настороженность в отношении проекта. Ведь в конечном итоге он противоречит базовым принципам науки: Вселенную можно изучать только посредством прямого наблюдения. «И потому это опасный инструмент», — говорит он. И он может использоваться, только если мы a)имеем достаточное количество точных данных для обучения b)можем проверить результаты. Вы можете обучить GAN генерировать данные о черных дырах и свободно проецировать их на ту часть неба, что до того не была детально изучена. И затем, если есть предположение о наличии черной дыры, астрономы должны это собственноручно проверить, как и в случае с гравитационными линзами. Шавински говорит, что, как и с любым научным инструментом, этот нужно тщательно и терпеливо протестировать, убедившись, что результаты не ведут к заблуждениям.
Если эти методы докажут свою целесообразность, они могут стать новым словом в исследовании, которое Шавински ставит в один ряд с классической компьютерной симуляцией и старым добрым наблюдением. Мы находимся в начале пути, но эффект может быть огромным. По словам ученого, «если у вас есть этот инструмент, вы можете применить его ко всем существующим данным, что пылятся по архивам, возможно, слегка их усовершенствовать и извлечь из них больше пользы для науки». Придать ценность, которой раньше не было. ИИ будет заниматься чем-то вроде научной алхимии, превращая старые знания в новые. И мы сможем изучать космос глубоко, как никогда раньше, даже не покидая Землю.