Новый генеративный искусственный интеллект превосходит диффузионные модели в создании изображений
Генеративный ИИ стал актуальной темой в последние годы, поражая воображение своей способностью преобразовывать простые текстовые запросы в сложные и реалистичные изображения.
Теперь исследователи из Лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института (CSAIL) представили революционную модель ИИ, которая объединяет два фундаментальных физических закона для создания новой генеративной модели, превосходящей существующие диффузионные модели при генерации изображений. Эта инновационная технология, известная как генеративная модель Пуассонова потока++ (PFGM++), способна произвести революцию в различных областях - от генерации последовательностей антител и РНК до создания аудиозаписей и генерации графов.
Смешение диффузии и пуассоновского потока
Успех PFGM++ заключается в интеграции двух, казалось бы, не связанных между собой физических законов: диффузии и пуассоновского потока. Диффузия обычно ассоциируется со случайным движением элементов, например, с распространением тепла по помещению или расширением газа в пространстве. С другой стороны, пуассоновский поток опирается на принципы, определяющие поведение электрических зарядов. Объединив эти две концепции, исследователи добились замечательных результатов в генерации новых изображений.
Высочайшая производительность при генерации изображений
PFGM++ превзошла существующие современные модели в генерации сложных узоров и реалистичных изображений. Опираясь на предыдущую работу команды над генеративной моделью пуассоновского потока (PFGM), PFGM++ использует математическое уравнение, известное как уравнение Пуассона, и применяет его к данным, на которых обучается модель. Для этого исследователи добавили дополнительное измерение в "пространство" модели, что позволило повысить гибкость и расширить контекст при генерации новых образцов.
Сила междисциплинарного сотрудничества
Разработка PFGM++ подчеркивает потенциал междисциплинарного сотрудничества между физиками и компьютерщиками. Джесси Талер, физик-теоретик, работающий в Центре теоретической физики Лаборатории ядерных наук Массачусетского технологического института и директор Института искусственного интеллекта и фундаментальных взаимодействий Национального научного фонда (NSF AI IAIFI), высоко оценивает эту модель как пример достижений в области ИИ, обусловленных таким сотрудничеством. Он отмечает, что некоторые из наиболее мощных генеративных моделей основаны на проверенных временем концепциях физики, а PFGM++ берет столетнюю идею дополнительных измерений в пространстве-времени и превращает ее в надежный инструмент для создания синтетических, но реалистичных наборов данных.
Будущее генеративного искусственного интеллекта
По мере развития генеративного искусственного интеллекта PFGM++ открывает новые возможности для создания сложного и реалистичного искусственного контента. Его применение выходит за рамки генерации изображений и может быть использовано в различных областях. От здравоохранения до развлечений - PFGM++ способен произвести революцию в создании синтетических данных и взаимодействии с ними.