Исследователи обнаружили, что нейронные сети видят мир не так, как мы
Вычислительные модели давно заслужили признание за способность имитировать сенсорное восприятие человека, точно распознавая объекты и слова независимо от вариаций цвета, высоты тона и других характеристик. Однако новаторское исследование, проведенное нейробиологами Массачусетского технологического института, показало, что эти модели часто реагируют одинаково на изображения или слова, которые не имеют никакого сходства с целевыми стимулами.
Исследование, проведенное под руководством Дженелль Фезер (Jenelle Feather PhD '22) и опубликованное в журнале Nature Neuroscience, показало, что когда эти нейронные сети обучались генерировать изображения или звуки, похожие на конкретные природные данные, например, изображение медведя, большинство сгенерированных стимулов были неузнаваемы для наблюдателей. Это говорит о том, что данные модели вырабатывают свои собственные идиосинкразические "инварианты", одинаково реагируя на стимулы с совершенно разными характеристиками.
Последствия этих результатов весьма значительны. Выяснив уникальные особенности восприятия моделей, исследователи теперь смогут разработать новые методы оценки точности воспроизведения сенсорного восприятия человека этими моделями. По мнению Джоша Макдермотта, доцента кафедры мозга и когнитивных наук Массачусетского технологического института, этот тест должен стать неотъемлемой частью процесса оценки вычислительных моделей.
"Данная работа показывает, что с помощью этих моделей можно получать неестественные сигналы, которые в итоге оказываются очень диагностичными для представлений в модели", - говорит Макдермотт. "Этот тест должен стать частью целой батареи тестов, которые мы, как специалисты, используем в своей работе.
Исследование проливает свет на сложную работу сенсорных систем человека и ставит под сомнение традиционное представление о том, как эти системы формируют инвариантность для игнорирования нерелевантных признаков. Широко распространено мнение, что сенсорная система человека учится распознавать объекты на основе их основной идентичности, игнорируя такие факторы, как условия освещения или угол обзора. Эта способность воспринимать объекты одинаковыми, несмотря на их вариации, известна как инвариантность.
"В классическом понимании сенсорные системы строятся на основе инвариантности ко всем тем источникам вариаций, которыми могут обладать различные примеры одного и того же объекта", - поясняет Фезер. "Организм должен распознать, что это одно и то же, даже если они проявляются как совершенно разные сенсорные сигналы".
Результаты исследования открывают новые возможности для изучения и оценки в области вычислительной нейронауки. Поняв, как эти модели воспринимают стимулы, ученые смогут еще больше повысить их точность и преодолеть разрыв между искусственным интеллектом и сенсорным восприятием человека.