Мозг и ИИ: нейронные механизмы обработки речи совпадают с работой языковых моделей
Прямые записи мозговой активности, полученные во время прослушивания рассказа, выявили, что мозг обрабатывает смысл речи последовательно, слой за слоем — аналогично внутренней работе больших языковых моделей типа GPT. Время, в течение которого различные языковые центры мозга достигают пика активности, точно соответствует переходу между «слоями» в искусственной нейронной сети. Это указывает на конвергентную эволюцию биологических и искусственных систем в сторону единого эффективного алгоритма построения понимания.
Исследование проведено международной группой под руководством доктора Ариэля Гольдштейна из Еврейского университета в Иерусалиме. Учёные проанализировали данные электрокортикографии, полученные от девяти пациентов с эпилепсией, которые в ходе клинического мониторинга слушали тридцатиминутный рассказ. Технология с использованием тонких электродных решёток, размещённых непосредственно на коре головного мозга, позволила с высочайшей точностью зафиксировать быструю нейронную активность в ключевых речевых областях — включая область Брока и верхнюю височную извилину.
Иерархия времени и смысла
Ключевым открытием стала обнаруженная временная прогрессия обработки. В области Брока пик совпадения между мозговыми сигналами и внутренними представлениями языковой модели закономерно сдвигался во времени по мере увеличения глубины слоя модели. Корреляция между глубиной слоя и задержкой активности достигла значения 0,85. Это не случайное совпадение, а чёткий паттерн: мозг, подобно ИИ, накапливает и интегрирует информацию поэтапно, а не совершает одномоментный скачок к пониманию.
Наиболее выраженный временной градиент наблюдался в высших языковых центрах (например, в височном полюсе), а не в первичной слуховой коре. В височном полюсе разница между пиками активности, соответствующими самым ранним и самым глубоким слоям модели, превышала 500 миллисекунд. Это указывает на увеличение временного окна, в котором происходит обработка контекста — от отдельных звуков к смыслу целых предложений и нарратива. Обнаруженная иерархия повторяет концепцию «временных рецептивных окон», которые последовательно расширяются по мере продвижения сигнала по языковому пути мозга.
Роль контекста против правил
Анализ показал, что классические лингвистические единицы — фонемы (минимальные звуковые единицы) и морфемы (минимальные значимые единицы) — слабо предсказывали зафиксированную мозговую активность. Намного более точное соответствие обеспечили контекстуальные эмбеддинги — векторные представления слов, кодирующие их значение с учётом окружающего контекста.
Более того, слова, которые языковая модель предсказывала с высокой вероятностью, демонстрировали более раннее и сильное совпадение с нейронными сигналами, чем непредсказуемые слова.
«Больше всего нас удивило, насколько близко временное развёртывание смысла в мозге совпадает с последовательностью преобразований внутри больших языковых моделей, — отметил доктор Ариэль Гольдштейн. — Даже несмотря на то, что эти системы устроены принципиально по‑разному, обе, судя по всему, приходят к схожему пошаговому накоплению информации для достижения понимания».
Данный результат не отменяет важности грамматических правил, но указывает: в условиях естественного восприятия речи распределённый контекст несёт основную нагрузку в формировании смысла. Это ставит под вопрос исключительно символические теории обработки языка и усиливает позиции теорий, основанных на прогнозировании и статистическом обучении.
Ограничения и значение открытия
Важно подчеркнуть: сходство не означает тождество. Архитектура трансформеров, лежащая в основе современных языковых моделей, инженерно создана для параллельной обработки длинных последовательностей во время обучения. Нейронные цепи коры головного мозга работают в рамках биологических ограничений — с серийной временной динамикой и иными принципами организации. Кроме того, выборка исследования была ограничена девятью пациентами с особыми клиническими показаниями, а размещение электродов варьировалось от человека к человеку.
Тем не менее работа устанавливает новый эталон в нейролингвистике. Все авторы выложили в открытый доступ полный набор данных — включая прямые нейронные записи, синхронизированные с каждым словом тридцатиминутной истории, а также код для анализа моделей. Этот шаг превращает теоретические споры в проверяемые утверждения и приглашает научное сообщество к прямым сравнительным тестам различных теорий языка.
Таким образом, открытие представляет собой редкий случай, когда сравнение биологической и искусственной систем не только демонстрирует их функциональное подобие, но и даёт инструмент для исследования работы одной из самых сложных функций человеческого сознания.
Остаётся ключевой вопрос: является ли обнаруженная пошаговая иерархическая обработка универсальным принципом организации сложных когнитивных систем независимо от субстрата — или же перед нами лишь удивительное, но поверхностное совпадение двух принципиально разных механизмов?

