grad-green grad-gray grad-blue grad-red grad-pink grad-purple grad-yellow
Нести помощь людям

Вход на сайт

Эмо Система вознаграждения/контроля

Краткое описание: 
Библиографическая ссылка для цитирования: Сазонов В.Ф. Эмо Система вознаграждения/контроля [Электронный ресурс] // Кинезиолог, 2009-2026: [сайт]. Дата обновления: 25.04.2026. URL: https://kineziolog.su/content/emo-sistema-voznagrazhdeniyakontrolya (дата обращения: __.__.20__). ___________

Нейробиология рассматривает систему вознаграждения и систему стратегического (исполнительного) контроля как функционально дифференцированные, но анатомически перекрывающиеся и динамически взаимодействующие сети. Обе они обеспечивают адаптивное принятие решений, целеполагание и регуляцию поведения.

В рамках доменной системы RDoC данные конструкты распределяются по доменам «Позитивная валентность» (вознаграждение за усилия, оценка ожидаемой ценности, обучение на основе предсказания ошибки) и «Когнитивные системы» (рабочая память, когнитивный контроль, гибкость, планирование).

Сдвиг в парадигме этой системы, произошедший в 20-е годы, заключается в переходе от модели «конкуренции лимбической и корковой систем» к коннектомной и вычислительной парадигме.

В новой парадигме поведение определяется динамическим балансированием между следующими процессами и структурами:

  • модель-свободным (модель-фри) обучением на основе непосредственного вознаграждения (стриатум, дофаминергические петли),
  • модель-зависимым (модель-бейзд) стратегическим планированием с учётом будущих последствий (префронтально-теменная сеть, рабочая память),
  • интегративными узлами (vmPFC/OFC, ACC), вычисляющими субъективную ценность и конфликт целей.

Ключевые нейронные структуры системы

1. Мезолимбические и мезокортикальные дофаминовые пути
Вентральная область покрышки (VTA) и её проекции в прилежащее ядро (NAc), вентральный стриатум и медиальную префронтальную кору формируют базовый контур обработки вознаграждения. Фазическая дофаминергическая активность кодирует ошибку предсказания вознаграждения (reward prediction error, RPE), тогда как тонический фон модулирует общую мотивационную готовность и «инцентивную салиентность» стимулов. Инцентивная салиентность - консервативный механизм выживания, обеспечивающий быстрое, энергосберегающее поведение в условиях неопределённости. Вместо того чтобы каждый раз проводить когнитивный анализ («стоит ли мне тратить энергию на поиск этого ресурса?»), мозг автоматически маркирует предикторы жизненно важных стимулов (еда, вода, партнёр, безопасность) как «притягательные». Это ускоряет принятие решений, оптимизирует распределение внимания и повышает шансы на выживание и репродуктивный успех.

Современные исследования с использованием сенсоров GRABDA подтвердили, что субпопуляции дофаминовых нейронов дифференцированно кодируют позитивные и негативные предикторы, обеспечивая тонкую настройку поведения.

2. Префронтально-теменная сеть исполнительного контроля
Дорсолатеральная префронтальная кора (dlPFC), вентролатеральная ПФК (vlPFC), передняя поясная кора (ACC) и задняя теменная кора (PPC) формируют сеть, ответственную за поддержание целей, торможение импульсивных реакций, когнитивную гибкость и распределение внимания. Функциональная МРТ и ЭЭГ-исследования демонстрируют, что активность dlPFC коррелирует со способностью к отсрочке вознаграждения (delay discounting) и переключению с автоматических на целеориентированные стратегии.

3. Орбитофронтальная и вентромедиальная префронтальная кора (OFC/vmPFC)
Эти регионы выступают интегративными хабами, где сходится информация о субъективной ценности, риске, социальных нормах и долгосрочных последствиях. vmPFC кодирует интегральную ожидаемую полезность (expected value), а OFC участвует в обновлении ценностей при изменении контекста или обратных связях. Повреждения или гипоактивность vmPFC приводят к импульсивности, неспособности учитывать будущие последствия и нарушению гибкого поведения.

4. Базальные ганглии и кортикостриатальные петли
Прямой (D1-рецепторы) и непрямой (D2-рецепторы) пути базальных ганглиев обеспечивают избирательность действий и баланс между инициацией («go») и торможением («no-go») поведенческих программ. Дорсальный стриатум (дорсолатеральный и дорсомедиальный) постепенно берёт на себя контроль при переходе от нового, когнитивно нагруженного поведения к автоматизированным привычкам, что отражает сдвиг от модель-зависимого к модель-свободному обучению.

 

Ваша оценка: 
0
Голосов пока нет