Инструментальное (оперантное) научение

С этой формой условнорефлекторного научения можно познакомиться на другом хорошо известном примере. Выработка рефлекса происходит без сочетания стимулов и без применения условного стимула. Принцип эксперимента состоит в том, что животное получает или награду (пищу), или наказание (боль) в зависимости от того, нажало оно или не нажало на рычаг. В нескольких первых пробах нажатие на рычаг осуществляется в результате спонтанной беспорядочной активности животного. При первом таком случайном нажатии животное получает пищу. Это подкрепление будет приводить к повторению удачной реакции: животное будет снова нажимать на рычаг в надежде получить пищу. Частота двигательных реакций зависит от самого животного: когда оно захочет получить корм, оно будет нажимать на рычаг. Наклон кривой, отражает частоту осуществления выработанной реакции.
Важное значение подкрепления. Инструментальный (или оперантный, по терминологии Скнннера) условный рефлекс всегда представляет собой активную двигательную реакцию, для которой подкрепление служит самым важным фактором. На эту реакцию можно влиять, изменяя частоту подкрепления.
Оперантное научение очевидным образом отличается от описанного выше опыта с выработкой классического условного рефлекса. Этот тип научения впервые в 1913 г. описал Торндайк (Thorndike); он объяснил свои результаты явлением, которое он назвал законом эффекта. Согласно этому закону, двигательная реакция усиливается положительным результатом (например, получением пищи), к которому приводит случайная активность животного. Эта теория согласуется с представлением Дарвина, что только такое поведение прочно закрепляется, которое существенно для выживания индивидуума и вида. Следует подчеркнуть, что в отличие от павловского условного рефлекса двигательная реакция в этом случае не вызывается внешним стимулом или сигналом, а вырабатывается на основе подкрепления, которое следует за определенным движением. Сложные стимулы, связанные с обстановкой, служат фоном и приобретают значение только в случае дифференцировки, когда, скажем, нажатие на рычаг подкрепляется при наличии одного стимула (например, шума машины) и не подкрепляется при другом стимуле (например, свистке).
Снова совмещение во времени. Что касается мозгового механизма инструментального научения, то и здесь, как и при павловском условном рефлексе, следует предполагать образование временной связи между двумя функциональными системами. При ориентировочной двигательной активности импульсы обратной афферентации активируют нейроны пропрноцептивного представительства в головном мозгу. За этим следует возбуждение, вызванное пищевым подкреплением. В результате в обеих центральных областях происходит специфическое повышение возбудимости. По мнению большинства исследователей, предпосылки для выработки условных реакций того и другого типа одни и те же: требуется более или менее одновременное возбуждение двух разных областей мозга.
Развитие оперантных условных рефлексов скорее всего связано с удовлетворением какой-нибудь физиологической потребности (например, голода) в процессе подкрепления. Согласно Халлу (Hull), для того чтобы поведение прочно закрепилось, в его основе должно лежать стремление удовлетворить какую-то насущную потребность. Двигательная реакция, достигающая этой цели, тем самым ослабляет побуждение. К этому вопросу мы вернемся позже.
Программированное обучение: игральные автоматы. На основе работы Скиннера оперантное научение используется во многих областях человеческой деятельности. Созданные в последнее время теории программированного обучения тоже содержат элементы этих рефлексов, поскольку обратная связь у обучающегося используется для подкрепления. Программы с подкреплением используются также при конструировании различных игральных автоматов: время от времени играющий получает награду (подкрепление), чтобы он не потерял интерес к игре, но нажатие на рычаг (или вкладывание монеты) должно быть достаточно частым, чтобы владелец автомата получал прибыль.

Материалы

Гистология интероцепторов

Кодирование интероцептивных импульсов

Декодирование висцеральных импульсов

ЭНЕРГЕТИКА УМСТВЕННОЙ ДЕЯТЕЛЬНОСТИ: БОДРСТВОВАНИЕ, СОН, ВНИМАНИЕ, СОЗНАНИЕ

Активированные нейроны в головном мозгу: бодрствование и внимание

Активирующая ретикулярная формация ствола мозга

«Нейроны бодрствования»

Запуск реакции тревоги.

Регуляция деятельности вегетативной нервной системы

Церебральный управляющий центр

Электроэнцефалография

Происхождение волн ЭЭГ

Внимание и привыкание

«Нейроны внимания»

Гипногенные клетки

Гипноз

Три фазы по Павлову

Внушение и гипноз

Сознательное и бессознательное состояние

Отсутствие биологической теории сознания

Критика фрейдистского бессознательного

Три краеугольных камня фрейдизма

Бессознательные физиологические процессы

Гормональные влияния

Интероцепция

Перевод висцеральных импульсов в сознание

Биология сознательного состояния — неизученная область

Фрагментарность биологических данных

ПРИОБРЕТАЕМЫЙ МОЗГОМ ОПЫТ: НАУЧЕНИЕ И ПАМЯТЬ

Безусловные и условные стимулы

Условный стимул как сигнал

Инструментальное (оперантное) научение

Ошибочное научение: суеверия

Процесс выработки условного рефлекса

Степень прочности

Структурная организация условных рефлексов

Негативный аспект научения: торможение

Охранительное торможение

Дифференцировка

Иррадиация — концентрация

Заключительные замечания

Фиксация и хранение информации

Теория «двойного процесса»

Электрическая модель памяти

Долговременное (перманентное) хранение информации.

Два вида мембраны

Ускоренный синтез белка

Опыты с планариями

Синтез теорий

Разделы

Поцелуй по расчету
Поэма Содди
Задача о сферах
Многомерность
Гость из четвертого измерения
Четырехмерный симплекс
Возможности нового измерения
Эксперимент Цельнера
Геометрия - это интуиция
Ущербность нашего восприятия
Объем - в плоскость
Наш плоский объемный мир
Мебиусиана
Односторонность листа Мебиуса
Топология - из листа Мебиуса
Число Бетти
Хроматический номер
Справа, где сердце
Бутылка Клейна
Мебиус и микромир
Левый и Правый Мебиусы
Эксперимент By Цзянь-сюн
Двухкомпонентная теория нейтрино
Зеркальные двойники
Роль формы
Вселенная искривляется
Тензорный анализ
Теория Вселенной Эйнштейна
Пульс Вселенной
Великолепная пятерка
О божественной пропорции
«Начала» Евклида
Доказательство Эйлера
Символы Шлефли
Гамильтонова линия
Изопиранная задача
Интуиция царицы Дидоны
Как управляется мир
Серьезные игры
Искусство орнамента
Федоровские группы
Игры Эсхера
Симметрии Эсхера
Нефедоровская кристаллография
Мировая гармония
Удавшаяся провокация
«Колючий» ёж Кеплера
Фигура Петри
Теория многогранников
Правильные и почти правильные тела
Песок расширяется!
Кубическая плотная упаковка
Плотность упаковки
Дома на песке
Тайные связи
Музыка сфер
Подкупающая простота
Модели Дончияна
Полезные политопы
Организация пространства
Радость видеть и понимать
Теории Земли
Бейсбольный мяч планеты
Катенаны
Вечный Геометр
Цепь причин и следствий
Счастливый случай
Метод Монте-Карло
Вероятностные методы
Бросаем песчинку
Сходство схем
Задачи распространения тепла
Случайные траектории
Возможности равны
Случай в игре
Игры с таблицей
Новые осложнения
Хуже-лучше
Расшифровка кодов
Роль элемента случайности
Обучение и случайность
Обучение автоматов
«Школьная» схема обучения
Обучение — самообучение
Шаблон поведения
Уметь пользоваться памятью
Опыты И. П. Павлова
Условный рефлекс
Связь между нейронами
Носитель памяти
Механизм образования условного рефлекса
Механизм «вспоминания»
Структура нервной сети
Простой эксперимент
Проблема опознания
Что такое опознание
Зрительные образы
Персептрон
Различаемые образы
Что умеет персептрон
Свойства персептрона
Залог опознания образов
Роль случайности в эволюции
К чему приводят мутации
Естественный отбор
«Безжалостность» законов природы
Приспособление вида
Схема гомеостата
Идея Эшби
Усилитель отбора
Усилитель мыслительных способностей
Схема искусственного отбора
Самонастраивающиеся системы и случайность
Непохожесть систем
Критерий близости к совершенству
Самонастраивающиеся системы
Наладчик сложных систем
Метод компенсации
Как настроить
Устройство автомата
Держим точный размер
Анализ станка-автомата
Обратное воздействие
Способ Гаусса — Зейделя
Анализ настроек
Метод градиента
Метод случайной настройки
Метод случайного поиска
Программа случайного поиска
Схема случайного поиска
Самонастраивающаяся система
Источник неограниченных возможностей

ВОСПРИЯТИЕ, СОЗНАНИЕ, ПАМЯТЬ