Позитивное и негативное подкрепление



Вероятность реакции возрастает и после позитивного, и после негативного подкрепления. Позитивное подкрепление состоит из представления чего-то, воде пищи, воды или сексуального контакта, в данной ситуации. Негативное подкрепление состоит из удаления чего-то, воде яркого света или удара током, из данной ситуации. Таким образом, различие между позитивным и негативным подкреплением зависит от того, присутствие или отсутствие данного подкрепляющего стимула увеличивает вероятность реакции. Изъятие позитивного подкрепляющего стимула имеет тот же самый эффект, как и представление негативного подкрепляющего стимула.

Первичные и обусловленные подкрепляющие стимулы

Скиннер полагал, что все подкрепляющие стимулы, в конечном счете, получают свою силу от эволюционного отбора, и что часть “человеческой природы” заключается в том, чтобы получать подкрепление определенными способами с помощью определенных вещей. Например, и позитивный подкрепляющий стимул пищи и негативный подкрепляющий стимул спасения от опасной ситуации имеют очевидную ценность выживания. Только малая часть поведения немедленно подкрепляется пищей, водой, сексуальным контактом или другими подкрепляющими стимулами очевидного биологического значения. Такие подкрепляющие стимулы являются первичными или безусловными.

Большая часть поведения — это реакция на подкрепляющие стимулы, которые стали ассоциироваться с первичными подкрепляющими стимулами или обусловлены ими. Например, если каждый раз, когда голодному голубю дается пища, включен свет, последний в конечном счете становится обусловленным подкрепляющим стимулом. Свет может затем использоваться, чтобы обусловить оперант таким же образом, как и пища. Обусловленный подкрепляющий стимул генерализуется (распространяется на более широкий круг явлений), когда он соединен больше чем с одним первичным подкрепляющим стимулом. Важность этого в том, что генерализованный обусловленный подкрепляющий стимул, типа денег, полезен, потому что применим не только к одному состоянию депривации, типа голода, но и ко многим другим. Следовательно, при таком виде подкрепления реакция будет иметь место с большей степенью вероятности. Другими генерализованными обусловленными подкрепляющими стимулами являются внимание, одобрение и привязанность*.

Режимы подкрепления

Ферстер и Скиннер (Ferster & Skinner 1957) отмечают, что многие существенные особенности формирования и сохранения поведения можно объяснить, только обращаясь к свойствам режимов подкрепления, и что прерывистое подкрепление может быть очень важным источником подкрепления само по себе, а не только бедным родственником постоянного или длительного подкрепления.

Непрерывные режимы подкрепления:

Постоянное подкрепление, где каждая возникающая реакция подкрепляется.

Прекращение, где не подкрепляются никакие реакции.

Прерывистые режимы подкрепления включают в себя:

Режим с постоянным интервалом, при котором первая реакция, имеющая место после данного периода времени (например, пять минут), подкрепляется, а новый период начинается немедленно после подкрепления.

Режим с постоянным соотношением, при котором подкрепляется каждая энная реакция. (Слово “соотношение” относится к отношению между реакциями и подкреплением.)

Режим с вариативным интервалом, при котором подкрепление намечается согласно случайному ряду интервалов, имеющих данную среднюю величину и находящихся между произвольными величинами.

Режим с вариативным соотношением, при котором подкрепление намечается согласно случайному ряду отношений, имеющих данную среднюю величину и находящихся между произвольными величинами.

Множественный режим, при котором один режим подкрепления находится в силе в присутствии одного стимула, и другой режим — в присутствии другого стимула. Например, имеется установленный интервал, когда ключ в экспериментальной коробке голубя красный, и другой интервал, когда ключ зеленый.

Дифференцированное подкрепление уровня реакции, при котором реакция подкрепляется, только если она следует за предшествующей реакцией после указанного интервала времени (например, три минуты) или до конца данного интервала (например, половина секунды).

Сохранение и угасание

Скиннер не считал термин “научение” эквивалентным “оперантному обусловливанию”. Научение придает особое значение приобретению поведения, в то время как оперантное обусловливание сосредотачивается и на приобретении, и на сохранении поведения. Таким образом, поведение продолжает иметь последствия, и если этих последствий или подкрепления не оказывается в наличии, происходит угасание. Например, когда поведение голубя, типа подъема головы, которое подкреплялось последствием пищи, больше не получает этого подкрепления, подъем головы имеет тенденцию происходить с меньшей частотой. Точно так же, когда люди участвуют в поведении, которое больше не имеет полезных последствий, они оказываются менее склонными вести себя таким образом. Режимы подкрепления имеют отношение к угасанию. Например, сопротивление угасанию, порожденному периодическим укреплением, может быть намного сильнее, чем при постоянном подкреплении. Задача науки поведения состоит в том, чтобы объяснить вероятность реакции с точки зрения истории его подкрепления и угасания. Скиннер использовал термин “оперантная сила”, чтобы указать вероятность данной реакции, и отмечает, что у людей состояние низкой оперантной силы, являющееся результатом угасания, часто требует лечения. Например, психотерапия могла бы иногда рассматриваться как система подкрепления, предназначенного для восстановления угасшего поведения.


Дата добавления: 2019-02-13; просмотров: 340; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!