Исключения из правила вариативного подкрепления



Лишь в одном случае не следует прибегать к вариативному режиму подкрепления, пос­ле того, как поведение заучено, — это когда оно направлено на решение своего рода го­ловоломки или теста. При одном из видов дрессировки собака должна выбирать из не­скольких разнородных предметов тот, кото­рый побывал в руках у хозяина и хранит его запах. При этом необходимо каждый раз гово­рить собаке, что она выбрала правильно, что­бы в следующий раз она знала, что надо де­лать. В тестах на различение, — скажем, идентификация более высокого из двух зву­ков — необходимо подкреплять каждый пра­вильный ответ испытуемого, чтобы он был постоянно информирован о том, какую зада­чу он решает (подойдет, конечно, и условное подкрепление). Когда мы отгадываем крос­сворд или составляем картинку-загадку, мы получаем подкрепления за правильные догад­ки, так как только они являются "подходя­щими". Если бы при составлении картинки-загадки можно было вставить в одну ячейку несколько кусочков, то положительного под­крепления за правильный выбор, который является обязательной обратной связью в любой ситуации выбора, не получалось бы.


192                                                                                      К. Прайор


Долговременные программы поведения

В дополнение к вариативному режиму под­креплений можно ввести и закрепленный, при котором субъект знает, что он должен работать определенное время или выполнить определенный комплекс поведенческих реак­ций за каждое подкрепление. Например, под­крепляя каждый шестой прыжок, можно сде­лать так, что дельфин будет прыгать шесть раз подряд, и вскоре получим стабильные серии из шести прыжков. Трудность работы с фик­сированным режимом подкрепления состоит в том, что первые ответы в сериях не подкреп­ляются и возникает тенденция к уменьшению затрачиваемых на них усилий. У прыгающего дельфина со временем все прыжки, кроме последнего, который действительно подкреп­ляется, уменьшаются. Это отрицательное вли­яние фиксированного режима подкреплений является важным фактором во многих видах человеческой деятельности — например, на за­водском конвейере. Чтобы получить подкреп­ление, необходимо работать в течение опреде­ленного времени, но так как подкрепление дается в фиксированном режиме, независи­мо от качества выполнения, человек совершенно естественно стремится делать то наименьшее количество работы, которое по­зволяет не выпасть из игры, особенно низкая производительность может быть в начальный период работы. Зарплата по пятницам явля­ется фиксированным подкреплением, дела­ющим понедельник тяжелым днем. У дель­финов поддержать поведение поможет случайное подкрепление первого или второ­го прыжка, помимо шестого. У людей могут быть эффективны различные виды прогрес­сивных оплат или других подкреплений (на­пример, награды), тесно связанные с каче­ством и количеством продукции и выдаваемые неодновременно с обычным подкреплением.

Применяя либо фиксированный, либо ва-риативный режимы подкрепления можно от-тренировать чрезвычайно длинные цепи по­веденческих реакций. Можно добиться того, что цыпленок будет клевать кнопку сто и бо­лее раз за каждое зернышко пшеницы. Для людей также можно привести много приме­ров отставленного вознаграждения. Один пси­холог шутит, что самым длительным режи­мом неподкрепляемого поведения в человеческой жизни является учеба в школе.

При режимах подкрепления с чрезвычай­но длительными интервалами иногда созда­ются ситуации, которые не приносят орга­


низму полезного результата. Для цыпленка это определяется обменными процессами: когда на клевание кнопки он начинает тратить больше энергии, чем может восстановить при полу­чении пшеничного зерна, поведение начина­ет угасать — цена работы падает так низко, что ее просто становится незачем делать. Ко­нечно, так часто бывает и с людьми.

Другое явление, встречающееся при очень длительных интервалах между подкрепления­ми,— замедленный старт. Начав клевать, цып­ленок совершает эти действия с постоянной частотой, так как каждый удар приближает его к подкреплению, но было отмечено, что по мере того, как увеличиваются интервалы между подкреплениями, он стремится "отло­жить" начало реакции на более длительный срок. Это и называется "отсроченное начало поведения с долговременной программой" и очень распространено в жизни людей. В лю­бой долгосрочной задаче, начиная с уплаты подоходного налога и кончая уборкой гара­жа, можно придумать бесконечное количество причин для того, чтобы не начать дело безот­лагательно. Написание чего-либо, иногда даже просто письма, тоже поведение с долгосроч­ной программой. Когда оно уже начато, все идет прекрасно. Но так трудно заставить себя сесть и начать! Джеймс Турбер находил, что начать статью настолько трудно, что иногда он обманывал свою жену (которая по понят­ным причинам была чрезвычайно заинтере­сована в том, чтобы он писал статьи, так как доход с них шел на оплату квартиры), лежа все утро на диване в кабинете и читая книгу, которую он держал в одной руке, а другой стучал по клавишам пишущей машинки. Фе­номен отсроченного начала перевешивал яв­ное положительное подкрепление в виде де­нег, а симуляция печатанья на машинке, по крайней мере, предотвращала отрицательное подкрепление упреков жены.

Один из способов преодоления феномена отсроченного начала заключается в том, что­бы вводить какое-либо подкрепление имен­но за старт, так же, как я эпизодически под­крепляю у своих дельфинов первый или второй прыжок в серии из шести. Я успешно приме­няла этот прием и в самовоспитании. В тече­ние нескольких лет один или два раза в неде­лю я посещала вечерние занятия, что требовало много времени — три часа занятий и по часу на дорогу в один конец. Каждый раз, когда приближалось 5 часов, появлялось сильнейшее искушение не ездить. Но потом я обнаружи­ла, что, если я разобью поездку — первую


Не рычите на собаку!                                                                193


часть дела — на пять этапов: путь до станции метро, посадка в поезд, пересадка на другой, автобус до университета и, наконец, восхож­дение по лестнице до аудитории, и подкреп­лю каждое из этих начальных поведении пос­ле его выполнения маленьким кусочком шоколада, который я очень люблю, но обычно не ем, я стала способна вытащить себя из дома, а через несколько недель была в состоянии про­делать весь путь на занятия без шоколада и без внутренней борьбы.


Дата добавления: 2019-07-15; просмотров: 161; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!