ПОДКРЕПЛЕНИЕ: ЛУЧШЕ, ЧЕМ ВОЗНАГРАЖДЕНИЕ



Что такое положительное подкрепление

Положительное подкрепление — это собы­тие, совпадающее с каким-либо действием и ведущее к увеличению вероятности повторного совершения этого действия.

Запомните это положение. В нем заложен секрет успешного обучения.

Существуют два вида подкрепления: по­ложительное и отрицательное. Положительное подкрепление — это нечто, желаемое субъек­том: пища, ласка или похвала. Негативное под­крепление — это то, чего субъект хотел бы избежать: шлепок, нахмуривание бровей, неприятный звук (предупреждающий зуммер в машинах, который раздается, если вы забы­ли пристегнуть ремень безопасности, — это отрицательное подкрепление).

Поведение, которое уже встречается, вне зависимости от того, насколько оно спора­дично, всегда можно усилить с помощью по­ложительного подкрепления. Если вы зовете щенка, и он подходит к вам, а вы его ласка­ете, то в дальнейшем подход щенка на зов становится, все более и более надежным даже безо всякого другого обучения. Предположим, что вы хотите, чтобы кто-то позвонил вам — ваш отпрыск, родитель или любимый. Если он или она не звонит, то тогда уж ничего не поделаешь. Самое главное в обучении с под­креплением то, что вы не можете подкрепить поведение, которое не встречается. С другой стороны, если вы всегда проявляете радость, когда любимые вам звонят, то это значит, что их поведение положительно подкрепляется, вероятность частоты их звонков, очевидно, увеличится. Конечно, если вы примените от­рицательное подкрепление — "Почему ты не позвонил, почему я должна тебе звонить, ты мне никогда не звонишь" и т.д., замечания, которые вызывают раздражение, — вы созда­ете ситуацию, при которой звонящий избе­гает неприятностей тем, что не звонит; фак­тически вы обучаете их не звонить.

Простое введение положительного под­крепления за поведение является наиболее элементарной частью этого вида обучения. В научной психологической литературе встреча­ются такие выражения: "Были использованы поведенческие методики" или "Проблема была решена с помощью поведенческого под­хода". Обыкновенно это означает, что они


 

отдают предпочтение положительному под­креплению перед другими использованными ими методами. Это совсем не означает, что они использовали весь арсенал приемов, описанных в этой книге; они могут и не знать о них.

Однако введение положительного под­крепления часто является единственно необ­ходимым мероприятием. Кстати, например, наиболее действенный способ приучить ре­бенка не мочиться в постель — лично похва­лить его и выразить свое удовольствие, если утром простынки оказались сухими.

Положительное подкрепление можно при­менить и к себе. В Шекспировской студии, которую я в свое время посещала, я встрети­ла юриста с Уолл-стрит, которому было под пятьдесят и который был страстным любите­лем игры в сквош (игра, в которую играют ракетками и мягким мячом в закрытых кор­тах). Однажды он услышал, как я рассказы­ваю об обучении, и уходя заметил, что мож­но испробовать положительное подкрепление на его игре в сквош. Вместо того, чтобы как обычно сокрушаться об ошибках, он попро­бует вознаграждать себя за хорошие удары.

Через две недели я снова встретила его. "Как сквош?" — спросила я. На его лице по­явилось выражение заинтересованности и ра­дости, что нечасто бывает с юристами с Уолл-стрит.

"Сначала я чувствовал себя жутким дура­ком, — ответил он,— говоря: "Хорошо, Пит, молодец!" при каждом удачном ударе. Черт возьми, когда я тренировался один, я даже поглаживал себя по спине. Но затем моя игра начала улучшаться. И сейчас я на четыре ран­га выше в клубной лестнице, чем был когда-либо раньше. Я побеждаю тех, у которых преж­де не мог выиграть даже очко. И получаю гораздо больше удовольствия. С тех пор как я не ору на себя все время, я не кончаю игру злым и разочарованным. Если удар не полу­чился, ничего страшного, следующие будут хорошими. И я обнаруживаю, что мне просто смешно, когда кто-нибудь другой делает ошиб­ку, бесится, бросает ракетку — я знаю, что это не улучшит его игру, я только улыбаюсь.

Какой жестокий противник. И это сразу же как только перешел на положительное подкрепление.

Подкрепление относительно, не абсолют­но. Дождь является положительным подкреп­лением для уток, отрицательным для кошек, довольно безразличен, по крайней мере во влажную погоду, для коров. Пища не являет­ся положительным подкреплением, если вы


186                                                                                      К. Прайор


сыты. Улыбки и похвалы могут быть непри­годными в качестве подкрепления, если субъ­ект хочет вывести вас из себя. В качестве под­крепления надо выбирать нечто желаемое субъектом.

Для любой тренировочной ситуации по­лезно иметь набор подкреплений. В океанари­умах "Жизнь моря" касаток подкрепляют множеством способов: рыбой (их пища), поглаживанием или почесыванием различных частей тела, вниманием окружающих, игруш­ками и т.д. Все представления — это действия, при которых животное никогда не знает, ка­кое поведение будет подкреплено в следую­щий раз и каким будет подкрепление; эти "сюрпризы" так интересны для животных, что представления могут идти почти без стандар­тных подкреплений рыбой; животные полу­чают пищу в конце дня. Необходимость по­стоянного перехода от одного подкрепления к другому увлекательна и интересна и для тренеров.

Положительное подкрепление приносит пользу и при взаимоотношениях между людь­ми. Оно лежит в основе искусства делать по­дарки: точно угадать, что будет иметь подкреп­ляющее действие (правильный выбор является подкреплением и для делающего подарок). <..->

В нашем мире человек, выработавший в себе наблюдательность в отношении положи­тельного подкрепления, имеет большие пре­имущества перед другими. Как мать, я сдела­ла все, чтоб мои сыновья научились делать подарки. Например, однажды, когда они были еще маленькими — семь и пять лет, я повела их в довольно фешенебельный магазин и пред­ложила каждому выбрать по платью для их младшей сестренки. Им понравилось, разва­лясь в плюшевых креслах, одобрять или не одобрять платья, которые она примеряла, как нравится какому-нибудь миллионеру помогать своей подружке выбирать норковую шубку. Их маленькая сестренка тоже получила удоволь­ствие. Так, благодаря этому и подобным уп­ражнениям, урок был усвоен: как по-настоя­щему проникнуться интересом к тому, чего хочет другой человек, как находить радость в поисках положительного подкрепления для тех, кого любишь. <...>

Время подачи подкрепления

Как уже говорилось, подкрепление долж­но совершаться в связи с действием, которое предполагается видоизменить. Подкрепление —


 

это информация. Оно говорит субъекту, что именно вам нравится. Когда субъект пытает­ся обучиться, информационное содержание подкрепления становится важнее самого под­крепления. В тренировке спортсменов или при обучении танцоров именно восклицания ин­структора "Да!" или "Хорошо!", отмечающие нужное движение, а не разбор тренировки или репетиции в раздевалке дают требующуюся информацию.

Запоздалое подкрепление является наи­большим недочетом начинающего дрессиров­щика. Собака садится, но к тому времени, когда хозяин говорит: "Хорошая собака", собака уже снова стоит. За что, думает живот­ное, его хвалят? За то, что оно встает. Если у вас возникают трудности в дрессировке, пер­вый вопрос, который надо себе задать, не запаздывает ли ваше подкрепление. Если вы при работе с животным вдруг застряли в са­мый разгар дела, то иногда полезно, чтоб кто-нибудь со стороны понаблюдал за запаздыва­нием подкреплений.

Мы всегда слишком запаздываем подкреп­ляя друг друга. "Послушай, дорогая, вчера вечером ты выглядела замечательно", — зву­чит совсем не так, как та же фраза, сказан­ная вовремя. Отсрочка подкрепления может даже оказать вредное воздействие ("А что, разве я сейчас не выгляжу замечательно?"). Мы свято верим, что сила слов перекроет ошибки во времени подкрепления.

Слишком раннее подкрепление тоже не­эффективно. В зоопарке Бронкса служители замучились с гориллой. Им было нужно, что­бы она выходила в вольер, чтобы можно было почистить внутреннюю клетку, но она взяла манеру сидеть в дверном проеме, и, обладая недюжинной силой, не давала закрываться скользящей двери. Когда же служители клали пищу снаружи или подманивали ее банана­ми, горилла либо не обращала на них внима­ния, либо хватала пищу и бежала обратно к своей двери, прежде чем ту успевали закрыть. Дрессировщика, работавшего при зоопарке, попросили разобраться. Он объяснил служи­телям, что размахивание бананами и подбра­сывание пищи было попыткой подкрепить действие, которое еще не совершилось. Это называется взяточничеством. Надо было не замечать животное, пока оно сидело в дверях, но подкреплять пищей, если оно выйдет оттуда самостоятельно. Проблема была решена.

Мне кажется, что иногда и детей мы под­крепляем слишком рано, находясь под лож­ным впечатлением, будто мы их подбадрива-


Не рычите на собаку!                                                               187


ем ("Молодец, хорошо, ты уже почти все сде­лала правильно"). Возможно, при этом мы подкрепляем попытки. Но существует разни­ца между попыткой сделать что-то и выпол­нением этого. Причитания типа "я не могу" иногда отражают фактическое положение ве­щей, но они могут являться и признаками того, что часто подкреплялись просто попыт­ки. Вообще, подкрепление поведения, кото­рое еще не совершилось, — подарками, обе­щаниями, комплиментами или чем-нибудь в этом роде — ни капельки не подкрепляет это поведение. Если что-то и подкрепляется, так это поведение, совершающееся в данное вре­мя: вероятнее всего — выпрашивание под­крепления.

Соблюдение времени очень важно и при обучении с отрицательным подкреплением. Лошадь учится поворачивать налево, когда тянут за левый повод, но только если после поворота натяжение ослабевает. Прекращение натяжения является подкреплением. Вы сади­тесь на лошадь, пришпориваете ее, и она дви­жется вперед — тогда вам надо перестать ее пришпоривать (если, конечно, вы не хотите, чтобы она двигалась быстрее). Начинающие наездники часто тычут лошадь в бока непре­рывно, как будто шпоры — это своего рода педаль газа в автомобиле, необходимая для движения. Пришпоривание не прекращается и тем самым не несет никакой информации для лошади. Так в школах верховой езды появ­ляются лошади с железными боками, кото­рые передвигаются черепашьим шагом неза­висимо от того, как часто их пришпоривают.

То же происходит и с людьми, к которым постоянно придираются и бранят родители, начальство или учителя. Если отрицательное подкрепление не прекращается в момент до­стижения желаемых результатов, то оно не является подкреплением и не несет инфор­мации. Оно становится как буквально, так и в терминах теории информации "шумом". <...>

Величина подкрепления

Начинающие тренеры, использующие пище­вое подкрепление при работе с животными, ча­сто не знают, какова должна быть величина каж­дого подкрепления. Ответ таков: чем меньше, тем лучше. Чем меньше подкрепление, тем быс­трее животное съест его. Это не только эконо­мит время, но и позволяет дать большее коли­чество подкреплений за один сеанс, прежде чем животное насытится. В 1979 г. Национальный зоо­парк в Вашингтоне, штат Колумбия, пригла­сил меня в качестве консультанта для обучения


 

группы работников зоопарка технике положи­тельного подкрепления. Одна из смотрительниц в моей группе жаловалась, что обучение ланды продвигается у нее очень медленно. Мне пока­залось это странным, потому что интуитивно я чувствовала, что панды — эти большие, про­жорливые, активные животные — должны лег­ко поддаваться обучению с пищевым подкреплением. Я понаблюдала за ее занятия­ми и обнаружила, что, когда смотрительнице удавалось добиться какого-либо движения, она давала панде целую морковку. Панда долго сма­ковала каждую морковку, поэтому в течение пятнадцати минут отведенного ей драгоценно­го времени она зарабатывала только три под­крепления (а кроме того, морковь ей надоеда­ла). Один ломтик моркови на подкрепление был бы лучше.

Вообще, подкрепление величиной в один глоток животного вполне достаточно для под­держания его заинтересованности — одно—два зернышка для цыпленка, кубик мяса в 6 мм для кошки, половина яблока для слона. Особо любимой пищи можно давать и еще меньше — например, чайную ложку зерна для лошади. Слу­жители Национального зоопарка обучали бе­лых медведей многим полезным вещам, таким, как переход по команде в другую клетку, ис­пользуя изюминки.

Основное правило дрессировщика заклю­чается в том, что если вы собираетесь прове­сти в день одно занятие, то можете рассчи­тывать на хорошую работу животного примерно за четверть его дневного рациона, остальное дается после окончания работы. Если же вам надо провести три или четыре занятия в день, то дневную порцию пищи надо разделить примерно на восемьдесят частей и за один сеанс давать двадцать или тридцать. Восемь­десят подкреплений, видимо, являются макси­мумом, способным заинтересовать субъекта в те­чение дня. (Может быть, поэтому слайдовая кассета содержит восемьдесят слайдов; по крайней мере, когда лектор просит демонстратора показать вторую кассету слайдов, я тяжело вздыхаю.)

Размер подкрепления зависит также от сложности задачи. В океанариуме "Жизнь моря" мы сочли необходимым давать каждо­му киту по большой макрели за их олимпий­ские 6—7-метровые вертикальные прыжки. Они просто отказывались делать это за обыч­ное вознаграждение в виде двух маленьких корюшек. У людей почти всегда более труд­ная работа вознаграждается лучше. А если это­го нет, то как мы ненавидим тяжелую рабо­ту, если нам приходится ее делать.


188                                                                                      К. Прайор


Большой куш

Одним из наиболее полезных приемов пи­щевого или какого-либо другого подкреп­ления для человека и животных является по­лучение куша. Это награда, которая во много, иногда в 10 раз больше обыкновенного под­крепления и являющаяся сюрпризом для субъекта. В рекламном агентстве, где я когда-то работала, бывали официальные вечера на Рождество, а также неофициальные праздни­ки по поводу окончания большой работы или заполучения нового клиента. Но у председа­теля правления была еще привычка устраи­вать в год один-два абсолютно неожиданных вечера. Внезапно в середине дня он проно­сился по всем комнатам конторы, крича, чтоб все кончали работу. Коммутаторы выключа­лись, появлялась процессия поставщиков про­визии, музыканты, буфетчики, шампанское, копченая семга, и все это только для нас и безо всякой особенной причины. Это было неожиданным кушем для пятидесяти человек. Я думаю, что это очень способствовало под­нятию духа коллектива.

Куш можно использовать и для того, чтоб отметить внезапное озарение. Один мой зна­комый наездник, когда лошадь впервые про­делывает какой-нибудь сложный маневр, со­скакивает с нее, освобождает от седла и уздечки и свободно выпускает на манеж — куш полной свободы, который часто, по-ви­димому, может привести к образованию но­вой линии поведения.

Как ни странно, получение всего одного куша может также улучшить ответы непокор­ного, испуганного или сопротивляющегося субъекта, который вообще не проявлял нуж­ного поведения. В океанариуме "Жизнь моря" мы проводили исследования по заданию ВМС США, в которых дельфин получал подкреп­ление за новые реакции, осуществляемые вместо старого, ранее выработанного пове­дения. Испытуемой была понятливая самочка по имени Хоу, которая редко давала новые ответы. Когда ей не стало удаваться получать подкрепления за свои действия, она стала неактивной, и в конце концов в течение од­ного занятия за двадцать минут не дала ни одного ответа. Наконец, тренер кинул ей пару рыбок "ни за что". Явно ошарашенная такой щедростью, Хоу снова стала активной и вско­ре выполнила движение, которое можно было подкрепить, что привело к несомненному прогрессу на последующих занятиях.

Я сама бывала в таком же положении, как этот дельфин. Когда мне было пятнадцать лет,


 

самым большим удовольствием для меня были уроки верховой езды. Конюшни, где я зани­малась, продавали билеты, каждый на десять уроков; по своим деньгам я могла позволить себе один билет в месяц. В то время я жила с отцом, Филиппом Уили, и мачехой, Рики; и хотя они относились ко мне очень хорошо, я вступила в один из тех периодов юности, когда беспрерывно целыми днями бываешь невы­носимо грубым и противным. Однажды вече­ром супруги Уили, которые были любящими и изобретательными родителями, сказали, что они ужасно устали от моего поведения и по­этому решили меня наградить.

И они презентовали мне ослепительно новый, дополнительный бесплатный билет на верховую езду. Один из них не поленился съез­дить на конюшни, чтобы купить его. Порази­тельно! Незаслуженный куш. Как мне помнит­ся, я с ходу переменилась, и Рики Уили подтвердила это много лет спустя, когда я писала эту книгу.

Почему незаработанный куш может ока­зать такое внезапное и далеко идущее влия­ние, я не совсем понимаю. Может быть, со временем кто-нибудь напишет диссертацию по этому поводу и объяснит нам это. Я только знаю, что дополнительный билет на верхо­вую езду мгновенно снял у меня сильные чув­ства угнетенности и обиды, и я подозреваю, что и дельфин чувствовал то же самое.

Условное подкрепление

Очень часто, особенно при работе с пище­вым подкреплением, его невозможно дать в тот момент, когда субъект делает то, что хо­тели бы поощрить. Если я учу дельфина пры­гать, то я никак не могу дать ему рыбку в тот момент, когда он находится в воздухе. Если за каждым прыжком следует брошенная рыб­ка (отставленное подкрепление), то у жи­вотного в конце концов образуется связь меж­ду прыжком и едой, и оно будет прыгать чаще. Однако это не несет информации о том, ка­кой из аспектов прыжка мне нравится. На какую высоту? С каким прогибом? Может, надо войти обратно в воду со всплеском? Та­ким образом, потребуется очень много повто­рений, чтобы животное установило, какой именно прыжок я имела в виду. Чтобы обой­ти эту трудность, мы используем условное подкрепление.

Условное подкрепление представляет со­бой какой-либо изначально ничего незнача­щий сигнал — звук, свет, движение, — кото­рый умышленно связывают с подачей


Не рычите на собаку!                                                                189


подкрепления. Тренеры дельфинов останови­ли свой выбор на полицейском свистке: его хорошо слышно даже под водой и он не свя­зывает руки, чтобы можно было давать сиг­налы и бросать рыбу. С другими животными я обычно использую "сверчка", десятиценто­вую игрушку, которая щелкает, когда на нее нажимаешь, или особые поощряющие сло­ва, выбранные и приберегаемые для исполь­зования в качестве условного подкрепления:

"хорошая собака", "хорошая лошадка". Школьные учителя часто прибегают к неко­торым таким ритуальным и тщательно нор­мированным словам похвалы — "замечатель­но" или "очень хорошо",— за которые дети страстно работают и ждут их.

Наша жизнь изобилует условными под­креплениями. Нам нравится слышать, как зво­нит телефон или видеть набитый почтовый ящик, даже если половина звонков неинте­ресна и большая часть корреспонденции — утиль, потому что множество случаев научи­ли нас связывать звонок или конверт с хоро­шим. Нам нравится рождественская музыка, и мы ненавидим запах зубного кабинета. Мы храним окружающие нас вещи — картины, посуду, трофеи — не потому, что они краси­вы или полезны, а потому, что они напоми­нают нам о временах, когда мы были счаст­ливы, или о людях, которых мы любили. Они представляют собой условные подкрепления.

Практически дрессировка животных с ис­пользованием положительного подкрепления почти всегда должна начинаться с выработки условного подкрепления. Прежде чем начать выработку поведения как такового, пока субъект еще ничего особенного и не делает, вы учите его понимать значимость условного подкрепления, сочетая его с пищей, поглажива­нием или другим истинным подкреплением. Иногда, по крайней мере при работе с живот­ными, вы можете уловить, когда субъект начи­нает узнавать ваш сигнал, означающий "Хоро­шо!". Видно, как животное вздрагивает при действии условного подкрепления и начина­ет искать истинное подкрепление. После вы­работки условного подкрепления в ваших ру­ках оказывается реальный способ сообщения животному, что в его поведении вас интере­сует. Чтобы разговаривать с животными, вам не обязательно быть доктором Дулиттлом, можно очень многое сказать таким вырабо­танным подкреплением.

Условные подкрепления приобретают чрезвычайную силу. Так как информация "Ты прав" сама по себе представляет ценность,


 

она не обязательно должна сопровождаться первичным подкреплением. Фактически ис­пользование пищи, ласки или чего-нибудь в этом роде можно практически свести к нулю, а условное подкрепление будет приносить пре­красные результаты. Я видела, как морские млекопитающие долго работали после насы­щения за условные подкрепления, а лошади и собаки работают по часу и более с малень­ким или безо всякого безусловного подкреп­ления. Люди, конечно, же тоже могут беско­нечно работать за деньги, являющиеся ничем иным как условным подкреплением, обозна­чением вещей, которые на них можно купить, особенно люди, которые уже заработали го­раздо больше денег, чем они когда-либо смо­гут действительно потратить, и, следователь­но, пристрастившиеся к условному подкреплению.

Действие условного подкрепления можно усилить, сочетая его с несколькими безуслов­ными подкреплениями. В данный момент субъект может не хотеть, скажем, есть, но если тот же подкрепляющий звук или слово были умышленно связаны еще и с водой или другими потребностями или приятными мо­ментами, он сохраняет свое действие и в этом случае. Мои кошки слышат слова "хорошая киса!", когда получают ужин, когда их гла­дят, когда их впускают в дом и выпускают из дома, когда они проделывают маленькие трю­ки и получают за них вознаграждение. В ре­зультате я могу использовать эти слова для поощрения кошки, спрыгивающей с кухон­ного стола, и нет нужды сопровождать его каким-либо безусловным подкреплением. Быть может, причина того, что деньги оказывают на нас такое подкрепляющее действие, кро­ется в том, что они могут связываться практически с чем угодно. Это чрезвычайно обобщенное условное подкрепление.

Как только вы выработали условное под­крепление, вы должны пользоваться им ос­торожно, не разбрасывать без толку, иначе его сила уменьшится. Дети, которые ездили на моих уэльских пони, очень скоро научи­лись говорить: "Хорошая лошадка!" только когда хотели подкрепить поведение. Если им просто хотелось выразить свою привязан­ность, они могли болтать с пони, как угод­но, не употребляя этих слов. Однажды девоч­ка, которая только что присоединилась к их компании, начала гладить пони, приговари­вая: "Ты хорошая лошадка!". Трое остальных тотчас же ополчились на нее: "Ты за что ему это говоришь? Он же ничего не сделал!". Подо-


190                                                                                      К. Прайор


бным же образом можно и должно окружить заботой и вниманием детей, супруга, роди­телей, любимых и друзей безотносительно к какому-нибудь определенному поведению, но необходимо приберечь что-то специально в качестве условного подкрепления чего-либо определенного. Существует множество реаль­ных событий, заслуживающих похвалы, под­крепления, которым щедро обмениваются в счастливых семьях. Однако фальшивая или незначимая награда вскоре вызывает негодо­вание даже у маленьких детей и теряет вся­кую силу в качестве подкрепления.

Можно выработать и условное отрицатель­ное подкрепление, которое может быть очень полезным. Дети и многие животные часто моментально реагируют на резкое, громкое слово запрета, которое ничем не сопровож­дается. Возможно, оно является первичным или безусловным подкреплением. Но некото­рые животные — особенно этим славятся кош­ки — игнорируют окрики и брань. Одна моя подруга совершенно безуспешно пыталась отучить свою кошку царапать кушетку, ис­пользуя в качестве отрицательного подкреп­ления возглас "Нет!". Однажды в кухне она уронила большой латунный поднос, случай­но упавший почти рядом с кошкой, и, когда раздался громкий грохот подноса, воскликну­ла: "Нет!". Кошка была страшно напугана, подпрыгнула вверх, подняв шерсть дыбом. В следующий раз, когда кошка начала драть кушетку, хозяйка крикнула: "Нет!", у кошки сделался испуганный вид, и она тотчас же перестала. Двух—трех повторений ставшего ус­ловным слова оказалось достаточно, чтобы навсегда прекратить это поведение.

Режимы подкрепления

Бытует неправильный взгляд, что если вы начали вырабатывать поведение с помощью положительного подкрепления, то должны продолжать его применение на протяжении всей дальнейшей жизни субъекта, если этого не будет, то поведение исчезнет. Это невер­но: постоянное подкрепление необходимо только на стадиях обучения. Вы можете не­сколько раз вознаградить годовалого ребенка за пользование горшком, но как только по­ведение заучено, предмет обучения сам о себе позаботится. Мы даем или должны давать на­чинающему множество подкреплений — обу­чение ребенка езде на велосипеде идет под настоящий поток: "Правильно, крепче дер­жи руль, у тебя получилось, хорошо!" Но вы


 

будете выглядеть довольно глупо (а ребенок решит, что вы сошли с ума), если вы будете продолжать хвалить его после того, как навык установился.

Для того, чтобы поддерживать уже выу­ченное поведение на определенном уровне на­дежности, не только не надо подкреплять его все время, а даже, наоборот, следует прекра­тить регулярные подкрепления и перейти на эпизодическое использование подкрепления, подаваемого в случайном и непредсказуемом порядке.

Это и есть то, что психологи называют вариабельным режимом подкрепления. Вари-абельный режим гораздо более эффективен для поддержания поведения, чем постоян­ный, предсказуемый. Один психолог объяс­нил это мне так: если у вас машина новая и всегда хорошо заводилась, а однажды, когда вы сели в нее, повернули ключ, она не заве­лась, то вы, может быть, и попробуете заве­сти ее еще несколько раз, но скоро решите, что что-нибудь не в порядке, и позвоните в гараж. Поведение, состоящее в поворачива­нии ключа, при отсутствии ожидаемого не­медленного подкрепления быстро угаснет. С другой стороны, если у вас вместо машины старая консервная банка, которая еще ни разу не заводилась с первой попытки, и каждый раз требуется целая вечность для того, чтобы привести ее в движение, вы можете продол­жать попытки ее завести в течение получаса;

ваше поведение по поворачиванию ключа происходит в низковероятностном режиме подкрепления и поэтому сильнейшим обра­зом поддерживается.

Если давать дельфину рыбку за каждый прыжок, то скоро прыжки станут невысоки­ми, небрежными, лишь бы отделаться. Если теперь перестать давать рыбу, дельфин тут же перестает прыгать. Но, если после того как животное научилось прыгать за рыбку, начать подкреплять первый прыжок, затем третий и так далее наугад, поведение будет поддержи­ваться на более высоком уровне: не получив подкрепления, животное станет прыгать чаще, стараясь угадать счастливый номер, и прыжки могут даже усилиться. В свою очередь это позволит подкреплять выборочно наибо­лее сильные прыжки, то есть посредством вариативного режима совершенствовать дея­тельность. Но даже некоторые профессио­нальные дрессировщики не могут правиль­но использовать вариативный режим положительного подкрепления; многим эта концепция представляется особенно труд-


Не рычите на собаку!                                                                191


ной, не укладывающейся в голове. Нам по­нятно, что нет нужды продолжать наказывать за неправильное поведение, если оно прекра­тилось, но почему бы не вознаграждать по­стоянно за правильное поведение. Мы не так уверены в этом, только когда ставим целью добиться с помощью положительного под­крепления улучшения дисциплины.

Действенность вариативного подкрепления лежит в основе всех азартных игр. Если каж­дый раз, опустив в автомат 5 центов, будете получать десять, то скоро вы потеряете к это­му интерес. Да, вы будете делать деньги, но какой это нудный способ! Людям нравится играть с автоматом именно потому, что не­возможно предугадать заранее, то ли ничего не получишь, то ли какую-то мелочь, то ли сразу кучу денег, и когда именно будет это подкрепление (это может быть только один, самый первый раз). Почему одни люди втяги­ваются в азартную игру, а другие могут поиг­рать и бросить, это уже другой вопрос, но для тех, кто попался на крючок, этим крюч­ком стал вариативный режим положительно­го подкрепления.

Чем длительнее интервалы между подкреп­лениями в вариативном режиме, тем сильнее он стимулирует поведение. Однако режимы с длительными интервалами работают против вас, когда вы пытаетесь угасить поведение. Если поведение не подкреплять совсем, то скоро появится тенденция к его угасанию; но если оно все-таки время от времени под­крепляется — неважно сколь эпизодично — одна сигарета, одна рюмка, одна поблажка ворчуну или нытику — и поведение вместо того, чтобы угасать, может быть значительно усилено режимом с длительными интервала­ми между подкреплениями.

Всем встречались люди, которые непонят­ным образом привязаны к супругам или лю­бовникам, которые с ними плохо обращают­ся. Мы привыкли думать, что так бывает только с женщинами — она чувствует влечение к тому, кто груб, невнимателен, эгоистичен и даже жесток, она его все равно любит, — но это случается и с мужчинами. Каждый знает людей, которые после развода или другого рода утраты одного негодяя находят другого, в точ­ности похожего на предыдущего.

Являются ли эти люди вечными жертвами ; по каким-либо глубоким психологическим при­тонам? Возможно. Но, может быть, они — жер­твы режима с длительными интервалами меж­ду подкреплениями? Если вы вступили в связь с очаровательным, обаятельным, интересным


 

в сексуальном плане, веселым и вниматель­ным человеком, а затем он становится все более несговорчивым, даже обидчивым, но все же время от времени проявляет свои хо­рошие качества, вы станете жить ради этих все более редких моментов, когда вы получа­ете это прекрасное подкрепление: полное оча­рования, обаяния, привлекательности и ве­селья внимание. И парадоксально с точки зрения здравого смысла, но закономерно с точки зрения теории обучения, что чем реже и непредсказуемей становятся такие момен­ты, тем сильнее становится их подкрепляю­щий эффект, и тем дольше ваша линия пове­дения будет сохраняться. Кроме того, легко понять, почему человек, однажды оказавший­ся в таких отношениях, часто ищет их повто­рения: ему может казаться, что во взаимоот­ношениях с нормальным человеком, который сдержан и доброжелателен большую часть времени, не хватает остроты того редкого, страстно желаемого и потому вдвойне действенного подкрепления. <...>


Дата добавления: 2019-07-15; просмотров: 17;