Правила управления с помощью стимулов



Для того, чтобы управлять с помощью сиг­налов, надо сформировать нужное поведение, а затем, когда оно осуществляется, делать так, чтобы оно происходило во время или сразу после какого-либо определенного сигнала. Этот стимул затем становится ключом, или сигна­лом, поведения.

Например, предположим, что вы застав­ляете собаку садиться, надавливая на крес­тец и подтягивая за ошейник. Это безуслов­ные стимулы, они действуют без обучения. Затем вы подкрепляете любое самостоятель­ное проявление собакой этой позы, форми­руя соответствующее поведение. Делая это, вы произносите команду "Сидеть!", которая первоначально ничего не значит для собаки (конечно, подойдет и любое другое слово на любом языке). Когда собака усвоит, что вам иногда надо, чтобы она села, она иногда ста­нет выполнять это действие во время или пос­ле предъявления сигнала, или условного сти­мула, команды "Сидеть!". В конце концов она начнет выполнять действие точно в соответст­вии с тем, что ей приказывают.

Теперь поведение находится под контролем стимула, не так ли? Еще нет. Проделана только половина работы. Животное следует также обу­чить — и это специальная тренировочная зада­ча — не садиться без команды. Установление управления поведением стимулами не являет­ся завершенным, пока оно совершается и в отсутствии условного сигнала.


Не рычите на собаку!                                                                203


Это, конечно, не означает, что собака дол­жна целый день стоять, пока вы не скоманду­ете: "Сидеть!". Она может садиться сколько ей вздумается. Однако во время тренировок или работы, когда предполагается использование условных стимулов, "пуск" и "стоп" сигналы должны быть твердо установлены, чтобы вы­полнение команды было надежным.

Итак, полный контроль с помощью сти­мулов определяется четырьмя условиями, к каждому из которых следует относиться как к самостоятельному разделу тренировочной за­дачи, самостоятельному пункту программы выработки:

1. Поведение всегда осуществляется сразу после подачи условного стимула (собака са­дится, когда ей приказывают).

2. Поведение никогда не возникает в от­сутствие стимула (во время занятий или ра­боты собака никогда не садится спонтанно).

3. Поведение никогда не наблюдается в ответ на другие стимулы (если вы говорите:

"Лежать!", собака не должна садиться).

4. Никакое другое поведение не возникает в ответ на данный стимул (когда вы говорите. "Сидеть!" собака не должна ложиться или скакать и лизать ваше лицо)

Только когда все четыре условия соблю­даются, собака действительно полностью и окончательно понимает команду "Сидеть!". Теперь вы действительно управляете ею с помощью стимула. <...>

Что может быть сигналом?

Условным стимулом — выученным сигна­лом — может быть все, абсолютно все, что может быть воспринято. Флаги, свет, слова, прикосновения, вибрация, хлопки пробок шампанского — короче говоря, безразлично, какой сигнал вы используете. Коль скоро субъект может воспринимать его, сигнал мо­жет быть использован для вызова выученного поведения.

Дельфинов обычно тренируют с помощью воспринимаемых зрением сигналов руки, но я знаю одного слепого дельфина, который . выучил много разных типов поведения в от­вет на различные прикосновения. Пастушьих собак обычно дрессируют с помощью сигна­лов, поданных рукой и голосом. Однако в Новой Зеландии с ее широкими просторами, где собака может находиться очень далеко, в качестве условного сигнала используют прон­зительные свистки, которые слышны на боль­шем расстоянии, чем голос. Когда новозе­ландский пастух продает такую собаку,


 

покупателем может оказаться человек, живу­щий за много миль; так как свистки невоз­можно записать на бумаге, то старый хозяин обучает нового командам по телефону.

У рыб можно выработать условный реф­лекс на звуки или свет — мы все знаем, как аквариумные рыбки устремляются к поверх­ности, если постучать по стеклу или вклю­чить свет. А человеческие существа могут вы­работать условные связи практически на все что угодно.

В тренировочной ситуации полезно, что­бы для всех субъектов были одни и те же клю­чи и сигналы, чтобы не только дрессиров­щик, но и другие люди могли вызывать данное поведение. Поэтому дрессировщики склонны строго следовать традициям в использовании условных стимулов. Во всем мире лошади под седлом начинают движение, когда вы толка­ете их пятками в бока, и останавливаются, когда вы натягиваете поводья. Верблюды в зоопарке Бронц ложатся, когда слышат ко­манду "Каш!", даже если рядом с ними ни­кого нет, включая их дрессировщика, гово­рящего по-арабски; и любой человек знает, что надо сказать, чтобы верблюд лег. И то, что живущих в Нью-Йорке верблюдов можно с тем же успехом обучить ложиться при сло­вах "Спокойно, крошка!", не имеет ни ма­лейшего значения.

Поэтому-то профессиональные дрессиров­щики не могут понять, что многие условные стимулы выбраны произвольно. Однажды в платной конюшне я работала с молодой ло­шадью на корде, обучая ее команде "Вперед!". Тренер конюшни смотрел на это с отвраще­нием и наконец сказал: "Так ничего не вый­дет — лошади не понимают "Вперед!", надо цокать". Потом взял веревку у меня из рук, сказал: "Тцо-тцо" и стеганул жеребенка по крупу свободным концов веревки, что есте­ственно тотчас же вызвало движение вперед. "Понятно?" — сказал он, считая свои слова доказанными.

Я поняла. С тех пор, воспитывая моих пони, я обучала их слушаться не только моих ко­манд, но и любой возможной системы пону­каний, окриков, применяемой другими дрессировщиками. Это избавило меня от не­приятностей и заставило говорить обо мне как о подающем надежды дрессировщике-люби­теле. По крайней мере мне не приходилось переделывать моих сигналов!

Обучить пони двум системам команд не только возможно, но и легко. В то время, как на каждый отдельный сигнал вам надо полу-


204                                                                                      К. Прайор


чать только какое-либо одно поведение, впол­не достижимо получение одного и того же поведения на несколько условных сигналов. Например, в переполненном людьми по­мещении оратор может потребовать тишины, воскликнув: "Тихо!", или встать и, подняв руку, жестом призвать к молчанию. А если присутствующие шумят и при этом находят­ся в некотором подпитии и, следовательно, отличаются рассеянным вниманием, поможет позвякивание ложкой по стакану. Мы все обу­чены осуществлять данное поведение в ответ на любой из, по крайней мере, трех этих сти­мулов.

Введение второго условного стимула для выученного поведения называется переносом стимулов. Чтобы добиться переноса, вы предъявляете старый стимул — допустим, команду, поданную голосом, — как всегда, и новую команду — скажем, сигнал, поданный рукой,— и подкрепляете ответ; затем посте­пенно делаете старый стимул все менее и менее заметным и одновременно привлекае­те внимание к новому, делая его очень выра­женным, пока на новый стимул не будете получать столь же хороший ответ, даже тог­да, когда старый стимул не предъявляется вовсе. Обычно этот процесс идет несколько быстрее, чем выработка ответа на первона­чальный стимул; когда уже выработано "Вы­полняй это действие" и "Выполняй это дей­ствие по команде", то легче выработать "Выполняй это действие также по другой ко­манде". <...>

Время отставления

Чтобы добиться точности ответа на услов­ный стимул, полезно применять прием огра­ничения времени отставления. Допустим, ваш подопечный обучился совершать какое-либо действие в ответ на условный сигнал, но обычно имеется некоторый интервал време­ни между предъявлением стимула и ответом субъекта. Вы пригласили людей на ужин, и они немного запоздали, или ваш слон после сигнала к остановке постепенно замедляет ход и наконец останавливается.

Если вы хотите, то, используя ограниче­ние времени отставания, можете в процессе тренировки так сократить этот интервал, что поведение будет возникать так быстро, как это только физически возможно.

Вы начинаете с того, что устанавливаете нормативный интервал, с которым обычно наблюдается поведение; затем вы подкрепля­


 

ете только то поведение, которое совершается в течение этого интервала. Поскольку живые существа характеризуются вариабельностью, некоторые ответы будут выходить за пределы интервала и за них не будет даваться подкреп­ление. Например, если вы подаете ужин точно в назначенное в приглашении время, а не ждете опоздавших, то они рискуют получить все холодное или застать меньший выбор.

Когда вы подобным образом установите временной интервал и будете давать подкреп­ление только на его протяжении, то скоро вы обнаружите, что постепенно все ответы на­чинают наблюдаться в его пределах и ни один не выходит за него. Теперь вы снова можете подтянуть гайки. Достаточно ли пятнадцати минут, чтобы семья собралась? Начните по­давать на стол через двенадцать минут после того, как всех позвали, или через десять. Как быстро вы будете закручивать гайки, должно быть точно определено; как и при каждом процессе выработки желательно находиться в тех пределах, в которых наиболее часто на­блюдается данное поведение.

Животные и люди имеют очень развитое чувство времени и чрезвычайно четко реаги­руют на выработку времени отставания, но дрессировщик не должен полагаться на авось. Пользуйтесь часами или даже секундомером, если хотите, чтобы выработка отставления работала на вас. Для поведения ближайших окружающих, включая себя, сократите вре­мя ответа, скажем, с пяти тактов до двух. И конечно, если вы работаете с людьми, не обсуждайте ваши действия; вы не получите ничего, кроме возражений. Просто делайте и смотрите, что получается.

В 1960 г. в океанариуме "Жизнь моря" од­ним из наиболее эффектных номеров, всегда привлекавших внимание, была группа из шести небольших дельфинов, выполнявших различные акробатические трюки в воздухе синхронно. Они совершали различные прыж­ки и повороты в ответ на подводные звуко­вые сигналы. Первоначально, когда сигналы только вводились, прыжки, вращения и все остальные действия, которые от них требова­лись, возникали спорадически с интервалами пятнадцать—двадцать секунд. Но использовав секундомер и установив фиксированное от­ставание, мы смогли снизить время реакции до двух с половиной секунд. Каждое живот­ное знало, что получить рыбу можно только выскочив в воздух и совершив нужный пры­жок или вращение в течение двух с полови­ной секунд после начала сигнала. В результате


Не рычите на собаку!                                                               205


дельфины располагались вокруг подводного ис­точника звука, навострив уши, и когда вклю­чался сигнал, поверхность бассейна просто взрывалась их телами, извергающимися в воз­дух; это было действительно зрелище. Однаж­ды, Сидя среди зрителей, я была поражена, услыхав, как какой-то человек профессорско­го вида, по-видимому, психолог, безапелля­ционно объяснял своим спутникам, что един­ственный способ, который мы могли применить, чтобы добиться такой реакции, является удар электрического тока.

В реальной жизни ограничение времени отставания является попросту тем временем, которое вы считаете нужным ждать, пока просьба или инструкция будут выполнены. Ро­дителей, начальников и учителей, которые проявляют последовательность в выработке определенного временного интервала реак­ции, обычно считают хорошими, заслужива­ющими того, чтобы с ними иметь дело, даже если отставание — временное "окно", в те­чение которого должно осуществляться по­ведение, которое будет подкреплено, — очень короткое. <...>


Дата добавления: 2019-07-15; просмотров: 130; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!