Перенесение ценности: превращаем кротовый холмик в гору.



Эта книга описывает много примеров выработки классических условных рефлексов. Например, когда Баз впервые увидел короткий туннель, это был нейтральный раздражитель – он ничего не значил для него. Я кликала и поощряла его игрушкой, пока он не начал пробегать сквозь туннель. Используя положительное подкрепление, я вскоре выработала у База условную связь с туннелем, такую же, как и с поощрением, которое он получал за него. Мастерство в дрессировке требует понимания этого процесса. В этом случае высокая ценность подкрепления игрой перешла и на туннель. Поскольку туннель давал возможность поиграть, Баз очень скоро начал радоваться и заводиться, как только он его видел. Таким образом я использовала драйв, который был у База относительно игры, чтобы создать драйв к работе.

Принцип Примака.

Когда Баз выучил вид снарядов аджилити, он быстро стал одержим «бегать аджилити». Ценность препятствий стала огромной для него, так что он не мог дождаться тренировки. Он тянул и рыл землю лапами, идя на поводке к полю со снарядами.
Мне пришлось искать способ контролировать его при подходе к полю, так что я использовала принцип Примака. Дэвид Примак заметил, что доступ к высоковероятному поведению (в данном случае, преодоление препятствий) может поощрять низковероятное поведение (спокойный подход к полю со снарядами на провисшем поводке), или, простыми словами, чтобы получить то, что ты хочешь, сделай сначала то, что я хочу.

В сущности, то, что я делала, было просто еще одной задачей по перенесению ценности. Для База подход на провисшем поводке и спокойное ожидание того, пока я открою ворота на поле со снарядами, изначально не имели той притягательности, какой обладало аджилити. Если бы я физически или голосом корректировала База, то я бы подавила реакцию выхода из-под контроля, но не исключила бы ее окончательно; его пришлось бы поправлять всю жизнь. Я настаивала на том, чтобы он сел и обратил на меня внимание перед тем, как идти бегать, так что он понял, что спокойное ожидание – хорошо, поскольку оно дает возможность побегать аджилити.

Если бы я позволила Базу волочить меня к полю со снарядами, вместо того, чтобы настаивать на спокойном подходе, то он решил бы, что это является необходимой прелюдией к занятиям аджилити, и начал бы тянуть еще сильнее. Сейчас Баз – образцовая собака вблизи любого поля для аджилити. Он даже не смотрит на других собак, поскольку он знает, что его шанс побегать зависит от его хорошего поведения.
Когда Баз начал бегать связки снарядов, он настолько полюбил это, что игрушка потеряла для него былую ценность как поощрение в конце пробега. Снова я использовала Принцип Примака, чтобы повысить ее ценность и иметь возможность поощрять База за правильное выполнение (см.гл.22). Вы можете использовать Принцип Примака в повседневных отношениях с вашей собакой. Возьмите то, что любит ваша собака (играть в мяч, например), и попросите ее сначала выполнить какую-нибудь команду (сесть или лечь) перед тем, как вознаградить ее предложением любимой игры. С применением Принципа Примака вы сможете сделать так, чтобы собака полюбила простые действия (сесть, лечь или коснуться вашей руки). И это сделает выполнение команд более быстрым и точным.

Остерегайтесь самоподкрепляющегося поведения.

Имейте в виду, что вы можете не контролировать все виды поощрения, которые получает ваша собака. Некоторые реакции могут быть самоподкрепляющимися. Копание в отбросах, перелаивание с соседской собакой через забор, прыгание на гостей, копание ям в саду, охота на пылесос и жевание ваших тапочек – все это примеры самоподкрепляющегося поведения. Вы не можете просто игнорировать все нежелательные реакции в надежде, что они исчезнут сами собой, поскольку любая реакция, получающая поощрение, учащается. Игнорирование самоподкрепляющегося поведения – неэффективная и даже разрушительная тактика. Выискивайте такое поведение и делайте так, чтобы вы контролировали все поощрение, чтобы собака выучила, что вы намного интереснее всего окружающего.

Добиваемся точности.

Конечно, поощрение нужного поведения и игнорирование нежелательного – основа дрессировки собак с помощь положительного подкрепления. Но настоящая прелесть отбора поведения в том, что есть возможность ультра-усовершенствования в обучении: 1) очень точному поведению (например, определенной позиции на контактной зоне в аджилити); и/или 2) цепочке поведения (например, набор действий, которые собака должна произвести для правильного и безопасного преодоления горки).

При отборе поведения дрессировщик ждет, пока собака предложит какие-то действия. Поощряя каждый подходящий вариант, он подводит собаку к намеченному поведению. Дрессировщик может управлять действиями собаки, пользуясь точным и своевременным подкреплением и приспосабливая требования к каждому конкретному действию к конечной цели. То, что дрессировщик начинает поощрять в начале пути, очень сильно отличается от конечного продукта.

Например, чтобы научить База правильно проходить бум (сложная цепь действий), сначала я научила его касаться носом моей ладони. Я показала ему руку примерно в 25 см от него. Баз мог и проигнорировать ее, но как только он на нее посмотрел, я кликнула и дала ему лакомство. В следующий раз я показала ему руку, но уже ждала, чтобы он не только посмотрел, но и понюхал ее.

Если вы создаете собаке простые условия для выбора, она в большинстве случаев будет выбирать правильно, будет часто получать поощрение, и, следовательно, нужное поведение будет появляться все чаще и чаще. Поощрение повышает вероятность повторения поведения. У База был выбор – заметить мою ладонь или проигнорировать ее. При этом я таким образом использовала его окружающую среду (исключив возможные отвлекающие факторы), что я была уверена, что он выберет ладонь. Было бы нечестно начать эту игру среди стада овец или на собачьей площадке, поскольку сильные отвлечения сделали бы выбор База очень трудным. Неверный выбор был всегда доступен Базу, но на ранних стадиях дрессировки я делала его очень сложным. Занятия таким образом сделают ваши тренировки наполненными поощрением, и ваша собака всегда будет с нетерпением ждать их (см. таблицу в приложении А).

Мастера создания поведения: Бэйли.

На мое понимание приложения принципов обучения собак огромное влияние оказали работы Боба Бэйли и его чудесной жены, покойной д-ра Мэрион Бэйли. Мэрион (Бреланд) Бэйли училась у великого Б.Ф.Скиннера. Бэйли использовали принципы Скиннера по отношению к целому Ноеву ковчегу.

Удивительный дрессировщик любых животных, Боб Бэйли начал свою профессиональную карьеру, дрессируя дельфинов на службе в ВМФ США. Затем они владели и управляли Центром поведения животных, который Мэрион создала вместе со своим покойным мужем д-ром Келлером Бреландом. Здесь Боб и Мэрион обучили тысячи животных, как для любительских целей, так и для особо секретных нужд вооруженных сил. Например, они научили воронов нести в клювах маленькие шпионские камеры, следуя за лазерным указателем, мягко прижать камеру к нужному окну и открыть затвор, чтобы сфотографировать происходящее внутри.

Бэйли дрессировали все, от рептилий до приматов и китов. Боб часто говорит, что он «не дрессировщик собак», поскольку он дрессировал всего несколько сотен их. Как ни огромно вам может показаться это количество, по сравнению с более чем десятью тысячами животных, выпущенных Центром, это действительно немного. Бэйли говорит о дрессировке: «Это просто, но не легко».

Сейчас дрессировщики морских животных, владельцы зоопарков и дрессировщики собак всего мира извлекают пользу из новаторских трудов супругов Бэйли о дрессировке животных без принуждения. Особенно мир дрессировки собак развернулся на 180 градусов после популяризации Бэйли принципов оперантного научения. Я польщена и благодарна возможности познакомиться и поработать с этими выдающимися людьми. Вы найдете афоризмы Бэйли там и сям в тексте. Они стали моими заклинаниями.

Решение проблем.

Если тренировка не получается, Боб Бэйли советует проверить одно из трех необходимых условий: ваш расчет времени, выбор критериев или уровень поощрения.

Расчет времени.

Любой, кто занимался спортом, испытал влияние верного или неверного расчета времени на успех игры. Если вы слишком поздно ударите по мячу в бейсболе, то теряете шансы успеть добежать до «базы». Если же ударите слишком рано, то тем более ничего не выйдет. То же самое справедливо и для дрессировки собак. Если вы пытаетесь научить собаку касаться носом вашей ладони и при этом постоянно кликаете слишком рано, вы отмечаете поведение за секунду до того, как собака действительно коснется руки. Через некоторое время собака начнет тоько подносить нос к ладони, не касаясь ее. Вы можете использовать кликер или словесный маркер (например, «Да!»), чтобы обозначить правильное поведение, или просто бросать лакомство в нужный момент. Если время подачи маркера неверно, вы создадите ненужное поведение. Помните: только собака точно знает, какую реакцию вы подкрепили!

Точно так же, и дача лакомства собаке тоже влияет на успех ваших занятий. Хотя щелчок выделяет реакцию собаки, поощрение беспорядочно подкрепляет все, что происходит между щелчком и попаданием лакомства к собаке. Убедитесь, что вы подкрепляете ту реакцию, которую собирались. Боб Бэйли рекомендует: «Кликайте за действие и поощряйте за позицию!». Например, если вы учите собаку двигаться от вас, если вы щелкнете за правильное действие, но позволите собаке подойти к вам за поощрением, чему на самом деле научится ваша собака? Уходить от вас и сразу возвращаться. Более эффективным будет щелкнуть за движение от вас и бросить награду вперед собаки, чтобы ей пришлось продолжить двигаться дальше, чтобы получить свое поощрение.

Выбор критериев.

Критерии – как правила игры. Критерий определяет, что вы должны увидеть перед тем, как подкрепить реакцию. Для сложного поведения вам нужно больше одного критерия, но вы должны заниматься каждым элементом отдельно (как касание носом в обучении прохождению зон). Вы можете добавлять следующий критерий только после того, как собака поняла предыдущие.

Собаки могут научиться вычислять критерии и играть по правилам. Эта идея жизненно важна для каждого щенка, так что вы можете очень рано начинать учить его правилам игры. Я учила маленького База, что в каждой игре есть правила, и что он должен следовать им, если хочет, чтобы игра продолжилась. Игра аджилити полна критериев для выступления: Если собака хочет стартовать, она сначала должна посидеть на стартовой линии; Если хочет правильно пройти слалом, надо войти так, чтобы первая стойка была слева. Вся жизнь будет наполнена этими правилами, так что лучше, чтобы щенок начал учиться им как можно раньше.

Критерии должны быть четкими – черное и белое. Собака либо сделала правильно, либо нет; не может быть серого цвета ни для вас, ни для собаки. Она должна ассоциировать поощрение только с правильным поведением. Вы никогда не должны поощрять собаку, если она не следовала вашим критериям. Если ваша собака научена касаться носом ладони, если ваш критерий – касание, вы не должны соглашаться на меньшее. Принятие чего-то еще (например, приближение к руке без касания или хватание за рукав) означает, что вы изменяете критерии поведения и вознаграждаете за меньшие усилия. В результате ваша собака научится делать это медленно (и возможно, она будет совсем сбита с толку). Мы все следуем определенным критериям в жизни. Вы сначала должны открыть холодильник, чтобы достать поесть. Стояние перед холодильником и плач дверь не откроют. Собака научится точно выполнять нужное поведение, если вы правильно сумеете подобрать реально выполнимые критерии и следовать им.

Чем больше критериев у вас для поведения, тем больше у вас контроля за ним. Например, чтобы преодолеть качели, собака А должна добежать до конца доски, поставить передние лапы на землю и коснуться поверхности земли носом. Собака В должна только взойти на доску и сойти с нее. Поскольку тренер собаки В только слегка наметил контуры поведения, у него будет меньше контроля за поведением собаки и, следовательно, меньше возможности улучшить его. Это пример последствий дрессировки с пропуском «шагов» поведения.
Вы можете намеренно заложить малое количество критериев для определенного поведения. Например, возможно, вы будете не так требовательны к выполнению команды «Сидеть» на старте в аджилити, чем к выдержке сидя в обидиенс. На аджилити я позволяю собаке лаять, пока она сидит на старте, но в обидиенс я бы потеряла за это много баллов. Заранее продумайте количество критериев, которое вам понадобится для каждого поведения. Чем больше их, тем больше контроль над поведением, но тем больше потребуется времени для обучения и поддержания навыка.

Заблуждение относительно поведения собаки в ринге.

Научить поведению – несложно, гораздо сложнее не снижать требования к этому поведению в дальнейшем. Иногда проблема в том, что люди тоже хотят делать то, что подкрепляется. В аджилити мы могли научить собаку оставаться на старте, но на соревнованиях, когда адреналин бушует, а собака срывается без команды, мы можем снизить требования и позволить ей бежать. Почему? Потому что для человека пробежать трассу аджилити – тоже поощрение! Собака, которая получает поощрение пробегом трассы, быстро учится, что есть разные критерии для аджилити – один для тренировок, другой для соревнований. Многие люди считают, что эта собака изменяет поведение из-за соревнований, а не из-за них самих. Это нечестно по отношению к собаке и снимает ответственность с дрессировщика, перекладывая ее на собаку. Нет таких собак. Есть только дрессировщики, которые не придерживаются одинаковых требований в ринге и дома. Помните: Собаки делают то, что поощряется. Любое животное быстро приспособится к новым правилам игры, если вы поощрите его неверное поведение (позволив сорваться со старта без команды или не настаивая на касании носом земли на зоновом препятствии).

Уровень поощрения.

Уровень поощрения, говоря просто, это количество поощрения, которое собака получает в каждый момент тренировки. Это количество может меняться в зависимости от того, какой вид подкрепления вы используете (использование игрушек занимает больше времени) или какое поведение вы отрабатываете. Работая с простым поведением, как касание носом руки, собака получит больше поощрения, чем во время работы над высылом на 15 метров.

Боб Бэйли указывает, что уровень поощрения должен быть таким, чтобы поддерживать возобновление поведения. Если вы подкрепляете слишком редко, вы можете вызвать у собаки стресс и замешательство. Если вы подкрепляете слишком часто, вы впустую тратите ресурс (количество еды, которое может съесть животное, ограничено!). Более того, ваше поощрение должно быть пропорционально реакции собаки. Если собака не понимает условия, при которых вы ее поощряете, то вы ее просто кормите, а не поощряете за поведение. Случалось ли вам, стоя за рингом перед выступлением, кормить собаку в надежде, что она хорошо выступит? Собака учится: лакомство ни за что (за рингом) и отсутствие лакомства за работу (в ринге). Поскольку подкрепление создает поведение, видите, насколько ваше поведение нелогично для собаки? Собаки так же легко учатся работать медленно и неуверенно при наличии непонятных критериев поощрения, как при использовании методов физической коррекции. В обоих случаях замешательство ведет к стрессу.

Ваш уровень подкрепления должен быть высок при начале обучения новому упражнению или введения нового критерия. Когда собака уверенно предлагает новую реакцию, вы можете снизить уровень подкрепления, поскольку правильный ответ – тоже подкрепление для собаки. Например, высокий уровень подкрепления поможет при обучения щенка сидеть. Когда он уже научился садиться по команде, щенку не требуется поощрение всю жизнь каждый раз, как он предложит этот вариант, поскольку посадка часто ведет к другому, также поощряемому поведению – подзыву, возможности прыгнуть барьер.

Диагностическая таблица дрессировки.

Понимание важности выбора времени, установления критериев и уровня поощрения может помочь вам выяснить слабые места ваших занятий. Таблица поможет вам понять, что нуждается в улучшении.

Проблема Диагноз
Собака постоянно останавливается незадолго до выполнения требуемого действия Вы слишком рано отмечаете поведение
Собака начинает предлагать поведение, но ваши тренировки заканчиваются тем, что она просто смотрит на вас Вы слишком поздно отмечаете поведение
Ваши тренировки регулярно заканчиваются тем, что собака предлагает «неожиданные» варианты, которые вы, вроде бы, и не отбирали... Вы отмечаете поведение противоречиво
Ваша собака регулярно «забывает» уже, казалось бы, хорошо выученные навыки Вы повысили критерии, установленные изначально, и поощряли собаку за другие варианты, так что теперь она не уверена, что принесет вознаграждение
Собака предлагает и другие реакции вместе с желательными (например, касается мишени носом и лапой) Вам нужно больше критериев для тренируемого поведения. Вернитесь назад и измените окружающую среду собаки так, чтобы она смогла предложить только один вариант. Постепенно дайте ей больше возможности предложить больше одного варианта.
Похоже, что даже самое простое поведение нужно тренировать целую вечность Вы недостаточно повышаете требования. Вашим критериям легко соответствовать
Собака «скисает», отказывается предлагать варианты, пытается убежать Вы слишком резко повысили требования, проскочив несколько шагов. Разделите поведение на более мелкие элементы. Или слишком низок уровень подкрепления для этой конкретной собаки на данной конкретной стадии обучения
Собака не очень любит тренировки Надо использовать более интересное для нее поощрение
Собака очень любит работать, но прогрессирует медленно Возможно, вы поощряете один и тот же уровень прилагаемых собакой усилий (опять вопрос критериев)

Когда вводить команду.

Перед тем, как вводить команду, ответьте себе на два вопроса:

1.Нужна ли она мне прямо сейчас? Есть ли другие сигналы, по которым собака ориентируется, что надо делать (положение руки для касания носом ладони, присутствие слалома)?

2.Полностью ли собака понимает критерии, которые я наметила для этого поведения в любом месте без подсказок и намеков с моей стороны?
Когда собака сначала учится проходить слалом, ее исполнение этого упражнения будет не таким хорошим, как через несколько месяцев занятий. Она может неправильно войти, или не дойти весь ряд до конца, или просто идти медленно. Если вы дадите название в виде команды этому несовершенному исполнению, каждый раз, когда вы будете командовать ей, вы будете побуждать ее к неточным или медленным действиям. То, что мы учим первым, мы помним лучше всего! В большинстве случаев собака будет справляться с этими сложностями, но они дадут о себе знать, когда она будет в состоянии стресса. Возможно, на ваших первых соревнованиях ваша собака вспомнит, что раньше команда «Слалом» ассоциировалась у нее с пробегом мимо ряда палок.

Более правильный подход – не называть поведение, пока оно не достигло совершенства. Когда вы готовы ввести команду, подождите, пока не убедитесь, что собака точно собирается выполнить упражнение. Прямо перед тем, как она начнет, тихо дайте ей команду, которой вы отныне хотите обозначать это действие. Если собака получала достаточно подкрепления этого поведения в прошлом, звук вашего голоса не помешает ей закончить действие, и вы сможете поощрить ее как обычно. Если же она остановится, как только вы заговорили, подождите. Не поддайтесь искушению повторить команду. Вам надо, чтобы собака знала, что одна команда требует одного действия. Если вы будете терпеливы, нескольких повторений упражнения хватит, чтобы собака уверенно выполняла ваше задание по первой команде. Гораздо больше времени потребуется, чтобы собака начала выполнять его в любой обстановке в любое время, но и это придет с терпением и практикой.
Если вы меняете команду или, например, переключаетесь с жеста на голос, используются те же принципы: Добавьте новую команду перед прежней, которую собака уже знает. Например, при обучении собаки слалому, если вы сначала использовали команду «Змейка» для прохождения четырех стоек, а теперь ваша собака уже уверенно проходит полный слалом на скорости, вы можете решить, что пора сменить команду на «Слалом». Теперь ваша команда должна звучать так: «Слалом, змейка!» Через несколько успешных повторений вы сможете совсем убрать команду «Змейка».

Стимульный контроль.

Когда вы решаете, что настало время вводить команду, вы должны следить за тем, чтобы не подкреплять реакцию, не вызванную вашей командой. Когда поведение берется под стимульный контроль, животное получает подкрепление только в том случае, если оно предъявлено по команде. Видели ли вы когда-нибудь собаку, знающую несколько дежурных трюков? Каждый раз, когда владелец достает кусочек, собака не ждет команды; она демонстрирует весь репертуар. Это поведение не взято под стимульный контроль.

Точно так же, когда поведение находится под стимульным контролем, то по конкретной команде животное демонстрирует соответствующее поведение, и только его. Если вы попросите собаку сесть, она не ляжет. Если же собака все же ляжет, то это показывает, что ни одна из команд, «Сидеть» и «Лежать», не находится под стимульным контролем, поскольку собака не может их дифференцировать. Если собака стабильно отвечает на команду верно, вы контролируете стимул (команду) для каждой реакции. Чтобы получить этот контроль, не называйте поведение, пока вы не уверены, что собака понимает все критерии, установленные вами для этого действия. Если вы просите дать лапу, а собака кувыркается, ничего не говорите. Подождите, пока собака перестанет предлагать любые варианты и сфокусируется на вас, и потом еще раз попросите дать лапу. Важно не повторять команду сразу. Вы хотите научить собаку реагировать на первую команду. Если вы слишком быстро повторите ее, вы можете связать у собаки вместе нежелательный ответ (кувырок) с подкреплением, которое собака получит, когда в конце концов подаст лапу.

Миф о «желании работать».

Дрессировщики часто определяют собаку как имеющую или не имеющую «желание работать». Собака, выказывающая громадный энтузиазм к обучению и стремящаяся к деятельности, обычно называется «имеющей хорошее желание работать». На самом деле, то, что люди обозначают «желанием работать», является продуктом «истории поощрения», которое не только помогло вам научить собаку определенным навыкам, но и приучило ее любить занятия. Справедливо, что некоторым собакам от природы дан более активный темперамент (Баз очень рано начал это демонстрировать). Этот драйв, или желание работать, однако, можно выработать умелой дрессировкой так же легко, как и погубить неумелой. Называя это явление «желанием работать», мы намекаем, что у некоторых собак оно есть, а у других нет.

К сожалению, эта точка зрения побуждает многих дрессировщиков отказаться от работы с собакой и отдать ее, когда они решают, что у нее нет желания работать. Осознание того, что желание работать создается дрессировщиком с помощью правильного поощрения побудит тренеров заниматься каждой собакой, которую они покупают.

Желание работать и отношение к этому процессу собаки – индикатор того, насколько дрессировщик понимал, что именно он поощрял. Многие тренеры готовы навесить на собаку ярлык из-за того, что она не хочет работать в дождь или в жару, или в холод, но та же самая собака с энтузиазмом гоняется за белками в тех же самых условиях. Разница в ценности поощрения: бегущая белка возбуждает, так что собака очень мотивирована на погоню за ней. Если занятия послушанием или аджилити хоть немного менее захватывающи, чем дразнящаяся белка, то мельчайшее отвлечение или сложность могут побудить собаку отказаться от работы. Использование термина «желание работать» обвиняет собаку за неумелость дрессировщика. Если же определить эту проблему как «недостаточное внимание дрессировщика к поощрению», то обвинения попадут по адресу. Если у вас какая-то проблема в обучении, помните: проверьте свои расчет времени, отбор критериев и уровень поощрения. Не обвиняйте собаку!


Дата добавления: 2018-02-18; просмотров: 474; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!