Проблемы с отрицательным подкреплением.
Проблема с отрицательным подкреплением возникает тогда, когда люди оказывают все большее и большее воздействие и оно становится жестоким. Я видела такое когда жеребенка обучают ходить рядом с человеком. Если жеребенок отказывается идти, тренер начинает тянуть за корду сильней и сильней, а жеребенок становится все упрямей и ипуганней. Я видела как этот метод привел к тому, что лошадь можно было сдвинуть с места только при помощи автомобиля. Я учу своих студентов раз за разом: когда вы тренируетесь вести рядом любое животное, нужно мягко качнуть кордой, и если животное делает один малюсенький шаг вперед, вы мгновенно ослабляете веревку, чтобы вознаградить животное за этот шаг. Многие люди делают ошибку, продолжая тянуть.
Когда отрицательное подкрепление использует замечательный тренер никаких проблем не возникает. Большинство заклинателей лошадей и НХ тренеров ( не все) используют исключительно тонкие формы негативного подкрепления, которые постепенно превращают в легкие сигналы. Наступление и отступление, когда человек подходит к лошади довольно близко, чтобы заставить ее уходить в нужном тренеру направлении, работает на отрицательном подкреплении. Когда лошадь двигается, человек перестает наступать. Негативный стимул исчезает.
Большинство людей не умеют использовать отрицательное подкрепление так тонко. Отрицательное подкрепление в случае с треннировкой работает в обоих направлениях - от тренера к лошади и от лошади обратно к тренеру. Начав применять его, очень легко получить порочный круг эскалации негатива.
|
|
Это все время происходит в повседневной жизни. Хороший пример - родители и дети. Большинство родителей считают, что кричат на своих детей больше чем им хотелось бы, но им трудно остановиться. Бихевиорист сразу скажет ребенок отрицательно подкрепляет родительский крик. Каждый раз когда родители кричат на ребенка за то что он делает что то плохое и ребенок тут же прекращает заниматься этим - это отрицательное подкрепление. Поведение ребенка болезненно для родителя и крик прекращает неприятное воздействие, что делает применение крика более вероятным в будущем, поскольку он подействовал. Криком подкрепляется то что ребенок перестал совершать какое-то действие. Но потом родители кричат все больше и дети приучаются к крику. Они привыкают. Ребенок перестает реагировать на крик, тогда родитель кричит громче, и малыш реагирует. Это подкрепляет родителя кричать громче, а ребенок постепенно приучается к более громким крикам, и так далее.
Даже если вам удастся не попасть в этот порочный круг, отрицательное подкрепление часто имеет обратную сторону. Наиболее неприятный момент то что страх очень болезненное чувство для всех животных и нежелательно основывать взаимоотношения с любым из них на страхе, и уж точно не с пугливым животным жертвой.
|
|
Отрицательное подкрепление оказывает плохой побочный эффект, если его использовать так как это делает большинство людей, причем не только те кто тренирует животных, но и родители, учителя, начальники. Карен Прайор отмечает что используя негативное подкрепление " вы рискуете получить все непредсказуемые последствия наказания : избегание, скрытность, страх, растерянность, сопротивление, пассивность и снижение инициативы и кроме этого излишние ассоциации, когда все что происходит вокруг, включая тренировочную площадку и тренера становится неприятным или не нравится, чего лучше избегать или даже убежать подальше.
Используя положительное подкрепление включаем Поиск и выключаем Страх
Использование положительного подкрепления более лучший способ научить или натренировать любое животное или человека. Положительное подкрепление может включать угощения и ласку. Я особенно люблю кликер-тренинг при обучении сложным заданиям и последовательностям движений.
|
|
Просто из практики, кликер - это помощь в обучении лошади потому, что он позволяет тренеру работать без пищевого вознаграждения на протяжении времени, хотя вам таки прийдется поддерживать связь между кликом и наградой. Вы не можете просто настрооить лошадь на кликер и выбросить угощения. 28 Но более важные выгоды кликер-тренинга состоят в способе, каким он воздействует на эмоции лошади и на возможность тренера взаимодействовать с лошадью.
Кликер-тренинг начинается когда тренер настраивает лошадь на кликер, совмещая звук клика с едой. Это делает клик вторичным подкреплятелем, который говорит лошади: "Будет что-то приятное". Как только клик означает "будет что-то хорошее", кликер обретает силу включать ПОИСКОВУЮ систему, которая очень, очень приятна всем животным. Вместо того, чтобы лошадь получала вознаграждение каждый раз, она вырабатывает определенное поведение, она начинает предвидеть награду, что даже лучше.
Включение ПОИСКОВОЙ системы хорошее занятие когда вы тренируете любое животное или человека, но она может быть самой сильно с очень пугливыми животными-добычами. Это означает, что когда вы тренируете с кликером лошадь у вас двойная защита против ее СТРАХА и системы побега. В первую очередь, когда вы заменяете отрицательное подкрепление положительным, вы не включаете систему СТРАХА лошади в ответ на определенное поведение, которому учите. Если вы обучаете лошадь поднимать ногу для ковки, она поднимает ее не потому, что боится быть ударенной ковалем, но потому, что кооперация означает, что будет что-то хорошее.
|
|
Во вторых, когда ваша лошадь становится действительно приученной к кликер-тренингу или другому положительному подкреплению для поддержания ПОИСКОВОЙ системы в активном состоянии, вы вообще препятствуете системе СТРАХА потому, что ПОИСКОВАЯ система и система СТРАХА противоположны в мозге. Если вы в середине сессии кликер-тренинга и кусок пластика сдувает на лицо лошади, она менее вероятно будет паниковать чем если бы ее система СТРАХА была уже немного "включена" негативным подкреплением. Это проще для лошади быть храброй когда она чувствует щастье чем когда она нервничает или боится. Александра Курланд, которая написала Кликер-тренинг для вашей лошади, 29 говорит: "Кликер-тренинг... учит эмоциональному самоконтролю, и это много". Если вы хотите безопасную лошадь, кликер-тренинг - это великолепный способ выстроить вежливое, доверительно поведение. 30
Именно поэтому исследователь лошадей Пол МакГриви считает что научно обоснованные приемы тренинга могут спасти множество лошадиных жизней. Тренер использующий негативное подкрепление обязан уметь распознавать признаки нарастающего страха до обострения ситуации. А тренер использующий позитивное подкрепление может избежать включения системы страха вообще, и включить поисковую систему даже с норовистой, легко возбудимой лошадью, с которой иначе просто невозможно работать.
Множество людей использующих кликер тренинг делятся впечатлениями насколько счастливей становятся питомцы и с каким энтузиазмом начинают относиться к занятиям с положительным подкреплением. Это происходит потому что любая тренировка с ПП (положительное подкрепление) использует формирование поведения. Формирование это когда вы подкрепляете естественное поведение животного, которое оно и так совершает по собственному желанию. Например, если вы тренируете лабораторную крысу нажимать на кнопку, то сначала нужно будет подкреплять хотя бы малюсенький поворот головы в сторону кнопки. Затем, когда крыса выучит немножко поворачивать голову, вы будете подкреплять ее за более сильный поворот в нужном направлении, и так далее пока она не нажмет на кнопку.
Отрицательное подкрепление действует наоборот. Используя отрицательное подкрепление, тренер подталкивает или оказывает давление на животное добиваясь желаемого поведения, а затем усиливает его, уменьшая давление или давая животному лакомство. Вы можете использовать отрицательное и положительное подкрепление вместе, и много людей так и поступают. С положительным подкреплением, животное вдруг "получает это" - понимая, что оно может сделать что-либо, чтобы произошла приятная вещь. Это называется умение учиться. Когда животное учится учиться оно начинает предлагать поведение. Именно к этому стремятся бихевиористы. Животное будет сознательно пробовать различные виды поведения, в поисках того что будет работать.
Карен Прайор объясняет, что животные которые научились учиться, чувствуют себя как будто это они тренируют человека, а не наоборот. Они понимают, что могут выяснить каким образом сделать так, чтобы выудить у тренера награду. Это подтверждается исследованиями человеческого поведения. Я читала очень интересную статью о сравнительном психогологическом исследовании позитивного и аверсивного контроля людей. Аверсивный контроль это то что мы часто наблюдаем в общественных школах. Ученики должны сделать задание или хорошо себя вести иначе они получат плохие оценки или придется задержаться на дополнительные занятия. Позитивный контроль использовали в дошкольном учреждении: учитель ловил хорошее поведение детей и подкреплял его. Вместо того чтобы требовать от детей хорошего поведения обещая награду и наказывая их если они ведут себя плохо, учитель смотрел за детьми пока они спонтанно не начинали делать что-то хорошее и награждал их за это, подкрепляя правильное поведение и увеличивая его вероятность в будущем.
Психологи отмечают что люди по разному себя чувствуют в этих двух системах. Когда человек под аверсивным контролем, он чувствует, что его контролируют. Авторы пишут : " люди сообщают, что их самостоятельность нарушалась, требуемое поведение словесно обозначалось как то что они Должны были делать. Позитивный контроль - наоборот, даже если преподаватель или психолог создает пространство контроля за человеком, человек не чувствует этого, возможно причина в подкреплении за то, что он делает по собственному желанию. Автор пишет" Поведение лучше представить, как продукт самостоятельного решения действовать. Субъективно, поведение имеющее приятные последствия, лучше всего описывается словами как то что нам нравится или мы выбрали для себя. 33
Вот история Карен Прайор о переучивании арабской кобылы при помощи положительного подкрепления, в которой показано, как животное начинает предлагать поведение с целью получить награду:
К сожалению, до сих пор некоторые тренеры используют взмах хлыста вокруг головы лошади, чтобы заставить ее навострить уши ...(негативное подкрепление). Эту лошадь явно не учили такому. Когда хлыст свистел возле ее головы, она прижимала ужи и обнажала зубы. И конечно чем громче свистел рядом хлыст, тем страшнее была ее морда. Новый тренер начал поощрять кобылу кликером за навостренные уши и лошадь выучила, что клик означает морковку и что она может вызвать клик своим поведением. Затем она осознала что поведение которое хочет тренер как то связано с ушами. Но что именно делать? И она начала делать все: хлопать ушами и так и сяк, поворачивать их назад и вперед, вместе и по отдельности., одно ухо вверх другое вниз, - настоящее шоу.
Также, животное тренированное с положительным подкреплением учится быстрее. Если предложить лошади лабиринт, и позволить ему(ей) найти выход путем проб и ошибок, он(она) закончит быстрее, чем лошадь, получающая шок, когда делает неправильный поворот. Пол МакГриви говорит, «Наказание может задушить творчество и препятствует использованию лошадью врожденных навыков решения проблем." 35
Дата добавления: 2018-09-20; просмотров: 339; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!