Метод последовательных приближений



Б.С. Скиннер (1904 - 1990) показал, что не всегда поведение формируется случайно, а чаще в результате отбора под воздействием подкрепляющего фактора.

Подкрепление - это такое воздействие, при котором появление или исчезновение какого-то стимула в результате той или иной поведенческой реакции повышает вероятность повторения этой реакции.

Первичное подкрепление - это удовлетворение физиологических потребностей, таких как голод, жажда, сон и т. п.

Вторичное подкрепление - удовлетворение, как-то связанное с другими подкрепляющими факторами, прежде всего с социальными потребностями.

Подкрепление (положительное или отрицательное) повышает вероятность повторения поведенческой реакции; напротив, наказание - это неприятное событие, всякий раз вызываемое данным поведением, и поэтому оно приводит к исчезновению такого поведения.

 

Подкрепление положительное и отрицательное.

 

(Карен Прайор «Не рычите на собаку»)

«Положительное подкрепление — это нечто, желаемое субъектом: пища, ласка или похвала. Негативное подкрепление — это то, чего субъект хотел бы избежать: шлепок, нахмуривание бровей, неприятный звук (предупреждающий зуммер в машинах, который раздается, если вы забыли пристегнуть ремень безопасности, — это отрицательное подкрепление).

…Подкрепление должно совершаться в связи с действием, которое предполагается видоизменить.

Размер подкрепления зависит также от сложности задачи».

Процедуры использования наград:

  1. Процедура постоянных временных интервалов

Индивида за определенное поведение награждают регулярно по истечению установленного времени. Частота и сила подкрепления зависит не от достижений человека, а от прошедшего времени. ! Эта процедура приводит к отрицательным последствиям, т.к. нет зависимости между достижением и подкреплением. Люди работают неритмично, замедляют темп после награды и увеличивают перед наградой.

 

  1. Процедура постоянных пропорций.

Индивид получает награду после выполнения определенного количества реакций или работы. Подкрепление – регулярно после каждой нормальной реакции. Сила подкрепления зависит от достижений человека. Эта процедура обеспечивает повышение уровня активности и увеличение темпа работы. ! Процедура не является эффективной, если нельзя определить после какого количества реакций необходима награда. Большинство людей эту процедуру не любят и избегают ее.

 

  1. Процедура варьирующих временных интервалов

Подкрепление нерегулярно. Время между реакцией и наградой изменяется в случайном порядке. Это не дает возможности индивиду предугадывать, когда реакция будет подкреплена (элемент неопределенности). ! Процедура еще более эффективна, чем предыдущая: обеспечивает еще более высокий темп и ритмичность.

 

  1. Процедура варьирующих пропорций

Варьируется число реакций, после которых последует подкрепление (лотерея). Есть элемент риска. Распределение подкрепления в изменяющихся пропорциях является еще более эффективным. Люди работают ритмично, с наибольшей отдачей, т.к. живут надеждой, что их усилия рано или поздно будут подкреплены. ! НО. Неполный результат, если индивид не овладел соответствующими образцами инструментального поведения, следовательно, возникает проблема конструирования реакций. Используется метод последовательных приближений: на начальном этапе индивида награждают за реакции, которые хотя и далеки от желаемых, но уже усвоены. Постепенно критерий подкреплений становится более строгим, т.е. награда – за реакции, которые все ближе и ближе к желаемой.

При реактивном научении приобретенная реакция сохраняется лишь до тех пор, пока ее поддерживают безусловным раздражителем.

При оперантном научении – до тех пор, пока она поддерживается специальным подкреплением. Если же эти подкрепляющие факторы перестают действовать, то выработанное на их основе поведение быстро УГАСАЕТ и после нескольких попыток прекращается вовсе.

С угасанием тесно связана так называемая ДИФФЕРЕНЦИРОВКА.

При дифференцировке те поведенческие реакции, которые перестают сопровождаться безусловным раздражителем или подкреплением, исчезают, и сохраняются лишь такие реакции, при которых эти факторы продолжают действовать.

Важнейшую роль в научении путем выработки условных связей играет процесс ГЕНЕРАЛИЗАЦИИ.

Именно благодаря этому явлению вновь образованная связь распространяется на все то, что похоже на безусловный раздражитель или на ситуацию, в которой происходило подкрепление

 

Правила выработки навыка.

1. Повышайте критерий небольшими градациями, чтобы у субъекта всегда была реальная возможность выполнить требуемое и получить подкрепление.

2. В конкретный промежуток времени отрабатывайте что-нибудь одно, не пытайтесь формировать поведение по двум критериям одновременно.

3. Прежде чем увеличивать или повышать критерий, пользуйтесь подкреплением текущего уровня ответа, т. е. подкрепляйте любое исполнение данного действия, имеющегося в данный момент.

4. Вводя новый критерий, временно ослабьте старые.

5. Будьте впереди того, кого вы обучаете: полностью планируйте свою программу выработки так, чтобы в случае внезапного успеха обучаемого, вы знали, что следует подкреплять далее.

6. Не меняйте тренеров на "середине реки"; у вас может быть несколько инструкторов на одного обучающегося, но придерживайтесь одной программы выработки на каждый из типов поведения.

7. Если одна процедура выработки не приносит успеха, найдите другую, существует столько же способов добиться нужного поведения, сколько инструкторов, способных их придумать.

8. Не кончайте тренировку, не дав положительного подкрепления, это соответствует наказанию.

9. Если навык ухудшается, "возвратитесь к детскому саду", быстро повторите весь процесс выработки с серией легких подкреплений.

10. Оканчивайте, по возможности, каждую тренировку на высокой ноте и в любом случае останавливайтесь, оставаясь впереди обучаемого.

 


Дата добавления: 2020-04-25; просмотров: 126; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!