Вознаграждения (rewards)

Вознаграждения (rewards)

Античная теория гедонизма осн. на заманчивом допущении, что поведение регулируется наслаждением и страданием. Мы стремимся делать то, что доставляет нам удовольствие, и стараемся избегать болезненных стимулов или ситуаций. Сформулированный т. о. принцип удовольствия — страдания оказывается по своей сути мотивационным принципом. Торндайк в поисках теории, к-рая бы могла объяснять адаптивное поведение (по аналогии с эволюционным отбором физ. признаков), применил этот принцип В. и наказаний к научению. Он высказал предположение о способности животных (и людей) к научению. Если организм повторил к.-л. реакцию, все то, что следовало за этой реакцией в предыдущей попытке, м. б. названо В.; если к.-л. реакция не возникает повторно, все то, что следовало за этой реакцией в предыдущей попытке, может рассматриваться как наказание. Т. о., если ребенка отшлепали за неблаговидный поступок, такое воздействие может и не вызвать сдерживающего эффекта — напротив, оно может привести к тому, что ребенок сочтет такое наказание «удовлетворяющим» нек-рую гипотетическую потребность во внимании.

Однако гипотеза о том, что наказание ослабляет связи между стимулом и реакцией, так и не получала удовлетворительного подтверждения в экспериментах, и в конечном итоге Торндайк отказался от идеи, что вызывающие неудовольствие стимулы имеют к.-л. иное отношение к научению, помимо побуждения организма испробовать др. реакции. Т. о., научение стало делом В. желательных реакций. К 1938 г. два наиболее выдающихся последователя торндайковской теории осознали необходимость в изменении ее терминологии. Для обоих, К. Л. Халла и Б. Ф. Скиннера, «удовлетворители» (satisfiers) трансформировались в «подкрепления» (reinforcements). Халл определял подкрепление в терминах убывающих степеней воздействия драйва (или внутреннего побуждения). В., или «удовлетворители», теперь превратились в ослабители драйва, и научение могло происходить только при уменьшении силы драйвов. Так, пища для голодной крысы ослабляла драйв голода и каким-то образом это ослабление внутреннего побуждения усиливало связь между стимулом и реакцией.

По мнению Скиннера, термин «драйв» был слишком неопределенным и/или субъективным, и он заменил его термином «депривация». С этой т. зр. крыса, к-рую продержали какое-то время без пищи, будет находиться в депривированном (букв. — «лишенном») состоянии и, находясь в таком состоянии, будет научаться (или выполнять) определенный акт поведения, за к-рым следует пища (подкрепление). Для Скиннера, как и для Торндайка, в качестве подкрепления может использоваться все, что приводит к более устойчивому или быстрому выполнению деятельности, к-рая прежде возникала лишь случайно. Скиннер, подобно Торндайку, не считал наказание действенным, поскольку смог продемонстрировать, что после подкрепления реакции наказание уже не влияет на вероятность будущих повторений и может только отсрочивать их.

Вторичное подкрепление

Для Халла и Скиннера представлялось очевидным, что люди не совершают действий или поступков ради В. в виде незамедлительного ослабления биолог. драйвов. Люди включаются в деятельность, когда они получают похвальные отзывы, золотые звезды, деньги или др. В. небиолог. характера. Дабы перебросить мост через ту пропасть, к-рая существует между поведением людей и голодных крыс, было введено понятие вторичного подкрепления. При этом предполагалось, что вторичное подкрепление приобретает свою подкрепляющую силу благодаря ассоц. с первичным подкреплением. Отметим, что при введении вторичных подкреплений никакой реакции не требуется — стимул прослеживается в появлении В.

Парциальное (частичное) подкрепление

Скиннер обнаружил, что когда В. или подкрепления время от времени пропускались, крысы и голуби (как, впрочем, и люди) работали усерднее или дольше, чем когда В. регулярно следовали за каждой реакцией. Т. о., для закрепления и повышения устойчивости нек-рого поведения рекомендуется почаще перемежать невознаграждаемые попытки вознаграждаемыми, однако не настолько часто, чтобы это могло привести к его «угашению» (ослаблению связей между стимулом и реакцией).

Критика

Уже в тот период, когда Халл и Скиннер подчеркивали важность В. для научения, возникали серьезные критические возражения против мнения, что В. имеют прямое отношение к научению. Вероятно, В. играют определенную мотивирующую роль, но научение может осуществляться и без них.

В 1940—1950-х гг. было проведено множество исслед. по т. н. «побочному научению» (incidental learning). В этих исслед. испытуемых инструктировали учиться делать одни вещи, тогда как проверяли выполнение др. Было обнаружено, что они часто научались делать то, чему их не обязывали учиться, и даже тому, чему их инструктировали не учиться. В таких исслед. испытуемые определенно никак не подкреплялись за подобное «непрошенное» научение.

В 1970-х гг., когда интерес к связи В. с научением начал постепенно снижаться, обнаружилась его новая роль, вероятно в большей степени раскрывающая его истинную природу, — роль мотивирующего фактора. Поведенческие терапевты стали применять предложенные Скиннером процедуры в целях модификации челов. поведения, т. е. вознаграждая людей, когда те вели себя неким желательным образом, и лишая их В., когда они демонстрировали нежелательное поведение. Эта древняя как мир практика всех родителей была перенесена на клиническую сцену в более систематическом и стандартизированном (или регулируемом) применении.

Применение В. в настоящее время связывается гл. обр. с областью контроля поведения, в к-рой они демонстрируют свою очевидную эффективность. Родители часто не осуществляют должного контроля за поведением детей, поскольку они не склонны к систематическим действиям и, как правило, не формулируют четко своих требований к тому поведению, к-рое им хотелось бы видеть. Родителям следует осознать, что В. желательного поведения, по-видимому, является единственной процедурой, позволяющей достичь желаемых эффектов. Им тж следует принять во внимание предостережения Скиннера в отношении наказания, поскольку, помимо своей общей неэффективности, наказание зачастую сопровождается негативными побочными эффектами (гнев, обида), к-рые могут повлечь за собой нежелательные последствия.

См. также Внешние побуждения (стимулы), Мотивация

Б. Р. Бугельски