Между способом проведения опыта по выработке классического условного рефлекса и постановкой эксперимента по инструментальному научению существует коренное различие. В первом случае связь устанавливается между УС (например, звонком) и БС (например, пищей). Подкрепление предъявляется независимо от поведения животного. При инструментальном научении подкрепление (например, пища) связано с определенным поведением животного (например, с нажимом на рычаг). Таким образом, при классических условных рефлексах связь устанавливается между стимулом и результатом, а при инструментальном научении она возникает между реакцией и результатом. Такие различия необязательно означают, что в этих двух типах опытов происходят разные виды научения, но они говорят о разных процессах подкрепления. Как мы видели, согласно взгляду Павлова, наличие подкрепляющего стимула в определенных условиях приведет к тому, что реакции, вызываемые им, будут возникать еще до подкрепления. Ясно, однако, что не всегда подкрепление необходимо для проявления выработанных связей между стимулами. Это яснее всего видно при рассмотрении феномена, называемого сенсорным предобусловливанием. При нем два условных стимула (УC1 и УС2) применяются вместе много раз до того, как в опыт вводится БС. За совместным предъявлением УC1 и УС2 следует сочетание УC1 с БС. В заключительной части опыта измеряется сила УР в ответ на УС2. Первая четкая демонстрация сенсорного предобусловливания принадлежит Брогдену (Brogden, 1939), который предъявлял собакам 200 одновременных сочетаний света и зуммера. Затем один из этих стимулов сочетался с электрическим ударом лапы для выработки ее условнорефлекторного сгибания. Применения второго УС вызывали в среднем 9,4 УР по сравнению со всего лишь 0,5 УР в контрольных опытах без предварительного сочетания зуммера и света. Более поздние опыты показывают, что лучшие результаты получаются при меньшем числе предварительных сочетаний и когда два УС предъявляются не одновременно, а с промежутком в несколько секунд (Mackintosh, 1974). Результаты опытов с сенсорным предобусловливанием ясно показывают, что 290
сочетания двух нейтральных стимулов достаточно, чтобы установить некоторую связь между ними. По-видимому, при слишком частом применении этих стимулов наступает известное привыкание, и научение не улучшается. Совершенно независимо от того, что эти результаты нельзя удовлетворительно объяснить теорией стимул-реакция, ясно, что для образования связи между двумя нейтральными стимулами нет необходимости в подкреплении. Поэтому павловское подкрепление не является обязательным условием образования связей, но оно облегчает их образование и делает их устойчивыми к привыканию. Как мы увидим дальше, животные вполне способны научиться тому, что некоторые стимулы несущественны для их текущих мотивационных потребностей, и поэтому неудивительно, что связи, образованные между двумя нейтральными стимулами, должны быть временными. Обратимся теперь к вопросу об инсmpументальном подкреплении. Закон эффекта Торндайка лег в основу бихевиористского подхода к научению животных. Крайнюю позицию занял Гарвардский бихевиорист Скиннер (Skinner), который определил подкрепление, исходя из закона эффекта. По Скиннеру. подкреплением является любое событие, которое, сочетаясь с каким-нибудь видом поведения, будет делать ею более частым. Скиннер (1938) считал также, что любое подкрепление может усилить любую реакцию в присутствии любого стимула при условии, что этот стимул ощущается животным, а реакция лежит в пределах его возможностей. Таким образом, предполагалось, что реакция и подкрепление по существу произвольны. Это стало широко распространенной точкой зрения среди теоретиков научения до конца 50-х годов. Подкрепление, побуждающее животное приближаться к стимулам, которые оно связывает с этим подкреплением, обычно называется «положительным». Если же подкрепление заставляет животное в дальнейшем избегать данной ситуации, оно считается «отрицательным». Животные могут научиться бояться некоторых ситуаций, испытав в них боль или стресс. В дальнейшем они могут избегать таких ситуаций при столкновении с ними. Сходным образом ситуации, в которых на животное действуют естественные вызывающие страх стимулы, могут по ассоциации вызывать страх, даже когда животное не испытывает боли. Но многократное применение таких стимулов может привести к привыканию, и животное перестанет их избегать. Как мы видели, неприятные стимулы применимы в опытах по классическим условным рефлексам. Одно из первых таких исследований принадлежит В.М.Бехтереву (1913), который раздражал переднюю лапу собаки слабым электрическим током (БС) вслед за звуковым стимулом - тоном (УС). Сначала собака сгибала лапу в ответ на ток (БР), а после ряда сочетаний УС и БС - в ответ на тон (УР) в отсутствие тока. Классическая оборонительная условная реакция многие годы оставалась парадигмой научения избеганию. По Торндайку (Thorndike, 1913) наказание вызывает такую же силу реакции, что и вознаграждение. Согласно положительному закону эффекта, если за реакциями следует состояние удовлетворения, вероятность их возникновения возрастает. Отрицательный закон предполагает, что вероятность возникновения реакций, приводящих к неприятным последствиям, снижается. Однако в конечном счете Торндайк (1932) на основании некоторых опытов пришел к заключению, что закон эффекта неприменим к наказанию. В этом отношении с ним соглашались Скиннер (Scinner, 1938, 1953) и Эстес (Estes, 1944). Общее мнение, по-видимому, сводилось к тому, что наказание не ослабляет связи стимул-реакция, хотя иногда оно временно подавляет наказуемое поведение. Более поздние данные говорят о том, что наказание может быть эффективным с точки зрения модификации поведения, когда его сочетают с определенной реакцией (Church, 1963, 1969).
Ви переглядаєте статтю (реферат): «Подкрепление» з дисципліни «Поведінка тварин: психобіологія, етологія і еволюція»