§ 5. Инструментальные условные реакции и дрессировка
В некоторых ситуациях у животных возникают и постепенно закрепляются действительно новые реакции (в том смысле, что раньше они никогда не проявлялись у данного вида или, во всяком случае, безусловные раздражители - пища, электрический ток и т. д. - сами по себе этих реакций не вызывали даже на расстоянии). Эти формы реакций по традиции принято относить к условным (в широком смысле этого слова) реакциям.
а) Реакции этого типа были описаны Миллером и Конорским (1928, и 1934, 1937) и в отличие от классических условных рефлексов получили название "условные рефлексы II типа".
В этих случаях происходит следующее: слуховой раздражитель, например звук рояля, предъявленный определенное количество раз непосредственно перед пассивным (или вызываемым соответствующим раздражителем) выполнением движения, например отдергиванием лапы у собаки, начинает сам по себе вызывать двигательную реакцию, если эта реакция сопровождается вторым раздражителем, например пищей.
Согласно этим авторам, образование такого рефлекса нового типа происходит в соответствии с общей схемой классического условного рефлекса (см. рис. 5). Пищевой раздражитель выступает как безусловный, вызывающий слюноотделение, а совокупность слуховых (звук рояля) и кинестетических (выполнение движения) раздражителей образует вначале сложный условный раздражитель слюнной реакции. В данном случае второе обусловливание формируется на основе первого: слуховой раздражитель становится условным и начинает вызывать не только слюноотделительный но также и двигательный ответ. Начиная с этого момента двигательная реакция будет "уже не только частью сложного условного раздражителя слюнной реакции, но также и условной реакцией на слуховой раздражитель.
Рис. 5. (По Конорскому Миллеру, 1937)
Конорский и Миллер считают отличительными особенностями условной реакции второго типа то, что, во-первых, она должна вызывать проприоцептивные раздражения и, во-вторых, являться необходимым условием ожидания или избегания безусловного раздражителя.
Кроме того, они отмечают, что в отличие от классического обусловливания условная реакция в этом случае никогда не бывает абсолютно идентичной реакции, вызываемой обычно данным безусловным раздражителем.
б) Ситуация, описанная и проанализированная Скиннером (1935, 1937, 1938) и положившая начало большому количеству экспериментальных исследований, в общем аналогична ситуации Миллера и Конорского. Ее можно проиллюстрировать следующим примером: крыса, помещенная в клетку с рычагом, научается нажимать на рычаг, если эта реакция позволяет ей получить пищу.
В этом случае, согласно Скиннеру, мы имеем дело с рефлексом "оперантного" типа, то есть с таким рефлексом, который не связан со специфическим раздражителем, а "вызывается" спонтанно. Этот рефлекс характерен для обусловливания типа R, при котором подкрепляющий (безусловный) раздражитель связан с ответом в отличие от рефлекса "респондентного" типа, то есть связанного со специфическим раздражителем и характерного для классического обусловливания, или обусловливания типа S, при котором подкрепляющий (безусловный) раздражитель связан с другим (условным) раздражителем (см. рис. 6).
Рис. 6. (По Скиннеру, 1938)
Основное различие между этими двумя типами обусловливания состоит в том, что при оперантном обусловливании подкрепляющий, или безусловный, раздражитель совпадает во времени с ответной реакцией, а при респондентном - с другим раздражителем. Этим объясняется тот факт, что обусловливание классического типа возможно лишь в случаях "респондентного" поведения; в "оперантном" поведении нет так называемого "условного" раздражителя.
Вторая отличительная черта, более или менее связанная с первой, отмечаемая Скиннером и используемая другими авторами (Хилгард и Маркие, 1940) для разграничения, по крайней мере внешнего, двух типов рефлексов, заключается в следующем: при классическом обусловливании подкрепление дается независимо от наличия ответной реакции (получение пищи никоим образом не зависит от слюнной реакции), а при оперантном обусловливании подкрепление опосредствовано ответной реакцией - в этом случае пища дается животному только при нажатии на рычаг.
Именно в связи с этим обусловливание типа R, вызывающее оперантное поведение, стали называть вслед за Хилгардом и Маркисом (1940) "инструментальным обусловливанием"; ответная реакция является в данном случае способом получения или избегания безусловного раздражителя.
в) Многие ситуации научения у животных легко могут быть сведены либо к схеме Скиннера, либо к схеме Миллера и Конорского. К первой относятся все ситуации, в которых животное должно манипулировать каким-либо приспособлением для открывания двери или ящика (нажимать на педаль, перемещать задвижку или щеколду, дергать веревку и т. п.), ко второй - все ситуации "дрессировки", предполагающие выполнение движения или совокупности движений, непривычных для животного и вызываемых вначале либо пассивно, либо посредством соответствующих специфических раздражителей, необходимость в которых в дальнейшем отпадает.
Механизмы такого научения, несомненно, гораздо сложнее, чем механизмы простого классического обусловливания, однако между ними нет непроходимой грани.