Перестав подкреплять выполнение условной реакции, можно не только «угасить» УР, но и «усовершенствовать» его, т.е. добиться, что условная реакция будет осуществляться точно на данный и только на данный стимул, а близкие по своим физическим свойствам раздражители ее не вызовут. Как известно, в начале формирования УР животное реагирует не только на строго конкретный условный стимул, например звук определенной частоты, но и на сходные с ним звуки, хотя и не полностью ему идентичные, например звуки близких частот (см. рис. 3.2Б). Эта стадия выработки УР называется генерализацией. Далее исследователь продолжает подкреплять (пищей или избавлением от опасности) условную реакцию только на определенный сигнал и не подкрепляет ответов на сходные, и в результате они постепенно угасают. Таким способом животное обучают различать — дифференцировать — весьма похожие сигналы.
В основе формирования дифференцировочных УР лежит дифференцировочное торможение — один из видов внутреннего торможения.
Процедура такого «совершенствования» сигнального значения условных раздражителей была названа И. П. Павловым дифференцировкой, или выработкой дифференцировочных условных рефлексов (см. также рис. 3.2).
Выработка дифференцировочных УР (разными методами) успешно используется для оценки сенсорных способностей (т.е. возможностей органов чувств) животных разных таксономических групп (см., например: Дьюсбери, 1981; Pearce, 1998). Так, выработав у животного УР дифференцирования (различения) двух цветовых стимулов, можно, выравнивая их другие параметры (например, яркость), изучать механизмы восприятия цвета. При этом если животное, в силу особенностей органов чувств, не воспринимает различий между двумя зрительными стимулами (цветами спектра), то выработать у него устойчивую дифференцировку такой пары стимулов невозможно.
Методики выработки дифференцировочных УР весьма многочисленны и разнообразны по процедуре эксперимента. Перечислим основные параметры, по которым различаются такие методики.
1. Порядок предъявления стимулов может быть последовательным или одновременным. При последовательном предъявлении голубь должен научиться клевать кнопку (диск) в ответ на стимул А и воздерживаться от реакции при включении стимула Б (методика go— no go). Выработка дифференцировки, таким образом, состоит в торможении реакции на второй стимул. При одновременном предъявлении конкретной пары стимулов животное учится различать (дифференцировать) их абсолютные признаки. Например, при дифференцировке стимулов по их конфигурации животному одновременно показывают две фигуры — круг и квадрат, и подкрепляют выбор одной из них, например, круга. Это наиболее распространенный вид дифференцировочных УР. Выработка и упрочение такой реакции требует, как правило, многих десятков сочетаний.
2. Животному предлагают сделать выбор стимулов: альтернативный или множественный.
3. Предъявление стимулов может осуществляться в соответствии с двумя режимами: повторение одной пары стимулов до достижения критерия и чередование нескольких пар стимулов при систематическом варьировании второстепенных параметров.
Рассмотрим некоторые методы более подробно.
При систематическом варьировании второстепенных параметров стимулов можно оценивать способность животных различать не только данную конкретную пару раздражителей, но и их «обобщенные» (отвлеченные) признаки, совпадающие у многих пар.
Например, животных можно обучить различать не конкретные круг и квадрат, а любые круги и квадраты независимо от их размера, цвета, ориентации и т.п. С этой целью в процессе обучения каждый следующий раз им предлагают новую пару стимулов (новые круг и квадрат). Новая пара отличается от остальных по всем второстепенным признакам стимулов — цвету, форме, размерам, ориентации и т.п., но сходна по их основному параметру — геометрической форме, различения которой и предполагается добиться. В результате такой тренировки у животного постепенно происходит обобщение основного признака и отвлечение от второстепенных. В приведенном примере обобщается признак «круг» (подробнее см. гл. 5).
Данный режим оказался весьма эффективным для выработки дифференцировочного УР на обобщенный признак «мерность», когда животное училось выбирать любую объемную (трехмерную) фигуру и не реагировать на плоские (двумерные) фигуры (см. 4.6.3). В таких опытах с собаками, обезьянами и воронами у одной группы животных каждого вида вырабатывали УР выбора любой объемной (трехмерной) фигуры, а у второй группы — любой плоской (двумерной). Каждый раз животному предъявляли новую пару стимулов из набора, изображенного на рис. 4.15 (всего 30 пар), причем плоская фигура всегда представляла собой фронтальную проекцию объемной.
Может возникнуть предположение, что задача по выработке таких дифференцировок для животных очень сложна, однако с ней справляются не только приматы, но и хищные млекопитающие (Дашевский, Детлаф, 1974), а также птицы — врановые (Крушинский и др., 1981) и даже голуби. При этом животным всех указанных видов требовалось примерно столько же сочетаний, как и при выработке дифференцировки с одной парой стимулов. После такой серии обучения они способны выбирать любую новую объемную (или плоскую) фигуру без дополнительной тренировки.
При систематическом варьировании второстепенных признаков стимулов можно исследовать не только способность животных к обучению, но и более сложную форму их высшей нервной деятельности — способность к обобщению, которая составляет одно из важнейших свойств довербального мышления животных (гл. 5).
Как уже упоминалось, животные с разным уровнем структурно-функциональной организации мозга практически не различаются по способности к простым формам условнорефлекторного обучения. Образование отдельных дифференцировочных УР в этом плане не составляет исключения. Однако благодаря использованию дифференцировочных УР в качестве элементарных единиц обучения и созданию их разнообразных комбинаций было разработано несколько экспериментальных процедур, которые называют «сложными формами обучения», или серийным обучением (serial learning). Появление этих методов было связано со стремлением специалистов все же выявить какие-то различия в способностях у животных разных таксономических групп с разным уровнем организации мозга (см. 8.1). Наиболее важные из этих методов:
♦ последовательные переделки сигнального значения дифференцировочных стимулов;
♦ формирование установки на обучение;
♦ формирование «систем» дифференцировочных УР.
3.3.1. Последовательные переделки сигнального значения дифференцировочных стимулов
Переделка сигнального значения условных раздражителей (ее часто называют переделкой дифференцировки) — это разновидность дифференцировочного обучения.
После достижения определенного, выбранного экспериментатором критерия выработки различения (например, 80% правильных решений) условия получения подкрепления меняются на противоположные: теперь реакция на стимул, ранее подкреплявшийся, перестает сопровождаться пищей, а реакцию на стимул, на который животное только что научилось не реагировать, начинают подкреплять.
Американский исследователь М. Биттерман (1973) предложил проводить такие переделки многократно. Эта процедура получила название метода последовательных (или обратимых) переделок (discrimination reversal learning). Автор исходил из того, что после многократных смен сигнального значения стимулов у животных может сформироваться единая стратегия (или правило), и они не будут каждый раз обучаться совершенно заново.
Опыты проводились на разных видах позвоночных. При каждой следующей переделке число ошибок снижалось, и в конце концов наступал момент, когда при очередной смене сигнального значения стимулов животное уже со второй пробы начинало выбирать «правильно» без дополнительного обучения.
Снижение числа проб, необходимого для очередной переделки реакции, происходит тем быстрее, чем выше уровень эволюционного развития данного животного.
3.3.2. Формирование «установки на обучение»
Метод формирования «установки на обучение» (object learning-set formation) разработал американский исследователь Г. Харлоу (Harlow, 1949; 1958). Согласно классическому варианту этой методики, животное (в опытах Харлоу макака-резуса) обучают простой дифференцировке — выбору одного из двух стимулов: игрушек или мелких предметов обихода. По достижении определенного критерия выработки дифференцировки начинают следующую серию: животному предлагают два новых стимула, ничем не похожих на первые. По завершении второй стадии обучения формируют третью дифференцировку и т.д. После выработки 100—150 таких реакций (их число зависит от уровня организации данного вида и может доходить до 1500 у крыс и голубей, занимая многие месяцы) животное уже при втором предъявлении новой пары стимулов действует не наугад, не методом проб и ошибок, а в соответствии с усвоенным им ранее правилом, которое принято называть установкой. Оно запоминает результат первой пробы и далее реагирует в соответствии с этой «установкой».
Правило состоит в том, чтобы «выбирать тот же предмет, что и в первой пробе, если его выбор сопровождался подкреплением, или другой, если подкрепление получено не было (в дальнейшем эта стратегия получила название "win-stay, lose-shift")».
Принято считать, что при обучении с использованием метода последовательных переделок и при формировании установки происходят сходные процессы, так что первый можно считать частным случаем формирования установки.
Впоследствии было создано несколько модификаций исходной методики. Например, Д. Уоррен (Warren, 1977) в своих опытах не вырабатывал каждую дифференцировку до достижения критерия обученности, а предъявлял каждую пару определенное число раз и затем предлагал следующую. Именно этот вариант был использован рядом авторов для сравнения обучаемости разных видов приматов (Passingham, 1982; Rumbaugh et al., 1987, 2000).
Методом формирования установки на обучение впервые была получена широкая сравнительная характеристика обучаемости животных разных систематических групп, которая в определенной степени коррелировала с показателями организации мозга. Вместе с тем, как и данные М. Биттермана, эти результаты свидетельствовали о существовании у животных каких-то процессов, выходящих за рамки простого образования дифференцировочных УР. Считают, что в ходе такой процедуры животное «учится учиться». Оно освобождается от связи «стимул-реакция» и «переходит от ассоциативного обучения к инсайт-подобному обучению с одной пробы» (Harlow, 1958). При этом, по мнению Р. Бирна (Byrne, 1998), у животного должна сформироваться характеристика подкрепляемого стимула в какой-то отвлеченной форме, т.е. должно сформироваться абстрактное правило. Человек выразил бы это правило, как «выбирай подкрепляемое» вместо того, чтобы запоминать каждый раз целый список стимулов (например, красный мяч «+», блюдце «—»; штопор «+», свисток «—» и т.д.).
Аналогичной точки зрения придерживается Л. А. Фирсов. Он считает, что этот вид обучения по своей сути и по лежащим в его основе механизмам близок к процессу обобщения (подробнее см. гл. 5), и с какого-то момента «первичное» обучение — выработка конкретной дифференцировки — сопровождается «вторичным» обучением — некими когнитивными процессами, при которых выявляется общее правило решения многих однотипных задач.
То же мнение разделяет английский специалист по теории обучения Н. Макинтош (Mackintosh, 2000): в основе формирования установки на обучение лежит переход от простых ассоциативных механизмов (образования УР и дифференцировок) к когнитивным, т.е. к процессам, основанным на формировании представлений об общем правиле решения серии однотипных задач. По его образному выражению, животные «переходят от заучивания наизусть к заучиванию по смыслу».
Данные, полученные с помощью метода последовательных переделок и метода формирования «установки», впервые создали основу для широкой сравнительной характеристики обучаемости животных и показали, что в процессе такого обучения наряду с ассоциативными участвуют механизмы другого уровня — когнитивные (см. 8.1 и 3.4).
3.3.3. Формирование «систем» дифференцировочных условных рефлексов
В работах Л. Г. Воронина (1984) также было показано, что при комбинации отдельных УР возникают новые свойства, не сводимые к свойствам суммы исходных рефлексов. Происходит образование так называемых систем дифференцировочных УР, или просто «систем». Такие системы Л. Г. Воронин считал целостными функциональными единицами, из которых складывается психическая деятельность.
У животного вырабатывают несколько дифференцировочных УР, объединенных в систему таким образом, что выполнение одного УР зависит от усвоения другого.
Одна из таких процедур составляет необходимый этап в изучении способности к транзитивному заключению — форме дедуктивного мышления, свойственной и животным, и человеку.
Программа эксперимента по выработке систем дифференцировок состоит в следующем. Животное учится дифференцировать несколько пар раздражителей (как правило, цветовых стимулов). При выработке дифференцировки каждой следующей пары стимулов производится смена сигнального значения части из них в соответствии с определенным правилом: стимул, бывший положительным в паре А— В+ (где «В+» — подкрепляемый стимул, а «А—» — неподкрепляемый), становится отрицательным в паре В— С+. В процессе обучения животное должно усвоить информацию о том, что значения стимулов В, С, D могут быть как положительными (В+, С+, D+), так и отрицательными (В—, С—, D—), в зависимости от пары, в которой они в данный момент предъявляются. Стимулы А— и F+ , т.е. первый и последний в последовательности, остаются во всех комбинациях только положительным (F) или только отрицательным (А). Высокая доля правильных выборов при чередовании всех пар стимулов, когда животное выбирает, например, стимул С в паре В- С+, но не реагирует на него в паре С- D+, свидетельствует, что оно усвоило принцип данной системы. Такую систему дифференцировок успешно усваивают дети, начиная с 4 лет (Bryant, Trabasso, 1971), взрослые шимпанзе (Gillan, 1981; Boysen, Berntson, 1995), а также голуби и вороны (Зорина и др., 1989). Межвидовые различия в динамике и успешности формирования такой системы дифференцировок у этих видов птиц оказались незначительными и недостоверными. В то же время при обратимых последовательных переделках и формировании установки на обучение голуби существенно отставали как от врановых, так и от приматов.
Метод выработки дифференцировочных УР в разных его комбинациях является одним из ведущих в физиологии ВНД и используется как инструмент для исследования целого ряда проблем.
К этим проблемам, помимо оценки возможностей органов чувств животных разных видов, относится изучение следующих более сложных когнитивных способностей:
♦ к обобщению;
♦ к транзитивному заключению;
♦ к формированию установки на обучение.
Такие экспериментальные исследования будут подробнее рассмотрены ниже.
Достарыңызбен бөлісу: |