Исследование мотивации: точки зрения, проблемы, экспериментальные планы


Латентное научение: разделение научения и мотивации



бет18/44
Дата19.07.2016
өлшемі4.4 Mb.
#209004
түріГлава
1   ...   14   15   16   17   18   19   20   21   ...   44

Латентное научение: разделение научения и мотивации

Крайним случаем варьирования привлекательности является полное ее отсутствие, когда не происходит подкрепления и не приходится ожи­дать целенаправленного поведения. Ну, а как быть с научением? Что научение имеет место, первым пока­зал Блодгетт [Н. С. Blodgett, 1929] в экспериментах по так называемому латентному научению. Три группы одинаково голодных крыс в течение девяти дней по одному разу в день помещались в лабиринт. Первая группа находила корм в целевой камере с первого же дня, вторая — с третьего, а третья — с седьмого. После того как животное попадало в целевую каме­ру, оно при наличии там еды могло есть только 3 мин, а при отсутствии еды извлекалось оттуда через 2 мин. Как видно из рис. 5.9, после введения целевого объекта во второй и третьей группах число ошибок быстро сокра­щается. Каждая группа почти сразу же достигает уровня научения первой группы, которая подкреплялась с пер­вого дня. Более поздние исследова­ния Толмена и Хонзика [Е. С. Tolman, С. A. Honzik, 1930] подтвердили эти данные.




Рис. 5.9. Зависимость достижений от латентно­го научения и последующего подкрепления. Первая группа получала корм после каждой попытки, две другиесоответственно после третьей и седьмой (отмечено х) [Н. С. Blod­gett, 1929, S. 120]

Полученные результаты многое проясняют. Прежде всего то, что на­учение происходило и без подкрепле­ния, а значит, оно не является необ­ходимым условием научения. Науче­ние может оставаться латентным, т. е., состоявшись, не проявляться в поведении. В таком случае научение должно заключаться в образовании знаний о структуре путей в лабирин­те, а не в образовании жесткой пос­ледовательности объединений «раз­дражитель— реакция», поскольку це­ленаправленный, с уменьшающимся количеством ошибок поиск целевой камеры не происходил, когда там не было корма. Успехи научения можно наблюдать в поведении только при достижении цели, когда имеет место мотивация. Поэтому закон эффекта Торндайка есть не принцип научения, а принцип поведения. Научение и мотивация представляют собой две самостоятельные группы факторов, совместная игра которых определяет поведение. Реализация вызванной привлекательностью пищи мотивации к достижению целевой камеры зави­сит от достигнутых на данный момент результатов научения, что сказывает­ся на различии в улучшении достиже­ний второй и третьей групп. После семикратно предоставленной возмож­ности ознакомиться с лабиринтом ко­личество ошибок сокращается резче, чем после трехкратной.

Итак, поведение объясняется вза­имодействием двух промежуточных переменных: научения и мотивации. Фактор научения, по Толмену, состо­ит из знаний о том, какая из секций лабиринта куда ведет. Этот резуль­тат научения в актуальном случае становится предвосхищением цели в форме отношений между действием и его последствиями. Мотивационный фактор — нужность цели. Она зависит от физиологического состояния пот­ребности, или влечения, и от привле­кательности целевого объекта (у Ле­вина— соответственно от t и G; Толмен рассматривает обе части, влече­ние и привлекательность, как явле­ния более или менее одного ранга; различия в степени их влияния и их взаимоотношения им не выясняются). Постулированные Толменом нужность цели и ее ожидание стали теми про­межуточными переменными, которые не только имеют когнитивную приро­ду, но и выступают посредниками между поддающимися наблюдению особенностями исходных условий и последующим поведением, благодаря чему оказывается возможным объяс­нение наблюдаемой целенаправлен­ности поведения. На рис. 5.10 схема­тично представлена логика этих те­орий мотивации. Исходные условия, которые помимо стимулов окружения и влечения (состояние потребности) включают также прошлое научение, предрасположенность и степень раз­вития, при некоторых еще подлежа­щих уточнению обстоятельствах могут детерминировать как нужность цели, так и ее ожидание. Последующие молярные действия определяются тремя доступными наблюдению ас­пектами целенаправленности.

Приводимая ниже цитата из книги «Целенаправленное поведение у жи­вотных и человека» содержит ответ на вопрос, чему же научаются живот­ные в экспериментах по научению, а также новый взгляд на взаимовли­яние научения и мотивации поведе­ния.

«Окончательная критика доктрины научения методом проб и ошибок направлена на ее основополагающее понятие стимульно-реактивных связей. Стимулы, как таковые, реакции не вызывают. Правильные стимульно-реактивные связи не «запечатлеваются», а неправильные не «не стираются». Скорее, на­учение состоит в «открытии», или «вычлене­нии», организмом того, к чему ведут любые из всех соответствующих альтернативных реак­ций. И затем, если при возбуждающе-аверсивных условиях момента одна из этих альтернатив оказывается нужнее других (или одна «требуется», а другие «не требуются»), то организм будет стремиться (после такого на­учения) выбирать или осуществлять реакцию, ведущую к более «нужным» последствиям. Но если различия в нужности отсутствуют, то никакого выбора и осуществления данной реак­ции не произойдет, хотя научение будет иметь место» [Е. С. Tolman, 1932, р. 364].

Матрица «ожидаемой ценности»

Позднее Толмен [Е. С. Tolman, 1951; 1959] несколько переработал свою теорию мотивации (по сравне­нию с Халлом он был менее система­тичен). Наряду с состояниями потреб­ности (его классификацию мотивов см. в гл. 3) актуальное поведение мотивируют еще две промежуточные переменные — ожидание и ценность. Ценность—это то же, что привлека­тельность целевого объекта, т. е. она наряду с потребностью (или влечени­ем) определяет нужность цели. Обе переменные обычно не поддаются свободному комбинированию, их зави­симость друг от друга устанавливает­ся так называемой матрицей «ожида­емой ценности». Как правило, для достижения соответствующего целе­вого состояния потребности в форме ожиданий действий и их последствий (R — S*) существуют многочисленные возможности предвосхищения, с од­ной стороны, возможных действий, а с другой — связанных с ними целевых состояний (S*), обладающих различ­ной ценностью.




Рис. 5.10. Толменовская теоретико-мотивационная схема с двумя промежуточными переменны­минужностью и ожиданием цели, объясняющими отношения между наблюдаемыми особенно­стями ситуации (исходные условия) и последующим молярным поведением

Это особенно ярко проявляется в ситуациях выбора, например, когда хочется есть, а поблизости находятся несколько хороших и дорогих ресто­ранов с разным ассортиментом куша­ний и с соответствующими требовани­ями к кошельку. Выбор ресторана определяется не только предлага­ющейся в нем едой, т. е. предвосхи­щением возможных действий, но и соображениями возможной стоимости обеда. На рис. 5.11 приведена матри­ца «ожидаемой ценности» для чело­века, находящегося в подобной ситу­ации (задачей психологии личности помимо прочего является установле­ние расхождения между матрицей «ожидаемой ценности» конкретного индивида и соответствующими соци­окультурными нормами). Составлен­ная Толменом матрица дает годологи-ческую картину последовательности действий в промежутке между состо­янием голода (слева) и его удовлет­ворением (справа). Заканчивающиеся стрелками лассообразные линии представляют учтенные этапы дей­ствия, размер знаков « + » соответ­ствует оценке конкретного ресторана (средства) и пищи (целевого объекта). Во всех четырех ресторанах можно получить наиболее предпочитаемые данным человеком блюда а и b, блюда с, d и е также могли бы его насытить, но не еда f. Еще заметнее влияние Левина проявилось в попытке Толмена [Е. С. Tolman, 1952] психологически полно представить описанную ситу­ацию выбора. Как видно из рис. 5.12, Толмен нашел свой способ объедине­ния левиновских моделей личности (система потребностей) и окружения (поведенческое пространство), при­чем уже отмечавшаяся несовмести­мость этих моделей была преодолена благодаря включению (см. заканчива­ющиеся стрелками пунктирные линии) когнитивных процессов системы «ожидаемой ценности». Независимы­ми переменными при этом выступают физиологическое состояние потреб­ности (Т, влечение) и стимулы окру­жения (S), промежуточными — система потребностей, система «ожи­даемой ценности» и пространство по­ведения, зависимой переменной — результирующее поведение (V). Про­странство поведения представляет собой когнитивно-феноменальную репрезентацию данной ситуации. Ее структура решающим образом зави­сит от системы «ожидаемой ценно­сти». Привлекательности х1, х2, а также а1, а2 являются производными от соответствующих оценок в системе «ожидаемой ценности» (в данном слу­чае два ресторана и наличие в каж­дом из них предпочитаемых блюд). В этой же системе учитываются ожида­емое насыщение и переживаемый им­пульс голода (need push *), в конеч­ном счете также непосредственно за­висящий от потребности и стимулов окружения.




Рис. 5.11. Пример матрицы «ожидаемой ценно­сти»: когнитивного предвосхищения при выбо­ре в состоянии голода между хорошими (и дорогими) ресторанами и различными блюда­ми [Е. С. Taiwan, 1952, S. 392]

Не вдаваясь в подробности (и от­влекаясь от трудностей), уже из рис. 5.12 можно видеть, что Толмен в своей попытке установить генетиче­скую связь данного пространства по­ведения с состоянием когнитивных переменных пошел дальше Левина. В работе, посвященной этому вопросу, он, кроме того, рассмотрел возможно­сти операциональной диагностики ин­дивидуальной выраженности когни­тивных переменных системы «ожида­емой ценности». В отличие от Левина Толмен подчеркивал значимость ин­дивидуальных различий и в результа­те своих исследований сформулировал проблему, которая заняла цен­тральное место в новых работах по мотивации, особенно выполненных в рамках теории «ожидаемой ценности» (см. гл. 9).

* Импульс нужды. (Прим. ред.)


Рис. 5.12. Влияние на ситуацию выбора актуальной потребности представлено тремя различными блоками модели: системой потребностей, системой «ожидаемой ценности» и пространством поведения. Система «ожидаемой ценности» служит посредником между системой потребностей и пространством поведения, последние два блока соответствуют левиновским моделям личности и окружения. Независимыми переменными являются состояние потребности, голод (Т) и стимулы окружающего мира (S), промежуточнымисистемы потребностей, «ожидаемой ценности» и пространство поведения, зависимой переменнойрезультирующее поведение (V) [Е. С. Tolman, 1952, р. 395]

Ожидание и привлекательность в рамках теории SR

Анализ Толменом целенаправлен­ного поведения и экспериментальное подтверждение этого анализа были восприняты в конце 20-х гг. привер­женцами объяснения поведения с по­зиций теории ассоциаций как вызов. Они считали сочетание «стимул — реакция» основной схемой причинно-следственной связи. Каким образом можно было при таком подходе объ­яснить влияние на текущее поведе­ние ожидания, т. е. знания будущего целевого состояния, средств и путей его достижения? Халл принял вызов. Поскольку строгость бихевиористско­го анализа Толменом целенаправлен­ного поведения не подлежала сомне­нию, пришлось признать существова­ние процесса мотивации как стремле­ния к цели, отличающегося от науче­ния как простого подкрепления свя­зей S — R.



Ранний Халл

Но, спрашивал Халл, нельзя ли в конечном счете свести мотивацию к сочетаниям S—R? Ответ на этот вопрос привел его в 30-е гг. к созда­нию в рамках представлений об S — R варианта когнитивной теории мотива­ции. Речь шла о том, чтобы подвести под предвосхищающие цель ожида­ния, под эти направляющие поведе­ние и носившие пока менталистский характер «идеи» о нужности цели, субстанционную, т. е. физикалист-скую, основу в виде связей S — R. На первой стадии построения своей те­ории Халл в качестве эквивалента когнитивного ожидания постулировал так называемый rG — SQ-механизм, частичную антиципирующую цель реакцию.

Рассмотрим кратко эту концепцию. Мотивирующее действие привлека­тельности целевого объекта в этом варианте теории Халла заметной ро­ли еще не играет. К ней Халл подо­шел только на третьей, последней стадии переработки своей теории [С. L. Hull, 1951], а затем эти идеи были развиты Спенсом [К. W. Spence, 1956], причем rG — So-механизм снова стал играть важную роль. Промежу­точную стадию характеризует теория подкрепления и влечения, сформули­рованная в «Принципах поведения» [С. L Hull, 1943; см. также гл. 4], ког­да когнитивные процессы, такие, как ожидание и привлекательность и их конструирование в рамках представ­лений об S — R, отошли на задний план. Более двадцати лет привержен­цы теории «стимул — реакция» сопро­тивлялись выдвинутым Толменом по­ложениям и лежащим в их основе данным, пока мотивационный фактор не нашел себе места в теории пове­дения S — R в виде такой перемен­ной, как привлекательность целевого объекта.

Обратимся к исходному вопросу Халла: каким образом ожидание мо­жет направлять текущую деятель­ность, как будущее может определять настоящее? Можно ли описать ожида­ние в системе понятий S —R? Осно­вой дальнейших рассуждений стали результаты исследований Павлова, полный перевод работ которого на английский язык появился в конце 20-х гг. Как показал Павлов в ходе формирования условных рефлексов, нейтральные до некоторых пор раз­дражители могут приобретать сиг­нальное значение, информируя о предстоящих событиях. Тем самым они создают нечто аналогичное зна­нию о будущем, что можно видеть на примере реакции слюноотделения. Эта реакция заранее подготавливает собственно целевую реакцию (поеда­ние пищи), хотя целевой объект (корм) еще не представлен, а значит, целевая реакция не может иметь ме­ста и целевое состояние (насыщение) еще только предстоит достичь. Если вызываемая внешним раздражителем (SO реакция (R,) сопровождается проприоцептивной обратной связью, т. е. имеет своим следствием внут­ренний раздражитель (s1), то такой внутренний раздражитель может сов­пасть во времени с появлением сле­дующего внешнего раздражителя (S2), который, в свою очередь, вызо­вет реакцию R2. Тем самым s, непос­редственно предшествует г2 и может ассоциироваться с ней. С течением времени одного только s, может ока­заться достаточно, чтобы породить всю цепь реакций, опосредованную вызванными этими же реакциями внутренними раздражителями. При этом следует отметить, что связи Sn — Rn тем сильнее, чем ближе они к целевой реакции, иными словами, цепь строится с конца. На рис. 5.13 представлены этапы образования ас­социативных связей при посредстве внутренних раздражителей.

С помощью ею самой созданных и от нее зависящих внутренних раздра­жителей последовательность реакции может, так сказать, замыкаться на самое себя и становиться в своем дальнейшем протекании независимой от внешней стимуляции. Созданная таким образом цепь реакций может завершиться до достижения целевого объекта быстрее, чем цепь реакций на стимулы, которые представляют собой 'события внешнего мира. После­довательность реакций протекает бы­стрее последовательности стимулов, R3 осуществляется до наступления S3. Другими словами, события в орга­низме обгоняют происходящее в окру­жении. Тем самым организм получает возможность реагировать на то, что нa самом деле еще не произошло: создаются основы для предвосхище­ния.

Конечно, это рассуждение вызыва­ет возражения. Согласно изложенной точке зрения, внешнего раздражите­ля (S1), который еще очень далек от собственно целевого раздражителя (SG. G— goal), должно быть достаточ­но для приведения в движение всей цепи реакций. Целевая реакция (RG) должна произойти в любом случае, даже если не был достигнут целевой объект (например, пища). Поскольку реакции в таком случае оказываются неэффективными, то, как считает Халл, они в соответствии с законом эффекта постепенно угасают вплоть до незначительных остаточных сле­дов первоначально полностью пред­ставленных реакций. Эти остаточные следы реакции Халл назвал «чисто стимульными актами». Их единствен­ная функция состоит в том, чтобы быть внутренними раздражителями, возбуждающими другие акты, кото­рые в конечном счете приводят к критическому событию.— реакции на цель. В чисто стимульных актах Халл видел неврологические основы когни­тивных процессов, таких, как мысли и ожидания. Подобно Уотсону, Халл был «перифериалистом», а не «цен­тристом», т. е. он связывал субстрат когнитивных процессов не с централь­ной нервной системой (например, ко­рой больших полушарий), а с перифе­рической эффекторной системой те­ла. Во всяком случае, он полагал, что чисто стимульные акты составляют основу гибкого когнитивного управле­ния поведением. В 1930 г. он писал:

«При незначительном размышлении стано­вится очевидным, что появление чисто сти­мульных актов знаменует в биологическом раз­витии важный этап, шаг вперед. Они сразу же Делают доступным новый и заметно расширив­шийся круг поведенческих возможностей. Орга­низм уже не пассивно реагирует на стимулы, он приобретает относительную свободу и дина­мичность. Ограниченность привычки (в ее обычном смысле) имеет и свои преимущества, благодаря ей организм может реагировать не только в данном месте и не только в данное время... Таким образом, чисто стимульный акт можно представить как органический, физи­ологический (строго внутренний и индивидуаль­ный) символизм. Самые обычные инструмен­тальные акты благодаря естественному стрем­лению к процессу редукции преобразуются в нечто вроде мышления» [С. L. Hull, 1930, р. 516—517].


Рис. 5.13. Примерная схема того, как последо­вательности реакций от R1 до R3 (а) могут замыкаться с помощью промежуточных внут­ренних, т. е. вызванных реакциями, раздражи­телей (s1, S2) (Ь, с) и таким образом становить­ся в своем дальнейшем протекании независи­мыми (d) от вызывающих реакции внешних раздражителей

Стремясь найти в рамках теории «стимул — реакция» истоки направля­ющих поведение предвосхищений це­ли, Халл выдвинул наряду с положе­ниями о внутренних стимулах (как результате проприоцептивной обрат­ной связи) дополнительную концеп­цию, которая оказалась более значи­мой для дальнейшего развития те­ории, в особенности для учета дей­ствия привлекательности. Халл выде­лил особую группу чисто стимульных актов: частичную антиципирующую цель реакцию, rG — SQ-механизм. Он исходил (как до него Фрейд) из того, что состояние потребности вплоть до своего удовлетворения сопровожда­ется раздражителем влечения (SD). Поскольку раздражитель влечения присутствует постоянно, он ассоци­ируется со всеми следующими друг за другом и ведущими к цели реакциями. В конце концов раздражитель влече­ния оказывается способным сразу, как только возникает, вызывать це­левую реакцию. Но если эта реак­ция полностью осуществится, она, бу­дучи преждевременной, вступит в конфликт с необходимыми инструмен­тальными реакциями, которые при контакте с целевым объектом, и только тогда, создают предпосылки для ее успеха. Поэтому преждевременно вызванная целевая реакция в соот­ветствии с законом эффекта быстро аннулируется. Сохраняется лишь ее фрагмент, который не мешает проте­канию инструментальных реакций. Та­ким образом, вместо кусания, жева­ния и глотания (целевая реакция) наблюдаются отделение слюны, гло­тательные движения и тому подобные составляющие акта питания.

Решающее значение имеет то об­стоятельство, что этот фрагмент це­левой реакции (rG), будучи вызван­ным раздражителем влечения, в са­мом начале позволяет пропустить всю цепь реакций, которые еще толь­ко должны были бы привести к целе­вой реакции (RG). Как и всякая дру­гая, реакция на цель имеет свою проприоцептивную обратную связь (SG), внутренний раздражитель, кото­рый Халл обозначил как целевой. Она репрезентирует целевое событие, удовлетворение потребности, и, по­добно раздражителю влечения, при­сутствует на протяжении всей после­довательности поведенческих актов, при каждой промежуточной реакции. Поэтому ее можно рассматривать в качестве основы того, что Толмен называл предвосхищением цели, т. е. антиципацией результата действия и тем самым основой целенаправленно­го управления им. Халл писал:

«Антиципирующие цель реакции представля­ют собой физическую основу целенаправлен­ных идей» [С. L. Hull, 1931, р.505].

После того как в рамках теории S — R была решена проблема целе­направленности, т. е. стремление к цели было объяснено предвосхищени­ем ее целевого состояния, Халл [С. L. Hull, 1935] предпринял попытку вообще свести все процессы мотива­ции к законам научения по типу выра­ботки ассоциаций S — R. Ему нужно было дополнительно показать, что подкрепляющие события (удовлетво­рительное состояние дел — по Тор-ндайку) имеют врожденные потребно-стно-специфические основы, благода­ря которым в онтогенезе путем науче­ния развиваются и выкристаллизовы­ваются определенные модификации.

Таким образом, взгляды Халла сбли­жались с положениями Толмена. Но можно ли тем самым действительно объяснить полученные Толменом дан­ные? Возьмем почти мгновенное улуч­шение достижений после введения вместо еды с ограниченной привлека­тельностью пищи с высокой привле­кательностью. Халлу необходимо бы­ло бы допустить, что (1) использова­ние новой пищи вызывает несколько иные целевые реакции (вполне веро­ятное событие, например, при замене каши из отрубей семечками, посколь­ку в этом случае может возникнуть другая антиципирующая цель реакция rG); (2) уже после однократного появ­ления новой rG ассоциация раздражи­теля влечения SD с прежней rG исче­зает. Второе предположение малове­роятно, если учесть постепенный ха­рактер научения, в особенности пере­учивания. Совсем необъяснимым ока­зывается явление латентного науче­ния, когда имеет место раздражитель влечения SD, но нет целевой реакции RG и rG — SQ-механизм сформировать­ся не может. Для образования пос­леднего, как показывают результаты контрольной группы, необходимы пов­торные пробы. Скачкообразный ха­рактер достижений контрольной груп­пы также остается необъяснимым при помощи новых положений Халла.



Средний и поздний этапы развития взглядов Халла

В 1943 г. Халл сформулировал свою теорию подкрепления (при этом он временно отказался от рассмотре­ния вопросов стимульно-реактивного объяснения когнитивных процессов стремления к цели). Единственное, что следует отметить в этой те­ории,—отнесение Халлом количе­ственных и качественных характери­стик подкрепляющего целевого объ­екта к условиям, ответственным за силу подкрепления связи S — R. Крес-пи [L. P. Crespi, 1942; 1944], опираясь на новые данные, показал невозмож­ность решения на основе теории S—R проблемы привлекательности, поскольку последняя, скорее, указы­вает на своеобразие мотивации. Крес-пи менял количество корма, которое находила голодная крыса в целевой камере при успешной попытке про­хождения лабиринта. При большем количестве корма скорость бега воз­растала в первых 19 попытках бы­стрее, чем при меньшем его количе­стве. Как видно из рис. 5.14, макси­мальная скорость бега была разной при разных условиях привлекательно­сти, но она была достигнута обеими группами животных после одинаково­го числа попыток, так что обе группы должны были выработать одинако­вую силу привычки. Эти данные пол­ностью согласуются с теорией под­крепления Халла. Но когда Креспи изменил у одной из групп количество получаемого корма (на рис. 5.14 пока­зано изменение скорости бега при переходе от большего к меньшему количеству корма), скорость бега у группы, получавшей много корма, упа­ла ниже уровня группы, до сих пор получавшей мало корма. Столь вне­запное изменение поведения необъ­яснимо с теоретико-ассоциативной точки зрения. Данные Креспи под­твердил затем Зиман [Q. Zeaman, 1949]: увеличение количества пищи с 0,05 до 2,4 г привело к полной инвер­сии латентного времени по отноше­нию к достигнутому на тот момент плато другой группы, с самого нача­ла получавшей такое количество корма.

На заключительном этапе разра­ботки своей теории Халл [С. L. Hull, 1951] попытался объяснить эти дан­ные. Он уже не считал, что размер и вид подкрепления, зависящие от си­лы и вида привлекательности целево­го объекта, влияют на образование привычки. Эта функция сохранялась теперь только за частотой и степенью отсроченности подкрепления. Размер и вид подкрепления Халл объединил в новом мотивационном факторе К. Интенсивность К зависит от силы консумматорной реакции, которая, в свою очередь, зависит от привлека­тельности целевого объекта. Наряду с D переменная К ответственна за силу инструментальной реакции, но не за образование привычки, т. е. не за то, какая последует реакция. D и К мультипликативно связаны друг с другом, так что формула потенциала реакции (s E R) приняла следующий вид: sER=DxKxsHR.


Рис. 5.14. Зависимость скорости бега от коли­чества корма. До 19-й попытки одна группа получала 16 единиц корма, а другая256. С 20-й попытки обе группы получали 16 единиц [L P. Crespi, 1942, Fig. 2, p. 488, Fig. 8, p. 508]



Достарыңызбен бөлісу:
1   ...   14   15   16   17   18   19   20   21   ...   44




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет