Когнитивная психология тривоас! Москва, 1996 ббк88 C60


Принципа обработк информа "снизу-вв и "сверху вниз"



бет8/60
Дата18.07.2016
өлшемі4.9 Mb.
#208377
1   ...   4   5   6   7   8   9   10   11   ...   60

Принципа обработк информа "снизу-вв и "сверху вниз"

3Более подробно об этом см. Deregowski (1973, 1973); Deregowski, Muldrow, and Muldrow (1967); Hudson (1967).

YXo


Рот

Рис. З.2.

лица, опоз емые в кон всею профи вне контекст знать трудн< Однако, ecj черты изоб/ более полис алистично (С опознаются Заимствов < Palmer, 197

Распознавание namm

3.3. Рисун-^спользован-при изучении •1ия контекста, дъя вл е н и е ь/ (левая часть гнка) задает экстдля одно-'з рисунков ïsoj, изо-бра-щих опозна-\ые объекты: 1нка хлеба,

'ОВЫЙ ЯЩИК,

<бан. Взято из er, 1975b.

В различных контекстах мы ожидаем увидеть определенные объекты. В кабинете врача мы обнаруживаем стетоскоп, на кухне — столовое серебро, в офисе — пишущую машинку, а на улице — пожарный кран. Похоже, что такое "знание о мире" каким-то образом облегчает идентификацию объектов в знакомых контекстах и мешает их идентификации в неподходящих контекстах. Несколько исследований "влияния контекста", проведенных Бидерманом и его сотрудниками (Biederman, 1972; Biederman, Glass, and Stacy, 1973), показали, что когда испытуемые ищут объект в сценах из реального мира (например, объекты в своем институте или на улице), то точность опознания и требуемое для идентификации время зависит от соответствия объекта его положению в данной сцене.

Другие свидетельства влияния контекста на опознание объектов приведены в работе Palmer, 1975a, 1975b. В одном эксперименте испытуемым показывали сцену — такую, как слева на Рис.3.3,— а затем на очень которое время предъявляли объекты — такие, как в правой части этого рисунка. Испытуемых просили опознать воспринимаемый объект и степень их уверенности в своем ответе по пятибалльной шкале. Этими "целевыми объектами" были: (1 Соответствующие сцене (например, хлеб), (2)несоответствующие сцене, но внешне сходные с первыми (например, почтовый ящик), и (З)несеответствующие сцене и несходные с первыми внешне (например, барабан). В дополнительном условии эксперимента испытуемым предлагалось идентифицировать целевые объекты без кон­текстуальной сцены. Результаты показаны на Рис.3.4. Кривая "правильных ответов" показывает количество правильных опознаний в зависимости от контекста. Правильное опознание объекта при соответствующем контексте (узнавание буханки хлеба после показа сцены "кухня") составило около 84%, тогда как правильное опознание целевого объекта без контекста или при несоответствующем контексте происходило значительно реже.

Из этих и других аналогичных исследований, в которых на фоне контекста идентифицировались буквы и слова, ясно, что на восприятие объекта значительно влияют ожидания человека, задаваемые контекстом.





В





КОНТЕКСТУАЛЬНАЯ СЦЕНА

ПРЕДЪЯВЛЯЕМЫЙ ОБЪЕКТ

груженые u интерпретация сенсорных сигналов



Одна из гипотез о том, как распознаются паттерны и формы, называется "сравнение с эталоном". В нашем случае с распознаванием паттернов че­ловеком эталон — это некоторая внутренняя структура, которая при ее сопоставлении с сенсорными стимулами позволяет опознать объект. Со­гласно такому представлению о распознавании, в процессе приобретения жизненного опыта у нас образуется огромное количество эталонов, каж­дый из которых связан с некоторым значением. Так, зрительное опозна­ние формы, например, геометрической фигуры, происходит следующим образом: световая энергия, исходящая от этой фигуры, воздействует на сетчатку глаза и преобразуется в нервную энергию, которая передается в мозг. Осуществляется поиск среди имеющихся эталонов. Если находится эталон, который соответствует нервному паттерну, человек опознает этот паттерн. После сопоставления объекта с его эталоном может происходить дальнейшая обработка информации и интерпретация объекта.

Сравнение с эталоном как одна из теорий распознавания паттернов имеет свои сильные и слабые стороны. С положительной стороны, кажет­ся очевидным, что для опознания некоторой фигуры, например, буквы или какой-нибудь визуальной формы, нужен определенный контакт с соответ­ствующей внутренней формой. На каком-то уровне абстракции для опоз­нания объекта "внешней реальности" необходимо, чтобы он был представ­лен в долговременной памяти. С другой стороны, буквальная интерпрета­ция теории сравнения с эталоном встречается с определенными трудно­стями. Например, если опознание возможно только тогда, когда между "внешним" объектом и его "внутренней" репрезентацией имеется соот­ветствие 1:1, то это значит, что даже при незначительном расхождении между объектом и его эталоном опознания не произойдет. Поэтому стро­гое следование этой теории означало бы необходимость формирования несчетного количества эталонов, соответствующих каждой из разнообраз­ных геометрических форм, которые мы видим и узнаем.

Легкость, с которой мы распознаем зрительные образы в повседневной жизни, может навести на мысль, что это очень простой процесс, и все же,



Рис. 3.4. К f.

ответов испыт го в исследоЕ влияния конте. По горизон' "А"~ соответс щий контекст; нет контекста; несоответствуг контекст, схс объект; и "76" соответствуй: контекст, не г жий объект. Ад ровано из: melhart (197', данным Ра (1975Ь).



Сравнение эталоном

Распознавание nammep

когда мы пытаемся воспроизвести опознание с помощью искусственных средств, то оказывается, что результат от нас ускользает. Возьмем для примера опознание букв и устройство для распознавания слов. Чтобы на­учиться хорошо читать, нужно потратить несколько лет, но когда мы на­учились распознавать орфографическую конфигурацию, составляющую слово, мы можем мгновенно узнать это слово в различных контекстах, произнести его и вспомнить его значение. Как бы вы смоделировали ис­ходный процесс опознания буквы на компьютере? Один из способов — это хранить в "памяти" компьютера каждую из 26 букв. Тогда каждый раз, когда буква сканировалась бы оптическим устройством, воспринимаемая зрительная конфигурация "настраивалась" бы на элемент памяти (эта­лон), связанный с этой буквой. Так, слово CARD (карточка) анализирова­лось бы как C-A-R-D, т.е. "С" настраивалось бы на ячейку памяти, соот­ветствующую конфигурации "С", для "А" нашлось бы соответствие в ячейке "А" и т.д. "Вуа-ля! — мог бы воскликнуть компьютер, — а я читаю буквы!" Но что если бы мы попросили его опознать буквы в слове "card"? В его памяти нет конфигураций для написания букв в нижнем регистре. Реше­ние просто, скажете вы: увеличьте память и включите туда буквы нижне­го регистра. Но тогда мог бы наш компьютер прочитать (как это делаем мы) буквы, написанные вот так:

или так>

или так>

Конечно же, в чтении участвуют гораздо более сложные процессы, чем простое опознание букв. Прием, используемый в компьютерной техни-ке> — сравнение конфигурации букв с конкретными конфигурациями в памяти машины — называется "сравнение с эталоном"; это похоже на поворот ключа в замке. Чтобы открыть замок, конфигурация бороздок u выемок на ключе должна совпасть с конфигурацией замка. На языке рас­познавания образов при сравнении с эталоном происходит следующее: когда зрительная конфигурация соответствует совместимой с ней репре­зентации в памяти, информация высвобождается. Как видно из примера с компьютером, метод сравнения с эталоном встречается с трудностями при попытке опознать слово "CARD", если в его написании есть какие-либо отклонения, — это все равно, что пытаться открыть замок погнутым клю­чом.

Таким образом, сравнение с эталоном — это элементарная процедура распознавания паттернов, основанная на том, что конфигурация сенсор­ной информации точно подходит к соответствующей "конфигурации" в памяти; и хотя ее возможности ограничены, она имеет определенное тео­ретическое и практическое значение. Теоретические вопросы, связанные с этим методом, мы затронем позднее. Что касается его практических применений, то они весьма многочисленны.

Итак, в случае распознавания паттернов человеком "жесткое" следо­вание этой модели привело бы к необходимости создания миллионов от­дельных шаблонов, каждый из которых соответствовал бы отдельному зрительному паттерну. Если бы нам приходилось хранить так много этало­нов, наш мозг был бы таким громоздким, что пришлось бы возить его на тачке. Так что этот трюк не пройдет по неврологическим соображениям.

гружение и интерпретация сенсорных сигналов

; Сравнение с эталоном является основой многих кодирующих систем, ставших час-

|| тью нашей повседневной жизни. Например, почти все банки в США имеют системы

цену, печатаемую затем на контрольной ленте кассового аппарата.)



STATE BANK

Mattew A. SWANN 18 Chelsea Place New York, N.Y. 1ÜÜ11



no. 159

pay to the order of_

для идентификации счетов по специальным | цифрам, отпечатанным на оборотной сто-|роне чека, а во многих магазинах исполь-|||зуются аналогичные коды (напечатанные ff i; на упаковках товара) для ускорения про-|цесса выписки счетов и проведения пере-|учета товаров. (По этому коду компьютер | определяет единицу товара и указывает ее

Обе эти разновидности кодов читаются посредством сравнения с эталоном. Рису­нок на чеке имеет отличительные детали, помогающие компьютеру различать буквы, а торговые коды читаются по положению линий, их ширине и пространству между ними. Коды преобразуются сканером в электрические импульсы, из которых со­ставляется сигнальный паттерн; последний передается в компьютер, идентифицирую­щий этот паттерн путем сравнения его с аналогом (эталоном), находящимся в его памяти.

Но даже если бы это было возможно, то для доступа к памяти, где хранят­ся многие миллионы эталонов, потребовалась бы процедура поиска, зани­мающая крайне много времени, что никак не соответствует нашей способ­ности быстро опознавать множество различных паттернов. Наконец, эта модель маловероятна, потому, что мы можем опознавать незнакомые фор­мы и фигуры (например, новые варианты начертания буквы "А").

Еще один подход к проблеме извлечения информации из сложных стиму- Подеталь-лов — это подетальный анализ. В соответствии с ним, восприятие — это ный ана-"высокоуровневая" обработка информации, которой предшествует этап лиз идентификации входных стимулов по их более простым деталям. Так, прежде чем произойдет оценка информации зрительного паттерна "в полном объеме", осуществляется минимальный анализ его составных частей. На элементарном визуальном уровне слово — например, слово ARROW (стрела) — не переводится непосредственно в свою понятийную или мысленную репрезентацию в нашей памяти (например, "заостренное древко для стрельбы из лука" или знак " —^ "). Оно не читается как "arrow", и его отдельные буквы не воспринимаются как A-R-R-O-W, а вместо этого обнаруживаются и анализируются детали или компоненты каждой буквы. Так, буква "А" может быть разложена на две наклонные линии (/ \) и

Распознавание паттерн



. 3.5. Уста-а для наблю-<я за нервной вностью, вы-:емой просты-зрительными jjféjfâ улами.



одну горизонталь (----), острый угол (/М, перевернутую емкость (/ \)

и т.д. Если процесс опознания основан на анализе деталей и это найдет свое подтверждение, то выходит, что ранние этапы обработки информации более сложны, чем мы предполагали вначале.4

В двух исследовательских направлениях — неврологическом и бихеви­ористском — были получены данные в пользу гипотезы о подетальном анализе. Мы сосредоточимся на втором из них, но сначала обратимся к экспериментам Хьюбеля и Визеля (Hubel and Wiesel, 1959, 1963; Wiesel, 1963), из которых прямо видно, какой тип информации кодируется в зри­тельной коре мозга. Эти ученые вживляли микроэлектроды в зрительную кору кошки и обезьяны, находившихся в состоянии легкого наркоза, а потом изучали нервную активность, возникавшую в результате проекции простых световых паттернов на экран непосредственно перед глазами жи­вотного (Рис.3.5).

Регистрируя возбуждение отдельных нервных клеток и усиливая воз­никающие в них электрические импульсы, они обнаружили, что некото­рые клетки реагируют только на горизонтальные фигуры, а некоторые —



4Чтобы оценить сложность сенсорного, перцептивного и моторного аппара­тов, обслуживающих "простое" восприятие и ответные реакции, представьте себе, сколько всего требуется, чтобы отбить ракеткой на лету теннисный мяч. За долю секунды мы способны оценить его форму, размер, скорость, цвет, траекторию, вращение и предсказать его положение. Наш мозг должен пере­вести всю эту информацию (записанную только в двумерном виде на сетчат­ке) в моторную реакцию, которая в случае успеха позволит нам отразить мяч. Помимо того, что все это происходит практически мгновенно, значительная часть информации постоянно меняется (например, относительная величина мяча, его скорость и траектория).

гружение и интерпретация сенсорных сигналов

В







ММ*


ttrrr

Рие. 3.6. Pec

клеток зритеп коры кошки не муляцию гу светлой поле Фрагменты А-. казывают орие цию светлой п сы (вытянутый моугольник сп.

НЫМИ ЛИНИЯМ!*

носительно рецептивного (штриховые лм Но фрагмен-полоса была ентирована же, как на А

НО быстро ДЕ

лась из сторо сторону. Взятс Hube/ and W (1963).

только на вертикальные. В других экспериментах они обнаружили, что некоторые клетки чувствительны к краям зрительного стимула, некото­рые — к линиям, а некоторые — к правым углам. На Рис.3.6 показано, как усиленная мозговая активность клеток коры у очень молодого (и соот­ветственно зрительно неопытного) котенка связана с конкретной ориента­цией освещенной полосы (А-Е), предъявлявшейся на экране в поле зрения животного. Горизонтальными отрезками над каждой записью активности обозначены периоды, когда стимул был виден. Хьюбель пришел к выводу, что формирование этих кортикальных кодов воспринимаемых фигур явля­ется врожденным и специфичным для каждой клетки:

"Теперь становится понятным значение огромного числа клеток в зрительной коре. Видимо, каждая клетка имеет свое особое назначение; она отвечает за одну ограниченную зону сетчатки, реагируя лучше всего на одну конкретную форму стимула и на одну конкретную ориентацию. Если посмотреть на эту проблему с противоположной стороны, то для каждого стимула — каждой зоны сетчатки, на которую воздействует стимул, каждого типа линии (край, полоса или отрезок) и каждой ориентации стиму­ла — существует определенный набор простых кортикальных клеток, которые на них реагируют; всякое изменение расположения стимула вызывает ответную реакцию новой^группы клеток. Количество клеточных групп, последовательно реагирующих по мере того как глаз следит за медленно вращающимся пропеллером, трудно вообразить" (Hubel, 1963).

Распознавание паттер

Следовательно, сложный и громоздкий механизм разложения паттерна на простые детали — не только возможность, имеющая отношение к невро­логии, но действительно неврологическая необходимость, т.е. подеталь­ный анализ может оказаться таким этапом, через который информация должна пройти, прежде чем анализ паттерна сможет начаться на высшем уровне.

Движения глаз и восприятие паттерна. Непосредственное от­ношение к подетальному анализу имеют наблюдения за движениями глаз и зрительными фиксациями. Можно предположить, что если вы относи­тельно долго смотрите на некоторую деталь паттерна, то вы извлекаете из нее больше информации, чем при мимолетном взгляде. Этим подходом заинтересовались Макворт и Ярбус (Mackworth, 1965; Yarbus, 1967). Ре­зультаты экспериментов с фиксацией, проведенных русским психологом5 Ярбусом, показаны на Рис.3.7. Ярбус предположил, что чем больше ин­формации содержит некоторая деталь (например, глаза, уши или рот ре­бенка на указанной иллюстрации), тем дольше на ней фиксируется взгляд. Он также заключил, что распределение точек фиксации зависит от целей наблюдателя. В одной серии экспериментов испытуемых просили при раз­глядывании сложного изображения сделать некоторые оценки (оценить, например, каковы материальные условия членов семьи, сколько им лет). При этом взгляд останавливается на тех деталях, которые наиболее важ­ны для целей испытуемого. Таким образом, восприятие деталей сложного паттерна зависит не только от физических свойств стимула, но и от рабо­ты высокоуровневых когнитивных процессов, таких как внимание и моти­вация.



тогипное знание

Альтернативой сравнению с эталоном и подетальному анализу как сред­ствам распознавания паттернов является теория формирования прото­типов. Вполне вероятно, что в ДВП хранятся не конкретные эталоны и тем более не детальные признаки многочисленных паттернов, которые нам приходится опознавать, а своеобразная абстракция паттернов, которая и служит в качестве прототипа. Паттерн сопоставляется с прототипом и при наличии сходства происходит его опознание. Применительно к чело­веку, гипотеза прототипного сравнения более отвечает принципу невроло­гической экономичности и процессам поиска в памяти, чем гипотеза о сравнении с эталоном; она позволяет также опознавать "необычные" пат­терны, которые, тем не менее, как-либо связаны с прототипом. В такой системе можно, например, сформировать прототип идеализированной бук­вы "А", относительно которого все остальные "А" будут оцениваться по принципу сходства. Если расхождение велико (например, если это не "А", а другая буква), то мы отмечаем отсутствие "совпадения" и отвергаем предъявленную букву как не "А"; затем можно искать прототип, который лучше подходит для этой буквы. Свидетельства в пользу прототипного сравнения — повсюду вокруг нас, и интуитивно эта гипотеза выглядит весьма достоверной. Мы узнаем машину марки Фольксваген, даже если у нее другие цвет и форма или она облеплена всякими безделушками, кото-

5Точнее, биофизиком.— Прим. ред. '-ружение и интерпретация сенсорных сигналов









Рис. 3.7. За

движений т испытуемого разглядыва картины (er вверху). Трое рия 1 получ когда испытуе рассмотри картину лр< вольно. Поел ющие траектс получены пс того, как испь мою просили нить эксноми кую состоят ность изобрел ных людей (Тр тория 2); их рост (3); пре, пожить, что делали, перед как пришел "п. титель" (4); за г нить их одежд) запомнить пс жение люде объектов в кол те (6); и оцен как долго "пос гель7' не видел "семью" (7). Bz из: Yarbus (19<

Распознавание паттер-

рые никак не сходятся с идеализированной моделью в нашей голове. В этом смысле прототип — это не только абстракция из набора стимулов, но и "краткий конспект", наилучшая репрезентация данного паттерна6.



Хотя приведенные аргументы говорят в пользу сравнения с прототи­пом, можно задать вопрос: Необходимо ли точное соответствие между

6В цивилизации, где физическое очарование вознаграждается, прототипами женственности и мужественности могут стать победительница пышного пред­ставления "Мисс Америка" и исполнитель главной мужской роли в кассовом фильме, и тогда оценка нами человека может оказаться связанной с тем, насколько он соответствует этому идеальному прототипу.

ИДИ, НАЙДИ ЭТО...

ДОЛГО­ВРЕМЕННАЯ ПАМЯТЬ

аружение и интерпретация сенсорных сигналов

образом и прототипем? Может быть эталоны — это некоторое приближе­ние к образу, нужное, чтобы открыть ячейку памяти? Однако, если бы это было так, то разве могли бы мы делать тонкие дифференцировки, необхо­димые для обычного зрительного восприятия? Возьмем, например, сход­ство деталей в буквах О и Q или В, P и R. Хотя эти зрительные паттерны похожи друг на друга, мы редко их путаем. Значит, эталоны не могут быть "приблизительными" или "размытыми"— иначе мы слишком часто оши­бались бы при распознавании образов, что очевидно не так.

Таким образом, сравнение с эталоном как принцип распознавания об­разов полезно для компьютерных программ (чтение кодов на чеках и т.п.), но в своей жестой форме оно не может адекватно объяснить разнообра­зие, точность и экономичность распознавания образов человеком. Подво­дя итог, скажем, что распознавание образов предполагает проведение опе­раций с памятью. В простейшем случае можно полагать, что при распоз­навании образа происходит сопоставление сенсорной информации с неко­торым следом, хранящимся в памяти.

Абстрагирование зрительной информации. Как мы предположили, на одном уровне зрительного опознания может происходить сравнение с эталоном, но на другом уровне могут использоваться прототипы. Предполагается, что прототип — это абстракция набора стимулов, воплощающая множество сходных форм одного и того же паттерна. Прототип позволяет нам распознавать образ, даже если он не идентичен прототипу, а только похож на него. Так, мы распознаем различные написания буквы "А" не потому, что они точно подходят к некоторой ячейке памяти, а потому, что члены класса "А" обладают некоторыми общими чертами.

Экспериментальные исследования, направленные на подтверждение те­ории прототипов как средства распознавания образов, часто обращались к вопросу о том, как формируются прототипы и как обеспечивается быстрая классификация новых паттернов. Этот вопрос не нов; он беспокоил епис­копа Беркли (Berkeley) еще много лет назад:

"Перед его мысленным взором все изображения треугольников обладали весьма конкретными свойствами. Они были или равносторонними, или равнобедренными, или прямоугольными треугольниками, и он напрасно искал мысленный образ "универсального треугольника". Хотя то, что мы имеем в виду под треугольником, легко определяется вербально, совсем не ясно, как выглядит "совершенный" треугольник. Мы видим множество самых, разнообразных треугольников; что же из всего этого множества мы создаем в своих, мыслях, как основу для опознания треугольника?" (Цит по: Calfee, 1975, р.222).

Воображаемая Одиссея Беркли о "совершенном" треугольнике растянулась на несколько столетий и, наконец, стала предметом эмпирического исследования в эксперименте, который сам стал для многих прототипом (Posner, Goldsmith, and Weiten, 1967). Эти ученые нашли прототип треугольника (и других фигур), а затем измеряли время реакции испытуемых на другие фигуры, в чем-то подобные прототипу. В первой части эксперимента они разработали серию прототипов (Рис.3.8) путем

Распознавание nammef.



f I Случайный _ Г^^1:^УЖи

ук^л^ча у'-у ^J'"" «г '^-''- -- ' '•ъ;**>~ь,'з& 'M«-Л«<•/- Л-* <• Л-'*' ч<» •



Достарыңызбен бөлісу:
1   ...   4   5   6   7   8   9   10   11   ...   60




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет