Принципа обработк информа "снизу-вв и "сверху вниз"
3Более подробно об этом см. Deregowski (1973, 1973); Deregowski, Muldrow, and Muldrow (1967); Hudson (1967).
YXo
Рот
Рис. З.2.
лица, опоз емые в кон всею профи вне контекст знать трудн< Однако, ecj черты изоб/ более полис алистично (С опознаются Заимствов < Palmer, 197
Распознавание namm
3.3. Рисун-^спользован-при изучении •1ия контекста, дъя вл е н и е ь/ (левая часть гнка) задает экстдля одно-'з рисунков ïsoj, изо-бра-щих опозна-\ые объекты: 1нка хлеба,
'ОВЫЙ ЯЩИК,
<бан. Взято из er, 1975b.
В различных контекстах мы ожидаем увидеть определенные объекты. В кабинете врача мы обнаруживаем стетоскоп, на кухне — столовое серебро, в офисе — пишущую машинку, а на улице — пожарный кран. Похоже, что такое "знание о мире" каким-то образом облегчает идентификацию объектов в знакомых контекстах и мешает их идентификации в неподходящих контекстах. Несколько исследований "влияния контекста", проведенных Бидерманом и его сотрудниками (Biederman, 1972; Biederman, Glass, and Stacy, 1973), показали, что когда испытуемые ищут объект в сценах из реального мира (например, объекты в своем институте или на улице), то точность опознания и требуемое для идентификации время зависит от соответствия объекта его положению в данной сцене.
Другие свидетельства влияния контекста на опознание объектов приведены в работе Palmer, 1975a, 1975b. В одном эксперименте испытуемым показывали сцену — такую, как слева на Рис.3.3,— а затем на очень которое время предъявляли объекты — такие, как в правой части этого рисунка. Испытуемых просили опознать воспринимаемый объект и степень их уверенности в своем ответе по пятибалльной шкале. Этими "целевыми объектами" были: (1 Соответствующие сцене (например, хлеб), (2)несоответствующие сцене, но внешне сходные с первыми (например, почтовый ящик), и (З)несеответствующие сцене и несходные с первыми внешне (например, барабан). В дополнительном условии эксперимента испытуемым предлагалось идентифицировать целевые объекты без контекстуальной сцены. Результаты показаны на Рис.3.4. Кривая "правильных ответов" показывает количество правильных опознаний в зависимости от контекста. Правильное опознание объекта при соответствующем контексте (узнавание буханки хлеба после показа сцены "кухня") составило около 84%, тогда как правильное опознание целевого объекта без контекста или при несоответствующем контексте происходило значительно реже.
Из этих и других аналогичных исследований, в которых на фоне контекста идентифицировались буквы и слова, ясно, что на восприятие объекта значительно влияют ожидания человека, задаваемые контекстом.
В
КОНТЕКСТУАЛЬНАЯ СЦЕНА
ПРЕДЪЯВЛЯЕМЫЙ ОБЪЕКТ
груженые u интерпретация сенсорных сигналов
Одна из гипотез о том, как распознаются паттерны и формы, называется "сравнение с эталоном". В нашем случае с распознаванием паттернов человеком эталон — это некоторая внутренняя структура, которая при ее сопоставлении с сенсорными стимулами позволяет опознать объект. Согласно такому представлению о распознавании, в процессе приобретения жизненного опыта у нас образуется огромное количество эталонов, каждый из которых связан с некоторым значением. Так, зрительное опознание формы, например, геометрической фигуры, происходит следующим образом: световая энергия, исходящая от этой фигуры, воздействует на сетчатку глаза и преобразуется в нервную энергию, которая передается в мозг. Осуществляется поиск среди имеющихся эталонов. Если находится эталон, который соответствует нервному паттерну, человек опознает этот паттерн. После сопоставления объекта с его эталоном может происходить дальнейшая обработка информации и интерпретация объекта.
Сравнение с эталоном как одна из теорий распознавания паттернов имеет свои сильные и слабые стороны. С положительной стороны, кажется очевидным, что для опознания некоторой фигуры, например, буквы или какой-нибудь визуальной формы, нужен определенный контакт с соответствующей внутренней формой. На каком-то уровне абстракции для опознания объекта "внешней реальности" необходимо, чтобы он был представлен в долговременной памяти. С другой стороны, буквальная интерпретация теории сравнения с эталоном встречается с определенными трудностями. Например, если опознание возможно только тогда, когда между "внешним" объектом и его "внутренней" репрезентацией имеется соответствие 1:1, то это значит, что даже при незначительном расхождении между объектом и его эталоном опознания не произойдет. Поэтому строгое следование этой теории означало бы необходимость формирования несчетного количества эталонов, соответствующих каждой из разнообразных геометрических форм, которые мы видим и узнаем.
Легкость, с которой мы распознаем зрительные образы в повседневной жизни, может навести на мысль, что это очень простой процесс, и все же,
Рис. 3.4. К f.
ответов испыт го в исследоЕ влияния конте. По горизон' "А"~ соответс щий контекст; нет контекста; несоответствуг контекст, схс объект; и "76" соответствуй: контекст, не г жий объект. Ад ровано из: melhart (197', данным Ра (1975Ь).
Сравнение эталоном
Распознавание nammep
когда мы пытаемся воспроизвести опознание с помощью искусственных средств, то оказывается, что результат от нас ускользает. Возьмем для примера опознание букв и устройство для распознавания слов. Чтобы научиться хорошо читать, нужно потратить несколько лет, но когда мы научились распознавать орфографическую конфигурацию, составляющую слово, мы можем мгновенно узнать это слово в различных контекстах, произнести его и вспомнить его значение. Как бы вы смоделировали исходный процесс опознания буквы на компьютере? Один из способов — это хранить в "памяти" компьютера каждую из 26 букв. Тогда каждый раз, когда буква сканировалась бы оптическим устройством, воспринимаемая зрительная конфигурация "настраивалась" бы на элемент памяти (эталон), связанный с этой буквой. Так, слово CARD (карточка) анализировалось бы как C-A-R-D, т.е. "С" настраивалось бы на ячейку памяти, соответствующую конфигурации "С", для "А" нашлось бы соответствие в ячейке "А" и т.д. "Вуа-ля! — мог бы воскликнуть компьютер, — а я читаю буквы!" Но что если бы мы попросили его опознать буквы в слове "card"? В его памяти нет конфигураций для написания букв в нижнем регистре. Решение просто, скажете вы: увеличьте память и включите туда буквы нижнего регистра. Но тогда мог бы наш компьютер прочитать (как это делаем мы) буквы, написанные вот так:
или так>
или так>
Конечно же, в чтении участвуют гораздо более сложные процессы, чем простое опознание букв. Прием, используемый в компьютерной техни-ке> — сравнение конфигурации букв с конкретными конфигурациями в памяти машины — называется "сравнение с эталоном"; это похоже на поворот ключа в замке. Чтобы открыть замок, конфигурация бороздок u выемок на ключе должна совпасть с конфигурацией замка. На языке распознавания образов при сравнении с эталоном происходит следующее: когда зрительная конфигурация соответствует совместимой с ней репрезентации в памяти, информация высвобождается. Как видно из примера с компьютером, метод сравнения с эталоном встречается с трудностями при попытке опознать слово "CARD", если в его написании есть какие-либо отклонения, — это все равно, что пытаться открыть замок погнутым ключом.
Таким образом, сравнение с эталоном — это элементарная процедура распознавания паттернов, основанная на том, что конфигурация сенсорной информации точно подходит к соответствующей "конфигурации" в памяти; и хотя ее возможности ограничены, она имеет определенное теоретическое и практическое значение. Теоретические вопросы, связанные с этим методом, мы затронем позднее. Что касается его практических применений, то они весьма многочисленны.
Итак, в случае распознавания паттернов человеком "жесткое" следование этой модели привело бы к необходимости создания миллионов отдельных шаблонов, каждый из которых соответствовал бы отдельному зрительному паттерну. Если бы нам приходилось хранить так много эталонов, наш мозг был бы таким громоздким, что пришлось бы возить его на тачке. Так что этот трюк не пройдет по неврологическим соображениям.
гружение и интерпретация сенсорных сигналов
; Сравнение с эталоном является основой многих кодирующих систем, ставших час-
|| тью нашей повседневной жизни. Например, почти все банки в США имеют системы
цену, печатаемую затем на контрольной ленте кассового аппарата.)
STATE BANK
Mattew A. SWANN 18 Chelsea Place New York, N.Y. 1ÜÜ11
no. 159
pay to the order of_
для идентификации счетов по специальным | цифрам, отпечатанным на оборотной сто-|роне чека, а во многих магазинах исполь-|||зуются аналогичные коды (напечатанные ff i; на упаковках товара) для ускорения про-|цесса выписки счетов и проведения пере-|учета товаров. (По этому коду компьютер | определяет единицу товара и указывает ее
Обе эти разновидности кодов читаются посредством сравнения с эталоном. Рисунок на чеке имеет отличительные детали, помогающие компьютеру различать буквы, а торговые коды читаются по положению линий, их ширине и пространству между ними. Коды преобразуются сканером в электрические импульсы, из которых составляется сигнальный паттерн; последний передается в компьютер, идентифицирующий этот паттерн путем сравнения его с аналогом (эталоном), находящимся в его памяти.
Но даже если бы это было возможно, то для доступа к памяти, где хранятся многие миллионы эталонов, потребовалась бы процедура поиска, занимающая крайне много времени, что никак не соответствует нашей способности быстро опознавать множество различных паттернов. Наконец, эта модель маловероятна, потому, что мы можем опознавать незнакомые формы и фигуры (например, новые варианты начертания буквы "А").
Еще один подход к проблеме извлечения информации из сложных стиму- Подеталь-лов — это подетальный анализ. В соответствии с ним, восприятие — это ный ана-"высокоуровневая" обработка информации, которой предшествует этап лиз идентификации входных стимулов по их более простым деталям. Так, прежде чем произойдет оценка информации зрительного паттерна "в полном объеме", осуществляется минимальный анализ его составных частей. На элементарном визуальном уровне слово — например, слово ARROW (стрела) — не переводится непосредственно в свою понятийную или мысленную репрезентацию в нашей памяти (например, "заостренное древко для стрельбы из лука" или знак " —^ "). Оно не читается как "arrow", и его отдельные буквы не воспринимаются как A-R-R-O-W, а вместо этого обнаруживаются и анализируются детали или компоненты каждой буквы. Так, буква "А" может быть разложена на две наклонные линии (/ \) и
Распознавание паттерн
. 3.5. Уста-а для наблю-<я за нервной вностью, вы-:емой просты-зрительными jjféjfâ улами.
одну горизонталь (----), острый угол (/М, перевернутую емкость (/ \)
и т.д. Если процесс опознания основан на анализе деталей и это найдет свое подтверждение, то выходит, что ранние этапы обработки информации более сложны, чем мы предполагали вначале.4
В двух исследовательских направлениях — неврологическом и бихевиористском — были получены данные в пользу гипотезы о подетальном анализе. Мы сосредоточимся на втором из них, но сначала обратимся к экспериментам Хьюбеля и Визеля (Hubel and Wiesel, 1959, 1963; Wiesel, 1963), из которых прямо видно, какой тип информации кодируется в зрительной коре мозга. Эти ученые вживляли микроэлектроды в зрительную кору кошки и обезьяны, находившихся в состоянии легкого наркоза, а потом изучали нервную активность, возникавшую в результате проекции простых световых паттернов на экран непосредственно перед глазами животного (Рис.3.5).
Регистрируя возбуждение отдельных нервных клеток и усиливая возникающие в них электрические импульсы, они обнаружили, что некоторые клетки реагируют только на горизонтальные фигуры, а некоторые —
4Чтобы оценить сложность сенсорного, перцептивного и моторного аппаратов, обслуживающих "простое" восприятие и ответные реакции, представьте себе, сколько всего требуется, чтобы отбить ракеткой на лету теннисный мяч. За долю секунды мы способны оценить его форму, размер, скорость, цвет, траекторию, вращение и предсказать его положение. Наш мозг должен перевести всю эту информацию (записанную только в двумерном виде на сетчатке) в моторную реакцию, которая в случае успеха позволит нам отразить мяч. Помимо того, что все это происходит практически мгновенно, значительная часть информации постоянно меняется (например, относительная величина мяча, его скорость и траектория).
гружение и интерпретация сенсорных сигналов
В
ММ*
ttrrr
Рие. 3.6. Pec
клеток зритеп коры кошки не муляцию гу светлой поле Фрагменты А-. казывают орие цию светлой п сы (вытянутый моугольник сп.
НЫМИ ЛИНИЯМ!*
носительно рецептивного (штриховые лм Но фрагмен-полоса была ентирована же, как на А
НО быстро ДЕ
лась из сторо сторону. Взятс Hube/ and W (1963).
только на вертикальные. В других экспериментах они обнаружили, что некоторые клетки чувствительны к краям зрительного стимула, некоторые — к линиям, а некоторые — к правым углам. На Рис.3.6 показано, как усиленная мозговая активность клеток коры у очень молодого (и соответственно зрительно неопытного) котенка связана с конкретной ориентацией освещенной полосы (А-Е), предъявлявшейся на экране в поле зрения животного. Горизонтальными отрезками над каждой записью активности обозначены периоды, когда стимул был виден. Хьюбель пришел к выводу, что формирование этих кортикальных кодов воспринимаемых фигур является врожденным и специфичным для каждой клетки:
"Теперь становится понятным значение огромного числа клеток в зрительной коре. Видимо, каждая клетка имеет свое особое назначение; она отвечает за одну ограниченную зону сетчатки, реагируя лучше всего на одну конкретную форму стимула и на одну конкретную ориентацию. Если посмотреть на эту проблему с противоположной стороны, то для каждого стимула — каждой зоны сетчатки, на которую воздействует стимул, каждого типа линии (край, полоса или отрезок) и каждой ориентации стимула — существует определенный набор простых кортикальных клеток, которые на них реагируют; всякое изменение расположения стимула вызывает ответную реакцию новой^группы клеток. Количество клеточных групп, последовательно реагирующих по мере того как глаз следит за медленно вращающимся пропеллером, трудно вообразить" (Hubel, 1963).
Распознавание паттер
Следовательно, сложный и громоздкий механизм разложения паттерна на простые детали — не только возможность, имеющая отношение к неврологии, но действительно неврологическая необходимость, т.е. подетальный анализ может оказаться таким этапом, через который информация должна пройти, прежде чем анализ паттерна сможет начаться на высшем уровне.
Движения глаз и восприятие паттерна. Непосредственное отношение к подетальному анализу имеют наблюдения за движениями глаз и зрительными фиксациями. Можно предположить, что если вы относительно долго смотрите на некоторую деталь паттерна, то вы извлекаете из нее больше информации, чем при мимолетном взгляде. Этим подходом заинтересовались Макворт и Ярбус (Mackworth, 1965; Yarbus, 1967). Результаты экспериментов с фиксацией, проведенных русским психологом5 Ярбусом, показаны на Рис.3.7. Ярбус предположил, что чем больше информации содержит некоторая деталь (например, глаза, уши или рот ребенка на указанной иллюстрации), тем дольше на ней фиксируется взгляд. Он также заключил, что распределение точек фиксации зависит от целей наблюдателя. В одной серии экспериментов испытуемых просили при разглядывании сложного изображения сделать некоторые оценки (оценить, например, каковы материальные условия членов семьи, сколько им лет). При этом взгляд останавливается на тех деталях, которые наиболее важны для целей испытуемого. Таким образом, восприятие деталей сложного паттерна зависит не только от физических свойств стимула, но и от работы высокоуровневых когнитивных процессов, таких как внимание и мотивация.
тогипное знание
Альтернативой сравнению с эталоном и подетальному анализу как средствам распознавания паттернов является теория формирования прототипов. Вполне вероятно, что в ДВП хранятся не конкретные эталоны и тем более не детальные признаки многочисленных паттернов, которые нам приходится опознавать, а своеобразная абстракция паттернов, которая и служит в качестве прототипа. Паттерн сопоставляется с прототипом и при наличии сходства происходит его опознание. Применительно к человеку, гипотеза прототипного сравнения более отвечает принципу неврологической экономичности и процессам поиска в памяти, чем гипотеза о сравнении с эталоном; она позволяет также опознавать "необычные" паттерны, которые, тем не менее, как-либо связаны с прототипом. В такой системе можно, например, сформировать прототип идеализированной буквы "А", относительно которого все остальные "А" будут оцениваться по принципу сходства. Если расхождение велико (например, если это не "А", а другая буква), то мы отмечаем отсутствие "совпадения" и отвергаем предъявленную букву как не "А"; затем можно искать прототип, который лучше подходит для этой буквы. Свидетельства в пользу прототипного сравнения — повсюду вокруг нас, и интуитивно эта гипотеза выглядит весьма достоверной. Мы узнаем машину марки Фольксваген, даже если у нее другие цвет и форма или она облеплена всякими безделушками, кото-
5Точнее, биофизиком.— Прим. ред. '-ружение и интерпретация сенсорных сигналов
Рис. 3.7. За
движений т испытуемого разглядыва картины (er вверху). Трое рия 1 получ когда испытуе рассмотри картину лр< вольно. Поел ющие траектс получены пс того, как испь мою просили нить эксноми кую состоят ность изобрел ных людей (Тр тория 2); их рост (3); пре, пожить, что делали, перед как пришел "п. титель" (4); за г нить их одежд) запомнить пс жение люде объектов в кол те (6); и оцен как долго "пос гель7' не видел "семью" (7). Bz из: Yarbus (19<
Распознавание паттер-
рые никак не сходятся с идеализированной моделью в нашей голове. В этом смысле прототип — это не только абстракция из набора стимулов, но и "краткий конспект", наилучшая репрезентация данного паттерна6.
Хотя приведенные аргументы говорят в пользу сравнения с прототипом, можно задать вопрос: Необходимо ли точное соответствие между
6В цивилизации, где физическое очарование вознаграждается, прототипами женственности и мужественности могут стать победительница пышного представления "Мисс Америка" и исполнитель главной мужской роли в кассовом фильме, и тогда оценка нами человека может оказаться связанной с тем, насколько он соответствует этому идеальному прототипу.
ИДИ, НАЙДИ ЭТО...
ДОЛГОВРЕМЕННАЯ ПАМЯТЬ
аружение и интерпретация сенсорных сигналов
образом и прототипем? Может быть эталоны — это некоторое приближение к образу, нужное, чтобы открыть ячейку памяти? Однако, если бы это было так, то разве могли бы мы делать тонкие дифференцировки, необходимые для обычного зрительного восприятия? Возьмем, например, сходство деталей в буквах О и Q или В, P и R. Хотя эти зрительные паттерны похожи друг на друга, мы редко их путаем. Значит, эталоны не могут быть "приблизительными" или "размытыми"— иначе мы слишком часто ошибались бы при распознавании образов, что очевидно не так.
Таким образом, сравнение с эталоном как принцип распознавания образов полезно для компьютерных программ (чтение кодов на чеках и т.п.), но в своей жестой форме оно не может адекватно объяснить разнообразие, точность и экономичность распознавания образов человеком. Подводя итог, скажем, что распознавание образов предполагает проведение операций с памятью. В простейшем случае можно полагать, что при распознавании образа происходит сопоставление сенсорной информации с некоторым следом, хранящимся в памяти.
Абстрагирование зрительной информации. Как мы предположили, на одном уровне зрительного опознания может происходить сравнение с эталоном, но на другом уровне могут использоваться прототипы. Предполагается, что прототип — это абстракция набора стимулов, воплощающая множество сходных форм одного и того же паттерна. Прототип позволяет нам распознавать образ, даже если он не идентичен прототипу, а только похож на него. Так, мы распознаем различные написания буквы "А" не потому, что они точно подходят к некоторой ячейке памяти, а потому, что члены класса "А" обладают некоторыми общими чертами.
Экспериментальные исследования, направленные на подтверждение теории прототипов как средства распознавания образов, часто обращались к вопросу о том, как формируются прототипы и как обеспечивается быстрая классификация новых паттернов. Этот вопрос не нов; он беспокоил епископа Беркли (Berkeley) еще много лет назад:
"Перед его мысленным взором все изображения треугольников обладали весьма конкретными свойствами. Они были или равносторонними, или равнобедренными, или прямоугольными треугольниками, и он напрасно искал мысленный образ "универсального треугольника". Хотя то, что мы имеем в виду под треугольником, легко определяется вербально, совсем не ясно, как выглядит "совершенный" треугольник. Мы видим множество самых, разнообразных треугольников; что же из всего этого множества мы создаем в своих, мыслях, как основу для опознания треугольника?" (Цит по: Calfee, 1975, р.222).
Воображаемая Одиссея Беркли о "совершенном" треугольнике растянулась на несколько столетий и, наконец, стала предметом эмпирического исследования в эксперименте, который сам стал для многих прототипом (Posner, Goldsmith, and Weiten, 1967). Эти ученые нашли прототип треугольника (и других фигур), а затем измеряли время реакции испытуемых на другие фигуры, в чем-то подобные прототипу. В первой части эксперимента они разработали серию прототипов (Рис.3.8) путем
Распознавание nammef.
•f I Случайный _ Г^^1:^УЖи
ук^л^ча у'-у ^J'"" «г '^-''- -- ' '•ъ;**>~ь,'з& 'M«-Л«<•/- Л-* <• Л-'*' ч<» •
Достарыңызбен бөлісу: |