Когнитивная психология тривоас! Москва, 1996 ббк88 C60



бет48/60
Дата18.07.2016
өлшемі4.9 Mb.
#208377
1   ...   44   45   46   47   48   49   50   51   ...   60

Колш1»1ат*ризо0сш1*0*

t:

ж



ii

Том Харрингтон, Дениза Квон

Подобно Нарциссу, восхищавшемуся своей собственной красотой, человек с тоской гля­дит в нечто вроде интеллектуального увели­чительного стекла и отходит со словами "Да, ты действительно самый разумный из них всех'" Наш мозг в 10 биллионов раз менее эффективен энергетически, чем теоретически он мог бы быть, и его клетки реагируют в ты­сячи раз медленнее, чем ячейки цифрового ком­пьютера, и тем не менее он продолжает нахо­диться под нарциссическим впечатлением от своей собственной работы, обычно относя все недостатки на счет своей огромной сложнос­ти В 1968 году мозг Джона Кемени, заметивг что между ним самим и машиной нет суще ственной разницы, сделал утверждение, пока­завшееся в то время здравым "Даже на базе транзисторов конструктивные трудности едва ли позволят сделать4 машину более, чем из мил­лиона частей Так что мы можем свободно сказать, что человеческий мозг надолго оста­нется примерно в 10000 раз более сложным, чем самые сложные машины "

С тех пор компьютеры развились неверо­ятно Но мозг по генетическим причинам зас­трял на обочине интеллектуальной дороги, по­скольку он мутирует медленно К счастью, наши когнитивные способности не застряли вместе с ним Каждый день мы встраиваем в компьюте­ры новые мутации, и, навязывая им наше соб­ственное направление естественного отбора, раз­виваем "мыслительную" силу человека

Как может компьютер практически конку­рировать с нами? Лучше сначала спросить, а смог бы компьютер хранить и обрабатывать то количество информации, какое мы сами вос­принимаем Насколько это много? Информа­цию, воспринимаемую нами за одно мгнове­ние текущей зрительной сцены, можно оце­нить, исходя из интенсивности, с которой этот мир стимулирует каждую из ваших 250,000,000 палочек и колбочек При наличии 100 возмож­ных уровней интенсивности стимуляции каж­дой из них мы получим достаточно верное повторение воспринимаемого мира, так что для каждой колбочки или палочки нам пришлось бы записать по две цифры Это составило бы 2x250,000,000 единиц информации — те сред­няя ванная комната, заполненная перфокар­тами Обновляя стимульную зрительную сце­ну 100 раз в секунду на протяжении ста лет жизни, мы бы оказались затопленными в та­ком количестве зрительной информации, ка­кого хватило бы, чтобы заполнить перфокар­тами куб с ребром в 34 километра Компью­терная память такого объема оказалась бы без-

надежной, как это случилось в 1968 году, но тусклый свет надежды идет к нам из 1926 года, когда Эмануэль Голдберг смог записать на мик­рофильме буквы величиной в один микрон, такая плотность означает, что на большой по­чтовой марке можно расположить 50 Библий При такой записи информацию наш столет­ний опыт зрительного восприятия уместился бы в кубе из марок с ребром в 20 метров Объемные голограммы имеют более легкий до­ступ и гораздо большую плотность Но если бы мы могли хранить информацию так, как это делает природа, jam зрительный опыт за 100 лет смог бы уместиться в кубике с ребром в 1мм — с булавочную головку Генетическая информация, необходимая для воссоздания лю­бого человека, живущего в Соединенных Шта­тах, и хранимая в виде 4-битового РНК-кода уместилась бы в слое над одним ногтем

В таком случае хранение информации, пре­вышающей по объему все, что когда-либо мог собрать мозг, кажется легким, но как быть с обработкой, воспроизведением и передачей? Такие компоненты, как макромолекулярные транзисторы и оптические компьютеры на трансфазерах и технология производства оп­тики с сопряжением фазы скоро превзойдут все, что имеется сегодня Компьютеры будут более плотными, и в них, возможно, не будет проводов, а только световые лучи, которые могут проходить друг сквозь друга И они бу­дут способны обрабатывать целые поля опти­ческой информации и мгновенно формировать с ней ассоциации, избегая в некотором смыс­ле необходимости в интерактивных соедини­телях, имеющихся в мозге Такие компьютеры легко превзойдут мозг

Как насчет передачи информации? Новые оптические зеркала с сопряжением фазы по­зволят нам посылать трехмерные набитые ин­формацией голограммы по отдельным стеклян­ным волокнам Физики говорят, что по одно­му стеклянному волокну теоретически возмож­но транслировать продолжительный зрительный входной сигнал от примерно 10000 абонентов

Видимо, в неполноценности мозга нет со­мнений Даже по сравнению с существующи­ми машинами он по многим параметрам выг­лядит, как игрушка Нам только нужно поболь­ше людей (и компьютеров), чтобы писать гиб­кие и тщательно разработанные программы, или сделать специальные компьютеры, кото­рые сами были бы своей программой

Поэтому спросим, а хорошо ли умеет мозг думать? Если мы нарисуем длинную ось, от­меряющую сложность мышления, то похоже, что мы все-таки сможем поместить себя на ней хоть на бит повыше абака Может ли абак мыслить? Наверно, нам лучше думать, что да

Этот спор далек от завершения, и некоторые, видимо, находят опреде­ленную ценность в его философской глубине. Однако, для меня этот спор не разрешен (на самом деле, он, вероятно, неразрешим!). Кроме того, оба лагеря ужесточили свои позиции и выдвигают скорее аргументы веры, чем разума. Для такой книги, как эта, его важность двояка: во-первых, он заставляет читателя глубоко задуматься о том "человеческом", что зак­лючено в человеческом познании. Во-вторых, в связи с этим спором вста­ет вопрос, до какого предела ИИ может имитировать человеческий интел­лект. Страсти, разгоревшиеся вокруг "теста Тюринга" и "китайской ком­наты" у обеих сторон, отражают сильную заинтересованность современ­ных философов и специалистов по ИИ в отношении электронного джина, выпущенного из бутылки.



Какого рода компьютером является человек?

Более функциональный подход, помещающий ИИ на когнитивную почву, предложил Ирл Хант (Earl Hunt, 1971); он поставил вопрос: "Какого рода компьютером является человек?" Исходя из того, что между обработкой информации человеком и компьютерной системой действительно суще­ствует аналогия, Хант предпринял грандиозную задачу описать компью­терную систему, которая "мыслит как человек". Фундаментальное поло­жение его системы, названной им моделью распределенной памяти, гла­сит, что мозг имеет несколько зон памяти, назначение которых — регули­ровать поток информации из окружения так, чтобы информация могла кодироваться в терминах прошлого опыта. В основной структуре этой модели, изображенной (в модифицированном виде) на Рис. 15.1, информа­ция из окружения проходит через ряд буферных памятей и поступает в КП, или сознательную память.

Как показано на рисунке, одновременно может обрабатываться более, чем один сенсорный канал. Буфферная обработка служит для преобразо­вания сообщений в постепенно более значимые единицы. Это можно про­иллюстрировать на примере чтения, где сначала различаются признаки (в ранних буферах), затем буквы и, наконец, слова; единственный сознатель­ный процесс (у опытного читателя) — это собственно чтение слов. Цент­ральная роль в этом процессе принадлежит ДП, в которой информация хранится постоянно. Кодирование сырой информации и ее перекодирова­ние на более высоких уровнях происходит под управлением КП. Вербаль­ная информация, достигающая КП, интерпретируется в значимый семан­тический код, хранимый в промежуточной памяти (ПП). Этот семантичес­кий код сохраняет непосредственный опыт, так что мы можем изучать его дальше, извлекая из него информацию и интерпретируя ее. Общая архи­тектура этой системы, как отмечает сам Хант, носит поразительное сход­ство с некоторыми из моделей памяти, с которыми мы встречались в Гла­ве 5 — особенно с моделью Аткинсона и Шифрина.

Таким образом, модель Ханта может служить руководством по конст­руированию моделей переработки информации у человека, причем для имитации конкретных когнитивных функций проектируются конкретные компьютерные программы. Возможно, что основным результатом процес­са моделирования является возможность испытать наши знания о когни­тивной природе человека. Компьютерные программы, которым не удается точно смоделировать человеческое познание (и часто это так и есть) мо-



Мышление и интеллект - естественный и искусственный 502



Рис. 15.1. Мо­дель распреде­ленной памяти. Адаптировано из: Hunt (1973).

гут иметь большее значение для определения единственно человеческих свойств человеческого познания, чем некоторые преуспевающие программы. До сих пор мы в общем наметили сферу ИИ и познакомились с посту­латом человеческого познания, на основе которого можно^ осуществлять компьютерное моделирование. В следующем разделе мы разберем некото­рые конкретные возможности компьютера. Развитие этих конкретных функций в модели на основе информационного подхода примерно соответ­ствует потоку информации от восприятия к распознаванию паттернов и высшим формам познания.



Восприятие и искусственный интеллект

Человек обладает обширными способностями к восприятию мира. Когда я разглядываю свой кабинет и выглядываю в окно, мой взгляд захватывает сотни объектов: книги на полке, телефон, пара стульев, картотека, скуль­птура совы, набор фотографий, самовар, стопка бумаг, псевдоготическая конструкция, анемометр наверху соседнего здания, заснеженные верши­ны гор, настойчиво приглашающие автора забросить на день-другой напи­сание книги и отправиться покататься на лыжах, —каждый из них я могу немедленно распознать и классифицировать. Не менее интересна челове­ческая способность видеть, слышать, обонять и чувствовать на вкус мири­ады вещей. И все же этот перцептивный этап обработки информации, получаемый нами как дар, для компьютера составляет потрясающе слож­ную проблему.

Наоми Вайсштейн (Naomi Weisstein, 1973) описал трудность, с кото­рой встречается гипотетический компьютер при выполнении элементар­ной задачи на восприятие: найти часы, считать время и сказать его нам— детская забава, но для компьютера она оказывается чрезвычайно сложной:

"Предположим, компьютер имеет сетчатку из 104 х 104 фотоэлементов. Сразу становится очевидным, что если мы дадим компьютеру список состояний, соответствующих часам, то список поиска для компьютера окажется бесконечным. По мере приближения компьютера к часам, их размер будет меняться;



Искусственный интеллект 503

следовательно, каждый шаг к часам будет... {приводить} к новому распределению {стимулов}... Но даже если бы эту проблему удалось решить, часы были бы любой величины и формы: современные часы "солнечные вспышки", цифровые часы, красные полоски, бегущие вокруг шестнадцатиугольного блока и т.д. Перечислить все возможные формы и величины часов или даже все возможные стандартные их формы и величины просто невозможно. И все же, большинство людей как правило справляется с задачей на опознание в пределах, скажем, 15 минут безо всяких трудностей'1.

Какие перцептивные способности используют люди при решении этой простой задачи, вызывающей такие трудности у компьютера? Здравый смысл подсказывает, что человек поступает разумно и организует поиск часов с применением своих знаний об окружении. Возможно, наш поиск органи­зован неким иерархическом способом, когда сначала осматриваются мес­та, где часы были замечены в прошлом, а если бы их там не оказалось, мы бы искали их в более скрытых местах. Обычно часы находятся на стене, а не под столом, и наше знание окружения направляет поиск.

Кроме стратегии поиска у человека есть система описания свойств часов: их движения, цифровых характеристик и т.д. Кроме того, для под­ражания человеческому познанию необходимо понимание назначения ча­сов и абстрактной природы времени. Кто-то может подумать, что после того, как паттерн опознан, считывание времени — это уже простейшая часть задачи. Все, что требуется 'от компьютера,— это просканировать и интерпретировать цифровые характеристики, определить положение этих паттернов в памяти и доложить: "2:12". А может, это было "14:12"? Боль­шинство людей на это отвечают немедленно, но для такого ответа требу­ется дополнительная информация о мире — день или ночь на дворе? Это нетривиальная задача, но нельзя ли ее свести к нескольким более про­стым и затем сконструировать робота по этим наметкам? Возможно, так, и в следующем разделе мы обратимся к некоторым конкретным перцеп­тивным вопросам, поднятым в связи с задачей Вайсштейна.

Восприятие человека инициируется внешними сигналами, состоящими из света, звука, молекулярных соединений и давления. Эти сигналы обна­руживаются органами чувств и преобразуются (конвертируются в нервную энергию) в сообщения, понимаемые мозгом. Количество информации, дос­тупной органам чувств, огромно; одна только зрительная система может передавать в мозг 4.3х106 бит информации в секунду. Фейгенбаум (Fe­igenbaum, 1967) предполагает, что некоторые периферийные устройства, иногда называемые периферической системой памяти, действуют подобно сенсорному буферу, предохраняющему мозг от переполнения потоком вте­кающей в него информации.

Как построить машину, способную подражать этому перцептивному, механизму? Логично было бы разработать что-то способное чувствовать. Один такой подход можно найти в работе по компьютерным распознаю­щим системам.5



5Многие из ранних исследований этого типа руководствовались практически­ми задачами (например, как сделать устройство, считывающее цифровой код на чеках) и как таковые были слабо связаны с проблемой аналогии ИИ с человеком; здесь этот пример приводится для иллюстрации некоторых воз­можностей существующих систем компьютерного "восприятия".

Мышление и интеллект - естественный и искусственный 504

Один из способов научить компьютеры распознавать геометрические фор­мы путем анализа логических признаков — это использовать принцип, что сложные геометрические формы состоят из простых. В этой программе использован ряд небольших "матриц", которые систематически проходят через каждый объект в поисках соответствия. Пример "матрицы" и иден­тифицируемого геометрического объекта показан на Рис. 15.2. Матрица сделана из двух типов сенсоров — позитивного и негативного; присут­ствует, отсутствует — это единственный сигнал, подаваемый такой ячей­кой, или подразделением матрицы. Изображенная матрица содержит толь­ко шесть ячеек — три "минуса" и три "плюса", и, судя по расположению этих компонентов (все "отрицательные" элементы расположены слева), вроде бы, подходит для идентификации левого края объекта. Помещение матрицы ее средней линией над левым краем куба привело бы к полному соответствию. На углу соответствие было бы плохим, а на нижнем краю, где плюс и минус отменяют друг друга, соответствия не будет. Хотя эта эвристика в наибольшей степени ориентирована на возможности машин, она не расходится с результатами изучения восприятия у животных и человека. Ранее в этой главе (и в Главе 3) мы узнали, что психофизиоло­гам удалось найти детекторы линий в клетках коры у кошек и, хотя эти данные не полностью подтверждены, похоже, что у человека также име­ются детекторы края.

Трудность с вышеприведенной системой состоит в том, что для распоз­навания даже простых паттернов нужно большое количество матриц (на­пример, детектор левой кромки, детектор правой кромки). Также пробле­матична "добротность" стимула; большинство геометрических форм (осо­бенно в реальном мире) могут иметь резкие или расплывчатые края, яр­кие или тусклые края. Распознавание паттернов путем распознавания линий можно сильно упростить, если распознаваемую форму сначала преобразо­вать в образ, состоящий только из линий, и затем использовать матрицы для определения ориентации этих линий.

Распознава­ние линий

Системы распознавания паттернов обычно имеют дело со зрительным ма­териалом. Как правило, воспринимающие устройства у таких систем име­ют растр, или матрицу из фотоэлементов, реагирующих на свет. Обычно эти фотоэлементы имеют только два состояния — включено и выключено (для "белого" и "черного"). Рассмотрим элементарную задачу идентифи­кации цифры. На Рис. 15.3 показано, как цифры можно преобразовать в



Распознава­ние паттер­нов

Матрица


Плохое соответствие



Соответствие отсутствует



Рис. 15.2. Обнаружение левого края посредством шестиэлементной матри­цы. Знаки *+" и "-" указы­вают элементы, реагиру­ющие на условия "присут­ствует" и 'отсутствует* со­ответственно. Адаптиро­вано из: Raphael (1976).

Искусственный интеллект 505

двоичный код — 0, или выключено для "черного", и /, или включено — для "белого". Компьютер считывает каждую цифру (т.е. фотоэлементы — один для каждого квадрата сетки, накладываемой на число, — "ощущает" световые зоны, т.е. те, что не заняты числом), исходя из того, насколько данный цифровой код совпадает с матрицей, хранящейся в памяти компь­ютера. Это работает очень хорошо — если все буквы одной формы, одина­ково расположены и не уменьшены,— и такие устройства широко приме­няются в американской промышленности и государственной почтовой служ­бе. Но когда дело доходит до чтения рукописных писем, присланных для тети Иолы, у оптических сканирующих устройств начинаются разные труд­ности. Однако, судя по всему, быстро разрабатываются системы для "чте­ния" даже и рукописных текстов.



Идентификация букв и слов средствами ИИ представляет не только практическую проблему, она также имеет значение для тех ученых, кого интересует процесс анализа информации человеком. Многое из того, что известно об идентификации человеком букв и слов, обсуждалось в Гла­ве 10 Эти знания помогают разрабатывать компьютерные программы, ими­тирующие этот процесс. Плодотворный отчет по этой теме, послуживший руководством для последующих исследований, представили Селфридж и Нейсер (Selfridge and Neisser, 1963). Только что описанная общая проце­дура "восприятия буквы" потребовала бы огромной компьютерной памяти (для хранения матрицы каждого нового варианта каждой буквы) или не

Рис. 15.3. Двоич­ное представле­ние (колонка в центре! букв (ко­лонка слева) Ну­ли показывают выключено или "черный", едини­цы — включено или "белый". В правой колонке изображено, как выглядели бы циф­ры при считыва­нии их сканером Адаптировано из Raphael (1976)







0 0

0

0

0

0

0

0

0 0

0 0

0

0

1

1

Û

0

0 0

0 0

0

1

1

1

1

0

0 0

0 0

0

1

0

0

1

0

00

0 0

0

1

0

0

1

0

0 0

0 0

0

1

1

1

1

0

0 0

0 0

1

1

0

0

1

1

0 0

00

1

0

0

0

0

1

0 0

0 0

0

0

0

0

0

0

0 0

0 0

0

0

0

0

0

0

0 0





s „. <: ^

*• v'***

? У

t) Û

и

0

0

15

0

0

Û 0

0 0

1

1

1

1

1

1

Ü 0

0 0

0

0

1

1

0

Û

0 0

0 0

0

0

1

1

0

0

0 0

0 0

0

0

1

1

0

0

0 0

0 0

0

0

1

1

0

0

0 0

0 0

0

0

1

1

0

0

0 0

00

0

0

1

1

0

0

0 0

0 0

0

0

0

0

0

0

0 0

0 0

0

0

0

0

0

0

0 0

4 '. **i

Л» *

TfTS

0

о

0

о

0

^

0 0

0 0

0

0

0

0

0

0

0 0

0 0

0

0

1

1

0

0

0 0

0 0

0

1

0

0

1

0

0 0

00

1

0

0

0

0

1

00

0 0

1

0

0

0

0

1

0 0

0 0

0

1

0

0

1

0

0 0

0 0

0

0

1

1

0

0

0 0

0 0

0

0

0

0

0

0

0 0

0 0

0

0

0

0

0

0

0 0



Мышление и интеллект - естественный и искусственный 506

смогла бы обнаруживать многие встречающиеся в действительности фор­мы букв (Рис. 15.4).

Нужен был более "хитрый" подход, и Селфридж и Нейсер предложили анализировать буквы по их "деталям".6 Возьмем, например, букву А. Чем помещать все типы написаний буквы А в память компьютера и проводить с ними операции поиска и сравнения, мы можем написать для компьютера программу, которая будет изучать каждую из составляющих букву дета­лей, проверять их наличие или отсутствие и принимать решение о том, какая это может быть буква. Для этого есть два фундаментально различ­ных способа — модель последовательной переработки и модель парал­лельной переработки. В модели последовательной переработки каждая деталь изучается заранее определенным пошаговым способом, и резуль­тат каждого теста определяет следующий шаг в программе. Пример про­граммы последовательной обработки показан на Рис. 15.5 слева. Эта про­стая программа оценивает всего три детали, спрашивая: Есть ли у предъяв­ленной фигуры кривизна наверху (например, H, U, Y, V), пересечение (например, H, F) и вертикальная линия (В, Y, T, R, P, H)? При постепен­ном процессе каждый из этих вопросов задается по порядку. Для рассмот­ренного набора букв (А, Н, V и Y) простое решение "Да" или "Нет"— это все, что необходимо для идентификации каждой буквы. Например, если предъявлена для опознания буква А, то, чтобы отделить эту букву от других букв рассматриваемого набора, надо только ответить отрицательно на первый вопрос (Есть ли кривизна наверху?). Остальные вопросы слу­жат для различения между собой остальных букв этого набора.

Юбсуждение подетальной идентификации см. в Главе 10.








Достарыңызбен бөлісу:
1   ...   44   45   46   47   48   49   50   51   ...   60




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет