Рис. 15.4. Типичные случаи неудачного обнаружения. В случае "А" матрица (открытая буква) не находит соответствия, когда неизвестная буква (темная) имеет неправильную величину, ориентацию или положение; в случае "В" неверное сопоставление происходит даже когда образец был приведен к стандартной величине и ориентации. Здесь матрице А больше соответствует буква R, чем закругленные или с другим наклоном образцы буквы А. Взято из: Selfrodge and Neisser (Т 963).
В
Искусственный интеллект 507
В модели параллельной обработки тестовые детали те же самые, что и в модели последовательной обработки, но все они применяются не шаг за шагом, а одновременно (Рис 15 5 справа) Это "адская" модель в том плане, что для каждой детали есть свой "демон", принимающий решение и реагирующий на входной стимул согласно своему конкретному виду чувствительности
Возможно, наибольшая неудача этой ранней модели — это ее слепота к "критическим деталям" и влияниям контекста Первый из этих недостатков особенно существенней, поскольку различение "критических деталей" — это отличительная особенность распознавания паттернов человеком При отличении G от С или Q от О, например, критическая деталь — это почти незаметная небольшая линия Неважно, насколько преобладает заметность других деталей, для человеческой обработки они не перевешивают важность критической детали Второй пункт критики этой ранней модели в том, что она нечувствительна к влиянию контекста при идентификации отдельных букв Наши обширные знания орфографии и структуры предложения оказывают нам при идентификации букв неоценимую помощь Чтение рукописного текста — как в указанном случае — было бы почти невозможно, если бы читающий не привносил в ситуацию изрядное количество собственной информации Чтобы заставить машину действовать при обработке информации подобно человеку, следует принять в расчет этот важный параметр
А теперь мы рассмотрим несколько примеров того, как идентифицируются паттерны более сложные, чем просто буквы
Рис. 15.5. Алгоритмы последовательной {слева) и параллельной (справа) обработки для различения букв А, И, У и Y путем использования трех тестовых картинок При последовательной обработке каждый последующий этап определяется выходной информацией предыдущего, при параллельной обработке все тесты применяются одновременно, и решение принимается на основании объединения их выходных данных Адаптировано из Se If ridge and N-eisserjl963)
Мышление и интеллект - естественный и искусственный 508
В качестве примера распознавания других паттернов обратимся к идентификации треугольника7 На рисунке 15 6 изображены несколько треугольников, каждый из которых человек может немедленно опознать и классифицировать как таковой Если прототип "треугольности", хранимый в программе компьютера, соответствует "правильной" матрице треугольника (а), тогда треугольники (Ь) и (с), если их правильно повернуть и скорректировать по величине, можно будет легко распознать, однако, треугольники (d) и (е) вызывают проблемы, особенно те, что на (е) — их можно идентифицировать только в результате "хорошего гештальта", но не по тому, что они состоят из трех прямых линий
Наша способность немедленно распознавать каждую из этих фигур как треугольник объясняется обширным опытом восприятия других треугольных объектов, абстрактное представление о треугольности достаточно широко, чтобы позволить нам опознать эти треугольники именно как треугольники, хотя мы их никогда не видели Может ли компьютер выучить это понятие? Возможно, но такой механизм поиска необходимо будет более сложным, чем единичная операция сопоставления, такая, как в машине, считывающей номер с чека Вместо этого стоило бы подумать о программе поиска, распознающей детали треугольника (как в программе распознавания букв Селфриджа-Нейсера) Тогда такие детали, или атрибуты, как углы, линии, форма, количество объектов и т д хранились бы в компьютерной памяти, точно так же как в нашей памяти хранится каталог этих атрибутов треугольника
Программы последнего типа, более близкие интересам когнитивной психологии, разрабатывали Гузман и Винстон (Gusman, 1968, Winston, 1970, 1973, 1984) Эти программы отличались от более ранних тем, что
Распознавание сложных фигур
7О том, как человек формирует понятие о треугольности см в Главе 13
Рис. 15.6. "Хорошие" (A-DJ и "проблематичные" (Е) треугольники Первые отличаются только по величине, ориентации и отношению сторон, у последних нет обычных прямолинейных сторон, но их все же можно опознать как треугольники
Искусственный интеллект 509
они не требовали хранения описаний тех форм, которые компьютеру предстояло распознавать, а основывались на соотношении частей трехмерных геометрических объектов
г
"Квалифицированное" зрительное восприятие у машин
Если бы мы могли видеть только те объекты, видеть которые были запрограммированы машины, описанные вплоть до этого момента, наши дела были бы плохи Основная проблема в том, что интеллект компьютеров, вежливо выражаясь, ограничен Люди "видят" мозгом столько же, сколько и глазами, эта мысль является основной темой этой книги Умение воспринимать базируется на частом опыте восприятия объектов и событий Опытный дизайнер по интерьерам способен разглядеть тончайшие нюансы цвета, или текстуры, или формы, к которым неспециалист слеп Тот же самый принцип, видимо, действует и в отношении других сенсорных модальностей (например, у профессиональных дегустаторов, музыкальных критиков, дегустаторов косметики и специалистов по мехам) Можно ли научить машину выполнять те же самые — или хотя бы сходные — функции?
Одна из очень практических функций, выполняемых человеком,— это обнаружение дефектов продукции Бесчисленные часы проводят наши друзья рабочие, изучая, правильно ли прилеплены этикетки на бутылках с пивом, или проверяя электролампочки, или ботинки, или печатные платы на предмет дефектов Люди не особенно хорошо справляются с такой работой не потому, что она превышает интеллект человека, но потому что она им быстро наскучивает, и они начинают допускать ошибки Скука не относится к характеристикам систем ИИ, они могут работать беспрестанно и не жалуются Может быть, квалифицированное человеческое восприятие, повторяющиеся действия — это именно то, что хорошо делает компьютер
Для обнаружения отклонений и принятия простых решений о качестве продукта было разработано много успешных программ с использованием компьютеров Примером работ по ИИ, проводимых в этой области, является программа, выполненная Тибадо (Thibadeau, 1985) в Институте Робр-тотехники, являющемся филиалом Университета Карнеги-Мелона Это не просто задача "зрительного обнаружения" (можно использовать оптику гораздо более чувствительную, чем человеческий глаз), а задача интерпретации обнаруженного паттерна как приемлемого или неприемлемого
В одном из проектов Тибадо занимался построением прибора для автоматической проверки, способном принимать разумные решения о качестве печатных плат На Рис 15 7 можно видеть сильно увеличенные изображения некоторых типов дефектов в проводниках печатных плат На части (а) этого рисунка изображен "обрыв" проводника, на части (Ь) — "короткое замыкание", а на части (с) — "щербинка"
Выявление такого брака человеком занимает много времени, дорого стоит и несовершенно, тогда как машины в этой сфере как минимум быстрее, дешевле и точнее Пока что они еще несовершенны, и именно к этому вопросу обратился Тибадо Первым этапом разработки лучшего ИИ прибора было составление списка видов брака, определяемых по стандартам, установленным инженерами Каталог этих ошибок включал сотни изображений, сходных с показанными на Рис 15 7 Следующим этапом было выяснить, на что обращают внимание инженеры, когда рассматрива-
Мышление и интеллект - естественный и искусственный 510
ют печатную плату В результате этот исследователь заинтересовался созданием методики, при которой инженеров просили описать эти изображения путем оценки их по отношению к системе отсчета
Одна система отсчета была установлена, когда инженеров просили сказать о том, "что вызвало данный дефект", и оценить уверенность в своей субъективной оценке по десятибалльной шкале Затем этих испытуемых просили сказать, какие части изображения привели их к такому решению и достаточно ли было этого изображения для вывода Наконец, в результате проведенной инженерами сортировки изображений дефектных соединений на категории была составлена определенная систематизация Данные этих наблюдений, отражающие некоторую точку зрения (о том, что вызвало данный дефект), использовались затем как часть базы данных компьютера, с тем, чтобы он принимал более разумные решения Совершенная оценка зрительных паттернов может потребовать многих систем отсчета
Такие разработки занимают в ИИ важное место В них с целью изготовления инструмента, способного "видеть" и принимать решения, сочетается применение некоторых способов принятия решения о зрительных стимулах, свойственных человеку, с превосходными возможностями ска-Рис. 15.7. Некоторые частые типы дефектов печатных плат Перепечатано с разрешения из 1984 Annual Research Review
Обрыв
Пример печатной платы
Короткое замыкание
Щербинка
Искусственный интеллект 511
нирования и скоростью вычислений, свойственных оптическим сканирующим устройствам и компьютерам Способен или нет компьютер видеть своим мозгом — это еще предстоит решать в будущем, но как минимум некоторые из деталей "мозга" теперь можно встроить в разумные машины
Перцептивная сторона ИИ выросла от сравнения фигур с матрицами до заучивания структурных признаков и отношений между ними Эти последние шаги не решают проблему Вайсштейна и не заполняют все ячейки в системе периферической памяти Ханта, но идут в верном направлении
Наша способность видеть и распознавать бесконечные знаки этого мира остается исключительно человеческим даром, но способность компьютера видеть и распознавать ограниченное, хотя и растущее количество довольно сложных зрительных паттернов, быстро развивается Если говорить очень строго, то компьютерные процедуры кодирования преобразуют яр-костные градации в двоичные коды, эти коды делаются значимыми путем соединения их так, чтобы это соответствовало общему знанию о зрительных стимулах Разработка машины, которая могла бы хранить прошлую информацию о мире и применять эти воспоминания при абстрагировании значений из перцептов,— это грандиозная задача для совместных усилий специалистов по ИИ и когнитивной психологии Значительная часть остальных разделов этой главы будет посвящена описанию этого предприятия
Память и искусственный интеллект
В когнитивной психологии памяти человека уделено значительное внимание, и хотя наши знания о памяти далеко не полны, некоторые устойчивые и хорошо определенные структуры начинают приобретать отчетливые очертания Некоторые из них обсуждались в средней части этой книги Стремление построить машину, способную хотя бы частично повторить удивительный феномен человеческой памяти, может одним казаться глупостью, а другим — бессмертной идеей, поскольку, как справедливо утверждают некоторые, электронная система памяти фундаментально отличается от органической Различия между компьютером и мозгом наиболее заметны в их устройстве компьютер собран из немыслимого количества электронных элементов — разъемов, переключателей, резисторов, конденсаторов, транзисторов, микросхем, тогда как мозг человека состоит из миллиардов нейронов, сложной сети капилляров, химических ионов в постоянном потоке метаболических и катаболических процессов
Утверждать, что человеческую память никогда не удастся повторить на компьютере по причине фундаментального различия между физической природой компьютера и мозга, это значит не понимать суть ИИ Конечно, мозг и компьютер материально различны Однако некоторые биологи пытаются создать живую клетку, и по идее могут прийти к созданию сложных клеток, а в конечном итоге и к созданию бионического существа В настоящее время к размышлениям о биологически синтезированной человеческой памяти лучше относиться как к научной фантастике Выглядит малоправдоподобным, чтобы нам удалось точно определить атрибуты и функции человеческой памяти и смоделировать эти свойства в машине Хотя компьютерная память все еще сильно отличается от человеческой, есть некоторые полезные сходства, определив которые мы смогли
Мышление и интеллект - естественный и искусственный 512
бы лучше понять и то, и другое Эти сходства заключаются в наличии активной и пассивной систем памяти, элементов памяти, центрального процессора, путей воспроизведения, адресуемой по содержанию памяти и многого другого, указывающего на все возрастающую роль компьютерной метафоры в понимании человеческой памяти и познания
Система памяти человека способна хранить, обрабатывать и воспроизводить информацию Виноград (Winograd, 1975) описывает несколько взглядов на аналогию между памятью человека и компьютерной системой В первой из его моделей (Рис 15 8) память представлена в виде набора независимых элементов, управляемых центральным процессором, который вызывает конкретную информацию из памяти, а конкретную входную информацию кодирует в ячейках памяти Если ваша тетя Глэдис вышла замуж за Лайла, этот факт будет храниться в некотором элементе памяти Когда вас просят воспроизвести этот факт, центральный процессор исследует содержание отдельного элемента памяти Этот процесс включает как "поиск", так и "активную обработку сообщения" Вообще, при поиске центральный процессор изучает содержание отдельной единицы памяти по определенной системе, а при активной обработке "каждый элемент памяти вправе производить над сообщением, посылаемым к элементам памяти, свои собственные вычисления, и каждый элемент может решать независимо, какие действия следует предпринять" (Winograd, 1975, p 144) Такая активная обработка сходна с ассоциативной памятью человека (Глава 7 — Андерсон и Бауэр), где конкретные элементы памяти связаны с другими элементами в единую сеть
Как поиск, так и активная обработка в компьютере могут осуществляться несколькими способами, каждый из которых зависит от предположений о том, как информация хранится в памяти Простейшие компьютерные "воспоминания" основаны на пассивной системе, тогда как в общем более сложные "воспоминания" основываются на активной системе
В пассивной системе памяти отдельные элементы хранятся в определен- Пассивная
ном месте, так же как вы храните письмо в отделении письменного стола система
или в почтовом ящике Такое "хранилище писем" хранит запомненный цОМЯТИ элемент и при запросе (когда центральный процессор решает, в какое
Входные Выходные сигналы сигналы
I памяти )
V^-'-v^--\
ч
|
à
г
|
|
Центральный процессор
|
/
|
|
\
|
Рис. 15.8. Модель памяти человека, построенная по аналогии с компьютерной системой Адаптировано из Winograd (1975)
Искусственный интеллект 513
отделение обратиться) воспроизводит его содержание В пассивной системе организация элементов памяти и доступ к ним могут осуществляться в последовательном или произвольном порядке
Последовательный доступ в пассивной памяти осуществляется примерно так же, как доступ к материалу, записанному на магнитной ленте (Рис 15 9) Предположим, что на ленте записано несколько песен, чтобы найти нужный фрагмент, вы перематываете ленту вперед и назад Время, которое потребуется, чтобы воспроизвести конкретную песню, будет зависеть от длины ленты и от того, где эта песня начинается Если лента очень большая, на поиск может уйти много времени и вообще время воспроизведения в системах с последовательным доступом линейно возрастает с количеством хранимой информации
При более сложном, произвольном доступе воспроизведение из памяти осуществляется посредством системы, которая определяет адрес конкретного элемента в памяти Этот принцип позволяет избежать расточительного по времени процесса прохождения через нетребуемую информацию, совершаемого при последовательном доступе В модели с произвольным доступом, изображенной на Рис 15 10, от центрального процессора посылается сообщение в декодер адресов, который затем зондирует конкретную ячейку памяти, и та высылает свою информацию Такая система в принципе аналогична библиотечной системе Чтобы найти конкретную книгу, вам нужно только найти ее "адрес" в карточном каталоге При этом доступ значительно облегчается вы просто извлекаете книгу по ее адресу Такая процедура компьютерного поиска имеет только отдаленное сходство с тем, как человек ищет элементы в памяти, поскольку в памяти человека бо'льшая часть информации хранится в виде связанной сети, а не в изолированных отделениях
Системы Система активной памяти основана на идее связывания элементов памя-
активной ти в единую сеть Когда вы активируете элемент в памяти, информация
памяти некоторым образом обрабатывается и затем передается дальше, к другим
частям системы памяти Воспроизведение информации из системы активной памяти может принимать очень разные формы, наиболее простая из которых называется доступ, адресуемый по содержанию В такой системе компьютерной памяти (Рис 15 11) все элементы памяти сообщаются с центральным процессором (не друг с другом, как в более сложных моделях) Эта модель напоминает модель с произвольным доступом в том отношении, что для доступа к памяти в ней используются определенные описания или индексы зондирования памяти Описывая модель произвольного доступа, мы приводили в качестве примера воспроизведение'книги Если вызывается конкретная информация (например, цвет яиц некоторой птицы) в модели памяти, адресуемой по содержанию, центральный процессор высылает описание требуемых данных в каждый элемент памяти, если соответствующие данные содержатся в некотором элементе, они отсылаются обратно в центральный процессор Вместо того, чтобы связывать каждый элемент памяти непосредственно с центральным процессором, используется более экономичная организация, которая называется шина Шина собирает информацию со всех ячеек и передает ее назад в центральный процессор Система памяти с адресацией по содержанию способна справляться со сложной и в некоторых случаях с неоднозначной информа-
Мышление и интеллект - естественный и искусственный 514
Элемент помята
Э/гемент
Элемент
Элемент памяти
Элемент
Элемент памяти
Элемент памяти
Рис. 15.9. Модель последовательного доступа в пассивной9 памяти Адаптировано из Wmograd(1976)
8В оригинале ошибочно названа "последовательная" па мять — Прим перев
Рис. 15.10. Модель произвольного доступа в пассивной памяти Адаптировано из Wmograd (1976)
Искусственный интеллект \ 515
цией. Например, в разделе этой главы, посвященном распознаванию паттернов, мы говорили о сложности создания системы ИИ, способной различать буквы, имеющие общие детали (например А и R). Система с адресацией по содержанию могла бы справиться с такой задачей путем опроса содержания нескольких элементов памяти. Если информация о деталях опознаваемых букв хранится в различных ячейках памяти, то когда компоненты буквы (скажем, буквы А) высылаются центральным процессором в каждую ячейку, каждая ячейка памяти подает "голос". Если за букву подано достаточно положительных голосов, тогда подтверждение ее присутствия передается в центральный процессор. Кроме опроса элементов памяти разрабатываются и другие системы компьютерной памяти и воспроизведения.
Язык и искусственный интеллект
В общем психологи считают язык основным проявлением когнитивных процессов. Он больше чем все другие виды человеческого поведения отражает мышление, восприятие память, решение задач, интеллект и научение. И ввиду его важности для основных психологических принципов он представляет главный интерес для специалистов по ИИ.
Способность к языку и связанная с ним сфера решения задач вышеупомянутого фантастического компьютера Хэла предвосхищена А.Кларком в наиболее полном виде — как обмен мнениями между Дейвом (человеком) и Хэлом:
"Я хочу сделать это сам, Хэл,— сказал он,- пожалуйста, передай мне управление.
"Слушай, Дейв, у тебя еще куча работы. Я предлагаю, чтобы ты оставил эту мне."
"Хэл, переключи анабиоз на ручное управление."
"Насколько я могу судить по обертонам твоего голоса, Дейв, ты серьезно расстроен. Почему бы тебе не принять таблетку от стресса и не отдохнуть немного?"
Рис. 15.11. Модель активной памяти с адресацией по содержанию Адаптировано из: Winogrod (19761.
|
|
ЖГ-][ГТ- Цента
|
альный эссор
|
|
|
|
|
|
|
|
прощ
|
|
lima
|
?
Описание желаемых данных
|
i
|
f
|
1
|
Г 1
|
г
|
i
|
\
|
t
|
|
-
|
|
Элемент памяти
|
Элемент Элемент 3 памяти памяти t
|
Элемент памяти
|
Элемент памяти
|
|
Шина '
|
t
|
i
|
Г 1
|
г
|
..... 1 .....
|
....... 1, .
|
|
Содержимое элементов памяти
Мышление и интеллект - естественный и искусственный 516
r
"Хэл, этим кораблем командую Я. Я приказываю тебе разблокировать ручное управление анабиозом."
"Извини, Дейв, но согласно специальной подпрограмме С1435-бис-4, цитирую: "Если экипаж мертв или недееспособен, бортовой компьютер должен принять управление на себя," конец цитаты. Следовательно, я должен признать твою власть недействительной, поскольку ты не в состоянии исполнять обязанности разумно."
Насколько близко мы подошли к этой фантастике в лабораториях ИИ? Рассмотрим пример реальной беседы с компьютером.
Одна из первых "разговаривающих" компьютерных программ ELIZA (ЭЛИЗА)9 была написана Джозефом Вейценбаумом из МТИ (Weizenbaum, 1966). В одной конкретной программе, называвшейся ДОКТОР, ЭЛИЗА играла роль, сходную с ролью психиатра. В следующем примере высказывания ЭЛИЗЫ выделены большими буквами.
Все люди похожи. ЧЕМ ЖЕ?
Они вечно надоедают нам то тем, то другим. НЕ МОГЛИ БЫ ВЫ ПРИВЕСТИ КОНКРЕТНЫЙ ПРИМЕР? Ну, мой приятель заставил меня прийти сюда. ВАШ ПРИЯТЕЛЬ ЗАСТАВИЛ ВАС ПРИЙТИ СЮДА? Он говорит, что я почти все время подавлен. МНЕ ЖАЛЬ СЛЫШАТЬ, ЧТО ВЫ ПОДАВЛЕНЫ Это правда, я чувствую себя несчастным.
ВЫ ПОЛАГАЕТЕ, ЧТО ПРИХОД СЮДА ПОМОЖЕТ ВАМ НЕ БЫТЬ НЕСЧАСТНЫМ?
Мне нужна какая-то помощь, это наверняка.
А ЕСЛИ БЫ ВЫ ПОЛУЧИЛИ ПОМОЩЬ, ЧТО БЫ ЭТО ВАМ ДАЛО? Может, я научился бы не ссориться со своей матерью. РАССКАЖИТЕ МНЕ ЕЩЕ О ВАШЕЙ СЕМЬЕ Моя мать заботится обо мне.
КТО ЕЩЕ ИЗ ВАШЕЙ СЕМЬИ ЗАБОТИТСЯ О ВАС? Мой отец. ВАШ ОТЕЦ?
Вы чем-то похожи на моего отца. В ЧЕМ ВЫ ВИДИТЕ СХОДСТВО?
Вы не агрессивны, но я думаю, вы не хотите, чтобы я это заметил. ПОЧЕМУ ВЫ ДУМАЕТЕ, ЧТО Я НЕ АГРЕССИВНЫЙ? Вы не спорите со мной.
ПОЧЕМУ ВЫ ДУМАЕТЕ, ЧТО Я НЕ СПОРЮ С ВАМИ? Вы боитесь меня.
ДОСТАВЛЯЕТ ЛИ ВАМ УДОВОЛЬСТВИЕ ДУМАТЬ, ЧТО Я БОЮСЬ ВАС?
Мой отец боится всех.
ЧТО ЕЩЕ ВАМ ПРИХОДИТ НА УМ, КОГДА ВЫ ДУМАЕТЕ О СВОЕМ ОТЦЕ?
9В пьесе Б.Шоу "Пигмалион" профессор Хиггинс учил Элизу Дулитл правильно говорить. Американский музыкальный фильм по этой пьесе назывался "My Fair Lady" ("Моя прекрасная леди"; 1971г.).
Искусственный интеллект 517
Забияки.
СВЯЗАНО ЭТО КАК-ТО С ТЕМ, ЧТО ВАШ ПРИЯТЕЛЬ ЗАСТАВИЛ
ВАС ПРИЙТИ СЮДА?
Кто-то может утверждать, что эта беседа вполне могла быть взята из беседы психиатра-человека и его пациента. Но давайте оценим этот конспект критически. Реакции компьютера в нем довольно стереотипны. Например, он запрограммирован отвечать на определенные ключевые слова фразой, являющейся всего лишь преобразованием первоначальной фразы. Так, когда пациент произносит ключевые слова "Я (есть)...", ЭЛИЗА отвечает диалектом "Мне жаль слышать, что вы...". Если ключевых слов не обнаружено, компьютер отвечает бессодержательным замечанием или в некоторых случаях преобразованием предыдущей фразы. Так что хотя высказывания ЭЛИЗЫ и могли бы создать у кого-то иллюзию разговора, им на самом деле не хватает той концептуальной базы языка и знания о мире, которые настоящий психиатр обязан использовать в клиническом интервью. То, что за отсутствием лучшего слова мы называем пониманием, включает человеческие знания об ощущениях, склонностях, групповой динамике и т.д. У ЭЛИЗЫ этого нет.
Какая получилась бы беседа, если поменять роли, т.е. если бы психиатр разговаривал с компьютерной моделью пациента? Колби и др. (Colby et al., 1972) смоделировали такого пациента, назвав свою программу ПАР-РИ10, поскольку она имитировала ответы параноидного пациента. Параноика они выбрали потому, что существует определенное теоретическое представление об этой системе и о процессе паранойи, различие между нормальными и психотическими ответами велико, и они могли использовать суждения экспертов для оценки отличимости ответов компьютерной модели от ответов человека. Колби и др. подвергли компьютер тесту Тю-ринга, попросив группу психиатров провести интервью с ПАРРИ при помощи дистанционно печатаемых сообщений. Психиатров просили оценить степень "паранойи" в общей сумме ответов. Приведем два диалога ("Интервью А" и "Интервью В") — один между ПАРРИ и психиатром, а другой между настоящим пациентом и психиатром11.
Достарыңызбен бөлісу: |