Колш1»1ат*ризо0сш1*0*
t:
ж
ii
Том Харрингтон, Дениза Квон
Подобно Нарциссу, восхищавшемуся своей собственной красотой, человек с тоской глядит в нечто вроде интеллектуального увеличительного стекла и отходит со словами "Да, ты действительно самый разумный из них всех'" Наш мозг в 10 биллионов раз менее эффективен энергетически, чем теоретически он мог бы быть, и его клетки реагируют в тысячи раз медленнее, чем ячейки цифрового компьютера, и тем не менее он продолжает находиться под нарциссическим впечатлением от своей собственной работы, обычно относя все недостатки на счет своей огромной сложности В 1968 году мозг Джона Кемени, заметивг что между ним самим и машиной нет суще ственной разницы, сделал утверждение, показавшееся в то время здравым "Даже на базе транзисторов конструктивные трудности едва ли позволят сделать4 машину более, чем из миллиона частей Так что мы можем свободно сказать, что человеческий мозг надолго останется примерно в 10000 раз более сложным, чем самые сложные машины "
С тех пор компьютеры развились невероятно Но мозг по генетическим причинам застрял на обочине интеллектуальной дороги, поскольку он мутирует медленно К счастью, наши когнитивные способности не застряли вместе с ним Каждый день мы встраиваем в компьютеры новые мутации, и, навязывая им наше собственное направление естественного отбора, развиваем "мыслительную" силу человека
Как может компьютер практически конкурировать с нами? Лучше сначала спросить, а смог бы компьютер хранить и обрабатывать то количество информации, какое мы сами воспринимаем Насколько это много? Информацию, воспринимаемую нами за одно мгновение текущей зрительной сцены, можно оценить, исходя из интенсивности, с которой этот мир стимулирует каждую из ваших 250,000,000 палочек и колбочек При наличии 100 возможных уровней интенсивности стимуляции каждой из них мы получим достаточно верное повторение воспринимаемого мира, так что для каждой колбочки или палочки нам пришлось бы записать по две цифры Это составило бы 2x250,000,000 единиц информации — те средняя ванная комната, заполненная перфокартами Обновляя стимульную зрительную сцену 100 раз в секунду на протяжении ста лет жизни, мы бы оказались затопленными в таком количестве зрительной информации, какого хватило бы, чтобы заполнить перфокартами куб с ребром в 34 километра Компьютерная память такого объема оказалась бы без-
надежной, как это случилось в 1968 году, но тусклый свет надежды идет к нам из 1926 года, когда Эмануэль Голдберг смог записать на микрофильме буквы величиной в один микрон, такая плотность означает, что на большой почтовой марке можно расположить 50 Библий При такой записи информацию наш столетний опыт зрительного восприятия уместился бы в кубе из марок с ребром в 20 метров Объемные голограммы имеют более легкий доступ и гораздо большую плотность Но если бы мы могли хранить информацию так, как это делает природа, jam зрительный опыт за 100 лет смог бы уместиться в кубике с ребром в 1мм — с булавочную головку Генетическая информация, необходимая для воссоздания любого человека, живущего в Соединенных Штатах, и хранимая в виде 4-битового РНК-кода уместилась бы в слое над одним ногтем
В таком случае хранение информации, превышающей по объему все, что когда-либо мог собрать мозг, кажется легким, но как быть с обработкой, воспроизведением и передачей? Такие компоненты, как макромолекулярные транзисторы и оптические компьютеры на трансфазерах и технология производства оптики с сопряжением фазы скоро превзойдут все, что имеется сегодня Компьютеры будут более плотными, и в них, возможно, не будет проводов, а только световые лучи, которые могут проходить друг сквозь друга И они будут способны обрабатывать целые поля оптической информации и мгновенно формировать с ней ассоциации, избегая в некотором смысле необходимости в интерактивных соединителях, имеющихся в мозге Такие компьютеры легко превзойдут мозг
Как насчет передачи информации? Новые оптические зеркала с сопряжением фазы позволят нам посылать трехмерные набитые информацией голограммы по отдельным стеклянным волокнам Физики говорят, что по одному стеклянному волокну теоретически возможно транслировать продолжительный зрительный входной сигнал от примерно 10000 абонентов
Видимо, в неполноценности мозга нет сомнений Даже по сравнению с существующими машинами он по многим параметрам выглядит, как игрушка Нам только нужно побольше людей (и компьютеров), чтобы писать гибкие и тщательно разработанные программы, или сделать специальные компьютеры, которые сами были бы своей программой
Поэтому спросим, а хорошо ли умеет мозг думать? Если мы нарисуем длинную ось, отмеряющую сложность мышления, то похоже, что мы все-таки сможем поместить себя на ней хоть на бит повыше абака Может ли абак мыслить? Наверно, нам лучше думать, что да
Этот спор далек от завершения, и некоторые, видимо, находят определенную ценность в его философской глубине. Однако, для меня этот спор не разрешен (на самом деле, он, вероятно, неразрешим!). Кроме того, оба лагеря ужесточили свои позиции и выдвигают скорее аргументы веры, чем разума. Для такой книги, как эта, его важность двояка: во-первых, он заставляет читателя глубоко задуматься о том "человеческом", что заключено в человеческом познании. Во-вторых, в связи с этим спором встает вопрос, до какого предела ИИ может имитировать человеческий интеллект. Страсти, разгоревшиеся вокруг "теста Тюринга" и "китайской комнаты" у обеих сторон, отражают сильную заинтересованность современных философов и специалистов по ИИ в отношении электронного джина, выпущенного из бутылки.
Какого рода компьютером является человек?
Более функциональный подход, помещающий ИИ на когнитивную почву, предложил Ирл Хант (Earl Hunt, 1971); он поставил вопрос: "Какого рода компьютером является человек?" Исходя из того, что между обработкой информации человеком и компьютерной системой действительно существует аналогия, Хант предпринял грандиозную задачу описать компьютерную систему, которая "мыслит как человек". Фундаментальное положение его системы, названной им моделью распределенной памяти, гласит, что мозг имеет несколько зон памяти, назначение которых — регулировать поток информации из окружения так, чтобы информация могла кодироваться в терминах прошлого опыта. В основной структуре этой модели, изображенной (в модифицированном виде) на Рис. 15.1, информация из окружения проходит через ряд буферных памятей и поступает в КП, или сознательную память.
Как показано на рисунке, одновременно может обрабатываться более, чем один сенсорный канал. Буфферная обработка служит для преобразования сообщений в постепенно более значимые единицы. Это можно проиллюстрировать на примере чтения, где сначала различаются признаки (в ранних буферах), затем буквы и, наконец, слова; единственный сознательный процесс (у опытного читателя) — это собственно чтение слов. Центральная роль в этом процессе принадлежит ДП, в которой информация хранится постоянно. Кодирование сырой информации и ее перекодирование на более высоких уровнях происходит под управлением КП. Вербальная информация, достигающая КП, интерпретируется в значимый семантический код, хранимый в промежуточной памяти (ПП). Этот семантический код сохраняет непосредственный опыт, так что мы можем изучать его дальше, извлекая из него информацию и интерпретируя ее. Общая архитектура этой системы, как отмечает сам Хант, носит поразительное сходство с некоторыми из моделей памяти, с которыми мы встречались в Главе 5 — особенно с моделью Аткинсона и Шифрина.
Таким образом, модель Ханта может служить руководством по конструированию моделей переработки информации у человека, причем для имитации конкретных когнитивных функций проектируются конкретные компьютерные программы. Возможно, что основным результатом процесса моделирования является возможность испытать наши знания о когнитивной природе человека. Компьютерные программы, которым не удается точно смоделировать человеческое познание (и часто это так и есть) мо-
Мышление и интеллект - естественный и искусственный 502
Рис. 15.1. Модель распределенной памяти. Адаптировано из: Hunt (1973).
гут иметь большее значение для определения единственно человеческих свойств человеческого познания, чем некоторые преуспевающие программы. До сих пор мы в общем наметили сферу ИИ и познакомились с постулатом человеческого познания, на основе которого можно^ осуществлять компьютерное моделирование. В следующем разделе мы разберем некоторые конкретные возможности компьютера. Развитие этих конкретных функций в модели на основе информационного подхода примерно соответствует потоку информации от восприятия к распознаванию паттернов и высшим формам познания.
Восприятие и искусственный интеллект
Человек обладает обширными способностями к восприятию мира. Когда я разглядываю свой кабинет и выглядываю в окно, мой взгляд захватывает сотни объектов: книги на полке, телефон, пара стульев, картотека, скульптура совы, набор фотографий, самовар, стопка бумаг, псевдоготическая конструкция, анемометр наверху соседнего здания, заснеженные вершины гор, настойчиво приглашающие автора забросить на день-другой написание книги и отправиться покататься на лыжах, —каждый из них я могу немедленно распознать и классифицировать. Не менее интересна человеческая способность видеть, слышать, обонять и чувствовать на вкус мириады вещей. И все же этот перцептивный этап обработки информации, получаемый нами как дар, для компьютера составляет потрясающе сложную проблему.
Наоми Вайсштейн (Naomi Weisstein, 1973) описал трудность, с которой встречается гипотетический компьютер при выполнении элементарной задачи на восприятие: найти часы, считать время и сказать его нам— детская забава, но для компьютера она оказывается чрезвычайно сложной:
"Предположим, компьютер имеет сетчатку из 104 х 104 фотоэлементов. Сразу становится очевидным, что если мы дадим компьютеру список состояний, соответствующих часам, то список поиска для компьютера окажется бесконечным. По мере приближения компьютера к часам, их размер будет меняться;
Искусственный интеллект 503
следовательно, каждый шаг к часам будет... {приводить} к новому распределению {стимулов}... Но даже если бы эту проблему удалось решить, часы были бы любой величины и формы: современные часы "солнечные вспышки", цифровые часы, красные полоски, бегущие вокруг шестнадцатиугольного блока и т.д. Перечислить все возможные формы и величины часов или даже все возможные стандартные их формы и величины просто невозможно. И все же, большинство людей как правило справляется с задачей на опознание в пределах, скажем, 15 минут безо всяких трудностей'1.
Какие перцептивные способности используют люди при решении этой простой задачи, вызывающей такие трудности у компьютера? Здравый смысл подсказывает, что человек поступает разумно и организует поиск часов с применением своих знаний об окружении. Возможно, наш поиск организован неким иерархическом способом, когда сначала осматриваются места, где часы были замечены в прошлом, а если бы их там не оказалось, мы бы искали их в более скрытых местах. Обычно часы находятся на стене, а не под столом, и наше знание окружения направляет поиск.
Кроме стратегии поиска у человека есть система описания свойств часов: их движения, цифровых характеристик и т.д. Кроме того, для подражания человеческому познанию необходимо понимание назначения часов и абстрактной природы времени. Кто-то может подумать, что после того, как паттерн опознан, считывание времени — это уже простейшая часть задачи. Все, что требуется 'от компьютера,— это просканировать и интерпретировать цифровые характеристики, определить положение этих паттернов в памяти и доложить: "2:12". А может, это было "14:12"? Большинство людей на это отвечают немедленно, но для такого ответа требуется дополнительная информация о мире — день или ночь на дворе? Это нетривиальная задача, но нельзя ли ее свести к нескольким более простым и затем сконструировать робота по этим наметкам? Возможно, так, и в следующем разделе мы обратимся к некоторым конкретным перцептивным вопросам, поднятым в связи с задачей Вайсштейна.
Восприятие человека инициируется внешними сигналами, состоящими из света, звука, молекулярных соединений и давления. Эти сигналы обнаруживаются органами чувств и преобразуются (конвертируются в нервную энергию) в сообщения, понимаемые мозгом. Количество информации, доступной органам чувств, огромно; одна только зрительная система может передавать в мозг 4.3х106 бит информации в секунду. Фейгенбаум (Feigenbaum, 1967) предполагает, что некоторые периферийные устройства, иногда называемые периферической системой памяти, действуют подобно сенсорному буферу, предохраняющему мозг от переполнения потоком втекающей в него информации.
Как построить машину, способную подражать этому перцептивному, механизму? Логично было бы разработать что-то способное чувствовать. Один такой подход можно найти в работе по компьютерным распознающим системам.5
5Многие из ранних исследований этого типа руководствовались практическими задачами (например, как сделать устройство, считывающее цифровой код на чеках) и как таковые были слабо связаны с проблемой аналогии ИИ с человеком; здесь этот пример приводится для иллюстрации некоторых возможностей существующих систем компьютерного "восприятия".
Мышление и интеллект - естественный и искусственный 504
Один из способов научить компьютеры распознавать геометрические формы путем анализа логических признаков — это использовать принцип, что сложные геометрические формы состоят из простых. В этой программе использован ряд небольших "матриц", которые систематически проходят через каждый объект в поисках соответствия. Пример "матрицы" и идентифицируемого геометрического объекта показан на Рис. 15.2. Матрица сделана из двух типов сенсоров — позитивного и негативного; присутствует, отсутствует — это единственный сигнал, подаваемый такой ячейкой, или подразделением матрицы. Изображенная матрица содержит только шесть ячеек — три "минуса" и три "плюса", и, судя по расположению этих компонентов (все "отрицательные" элементы расположены слева), вроде бы, подходит для идентификации левого края объекта. Помещение матрицы ее средней линией над левым краем куба привело бы к полному соответствию. На углу соответствие было бы плохим, а на нижнем краю, где плюс и минус отменяют друг друга, соответствия не будет. Хотя эта эвристика в наибольшей степени ориентирована на возможности машин, она не расходится с результатами изучения восприятия у животных и человека. Ранее в этой главе (и в Главе 3) мы узнали, что психофизиологам удалось найти детекторы линий в клетках коры у кошек и, хотя эти данные не полностью подтверждены, похоже, что у человека также имеются детекторы края.
Трудность с вышеприведенной системой состоит в том, что для распознавания даже простых паттернов нужно большое количество матриц (например, детектор левой кромки, детектор правой кромки). Также проблематична "добротность" стимула; большинство геометрических форм (особенно в реальном мире) могут иметь резкие или расплывчатые края, яркие или тусклые края. Распознавание паттернов путем распознавания линий можно сильно упростить, если распознаваемую форму сначала преобразовать в образ, состоящий только из линий, и затем использовать матрицы для определения ориентации этих линий.
Распознавание линий
Системы распознавания паттернов обычно имеют дело со зрительным материалом. Как правило, воспринимающие устройства у таких систем имеют растр, или матрицу из фотоэлементов, реагирующих на свет. Обычно эти фотоэлементы имеют только два состояния — включено и выключено (для "белого" и "черного"). Рассмотрим элементарную задачу идентификации цифры. На Рис. 15.3 показано, как цифры можно преобразовать в
Распознавание паттернов
Матрица
Плохое соответствие
Соответствие отсутствует
Рис. 15.2. Обнаружение левого края посредством шестиэлементной матрицы. Знаки *+" и "-" указывают элементы, реагирующие на условия "присутствует" и 'отсутствует* соответственно. Адаптировано из: Raphael (1976).
Искусственный интеллект 505
двоичный код — 0, или выключено для "черного", и /, или включено — для "белого". Компьютер считывает каждую цифру (т.е. фотоэлементы — один для каждого квадрата сетки, накладываемой на число, — "ощущает" световые зоны, т.е. те, что не заняты числом), исходя из того, насколько данный цифровой код совпадает с матрицей, хранящейся в памяти компьютера. Это работает очень хорошо — если все буквы одной формы, одинаково расположены и не уменьшены,— и такие устройства широко применяются в американской промышленности и государственной почтовой службе. Но когда дело доходит до чтения рукописных писем, присланных для тети Иолы, у оптических сканирующих устройств начинаются разные трудности. Однако, судя по всему, быстро разрабатываются системы для "чтения" даже и рукописных текстов.
Идентификация букв и слов средствами ИИ представляет не только практическую проблему, она также имеет значение для тех ученых, кого интересует процесс анализа информации человеком. Многое из того, что известно об идентификации человеком букв и слов, обсуждалось в Главе 10 Эти знания помогают разрабатывать компьютерные программы, имитирующие этот процесс. Плодотворный отчет по этой теме, послуживший руководством для последующих исследований, представили Селфридж и Нейсер (Selfridge and Neisser, 1963). Только что описанная общая процедура "восприятия буквы" потребовала бы огромной компьютерной памяти (для хранения матрицы каждого нового варианта каждой буквы) или не
Рис. 15.3. Двоичное представление (колонка в центре! букв (колонка слева) Нули показывают выключено или "черный", единицы — включено или "белый". В правой колонке изображено, как выглядели бы цифры при считывании их сканером Адаптировано из Raphael (1976)
0 0
|
0
|
0
|
0
|
0
|
0
|
0
|
0 0
|
0 0
|
0
|
0
|
1
|
1
|
Û
|
0
|
0 0
|
0 0
|
0
|
1
|
1
|
1
|
1
|
0
|
0 0
|
0 0
|
0
|
1
|
0
|
0
|
1
|
0
|
00
|
0 0
|
0
|
1
|
0
|
0
|
1
|
0
|
0 0
|
0 0
|
0
|
1
|
1
|
1
|
1
|
0
|
0 0
|
0 0
|
1
|
1
|
0
|
0
|
1
|
1
|
0 0
|
00
|
1
|
0
|
0
|
0
|
0
|
1
|
0 0
|
0 0
|
0
|
0
|
0
|
0
|
0
|
0
|
0 0
|
0 0
|
0
|
0
|
0
|
0
|
0
|
0
|
0 0
|
|
s „. <: ^
|
*• v'***
|
? У
|
t) Û
|
и
|
0
|
0
|
15
|
0
|
0
|
Û 0
|
0 0
|
1
|
1
|
1
|
1
|
1
|
1
|
Ü 0
|
0 0
|
0
|
0
|
1
|
1
|
0
|
Û
|
0 0
|
0 0
|
0
|
0
|
1
|
1
|
0
|
0
|
0 0
|
0 0
|
0
|
0
|
1
|
1
|
0
|
0
|
0 0
|
0 0
|
0
|
0
|
1
|
1
|
0
|
0
|
0 0
|
0 0
|
0
|
0
|
1
|
1
|
0
|
0
|
0 0
|
00
|
0
|
0
|
1
|
1
|
0
|
0
|
0 0
|
0 0
|
0
|
0
|
0
|
0
|
0
|
0
|
0 0
|
0 0
|
0
|
0
|
0
|
0
|
0
|
0
|
0 0
|
4 '. **i
|
Л» *
|
TfTS
|
0
|
о
|
0
|
о
|
0
|
^
|
0 0
|
0 0
|
0
|
0
|
0
|
0
|
0
|
0
|
0 0
|
0 0
|
0
|
0
|
1
|
1
|
0
|
0
|
0 0
|
0 0
|
0
|
1
|
0
|
0
|
1
|
0
|
0 0
|
00
|
1
|
0
|
0
|
0
|
0
|
1
|
00
|
0 0
|
1
|
0
|
0
|
0
|
0
|
1
|
0 0
|
0 0
|
0
|
1
|
0
|
0
|
1
|
0
|
0 0
|
0 0
|
0
|
0
|
1
|
1
|
0
|
0
|
0 0
|
0 0
|
0
|
0
|
0
|
0
|
0
|
0
|
0 0
|
0 0
|
0
|
0
|
0
|
0
|
0
|
0
|
0 0
|
Мышление и интеллект - естественный и искусственный 506
смогла бы обнаруживать многие встречающиеся в действительности формы букв (Рис. 15.4).
Нужен был более "хитрый" подход, и Селфридж и Нейсер предложили анализировать буквы по их "деталям".6 Возьмем, например, букву А. Чем помещать все типы написаний буквы А в память компьютера и проводить с ними операции поиска и сравнения, мы можем написать для компьютера программу, которая будет изучать каждую из составляющих букву деталей, проверять их наличие или отсутствие и принимать решение о том, какая это может быть буква. Для этого есть два фундаментально различных способа — модель последовательной переработки и модель параллельной переработки. В модели последовательной переработки каждая деталь изучается заранее определенным пошаговым способом, и результат каждого теста определяет следующий шаг в программе. Пример программы последовательной обработки показан на Рис. 15.5 слева. Эта простая программа оценивает всего три детали, спрашивая: Есть ли у предъявленной фигуры кривизна наверху (например, H, U, Y, V), пересечение (например, H, F) и вертикальная линия (В, Y, T, R, P, H)? При постепенном процессе каждый из этих вопросов задается по порядку. Для рассмотренного набора букв (А, Н, V и Y) простое решение "Да" или "Нет"— это все, что необходимо для идентификации каждой буквы. Например, если предъявлена для опознания буква А, то, чтобы отделить эту букву от других букв рассматриваемого набора, надо только ответить отрицательно на первый вопрос (Есть ли кривизна наверху?). Остальные вопросы служат для различения между собой остальных букв этого набора.
Юбсуждение подетальной идентификации см. в Главе 10.
Достарыңызбен бөлісу: |