Всеволод Сергеевич Бурцев Параллелизм вычислительных процессов и развитие архитектуры суперэвм м, 1997



бет13/16
Дата14.06.2016
өлшемі2.36 Mb.
#135091
1   ...   8   9   10   11   12   13   14   15   16

115




В.С. Бурцев, В.Б. Федоров. Ассоциативная память на принципах оптической обработки ин-формации для суперЭВМ нового поколения




2.2 Возможные решения второй задачи

Рассмотрим теперь возможные способы решения второй задачи - объединения модулей в единую АП. Она распадается на две самостоятельные части. Во-первых, неоходимо обеспечить коммутацию приходящих данных по модулям АП так, чтобы не потерять возможности достижения высокой пропускной способности АП в целом, поскольку, например, сто модулей с темпом работы 10 нс каждый обладают пропускной способностью в 10 миллиардов слов в секунду (слово за 0,1 нс). Во-вторых, необходимо добиться такого распределения данных по модулю в течение решения всей задачи, чтобы вероятность переполнения любого из модулей была минимальной, а в случае возникновения такой ситуации она не привела бы к прекращению работы всей системы.

Задача обеспечения высокопроизводительной коммутации данных со ста входных направлений к ста модулям АП в настоящее время может быть решена только с использованием оптических средств передачи и коммутации информации. Можно с достаточной уверенностью утверждать, что при решении задачи высокопроизводительной коммутации и передачи информации оптические принципы уже в настоящее время могут быть вне конкуренции по отношению к полупроводниковым средствам. Вопрос построения подобных коммутаторов требует самостоятельного рассмотрения и выходит за рамки настоящей статьи.

Задача равномерного распределения информации по модулям памяти не является новой для вычислительной техники. Методы распределения информации по модулям памяти с помощью так называемого метода "хеширования" могут быть полностью использованы и для обеспечения равномерного распределения информации по модулям АП. Отличие заключается в том, что неудачно выбранная функция "хеширования" разрядов адреса, определяющая модуль памяти, в старой архитектуре приводила к снижению производительности ЭВМ на некоторых задачах, в то время как в новой системе переполнение модуля АП вызывает прекращение работы комплекса в целом. Поэтому задача в полной мере будет решена в том случае, если функционирование АП прекращается только при переполнении всех модулей АП, в то время как переполнение отдельных модулей приводит к замедлению работы системы.

На Рис.6 приведена структурная схема АП, позволяющая реализовать работу АП без ее остановки в случае переполнения отдельных модулей МАП.

Принцип работы этой системы состоит в том, что в случае переполнения какого либо модуля, он производит запись в другой, заранее определенный модуль. Все модули имеют регистр переполнения, в котором каждый модуль отображается одним разрядом. В случае переполнения модуля и записи данных в другой модуль устанавливается "1" в разряд, соответствующий модулю, в который направляются данные для записи.

Поиск по ключу, адресованному в блок, из которого была произведена запись в другой модуль, происходит корректно, если алгоритм поиска будет следующим: выполняется поиск данного в модуле АП, к которому адресован ключ и данное. В том случае, если искомый ключ найден, пара данных выдается на выход и операция заканчивается.

116




В.С. Бурцев, В.Б. Федоров. Ассоциативная память на принципах оптической обработки ин-формации для суперЭВМ нового поколения




Рис.7. Модульная ассоциативная память.



АП - входной регистр; РПП - регистр повторного поиска; КМ - коммутатор модулей; МАП - модуль ассоциативной памяти; Вх - входной регистр модуля; РР - регистр результата повторного поиска; РП - регистр переполнения; СП - спецпроцессор.

В случае, если ключ в этом модуле АП не найден и в разрядах переполнения имеются единицы, ключ и данное отсылаются в те модули, в разрядах регистров переполнения которых находятся единицы. Данные для повторного поиска посылаются на регистр повторного поиска (РПП), после чего происходит обычная работа модуля АП. Если повторный поиск во всех модулях прошел, и поиск завершился успешно, то из одного модуля на выход выдаются необходимые данные и операция заканчивается. Если при первом поиске и нулевом регистре переполнения или при повторном поиске результат отрицательный, то происходит запись данных свободного регистра в тот модуль АП, куда они были первоначально адресованы.

Остается открытым вопрос, каким образом происходит стирание информациии в регистрах переполнения, если вся информация, которая была перезаписана из него в какой-либо модуль, в последнем при считывании уничтожена, и в повторном обращении к этой памяти нет необходимости? Так как нахождение в положении единицы какого-либо разряда в регистре переполнения в течение более продолжительного времени, чем это требуется, не приводит к ошибкам в работе АП, а лишь увеличивает иногда время поиска, процесс стирания единиц может выполняться спецпроцессором (СП) на фоне основной работы модулей. Для этого перезаписанная в модули ПАПК и ОАПК информация должна помечаться специальной битовой меткой, а в памяти данных каждое данное должно сопровождаться информацией, указывающей модуль, из которого это данное перезаписано. Спецпроцессор АП поочередно опрашивает в свободное от основной работы время модули АП и при необходимости осуществляет возвращение перезаписанных данных в свой модуль. Этот же СП, обмениваясь информацией со спецпроцессорами модулей АП, может

117




В.С. Бурцев, В.Б. Федоров. Ассоциативная память на принципах оптической обработки ин-формации для суперЭВМ нового поколения

устанавливать в каждом модуле код адреса того модуля, в который необходимо передать информацию в случае его переполнения.

Приведенные на Рис.5 и Рис.6 схемы не претендуют на оптимальность решения поставленных задач. Авторы пытались найти компромисс между наиболее лаконичным изложением основных принципов построения подобных структур, их оптимизацией и детализацией.

Очевидно, что, применив принцип интерливинга, в блок-схеме Рис.5, можно запараллелить во времени работу поиска ключа в ПАПК и ОАПК, а в блок-схеме Рис.6 - работу по поиску информации в модуле, к которому адресован ключ, и процесс поиска того же ключа в модулях, указанных в регистре переполнения основного модуля. Может быть, более оптимально выбран компромисс между объемом модуля и его производительностью, если считать возможным запас по объему до 105 слов. Безусловно, должен быть оптимизирован критерий прекращения работы АП по переполнению (например, по переполнению группы из 8 - 10 модулей), что может существенно упростить структурную схему АП и так далее. Важно, что на современном уровне науки и техники можно создать АП с весьма хорошими параметрами по быстродействию и объему запоминаемой информации. Можно предполагать, что объем модуля АП вместе с питанием и системой охлаждения не будет превышать нескольких сотен кубических сантиметров, а при переходе от объемной геометрической оптики к интегральной можно ожидать, что общий объем занимаемый АП, состоящей из сотни модулей, не превысит 0,2 - 0,3 м3 и АП будет потреблять не более 1 кВт электрической мощности.

Развивая идею совместного использования электронных и оптических принципов обработки информации в одном устройстве уже на более совершенном, развивающемся в настоящее время технологическом уровне, можно говорить о перспективной АПК, основой которой будет двумерная матрица ячеек памяти ключей, состоящих из пространственно - временных модуляторов света и размещенных в непосредственной близости от них и электрически связанных с ними триггеров, хранящих информацию о кодах ключей. На Рис.7. приведена схема такого модуля ассоциативной памяти.

Перезапись ключей по адресу в плате памяти, шифрация и дешифрация физических адресов ячеек памяти, а также хранение связанной с ключами информации осуществляется электронным устройством, имеющим в своем составе полупроводниковое ЗУ. Функции маскируемого регистра выполняет матрица полупроводниковых лазеров (МПЛ), на которую с помощью электронного дешифратора отображается инверсный код предъявляемого аргумента поиска. Физические адреса совпадений фиксируются матрицей фотоприемников. Оптическая система состоит из объективов, размещенных на фокусном расстоянии, двойного растра линз, поляризационно-чувствительных кубиков и расщепителя световых пучков каждого из лазеров на М световых пучков. Она позволяет проецировать в плоскость платы памяти микроизображения МПЛ и в плоскость МФП картину распределения s - компоненты излучения, возникающей за каждой из линз растра при отражении световых пучков от платы памяти.

118




В.С. Бурцев, В.Б. Федоров. Ассоциативная память на принципах оптической обработки ин-формации для суперЭВМ нового поколения

Использование в качестве УТ полупроводниковой матрицы позволяет в мо-дуле АП реализовать схему одновременного поиска информации по многим ключам [11], что существенно расширяет пропускную способность модуля и АП в целом.

Рис.7. Оптоэлектронная ассоциативная память.

Практическая реализация в обозримом будущем оптоэлектронных АП с основными параметрами (емкость, быстродействие, темп обмена информацией), близкими к ранее приведенным, связана с решением целого ряда сложных технологических задач. Основная из них - разработка технологии, которая позволила бы разместить на единой плате памяти площадью порядка 10 см2 интегральные электронные схемы управления и хранения информации и около 106 дискретных светомодуляторов. Нетривиален расщепитель световых пучков МИС, который для обеспечения одинаковой освещенности всех информационных ячеек должен при высокой оптической эффективности компенсировать неравномерность диаграммы излучения полупроводниковых лазеров и коррегировать аберрационные искажения (дисторсию) оптической системы и ряд других технологических трудностей.

Таким образом, можно предполагать, что в недалеком будущем оптические и электронные принципы обработки информации, реализуемые на единой технологической базе, будут дополнять друг друга.



Заключение

В настоящее время на базе современных технологических возможностей стало реальным создание ассоциативной памяти, отвечающей по быстродействию и объему хранимой информации требованиям перспективных архитектур суперЭВМ с производительностью 1010 - 1011 операций в секунду.

Дальнейшее развитие и использование оптических принципов обработки информации в архитектуре суперЭВМ нового поколения связано с существенной интеграцией оптических и электронных принципов на единой технологической базе.

119




В.С. Бурцев, В.Б. Федоров. Ассоциативная память на принципах оптической обработки ин-формации для суперЭВМ нового поколения

Литература


  1. В.С. Бурцев, Препринт ИТМ и ВТ АН СССР, М., 1977, N.32

  1. B.C. Бурцев, Препринт Отдел вычислительной математики АН СССР, М., 1989, N.5.

  1. J.R. Gurd et al., Comm. ACM, 1985, Vol.28, N.34.

  1. Arvind, Culler D.E., In: Fifth Generation Computer Architecture, North Holland, 1985.

  2. T. Shimada et al., Proceedings 13th Annual Symposium on Computer Architecture, ACM, 1986, P.226 234.

  1. V.S. Burtsev, Optical Computing and Processing, 1992, Vol 2, N.3.

  1. В.Б. Федоров, Всесоюзная конференция "Проблемы оптической памяти" Тезизы докладов и сообщений, М., ПИК ВИНИТИ, 1990, С.56 57.

  1. В.Б. Федоров, В.Г. Митяков, Радиотехника, 1985, Vol.79, N.4.

  2. В.К. Гусев, М.Л. Рослова, В.Б. Федоров, И.А. Шилов, 1982, Vol.22, N.6.




  1. В.Б. Федоров, В.Г. Митяков, Оптика и спектроскопия, 1984, Vol 878, N.56.

  2. V.S. Burtsev, V.B. Fydorov, Optical Computing and Processing, 1992, Vol.2, N.3, P.166.

120

B.C. Бурцев, Л.Г.Тарасенко. Использование микропроцессоров традиционной архитектуры в

системе потока данных



Использование микропроцессоров

традиционной архитектуры

в системе потока данных

B.C. Бурцев, Л.Г. Тарасенко



Аннотация

Рассматривается возможность использования стандартных микропроцессоров или микропроцессорных наборов в качестве исполнительных устройств в новой нетрадиционной архитектуре суперЭВМ. Вводится понятие сложного оператора, выполняющего функции оператора системы потока данных. Обсуждается возможность обработки различных структур данных с помощью сложных операторов. На примерах показыается, что предлагаемые схемотехнические решения позволяют уменьшить требования к объему АП и снизить количество обращений к ней.

Введение

В статье рассматриваются возможности оптимизации схемотехнических решений суперЭВМ массового параллелизма с целью увеличения ее производительности за счет использования традиционных аппаратно-программных средств, не нарушая целостности основных концепций потока данных. Задача состоит в том, чтобы новый принцип организации высокопроизводительных вычислительных процессов не проигрывал бы по быстродействию традиционным принципам (фон-Неймана), даже на вычислительных конструкциях последовательного типа. Пределы производительности разрабатываемой нетрадиционной архитектуры, как это показано в [1], во многом определяются параметрами ассоциативной памяти: временем выполнения операции и темпом ее работы [4, 5]. Необходимо отметить, что создаваемая нетрадиционная архитектуpa



121

B.C. Бурцев, Л.Г.Тарасенко. Использование микропроцессоров традиционной архитектуры в

системе потока данных

суперЭВМ позволит несколько ослабить требования ко времени выполнения операции АП по сравнению с традиционной архитектурой, построенной по принципу фон-Неймана. В то же время, требования к пропускной способности АП (темпу ее работы) остаются жесткими и определяют пределы быстродействия предложенной архитектуры массового параллелизма.

Пропускная способность одного модуля ассоциативной памяти ограничена разумными пределами потребляемой им мощности, исходя из возможности снятия тепла. При ограниченной предельной потребляемой мощности модуля объем его памяти будет обратно пропорционален максимальному темпу работы [5]. Дальнейшее увеличение темпа работы всей ассоциативной памяти требует новых схемотехнических решений, например, разбиения всей АП на достаточно мелкие модули. Однако, необходимо принимать во внимание тот факт, что при одном и том же объеме ассоциативной памяти уменьшение объема модуля повышает вероятность переполнения одного из них и усложняет коммутатор, а увеличение объема модуля повышает вероятность образования очереди заявок к модулю, что снижает общую производительность системы. Из этого следует, что чем больше снижаются требования к общему объему ассоциативной памяти, тем больший темп ее работы может быть реализован и тем больший предел производительности комплекса может быть достигнут.

Разгрузить ассоциативную память как по числу обращений к ней, так и по ее объему можно, используя следующие структурные решения в нетрадиционной архитектуре [1]:



  • вместо векторов в АП хранятся только их дескрипторы;

  • командная память вместе с константами вынесена из АП;

  • ассоциативная память разбита на модули;

  • имеется промежуточная буферная память БП готовых пар (токенов с одинаковыми ключами), сглаживающая темп работы АП и тем самым повышающая ее производительность;

  • одновходовые операторы не проходят через АП.

В работе делается попытка еще дальше продвинуться в направлении сокращения требований к объему АП и, следовательно, увеличению темпа ее работы, используя статическую определенность и локальность данных некоторых вычислительных конструкций.

1. Сложные операторы

При представлении процесса вычислений в виде графа никак не определяется сложность оператора. В проекте, по умолчанию, под оператором понимается команда машины, имеющая один или два входных операнда и один или два выхода результата. Такое представление диктовалось тем, что аппаратно слишком сложно организовать ассоциативную память с тройным и более совпадением ключей операндов. Вторым ограничением было отсутствие памяти в скалярных исполнительных устройствах. Однако, концепция потока данных нисколько не изменится, если в качестве оператора будут выполняться, например, вычисления какой-либо из тригонометрических функций или любой другой функции. Если эта функция будет не более чем над двумя



122

B.C. Бурцев, Л.Г.Тарасенко. Использование микропроцессоров традиционной архитектуры в

системе потока данных

параметрами, то для рассматриваемой структуры, кроме замены скалярного исполнительного устройства на микропроцессор с локальной прямоадресуемой памятью, по большому счету в аппаратной части менять ничего не надо Итак, условно вводятся два класса операторов: первый оператор - команда или простой оператор, второй оператор - функция или в дальнейшем сложный оператор. Аппаратно это не приведет к существенному увеличению объема оборудования, т.к. в принятой нами структуре каждое исполнительное устройство имеет все виды операций и командную память [1, 2].

Необходимо наложить определенные условия на тип выполняемых функций (сложных операторов). Так подпрограмма, реализующая сложные операторы, не может обращаться за результатом к внешней программе или сложному оператору, которые зависят от результатов или действий, выполняемых оператором.

В то же время, если оператор работает с несколькими входными операндами (более двух), то ограничений на их количество в принципе нет, так же как нет ограничений и на количество выходящих токенов результатов. Нет даже принципиального ограничения на ассинхронный запуск и выполнение сложного оператора. Выполнение сложных операторов может идти по мере поступления операндов (параметров) с выдачей результатов по мере формирования результатов.

Однако, для реализации ассинхронного запуска оператора с многими входными и выходными операндами необходимы определенные доработки в системе команд и принципах коммутации.

Пусть традиционный микропроцессор скалярного исполнительного устройства может при помощи подпрограммы, работающей в режиме фон-Неймана, выполнить как любой простой, так и сложный оператор. В этом случае микропроцессор должен иметь примитивную операционную систему для распределения оперативной памяти и достаточно развитую систему прерываний для организации вычислительного процесса по готовности программ к их выполнению.

Для реализации работы со сложными операторами (СО), кроме замены каждого скалярного ИУ на микропроцессор (МКП), необходимо ввести несколько специальных команд и изменить структурную схему суперЭВМ, введя еще один коммутатор типа К2. На Рис.1 он обозначен К2.

Коммутатор К2 подключается параллельно коммутатору К1 и может работать во времени либо последовательно, либо параллельно с последним в зависимости от входных параметров МКП. Параллельная работа потребует увеличения аппаратных затрат, но обеспечивает большую производительность всего комплекса.

Для запуска сложного оператора необходимо ввести специальную команду. Эта команда должна обеспечить инициализацию сложного оператора на одном из свободных микропроцессоров, включая выделение необходимой памяти, поставку входных параметров в нее и обеспечение выдачи результатов оператора. Очевидно, в одной команде все эти функции не всегда можно обеспечить, если иметь в виду поставку нескольких параметров и выдачу нескольких результатов в разные контексты выполняемой программы.

123

B.C. Бурцев, Л.Г.Тарасенко. Использование микропроцессоров традиционной архитектуры в

системе потока данных

Исполнительные устройства (ИУ)



Рис.1. Структурная схема суперкомпьютера нового типа.

Однако команду, обеспечивающую начало этого процесса - "начало сложного оператора" (НСО), - реализовать можно. В то же время хотелось бы в простейшем случае при одном входном параметре и одном результате сложного оператора обойтись одной командой НСО (HCOl). Реализуем НСО в одновходовом варианте с целью экономии аппаратных средств. В этом случае результат любой команды может быть использован как первый операнд сложного оператора. Одновходовая команда, если есть ресурс процессора, выполняется непосредственно на нем, а если нет, подается на коммутатор К1 для отыскания свободного процессора, готового к выполнению СО. Для того, чтобы осуществить

124

B.C. Бурцев, Л.Г.Тарасенко. Использование микропроцессоров традиционной архитектуры в

системе потока данных

вход в подпрограмму, в качестве одного из адресов назначения в командах НСО и НСО1 должен быть адрес входа в подпрограмму сложного оператора, второй адрес может содержать адрес выдачи первого результата.

Задача поставки нескольких параметров в СО может быть решена, если правильно сформировать уникальное на данный момент динамическое "имя" СО. Использовать в качестве имени "цвет" или код контекста процедуры недостаточно, т.к. возможны обращения из разных мест этого же контекста к одной и той же подпрограмме. Поэтому ключ, состоящий из "цвета" и адреса входа в подпрограмму сложного оператора, в данном случае не годится. Для формирования ключа необходимо использовать адрес последнего оператора той программы, из которой осуществляется вход в подпрограмму сложного оператора. Для каждого входа в подпрограмму сложного оператора (СО) последней командой, выполняемой в той программе, из которой осуществляется вход, является команда НСО. Следовательно, уникальным именем сложного оператора для программы будет код ключа, состоящий из контекста этой программы (текущий контекст) и адреса команды НСО в этой программе. В простейшем случае, когда сложный оператор работает в контексте запускающей его программы и имеет один входной параметр и один результат, можно обойтись одной командой типа НСО для обращения к сложному оператору (HCOl). В качестве входного параметра в этом случае может быть использован результат предыдущей операции, а в качестве адреса результата код индекса или адрес назначения. Остальные поля "цвета" подпрограммы П и Т определяют контекст подпрограммы СО, в котором она работает.

Перечислим основные функции, которые должна выполнить команда НСО:



  1. Определить МКП, в котором может быть выполнен сложный оператор, т.е. установить наличие блока оперативной памяти (64 или 128 слов) и, в первую очередь, того процессора, на котором выполняется формирование входного токена для НСО.

  2. Поставить имеющийся параметр, сформировать и записать в память ключ для поставки первого результата по адресу назначения.

  3. Сформировать и выдать на выход ИУ токен запроса параметров.

  4. Запустить подпрограмму сложного оператора.

Возможен вариант команды НСО, содержащий в поле данных входного параметра суммарное количество параметров и результатов СО, которое заносится в токен запроса для последующего его стирания из ассоциативной памяти.

Токен запроса должен включать:



  • в поле ключа: адреса назначения - адрес входа в команду НСО и "цвета" (текущего контекста);

  • в поле данных: физические адреса номера микропроцессора, номер выделенного блока и номер слова;

  • в поле операции: код специальной двухвходовой операции индексации;

  • в поле управления памятью: признак, который предписывает АП вести поиск по ключу без учета поля индекса ключа и, возможно, число запросов.

При формировании хеш-функции токена запроса поле индекса не учитывается.


Достарыңызбен бөлісу:
1   ...   8   9   10   11   12   13   14   15   16




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет