Всеволод Сергеевич Бурцев Параллелизм вычислительных процессов и развитие архитектуры суперэвм м, 1997


Оптимизация структуры векторного ИУ



бет16/16
Дата14.06.2016
өлшемі2.36 Mb.
#135091
1   ...   8   9   10   11   12   13   14   15   16

3. Оптимизация структуры векторного ИУ

3.1. Введение понятия вектора в векторное ИУ

Желательно сократить время выполнения операции над вектором, состоящим из нескольких страниц. Для этого надо сделать так, чтобы операции, начатые



144

В.С.Бурцев. Особенности проектирования векторного исполнительного устройства в системе массового параллелизма с автоматическим распределением ресурсов

над страницами двух векторов, не прерывались работой других векторов. В этом случае дескриптор должен описывать не страницу вектора, а вектор целиком, то есть его имя и количество страниц. В качестве имени может быть использован контекст. Управляющий процессор должен иметь справочник векторов, в котором каждому имени вектора соответствует список физических адресов его страниц. Опасение, что это замедлит вычислительный процесс за счет снижения его параллелизма, несправедливо, ибо страницы одного и того же вектора располагаются в разных блоках одного и того же модуля, а случай, когда происходит формирование страниц вектора в скалярной части, можно не учитывать, так как этот процесс слишком медленный.



3.2. Введение спецпроцессора в векторное ИУ

Для выполнения операций между элементами вектора внутри одного вектора нежелательно передавать страницы этого вектора в скалярную часть. Для этого можно внутри одного векторного процессора построить специализированный вычислитель, выполняющий часто встречающиеся операции между элементами внутри вектора.



Рис.2, Схема векторного процессора с фрагментами оптимизации его структуры

К таким операциям могут быть отнесены: операция сложения всех элементов страницы, операция перестановки элементов местами как в странице, так и в поле всего вектора, операция исключения элементов из вектора по определенному

145

В.С.Бурцев. Особенности проектирования векторного исполнительного устройства в системе массового параллелизма с автоматическим распределением ресурсов

правилу и т.д. Специальный процессор может иметь сверхоперативную память на два или три вектора и специальную схему оптимизации этих операций. Так, например, скорость выполнения операции перестановки элементов матрицы может быть увеличена в n2 раз по сравнению с выполнением ее на традиционной архитектуре [4] (Рис.2).



3.3. Введение сложных векторных операторов (экстракодов)

Следующим естественным шагом оптимизации векторного ИУ является введение экстракодов, определяющих в поле операций целые группы команд, наиболее часто встречающихся в вычислительных процессах. Подпрограммы экстракодов могут храниться в управляющем процессоре и иметь свои коды (экстракоды) операций над векторами. При операции экстракода запускается подпрограмма его выполнения.

Так может быть реализована операция умножения матриц и ряд других сложных операторов. Наличие эскракодов предусматривает введение в каждом векторном микропроцессоре регистров сверхоперативной памяти для хранения промежуточных результатов подпрограммы выполняемого эсктракода. Введение эсктракодов может значительно увеличить скорость выполнения этих операций и, в первую очередь, за счет сокращения обращений к ОЗУ.

3.4. Опережающий просмотр последовательности векторных команд

Следующий прием оптимизации вычислительного процесса векторного ИУ может вызвать существенный пересмотр принципов взаимодействия между векторной и скалярной частью суперЭВМ. Она сводится к опережающему просмотру заявок на выполнение операций, поступающих на векторный процессор. Так, управляющий векторный процессор может, не дожидаясь выполнения операции над пакетом ее дескрипторов, определить место результата этой операции, сформировать дескриптор результата и отослать его в скалярную часть. Продолжая таким образом взаимодействие векторной и скалярной части, можно "вытянуть" из выполняемой подпрограммы всю ближайшую очередь векторных операций. Анализируя их зависимость, можно динамически формировать подпрограммы, сокращая обращения к векторной памяти. Последнее предложение по оптимизации операций в векторном ИУ, безусловно, требует более глубокой проработки. Реализация этих идей, возможно, приведет к введению векторной КЭШ памяти в каждом процессорном модуле.



Заключение

Приведенные соображения по разработке векторного исполнительного устройства говорят о том, что на однопроцессорной суперЭВМ нетрадиционной архитектуры при элементной базе, обеспечивающей темп работы полупроводниковой АП в 10 нс, уже сегодня возможно построить процессор с максимальной производительностью на скалярных операциях 10 Гфлопс (1010), а на векторных более ста Гфлопс (1011). При этом принцип аппаратного распределения ресурсов вычислительных средств будет сохранен, что обеспечит максимальное



146

В.С.Бурцев. Особенности проектирования векторного исполнительного устройства в системе массового параллелизма с автоматическим распределением ресурсов

автоматическое распараллеливание вычислительных процессов и хорошую загрузку аппаратных средств.



Литература

  1. В.С.Бурцев. Система массового параллелизма с автоматическим рапределением аппаратных средств суперЭВМ в процессе решения задачи. Юбилейный сборник трудов ОИВТА РАН, М, 1993, т2, с. 5-27.

  2. В.С.Бурцев, В.Б.Федоров. Ассоциативная память на принципах оптической обработки информации для суперЭВМ нового поколения (в данной книге).

  3. V.B.Fyodorov. Optoelectronic multiport associative memory for data flow computing architecture. Proc.1994 Int.Conf. on Optical Computing, Inst. Phys. Conf.Ser., 1994, V139. pp87-92.

  4. V.S.Burtsev. Application of optical methods of information processing in a supercomputer architecture. International Journal of Optoelectronics, 1994, v9, N6, p. 489-503.

147

Основные этапы научной деятельности Бурцева B.C.

Бурцев Всеволод Сергеевич, академик Российской Академии наук, директор Института высокопроизводительных вычислительных систем РАН, является крупнейшим специалистом нашей страны в области создания высокопроизводительных вычислительных машин и комплексов как универсальных, так и специализированного применения для управления объектами, работающими в масштабе реального времени.

В.С.Бурцев начал свою деятельность под руководством выдающегося ученого академика С.А.Лебедева еще до окончания Московского энергетического института. Темой его дипломной работы была система управления первой советской быстродействующей электронной машины - БЭСМ АН СССР. Уже на дипломном проектировании он стал одним из ведущих разработчиков в создании этой системы.

Под его научным руководством и при непосредственном участии проведены следующие научные исследования, которые имели большое научно-техническое значение и были внедрены в промышленность.

1953-1956 гг. Бурцев B.C., являясь ответственным исполнителем, разработал принцип селекции и оцифровки радиолокационного сигнала. На основе этого принципа был осуществлен съем данных о цели с радиолокационной станции и ввод их в вычислительную машину. Успешно был проведен эксперимент одновременного сопровождения нескольких целей вычислительной машиной. На базе этой работы была написана кандидатская диссертация, а на защите члены совета единогласно проголосовали за присуждение Бурцеву B.C. степени доктора технических наук. Успешный эксперимент со съемом данных с радиолокационных станций в корне изменил структуру управляющих противоракетных и противосамолетных комплексов.

1956-1961 гг. Под непосредственным руководством В.С.Бурцева разработаны принципы построения вычислительных средств Противоракетной обороны (ПРО) и создан высокопроизводительный вычислительный комплекс для решения задачи высококачественного автоматического управления сложными, разнесенными в пространстве объектами, работающими в масштабе реального времени.

Вычислительные комплексы ПРО были оснащены самой быстродействующей в то время серийной ЭВМ М-40, в которой Бурцевым B.C. впервые были предложены принципы распараллеливания вычислительного процесса за счет аппаратных средств - все основные устройства машины (арифметическое, управления, ОЗУ, управления внешней памятью и т.д.) имели автономные системы управления и работали параллельно во времени. Впервые был использован принцип мультиплексного канала, благодаря которому без замедления вычислительного процесса удалось осуществить прием и выдачу информации с десяти асинхронно работающих направлений с общей пропускной способностью 1 млн. бит/с

148

1961-1968 гг. Под непосредственным руководством В.С.Бурцева для создания сложных боевых комплексов была разработана первая высокопроизводительная полупроводниковая ЭВМ 5Э92б с повышенной структурной надежностью и достоверностью выдаваемой информации, основанными на полном аппаратном контроле вычислительного процесса. В этой ЭВМ впервые был реализован принцип многопроцессорности, внедрены новые методы управления внешними запоминающими устройствами, позволяющие осуществлять одновременную работу нескольких машин на единую внешнюю память. Все это дало возможность по новому строить вычислительные управляющие и информационные комплексы для систем ПРО, управления космическими объектами, центров контроля космического пространства и так далее. Многомашинные вычислительные комплексы с автоматическим резервированием хорошо зарекомендовали себя в реальной работе.

1969-1972 гг. Бурцев B.C., являясь Главным конструктором, создал первую вычислительную машину третьего поколения для возимой серийной противосамолетной системы С-300. Это была трехпроцессорная ЭВМ, построенная по модульному принципу. Каждый модуль (процессор, память, устройство управления внешними связями) был полностью охвачен аппаратным контролем, благодаря чему осуществлялось автоматическое скользящее резервирование на уровне модулей в случае их отказов и сбоев, практически без прерывания вычислительного процесса. Комплекс, равный по производительности БЭСМ-6, занимал объем не более одного кубического метра. Эти комплексы в системе С-300 и до настоящего времени стоят на боевом дежурстве и продаются в другие страны.

1973-1985 гг. Являясь Главным конструктором многопроцессорного вычислительного комплекса (МВК) "Эльбрус-1" и "Эльбрус-2", Бурцев B.C. наряду с принципиальными схемотехническими вопросами большое внимание уделял конструктивно-технологическим вопросам, принципиальным вопросам системы охлаждения и повышения интеграции элементной базы, а также вопросам автоматизации проектирования. В процессе создания МВК "Эльбрус-2" по его инициативе и при непосредственном участии созданы новые быстродействующие интегральные схемы, высокочастотные групповые разъемы, многокристальные и большие интегральные схемы, микрокабели, прецизионные многослойные печатные платы. Это было большим вкладом в развитие технологии в нашей стране.

1980 г. Были закончены работы по созданию МВК "Эльбрус-1" общей производительностью 15 млн. оп/с.

1985 г. Успешно завершены Государственные испытания десятипроцессорного МВК "Эльбрус-2" производительностью 125 млн. оп/с. Оба комплекса освоены в серийном производстве.

При создании этих комплексов были решены принципиальные вопросы построения универсальных процессоров предельной производительности. Так, динамическое распределение ресурсов сверхоперативной памяти исполнительных устройств и ряд других решений, впервые используемых в схемотехнике, позволили в несколько раз увеличить производительность каждого процессора. С целью дальнейшего повышения производительности комплекса были решены фундаментальные вопросы построения многопроцессорных систем, такие как

149

исключение взаимного влияния модулей на общую производительность, обеспечение обезличенной работы модулей и их взаимной синхронизации.

1986-1993 гг. Разработана структура суперЭВМ, основанная на новом не фон-Неймановском принципе, обеспечивающая существенное распараллеливание вычислительного процесса на аппаратном уровне. Эта архитектура использует новейшие принципы оптической обработки информации, обладает высокой регулярностью структуры и позволяет достичь производительности 1010 - 1012 оп/с. Принципиальной особенностью предлагаемой архитектуры является автоматическое динамическое распределение ресурсов вычислительных средств между отдельными процессами и операторами. Решение этой проблемы освобождает человека от необходимости распределения ресурсов при программировании параллельных процессов в многомашинных и многопроцессорных комплексах.

Работы по исследованию и созданию новых архитектур ЭВМ проводились в рамках "Программы Основных направлений фундаментальных исследований и разработок по созданию оптической сверхвысокопроизводительной вычислительной машины Академии наук" (ОСВМ РАН).

В настоящее время В.С.Бурцев является научным руководителем фундаментальных исследований по разработке различных нетрадиционных архитектурных решений высокопроизводительных вычислительных машин с использованием новых физических принципов, а также системного программного обеспечения с целью создания информационно-вычислительных комплексов с максимальной производительностью 1012 - 1014 оп/с.

Бурцев B.C. удостоен Ленинской и Государственных премий, награжден орденами Ленина, Октябрьской революции, Трудового Красного знамени и медалями. За цикл работ "Теория и практика создания высокопроизводительных многопроцессорных вычислительных машин" ему присуждена премия АН СССР имени С.А.Лебедева.

Он является автором более 150 научных работ, опубликованных как в нашей стране, так и за рубежом, которые положены в основу проектирования новых вычислительных средств и используются в учебных целях в ведущих ВУЗах России.

Бурцев B.C. ведет большую работу по подготовке научных кадров. Под его руководством успешно защитили диссертации на соискание ученой степени кандидата и доктора технических наук более 40 человек. Он преподавал более 20 лет в Московском физико-техническом институте со дня его основания. В настоящее время Бурцев B.C. является заведующим филиала кафедры "Микропроцессорные системы, электроника и электротехника" и научным руководителем кафедры "Высокопроизводительные вычислительные системы" Московского авиационно-технологического университета им. К.Э.Циолковского.



150

Содержание

Предисловие 3

В.С.Бурцев. Значение создания ENIAC в развитии информацион-
но-вычислительных и управляющих систем России 5

В.С.Бурцев. О необходимости создания суперЭВМ в России 18

В.С.Бурцев. Новые подходы к оценке качества вычислительных

средств 28



В.С.Бурцев. Выбор новой системы организации выполнения высоко-
параллельных вычислительных процессов, примеры воз-
можных архитектурных решений построения суперЭВМ 41

В.С.Бурцев. Использование оптических методов обработки инфор-
мации в архитектуре суперЭВМ 79

В.С.Бурцев, В.Б.Федоров. Ассоциативная память на принципах оп-
тической обработки информации для суперЭВМ ново-
го поколения 105

В.С.Бурцев, Л.Г.Тарасенко. Использование микропроцессоров тра-
диционной архитектуры в системе потока данных 121

В.С.Бурцев. Особенности проектирования векторного исполни-
тельного устройства в системе массового параллелиз-
ма с автоматическим распределением рессурсов 140

Основные этапы научной деятельности В.С.Бурцева 148

B.C. Бурцев

Параллелизм вычислительных процессов и развитие архитектуры суперЭВМ

юбилейный выпуск



Оригинал - макет подготовлен в ИВВС РАН на персональном компьютере IBM PC



Подписано в печать 22.01.97. Заказ Тираж 500 экз.

Отпечатано в типографии издательства "НЕФТЬ И ГАЗ"

Достарыңызбен бөлісу:
1   ...   8   9   10   11   12   13   14   15   16




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет