84
В.С.Бурцев. Использование оптических средств обработки информации в архитектуре суперЭВМ
- при расширении класса задач и переходе к обработке в качестве данных сложных структур (деревья, списки, графики, сети и т.д.) требования к реализации массового параллелизма вычислительного процесса становятся более жесткими [3].
Исследования, проведенные в Вычислительном Центре Коллективного Пользования (ВЦКП) в области параллельных вычислений на ассоциативных сетях, представляют собой следующий шаг в направлении реализации массового параллелизма в архитектуре вычислительных средств.
Ниже будет произведен сравнительный анализ возможности создания устройств суперЭВМ новой архитектуры.
2. Реализация оптических принципов обработки информации в суперЭВМ с нетрадиционной архитектурой
2.1. Скалярное исполнительное устройство
В настоящее время в одном корпусе на полупроводниках может быть реализовано многофункциональное исполнительное устройство с темпом работы 5-10 нс и временем выполнения операции порядка 50 нс.
Рис.5. Типовая схема оптического процессора.
ПЧК - поляризационно-чувствителъный кубик, М - мультиплексор, И - система суперпозиционирования изображения, ОС - блоки определения символов, МИ - матрицы световых инверторов, А - матрица усилителей, Ф - формирователи измененных символов.
Оптический процессор, типовая схема которого показана на Рис.5, неконкурентоспособен с полупроводниковым по основному параметру - работе, затраченной на одно логическое срабатывание Аэ = τ3Рэ, где τ3 - задержка логического элемента, Рэ - потребляемая им мощность.
Реализованное в 1989 году в Bell Lab аналогичное арифметическое устройство на СС Sid не превосходит по темпу 1 мкс и потребляет значительно большую мощность на одно логическое срабатывание.
2.2.Память
Более 15 лет ведутся поиски материала, пригодного для реверсивной оптической памяти. Существующие материалы оптической памяти по времени записи
85
В.С.Бурцев. Использование оптических средств обработки информации в архитектуре суперЭВМ
в сотни раз проигрывают полупроводниковым. В настоящее время представляется возможным реализовать на оптических принципах динамическую память, как в свободном пространстве, так и на оптоволокне.
Рис.6. Динамическая память на оптоволокне. Q - емкость памяти, L - длина оптоволокна, С - скорость распространения света в оптоволокне, Тr - скорость выполнения операций записи и считывания, Тор - время выполнения операций записи и считывания.
Приведенная на Рис.6, динамическая память представляет набор оптоволоконных линий задержек, замкнутых в кольцо. Количество линий может быть равно числу разрядов в слове памяти. По отдельному каналу передаются синхронизирующие импульсы, благодаря которым восстанавливается фаза импульсов в разрядных линиях задержки. Такая память аналогична памяти на дорожках диска, у которого линейная скорость перемещения носителя равна скорости света. Для работы этой памяти в системе потока данных достаточно реализовать запись информации по принципу на свободное место и считывание информации со стиранием. Работа таких схем записи и считывания показана на Рис.7, где представлена аналогичная память, реализованная полностью на оптических элементах и работающая в свободном пространстве.
В данном случае линией задержки является свободное пространство. Эта линия задержки замкнута сама на себя при помощи зеркал поляризационных оптических кубиков.
Единственным усиливающим элементом в этом зацикленном пространстве является вентиль несовпадения BH1. Если приходит импульс считывания, то BH1 закрывается и происходит стирание кадра данных, в котором может быть одно или несколько слов, и выдача этих данных через вентиль В1.
86
В.С.Бурцев. Использование оптических средств обработки информации в архитектуре суперЭВМ
Рис.7. Оптическая динамическая память в свободном пространстве.
В - вентиль совпадения, ВН - вентиль несовпадения, 10 - синхроимпульсы.
В случае записи одновременно поступают на вход В2 - данные и на ВН2 -импульс записи. Если место пустое, то на вход ВН2 приходит один импульс записи и ВН2 пропускает его на В2, в результате чего через В2 происходит запись кадра данных. Общая синхронизация схемы происходит за счет синхроимпульсов световой "накачки" I0.
Из принципа работы динамической памяти вытекают следующие соотношения объема памяти Q, времен цикла Топ и темпа (скорости) ее работы Ттемп:
Q = L / СОТтемп; Топ = L / СО или Q = Топ / Ттемп (1)
Из приведенных соотношений видно, что динамические памяти будут иметь определенное преимущество перед полупроводниковыми по темпу записи и считывания, однако будут значительно проигрывать по циклу записи и считывания информации (времени операции).
В настоящее время проблема создания памяти в свободном пространстве соизмерима с созданием быстродействующего логического элемента. Лучшие работы в этом направлении, при использовании оптоволокна, приближаются к темпу 500 пс (2 ГГц).
Динамическая память на оптических принципах может найти применение в векторных исполнительных устройствах (Рис.4), где важен темп выдаваемой информации и не так остро стоит вопрос с временем доступа. В том случае, если время Ттемп динамической памяти приблизится к пикосекундному диапазону,
87
В.С.Бурцев. Использование оптических средств обработки информации в архитектуре суперЭВМ
появится возможность ее использования в ассоциативной памяти и коммутаторе - распределителе. Однако, сравнительно высокие энергетические затраты делают такую память пока не конкурентоспособной.
2.3. Ассоциативная память
На Рис.8 приведена блок-схема памяти, полностью соответствующая функциям АП описанной выше суперЭВМ.
Рис.8. Блок-схема ассоциативной памяти.
На вход АП приходит данное с соответствующим ключом. Ключ в виде аргумента поступает на вход ассоциативной памяти ключей (АПК). При точном совпадении аргумента с одним из ключей ассоциативной памяти из нее выдается физический адрес соответствующего данного в памяти данных (ПД), по которому считываются необходимые данные и объединяются с данными искомого ключа. Одновременно со считыванием данных происходит их стирание в ПД и соответствующего ключа в АПК. Как правило, физический адрес АПК и ПД едины для одной и той же пары ключа и данных.
В том случае, если искомый ключ отсутствует в АПК, происходит запись этого ключа из входного регистра в АПК и соответствующего ему данного в ПД по одному и тому же физическому адресу. Типовая реализация этой блок-схемы на оптическом принципе приведена на Рис.9.
Искомый аргумент вместе с соответствующим данным отображается на управляющем транспаранте (УТ). Ассоциативной памяти ключей соответствует оптическое пространство А, а запоминающему устройству данных - оптическое пространство В. В соответствии с этим разбита и регистрирующая среда (PC). Шифратору физического адреса соответствует оптическая адресная система (АС). Фиксация результата ассоциативного поиска ключей производится матрицей фотоприемников (МФП1), а регистрация считанных данных -матрицей фотоприемников (МФП2). Хранимая в памяти информация регистрируется PC в виде прозрачных и непрозрачных участков, соответствующих записи двоичных "1" и "0". Таким же образом отображается информация на УТ.
88
В.С.Бурцев. Использование оптических средств обработки информации в архитектуре суперЭВМ
Рис.9. Ассоциативная память.
АС - адресная система, УТ - управляемый транспарант, PC - регистрирующая среда, МФП1 - матрица фотоприемников для фиксации результата поиска, МФП2 - матрица фотоприемников для данных, А - поле ключей, В - поле данных.
Для выполнения при ассоциативном поиске логических операций точного совпадения кодов двоичные разряды ключевых слов хранятся в памяти в парафазном коде:
,
а предъявляемый аргумент поиска (ключ) кодируется светоклапанными элементами УТ инверсным парафразным кодом
.
Запись информации (признаков и связанных с ними данных) производится путем ее отображения на определенный участок PC с использованием оптической адресной системы (АС), функции которой может выполнять, например, электрически коммутируемая матрица полупроводниковых лазеров (МПЛ). При ассоциативном поиске АС высвечивает световые пучки, соответствующие всем М физическим адресам ячеек памяти, благодаря чему изображение инверсного парафазного кода аргумента поиска проецируется на все ячейки памяти ключей, и суммарные сигналы результатов оптического сравнения этого кода с парафазными кодами хранящихся признаков фиксируются МФП1. Если один из ассоциативных признаков совпал с аргументом поиска, то на соответствующем элементе МФП1 сигнал будет отсутствовать. Этот сигнал инвертируется и запускает соответствующий лазер АС, который производит считывание данных на МФП2. В том случае, если искомый ключ не найден (все фотоприемники засвечены), происходит запись информации, находящейся на УТ в поле PC, для чего системой записи включается соответствующий лазер АС.
Из приведенной схемы работы АП видно, что наиболее принципиальной ее частью является операция ассоциативного поиска в памяти ключей (Рис. 10). В тоже время, именно здесь, в наибольшей степени могут использоваться характерные для оптики свойства широкополосности и широкоформатности передачи информации.
89
В.С.Бурцев. Использование оптических средств обработки информации в архитектуре суперЭВМ
Рис.10. Ассоциативная память ключей.
АС - адресная система на матрице полупроводниковых лазеров, УТ - управляемый транспарант, PC - регистрирующая среда, МФП - матрица фотоприемников для фиксации результата поиска.
Фактически информация кода искомого ключа доставляется до каждого элемента ключевой памяти с сопоставлением всех разрядов каждого ключа в единой точке. Безусловно, в выполнении этих функций ассоциативной памяти оптика будет иметь преимущества перед электронными принципами обработки информации. В выполнении функций записи и считывания информации по физическому адресу, электронные принципы реализации этих функций на полупроводниковой базе в настоящее время будут иметь определенное преимущество и, в первую очередь, по энергетике, технологичности и физическим объемам реализации этих устройств.
Предельные параметры ассоциативной памяти (ее объем и производительность) всецело определяются соответствующими параметрами АПК. Основными параметрами ассоциативной АПК можно считать следующие: объем хранящихся в памяти ключей Q, количество разрядов ключа n, время поиска tП и темп обработки информации или производительность П, время записи ключа по физическому адресу t3.
Для нормального функционирования скалярной части суперЭВМ новой архитектуры на первом этапе можно считать приемлемым объем памяти ключей Q = 106. Такая цифра может быть достаточной, имея в виду, что для векторного процессора за каждым ключом может содержаться от 102 до 104 слов в ПД.
Максимальная производительность такой АПК, исходя из заданной допустимой потребляемой мощности Рдоп, будет определяться следующим соотношением [7]:
Пmах= Рдоп η / 2nWQ (2)
где: W - минимальная энергия срабатывания фотоприемника, необходимая для различения нуля и единицы, η = , где η1 и η2 - коэффициенты, учитывающие потери в лазере и оптической системе, соответственно.
При определении величины W необходимо исходить из требований надежности срабатывания фотоприемного устройства, выполняющего функции порогового
90
В.С.Бурцев. Использование оптических средств обработки информации в архитектуре суперЭВМ
инвертора света. Воздействующий на него моноимпульсный сигнал от одномодового лазера с характерной для такого излучения пуассоновской статистикой фотонов должен содержать, по крайней мере, несколько тысяч фотонов [8], что в видимой области спектра эквивалентно энергии 10-15 Дж. Однако, в матрицах с большим числом фотоприемников их пороговая чувствительность определяется не столько статистическими свойствами светового сигнала, сколько факторами, связанными с неидентичностью и нестабильностью характеристик элементов, разбросом их параметров, кодозависимыми помехами как временного (предистория), так и пространственного характера (паразитные связи между соседними элементами). Вследствие этого, как показывает опыт практических разработок, реализовать в матрицах с большим числом фотоприемников пороговую чувствительность, превышающую W = 10-14 Дж, представляется весьма проблематичной задачей. Практически η не превышает 10-2 (η ≤ 10-1 и η ≤ 10-1). Задаваясь предельно допустимой мощностью устройства Рдоп = 10 4 Вт, ограниченной возможностью отвода тепла с поверхности устройства (при жидкостном охлаждении не превышает 20 Вт с кв.см.) и минимальным требуемым объемом памяти ключей Q = 106, n = 50 разрядам, получим предельную производительность АПК равную Пmах = 108 оп/с.
Из соотношения (2) следует, что увеличение объема памяти в несколько раз, во столько же раз снижает и максимально возможную производительность АПК. Поэтому дальнейшее повышение производительности системы может быть достигнуто только путем расслоения памяти на параллельно работающие модули. Причем, если зафиксировать допустимую мощность на всю систему модулей, то увеличение производительности системы будет пропорционально количеству блоков при неизменной общей памяти Q. Если же зафиксировать предельную мощность на один модуль системы, то производительность системы будет квадратично возрастать от количества модулей N. Таким образом, если схемотехнически решить возможность модульной организации АПК, то можно существенно расширить возможности АП в части ее производительности и объема. Настоящий анализ проводился без учета технологических возможностей построения ассоциативной памяти ключей.
Более полный анализ дает возможность определить времена записи и считывания информации при работе с АПК. Темп считывания (поиска) в такой памяти, в основном, ограничен скоростью модуляции лазерных элементов и может достигать 1-0.1 нс. По этому параметру АПК, построенная на оптических принципах, будет иметь существенное преимущество перед полупроводниковой.
Гораздо хуже обстоит дело со временем записи, которое в настоящее время в PC, построенных на жидких кристаллах, не превосходит 1 мкс, в то время как АПК, построенная на базе полупроводниковой техники, может иметь время считывания и записи равным 10 нс. Поэтому, построение оптической АП возможно только с использованием групповой страничной записи ключей в память.
На Рис.11 представлена блок-схема оптической АП, обеспечивающей групповую запись ключей. Ключи, поступающие на такую систему, сначала проверяются на совпадение в небольшой ассоциативной полупроводниковой памяти, а затем в оптической.
91
В.С.Бурцев. Использование оптических средств обработки информации в архитектуре суперЭВМ
Рис.11. Блок-схема ассоциативной памяти ключей.
Если ключ найден в любой из двух памятей, он стирается и вырабатывается адрес. Если же ключа нет ни в той, ни в другой памяти, то он записывается сначала в полупроводниковую память, а затем передается в буфер для групповой записи в оптическую память. Использование метода групповой записи позволяет практически сравнять темп записи и считывания, но требует больших аппаратных затрат [5].
Интересными представляются работы по построению АП, в которых хранение информации осуществляется на полупроводниковых триггерах так же, как в обычной полупроводниковой памяти, причем каждый элемент памяти управляет оптическим элементом, меняющим свои свойства пропускания или отражения света.
Рис.12. Оптоэлектронная ассоциативная память.
Развивая идею совместного использования электронных и оптических принципов обработки информации в одном устройстве уже на более совершенном, развивающемся в настоящее время технологическом уровне, можно говорить о перспективной АПК, основой которой будет двумерная матрица ячеек памяти ключей, состоящих из пространственно-временных модуляторов света, и размещенных в непосредственной близости от них и электрически
92
В.С.Бурцев. Использование оптических средств обработки информации в архитектуре суперЭВМ
связанных с ними триггеров, хранящих информацию о кодах ключей. На Рис.12. приведена схема такого модуля ассоциативной памяти.
Перезапись ключей по адресу в плате памяти, шифрация и дешифрация физических адресов ячеек памяти, а также хранение связанной с ключами информации, осуществляется электронным устройством, имеющим в своем составе полупроводниковую память. Функции маскируемого регистра выполняет матрица полупроводниковых лазеров (МПЛ), на которой с помощью электронного дешифратора отображается инверсный код предъявляемого аргумента поиска. Физические адреса совпадений фиксируются матрицей фотоприемников. Оптическая система, состоящая из размещенных на фокусном расстоянии объективов, двойного растра линз, поляризационно-чувствительных кубиков и расщепителя световых пучков каждого из лазеров, на М световых пучков позволяет проецитировать в плоскость платы памяти микроизображения МПЛ и в плоскость МФП картину распределения s - компоненты излучения, возникающей за каждой из линз растра при отражении световых пучков от платы памяти.
Использование в качестве УТ полупроводниковой матрицы, позволяет в модуле АП реализовать схему одновременного поиска информации по многим ключам [11], что существенно расширяет пропускную способность модуля и АП в целом.
Таким образом, можно предполагать, что в недалеком будущем оптические и электронные принципы обработки информации, реализуемые на единой технологической базе, будут дополнять друг друга.
Дальнейшее развитие использования оптических принципов обработки информации в архитектуре суперЭВМ нового поколения связано с существенной интеграцией оптических и электронных принципов на единой технологической базе.
2.4. Коммутаторы
Определим требования к коммутаторам K1 и К2:
-
К1 должен обеспечивать передачу ста пакетов данных на все свободные исполнительные устройства за время 1 - 10 нс. Те данные, для которых не хватило исполнительных устройств, должны быть запомнены до следующего такта и т.д. Каждый пакет содержит 100 - 200 разрядов;
-
К2 должен обеспечивать передачу ста пакетов данных по ста направлениям в соответствии с адресом, имеющимся в каждом пакете, за время одного такта 1 - 10 нс;
-
Кз должен обладать небольшим временем перекоммутации направлений -порядка нескольких десятков наносекунд, однако он должен передавать каждые 1 - 10 нс кванты информации объемом в страницу (128 х 64 бит) между всеми восемью направлениями одновременно по входу и выходу.
Пространственные коммутаторы
Пространственные коммутаторы бывают одноступенчатые, как правило матричные, и многоступенчатые. Типовой матричный коммутатор изображен на Рис.13. Информация с входных каналов при помощи оптических систем разводится на все j-ые элементы i-oro столбца. Каждый элемент имеет электронное
93
В.С.Бурцев. Использование оптических средств обработки информации в архитектуре суперЭВМ
управление, которое делает каждый элемент либо прозрачным, либо отражающим и непропускающим свет. Информация с входных каналов при помощи оптических систем разводится на все j-ые элементы i-oro столбца. Каждый элемент имеет электронное управление, которое делает каждый элемент либо прозрачным, либо отражающим и непропускающим свет.
Оптические системы объединяют все i-ые элементы каждой j-ой строки в выходные каналы. Таким образом, каждый входной i-ый канал может быть скоммутирован с каждым выходным j-ым каналом в том случае, если во всех j-ых строках имеется не более одного элемента, пропускающего свет.
Рис.13. Матричный пространственный коммутатор.
По каналам может передаваться как последовательный код, так и параллельный (матрицами). В большинстве случаев передается последовательный код, а преобразование из параллельного в последовательный и обратно производится при входе в канал и, соответственно, при выходе из него. Таким образом, используются два основных преимущества оптики - широкополосность при уплотнении в один канал и широкоформатность при одновременной коммутации большого количества каналов. В последнее время стала возможной и интегральная реализация этой системы коммутации (Рис.14).
Рис.14. Интегральная реализация матричного коммутатора.
В этом случае в качестве разводящих и собирающих оптических систем могут быть использованы плоские голограммы в сочетании с пространственно-модулируемой матрицей света ПМС, которые могут быть созданы на жидких
94
В.С.Бурцев. Использование оптических средств обработки информации в архитектуре суперЭВМ
кристаллах, на магнитооптике и на элементах, работающих на квантоворазмерных эффектах.
Рис.15. Многоступенчатый коммутатор на дефлекторах.
Пример многоступенчатого коммутатора света показан на Рис.15. Основным элементом такого коммутатора является дефлектор, управляемый электрическим сигналом. Дефлектор, в зависимости от поданного на него напряжения, меняет угол преломления и, таким образом, либо пропускает луч, либо отклоняет его. Выстраивая последовательно каскады дефлекторов, можно вести коммутацию луча пo N каналов при log2N каскадов.
В настоящее время ведутся исследования возможности использования электрооптических дефлекторов на кристалле DKDP, акустооптических модуляторов света, интегрально-оптических ответвителей и т.д.
Многоступенчатые модуляторы будут иметь преимущества перед матричными при построении коммутационных систем тогда, когда будет выполняться соотношение 1 / N > ηlog2N, где η - коэффициент полезного действия дефлектора, равный η = Евых / Евх, Евых и Евх - интенсивности светового сигнала на входе и выходе дефлектора.
К пространственным коммутаторам можно отнести и статический коммутатор с использованием линеек лазеров и фотоприемников. Его создание с использованием линеек лазеров, а в последствии возможно и матриц лазеров и фотоприемников, становится реальным благодаря успехам технологии последних лет в области интегральной оптики. Схема одноразрядного статического коммутатора приведена на Рис.16.
Каждый канал коммутации имеет лазерную линейку, работающую в достаточно легком режиме - допускается срабатывание только одного лазера из N находящихся в линейке. Лазеры управляются от дешифратора, выбирающего тот канал, с которым должна быть выполнена коммутация. Свет от возбужденного
Достарыңызбен бөлісу: |