ISBN 5-7262-0634-7. НЕЙРОИНФОРМАТИКА – 2006. Часть 1
А.Н. ЧЕРНОДУБ, И.В. МОКРОВ, М.В. КАРАВАЕВ,
А.А. ЖДАНОВ
Институт системного программирования РАН, Москва
E-mail: alexander.zhdanov@ispras.ru
ПРОТОТИП АВАРИЙНО-УСТОЙЧИВОГО АВТОПИЛОТА
НА ОСНОВЕ БИОНИЧЕСКОГО МЕТОДА
«АВТОНОМНОГО АДАПТИВНОГО УПРАВЛЕНИЯ»
Аннотация
Рассматриваются принципы построения системы автоматического пилотирования на основе авторского метода, способной к выработке новых стратегий поведения во внештатных ситуациях. Приводятся результаты тестирования системы на физической модели самолета.
Системы автоматического пилотирования летательных аппаратов (ЛА) – автопилоты, применяются, начиная с 30-х гг. XX века. Целью автопилота является поддержание заданного курса, крена и тангажа ЛА путем подачи управляющих воздействий на его рули без непосредственного участия пилота. Информацию о текущем состоянии и необходимости коррекции курса автопилот получает от соответствующих авиационных датчиков. Иногда системы, подобные автопилотам, используются не в автоматическом режиме, а в качестве «посредника» между пилотом и исполнительными устройствами – рулями самолета. Так, еще задолго до появления ЭВМ в авиации появился термин «программный автопилот» [1]. При использовании этого устройства, пилот, двигая рычагами управления, на самом деле управляет не рулями ЛА, а только указывает тем самым целевую функцию управления автопилоту, а непосредственно рулями управляет уже автопилот. Отличие между этими двумя подходами в управлении ЛА примерно такое же, как между способами управления автомобилем с «ручной» и «автоматической» коробками передач. С развитием авиации и усложнением ЛА «программных автопилотов» становятся всё более востребованными. Однако введение подобного «буфера» между человеком и ЛА имеет свои минусы. Один из них состоит в том, что пилот лишается возможности приспосабливаться к свойствам ЛА, что особенно важно, если свойства ЛА изменяются в течение полета вследствие каких-либо нештатных ситуаций.
В любом случае, современные автопилоты содержат априори рассчитанный детерминированный закон управления, который, получая на вход текущее положение ЛА и целевое положение ЛА, выдает нужное управляющее воздействие на рули управления. В нештатной ситуации (например, при обледенении крыльев, повреждении механизации крыльев, фюзеляжа и т.п. причин) ранее заложенный закон управления может стать мало применимым к изменившимся параметрам ЛА. При этом авария может произойти не потому, что ЛА потерял управляемость, а потому, что априори найденный закон управления автопилота оказался неэффективным в изменившихся условиях. Разработчики систем автопилотирования для преодоления указанной проблемы пытаются наделить свои системы свойством адаптивности, т.е. возможностью автоматического изменения закона управления в соответствии с изменившимися условиями. Практические возможности автоматизации обычно существенно уже, чем спектр методов адаптивного управления, который известен по современным публикациям в научных изданиях. Например, используется ручное или автоматическое переключение между различными режимами, т.е. использование различных априори заложенных законов управления в зависимости от конкретной распознанной ситуации. Например, воздух на различных высотах имеет различную плотность, поэтому автопилот на различных высотах использует различные прописанные заранее законы управления. Для автоматического распознавания и классификации нештатной ситуации нередко применяются искусственные нейронные сети. Здесь можно привести пример компании McDonnell Douglas Electronic Systems, разработавшей соответствующий переключатель режимов полета при повреждении конструкции самолета с использованием нейросетей [2]. Однако, очевидно, что невозможно априори заложить в автопилот все возможные нештатные ситуации и сценарии действия в них.
Вместе с тем, ситуация не представляется принципиально безнадежной. Хорошо известно, что в естественной природе можно наблюдать управляющие системы, обладающие требуемыми свойствами – нервные системы живых организмов. Это дает нам уверенность в том, что существует принцип управления, который обеспечивает действительно адаптивное управление – способность непосредственно в процессе управления находить и корректировать способ управления объектом с большой степенью начальной неопределенности знания свойств объекта и среды.
Попытки понять, моделировать и использовать биологические принципы управления предпринимаются в последние десятилетия, они составляют так называемое имитационное или бионическое направление систем «искусственного интеллекта». Одним из таких методов этого направления является разрабатываемый нами метод Автономного адаптивного управления (ААУ) [3].
В данной работе исследуется возможность замены традиционной схемы действия автопилота на схему, основанную на методе автономного адаптивного управления (ААУ). В соответствии с методологией ААУ, предполагается, что управление объектом можно осуществлять без использования заранее известной точной математической модели объекта управления. Алгоритм управления получается на основе эмпирически знаний, автоматически накапливаемых во время работы системы, и меняется по ходу ее эволюции. Если имеются какие-либо начальные знания о свойствах объекта управления, они также могут быть использованы. Качество управления, обеспечиваемое системой ААУ, повышается постепенно поп мере накопления знаний. Преимуществами такого подхода являются большая независимость системы управления от свойств объекта управления, а также способность системы управления приспосабливаться к меняющимся свойствам объекта управления.
При построении системы управления ЛА по методу ААУ, в качестве «элементной базой» была выбрана нечеткая логика [6]. В этом случае для представления знаний в базе знаний (БЗ) системы используются продукционные правила вида Oi & Aj Ok, где Oi и Aj – нечеткие множества, которым принадлежали значения входных и выходных переменных системы на предыдущем такте, а Ok – нечеткое множество, которому принадлежат значения входных переменных на текущем такте. Каждому правилу припишем оценку, которая будет показывать, насколько результирующий образ правила соответствует целевому образу (например, нулевому углу тангажа).
За вычисление оценок правил и текущего состояния системы отвечает другой блок системы – аппарат эмоций [8].
Генерация нечетких правил осуществляется с применением процедуры кластеризации эмпирически полученных знаний методом вычетов [7]. На основании результатов кластеризации, помимо правил, строятся также входные и выходные функции принадлежности, которые задают соответствующие входные и выходные множества системы.
Процедура распознавания образов совпадает с традиционной для нечетких контроллеров процедурой фаззификации, а вычисление управляющего воздействия – с процедурой дефаззификации.
Окончательное принятие решений происходит в соответствии со следующим принципом: если сумма всех результирующих посылок правил управления меньше заданного порога Smin, то решение выбирается случайным способом. В противном случае управляющее воздействие вычисляется по методу центра масс на основе результирующих посылок правил управления. Этот принцип позволяет совместить в одном два процесса: обучения и управления, действуя случайно в ситуациях, для которых недостаточно описывающих их правил управления, и действуя на основе БЗ в тех ситуациях, в которых система «знает» оптимальное или близкое к оптимальному действие.
Адаптация системы к изменяющимся параметрам ЛА происходит за счет введения для каждого нечеткого правила некой величины Ki, задающей степень адекватности правила текущим параметрам ЛА. Эти величины корректируются на каждом шаге работы системы в зависимости от того, насколько полно каждое правило описывало текущую ситуацию и насколько точно оно предсказало результирующую ситуацию. Правила с низкой степенью адекватности отстраняются от принятия решений.
Более подробное описание разработанной системы управления можно найти в статье “Построение нечетких контроллеров по методологии автономного адаптивного управления” этого же сборника.
Для экспериментальной проверки предложенного подхода был построен настольный аэродинамический стенд, физически моделирующий задачи адаптивного управления самолетом в нестационарных условиях. Рассмотрим вертикальное движение самолета под управлением обычного автопилота (рис. 1).
Рис. 1. Реальное движение самолета в возмущающем воздушном потоке
под действием автопилота всегда несколько отличается
от заданной целевой траектории
Автопилоту задается целевая траектория полета (target flight), по которой он должен вести самолет. Например, это прямая горизонтальная линия. На самолет действуют различные возмущающие силы, например, восходящие и нисходящие потоки воздуха, которые отклоняют самолет от целевой траектории. Автопилот противодействует этим возмущающим силам и возвращает самолет к целевой траектории. Однако никакой автопилот не может обеспечить полного совпадения реальной траектории движения самолета с целевой траекторией, потому что заложенная в нем математическая модель самолета неточно соответствует текущим свойствам реального самолета. По степени рассогласования реальной и целевой траекторий можно судить о качестве управления, обеспечиваемом автопилотом в различных ситуациях.
Физическая модель самолета (рис. 2) с размахом крыла 130 см была закреплена на проходящей в области его центра масс и прикрепленной к опоре горизонтальной оси так, что у самолета остается только одна степень свободы – угол тангажа. Внешние возмущающие воздействия – восходящие и нисходящие потоки воздуха, изменяющие угол атаки, моделируются с помощью внешнего вентилятора мощностью 1660 м3 воздуха/час, направление потока воздуха от которого можно изменять, кроме того, поток обладает определенной турбулентностью. Изменение угла тангажа модели самолета обеспечивалось рулем высоты, приводимом в движение сервомотором.
Цель эксперимента – продемонстрировать, что адаптивный автопилот способен обеспечить более высокое качество управления, чем автопилот, реализующий детерминированный закон управления согласно традиционной схеме и работающий в тех же условиях.
Рис. 2. Общий вид программно-физической модели автопилота,
основанного на методе ААУ
Команды на сервомотор подавались системой управления, реализованной в виде программы на стационарном персональном компьютере. Поскольку на модели самолета трудно установить авиационный датчик угла тангажа, то для получения данных о текущем значении угла мы разработали систему распознавания графических образов, которая анализировала текущее изображение модели самолета, поступающее со стационарной видеокамеры. В настоящей работе при разработке адаптивного автопилота мы отталкивались от системы управления «PILOT» – адаптивной системы стабилизации углового движения космического аппарата [4]. В качестве основного инструмента разработки системы был использован инструмент Designer 4GN [5].
Проводимые с системой эксперименты состояли из 5 шагов, результаты каждого из которых фиксировались в виде графиков (рис. 3-7), на которых по оси абсцисс отложены время (номера тактов работы системы), а по оси ординат – угол тангажа модели ЛА.
Рассмотрим подробно каждый шаг эксперимента.
Шаг 1. Вначале система управления ничего «не знает» о самолете. База знаний не содержит информации по управлению ЛА. Включается режим обучения (рис. 3).
Рис. 3. Режим первичного обучения неповрежденной модели самолета
|
Рис. 4. Режим обучения и управления неповрежденной модели самолета
|
Шаг 2. База знаний постепенно заполняется. Теперь система находится в смешанном режиме обучения и управления (рис. 4).
Шаг 3. В какой-то момент времени (приблизительно, через 20 мин после начала эксперимента) возможности обучения исчерпываются. Система управления переходит в режим управления. Качество управления еще оставляет желать лучшего, однако заметны правильные команды, приводящие к выравниванию самолета (рис. 5).
Шаг 4. Теперь мы моделировали поломку самолета, путем приклеивания куска клейкой ленты к рулю высоты. Это заставляло самолет немного «кабрировать» – задирать нос вверх. На графике также видно, что в самом начале был смещен фиксатор, ограничивающий перемещение самолета сверху. Качество управления ухудшается. Система переходит в режим управления с обучением (рис. 6).
Рис. 5. Режим управления неповрежденной модели самолета
|
Рис. 6. Режим управления поврежденной модели самолета
|
Шаг 5. После переобучения (через 5 мин) качество управления опять достигает некоторого максимума, хотя и не достигает того уровня, который был до поломки (рис. 7).
Рис. 7. Режим управления поврежденной модели
переобучившейся системы управления
Как видно из сравнения рис. 5 и 7, качество управления до внесения поломки значительно лучше, чем после повреждения и переобучения. Из графиков, представленных на рис. 6 и 7 видно, что качество управления моделью самолета после дообучения повысилось, т.е. система демонстрирует адаптивное поведение.
При анализе приведенных графиков необходимо иметь в виду, что во время экспериментов имела место значительная задержка при чтении данных с веб-камеры, которая существенно замедляла реакцию системы и, как следствие, снижала качество обучения и управления.
Важно отметить, что система не обладает специальными датчиками, информирующими о характере поломки. Нет также датчиков, информирующих о самом факте получения поломки. Знания об измененившихся параметрах физической модели были «получены» системой через несоответствие ожидаемого и фактического угла тангажа после выполнения команд, подаваемых на руль. Сценарий поведения системы в новых условиях был выработан автоматически, из эмпирически накопленных знаний о среде и объекте управления.
Поиск способов повышения эффективности адаптивного управления предусматривается в планах наших дальнейших исследований. По-видимому, в качестве основного критерия, позволяющего оценить способность системы к адаптации, можно использовать сравнение автоматической системы с человеком–оператором – лучшем из известных нам адаптивных систем управления.
Список литературы
1. Савельев В. В., Основные элементы системы стабилизации самолет-автопилот. Законы управления автопилотов: Учеб. Пособие. Тул. политехн. ин-т. - Тула: ТулПИ. - 1990. – 63 с
2.Журнал “Signal Magazine” # 2, 1991, c. 19.
3. Жданов А.А. Метод автономного адаптивного управления // Известия Академии Наук. Теория и системы управления, 1999, № 5, с. 127-134.
4. Жданов А.А., Беляев Б.Б., Мамаев В.В., "PILOT" - адаптивная система стабилизации углового движения космического аппарата. Использование принципа автономного адаптивного управления в системе угловой стабилизации космического аппарата "Спектр РГ": Сборник "Информационная бионика и моделирование" (под ред. акад. Лупичева Л.Н.), Изд-во ГосИФТП, 1995, с.87-114. 27 стр.
5. Жданов А.А., Устюжанин А.Е., Караваев М.В., Липкевич Д.Б., 4GN - инструмент для разработки нейроноподобных адаптивных систем управления на основе метода автономного адаптивного управления: Сб. научн. тр. Всероссийской научн.-техн. конференции Нейроинформатика-2005 М.: МИФИ. С. 203-209.
6. Заде Л. Понятие лингвистической переменной и его применение к принятию приближенных решений. – М.: Мир, 1976.
7. Jyh-Shing Roger Jang, Chuen-Tsai Sun, Eiji Mizutani. Neuro-fuzzy and soft computing. Prentice-Hall, 1997.
8. Жданов А.А. О методе автономного адаптивного управления (лекция). Сб. научн. тр. Всероссийской научн.-техн. конференции "Нейроинформатика-2004". М.: МИФИ.
УДК 004.032.26(06) Нейронные сети
Достарыңызбен бөлісу: |