Динамическая модель вертолета для авторефлексивной системы управления вертолетом на основе нейросетей.

0
 

Кочнева
Марина Юрьевна

 

Кейзеров
Сергей Иванович

 

Орлов
Дмитрий Владимирович

 

Рахметов
Эдуард Рустамович

Ключевые слова: БЛА, системы управления, динамическая модель, нейросетевые технологии.
Аннотация: В данной статье рассматривается задача по разработке динамической модели вертолета для авторефлексивной системы управления. В результате исследований авторами была предложена динамическая модель для описания вектора состояния в особых кинематических переменных. Данная модель апробирована для генерации управляющий сигналов системы управления модели вертолета и была признана успешной.

Keywords: UAV, automation system, dynamical model, Deep learning.
Abstract: In this article the task on development of a dynamic model of the helicopter for autoreflexive management system is considered. As a result of researches authors offered a dynamic model for the description of state vector in special kinematic variables. This model is approved for generation the managing director of signals of management system of model of the helicopter and recognized as successful.

1. Введение
Целью настоящей работы является разработка динамической модели вертолета для системы автоматического управления беспилотным летательным аппаратом (БЛА) на основе нейросетей. Если мы рассматриваем БЛА как твердое тело, то соответствующие динамические уравнения –это хорошо известные уравнения Ньютона-Эйлера . В настоящее время аэродинамические силы, действующие на твердое тело, хорошо изучены и используются для построения динамических моделей самых различных летательных аппаратов . Однако, эта задача становится нетривиальной, если нужно учесть стохастическое воздействие среды на летательный аппарат, например, воздействие ветра и атмосферных осадков. Кроме того, в нашем случае динамическая модель нужна в качестве референсной модели в системе автоматического управления БЛА, то есть модель не должна быть ресурсоемкой, должна подходить для формирования однозначного вектора состояния БЛА и быть пригодной для формирования управляющих сигналов (стационарных решений, которые являются целевыми состояниями для управляющей программы). Также важным является выбор динамических переменных, используемых для описания положения БЛА, например, традиционные углы Эйлера (в отличие от кватернионов) не позволяют избежать сингулярностей при описании поворотов твердого тела .

 

 

 

 

2. Авторефлексивная система управления аппаратом.
Контроль состояния аппарата в пространстве осуществляется при помощи: 1) датчиков (акселерометры, гироскопы и т.д.), 2) камер (SLAM), 3) GPS, ГЛОНАСС. Условно данная группа называется «датчики». На основании данных датчиков синтезируются координаты аппарата в пространстве, а также его текущий вектор состояния (ориентация, скорость, ускорение, угловая скорость).

Координаты и текущий вектор состояния передаются в блок исполнения полетного задания (БИПЗ) или оператору аппарата, который вычисляет целевой вектор состояния. При вычислении целевого вектора состояния используются параметры актуальной модели аппарата (МА).
Текущий и целевой вектора состояния передаются в блок, синтезирующий управляющие сигналы (СУС) для управляющих элементов аппарата (двигатели, перекосы и т.д.), а также в виртуальный симулятор аппарата.
Сравнение данных на выходе симулятора с реальными (производится в компараторе) позволяет определить: 1) шумовую составляющую окружающей среды (ветер, осадки, удары по аппарату), которая передается в СУС; 2) изменение параметров аппарата, которые фиксируются в МА.
Разница между поведением реального аппарата и его виртуального модели может быть объяснена с помощью шумовой составляющей окружающей среды или посредством изменения параметров аппарата. Другими словами, типичное поведение БЛА, которое наблюдается после изменения массы аппарата или тяги какого-либо двигателя, нужно описывать сложной комбинацией шумовых воздействий; и наоборот типичная реакция аппарата на стохастические воздействия среды может осуществляться только при нестационарных и кратковременных изменениях в параметрах аппарата. Вот почему нужна оценка вероятности того, чем вызваны девиации аппарата (воздействием окружающей среды, изменением параметров или и обоими факторами одновременно). Для выполнения данной задачи подходит нейронная сеть классификатор.
В случае, если происходит: 1) отклонение координат или вектора состояния от допустимых (заложенных в полетном задании) больше, чем на заданную величину; 2) отклонение аппарата от поведения виртуальной модели больше, чем на заданную величину; 3) изменение актуальных параметров модели аппарата больше, чем на заданные величины – генерируется аларм-сигнал и БИПЗ переходит в состояние выполнения аварийного сценария (аварийная посадка, передача сигнала оператору и т.д.).
2. Динамическая модель вертолета.

либо — координаты центра тяжести вертолета
либо — репер ориентации ( смотрит вперед, — вверх, образует вместе с ними ортонормированную левую тройку векторов, т.е. , )
— масса вертолета
— тензор инерции в собственной системе координат
— угловая скорость вращения вертолета в системе Земли
— силы действующие на вертолет ( — сила тяжести, — сила, действующая на основной винт, — сила действующая на хвостовой винт, — все остальные, т.е. ветер и пр.)
— момент импульса вертолета как целого
— моменты сил, действующих на пропеллеры ( ) и другие возмущения

Подъемная сила винта и крутящий момент , действующий на винт (со стороны воздуха) являются некоторыми функциями угла атаки винта и пропорциональны квадрату скорости вращения винта

Здесь штрихи обозначают периодическую зависимость от времени (в зависимости от положения лопасти), кроме того, вычислен относительно центра винта, а не центра тяжести вертолета. Направления осей винтов и совпадают с осями и . Вектор — условная точка на лопасти, к которой можно считать приложенной сумму аэродинамических сил действующих на лопасть.
(вращение в плоскости, ортогональной )
(вращение в плоскости, ортогональной )
Нас интересуют усредненные по периоду величины.

где два штриха обозначают тот факт, что момент вычислен относительно центра винта
Для хвостового винта угол постоянный, поэтому и также постоянны и мы имеем

Для основного винта величина имеет периодическую составляющую

Величины и в низшем приближении можно записать в виде

Тогда

И после интегрирования

Моменты относительно центра тяжести равны

Для векторов запишем разложение

Причем (определяем направление «вперед» лежащим в плоскости, проходящей через центр тяжести, цент хвостового винта и ортогональное оси главного винта) и (центр тяжести основного винта находится в этой же плоскости). В идеально сбалансированном случае ось, проходящая через центр тяжести и центр основного винта, совпадает с осью основного винта, т.е. с направлением «вверх», а значит . В этих условиях суммарные силы и моменты

( , , )
Перепишем, разложив по компонентам:

В статике суммарная сила и суммарный момент сил, действующих на вертолет, должны быть равны нулю, поэтому в стабилизированном состоянии выполняются равенства:

Решением этой системы является

Таким образом, возможные стационарные состояния определяются одним независимым параметром. Причем, можно убедиться, что состояние с возможно только при специфическом сочетании физических параметров вертолета вида

3. Генерация управляющих сигналов.
Уравнения динамики БЛА в дискретном времени могут быть представлены в следующем виде:
(3.1)
(3.2)
где — вектор линейной скорости и — вектор угловой скорости БЛА, который может быть выражен через вектор ориентации БЛА в пространстве (углы , , и их производные); — управляющие сигналы на двигателях БЛА, — их экспоненциальные скользящие средние, и — некоторые «шумы»; наконец, — зависящие параметры и , и — некоторые постоянные величины, зависящие от конструкции модели и особенностей конкретного экземпляра летательного аппарата. Выражение (3.2), на самом деле можно было бы переписать в виде полностью аналогичном (3.1), выразив приращения углов как линейные по и функции, с коэффициентами, нелинейно зависящими от самих углов.
Выписанные уравнения представляют собой линейный фильтр с нелинейной обратной связью, поэтому программная реализация его методами численного интегрирования не представляет особой сложности как в «прямом» направлении (вычисление вектора состояния по заданным управляющим сигналам и зафиксированным шумам), так и в обратном (восстановление шумов по имеющейся траектории и управляющим сигналам, либо восстановление управляющих сигналов при наличии информации о траектории и шумах). При этом, «теоретически» виды всех функций и параметров известны. Однако на деле эти параметры зависят от конкретного экземпляра БЛА, то есть его массы, тензора момента импульса, точного расположения центра масс по отношению к двигателям, направлений тяги, генерируемой двигателями, скоростью их раскручивания и т.д. Усредненные значения данных параметров варьируются вокруг параметров «идеальной модели» БЛА, заданных на этапе конструирования, однако для надежной работы конкретного экземпляра следует знать параметры именно этого аппарата, либо иметь возможность адаптироваться под неизвестные параметры. Последняя задача, т.е. адаптация под неизвестные параметры конкретного экземпляра БЛА, может быть решена с помощью нейронной сети.
4. Заключение.
В данной работе представлены уравнения динамической модели вертолета их стационарные решения, пригодные для использования в автоматической системе управления летательным аппаратом, решена задача выбора удобных кинематических переменных для описания вектора состояния вертолета и параметров аппарата. Данная модель была использована для генерации управляющих сигналов автоматической системы управления. В приложении рассмотрена задача учета стохастических сил, действующих на летательный аппарат.
Приложение А. Учет внешних стохастических сил.
Силы воздействия внешней среды условно можно разбить на две части: силы, оказываемые на летательный аппарат со стороны воздуха (сопротивление, подъемная) и силы случайного характера (дождь, град, частицы песка и гравия в случае полетов низко над землей и т.д.)
(5.5)
Аэродинамическая сила в широких пределах пропорциональна квадрату скорости аппарата относительно воздушной среды, с коэффициентами пропорциональности, зависящими от положения аппарата в воздушном потоке (в частности – угол атаки для крыла). В общем случае вектор силы направлен неколлинеарно относительной скорости, и в низшем приближении «коэффициент пропорциональности» представляет собой матрицу. Таким образом,
(5.6)
где мы в явном виде выписали геометрические индексы (малые греческие символы), чтобы было ясно, как матрица действует на вектор . Зависимость от в общем случае аналитически непредставима и является предметом либо численного расчета, либо результатом замеров в аэродинамической трубе. Поскольку величина на самом деле является нелинейной функцией без «плохих» (недифференцируемых) особенностей (бесконечностей и точек осцилляций), то она хорошо аппроксимируется нейронными сетями. Более того, для восстановления этой функции можно обойтись без аэродинамической трубы – а именно, воспользоваться результатами достаточно большой выборки сравнения спрогнозированного и реализовавшегося поведения летательного аппарата в контролируемых условиях в различных режимах в неподвижном воздухе.
Относительная скорость равна разности скоростей воздух и аппарата в неподвижной системе координат:
(5.7)
где — скорость воздуха относительно земли. Величина — известна и в идеальных условиях прогнозируема. Величина имеет случайный характер (даже если предположить, что мы можем с приемлемой точностью и скоростью решать уравнения гидродинамики сплошной среды, для получения конкретного решения нужно было бы знать поле давлений и скоростей воздушных масс на неопределенно большом расстоянии вокруг аппарата, что конечно же невозможно). Однако, для случаев достаточно малых квантов времени мы можем предположить
(5.8)
где — случайная величина, имеющая математическое ожидание равное нулю и, вообще говоря, скоррелированная с предыдущими значениями и . Предполагается, что дисперсия и типичные значения автоковариации величины много меньше типичных значений квадрата скорости (такое предположение оправдано для случаев дозвуковых скоростей при достаточно малых ). При таких предположениях трата ресурсов на прогнозирование более качественное, чем математическое ожидание будет вряд ли оправданной, поэтому при вычислении прогнозного поведения аппарата на небольшое количество интервалов будет браться равное нулю. (т.е. скорость воздушных масс в ближайшие миллисекунды будет считаться той же самой, которая реализовалась в последний момент времени).
Величина , как уже говорилось, является суммой случайных воздействий «дробного» характера. Под «дробным» характером в данном контексте подразумевается достаточно сильное изменение импульса и момента летательного аппарата, происходящее за небольшой промежуток времени (сравнимый с интервалом ). Сложность состоит в том, что воздействия от разных источников имеют различные характеристики, причем сами же источники имеют нестационарный характер (град может начаться и закончиться, размер градин – а с ними и их воздействие – могут увеличиваться или уменьшаться со временем и т.д.). Тем не менее, по крайней мере для воздействий, не меняющих характеристик аппарата (веса, формы), в низшем приближении можно записать
(5.9)
где — моменты времени, в которые произошло воздействие на летательный аппарат с переданным импульсом .
Задача разделения воздействия внешней среды на аэродинамическую (почти стационарную) и «дробную» составляющую лишь по информации о разности между прогнозируемым и реализовавшимся состоянием летательного аппарата не имеет однозначного решения. Тем не менее, если частота «дробных» воздействий достаточно низка (по сравнению с ), сравнение поведения аппарата более чем за один интервал позволяет произвести такое разделение с достаточно хорошей вероятностью. А именно, берем интервалов и последовательно отбрасываем первое, второе и т.д. наблюдения; высчитываем средний квадрат изменения в оставшихся интервалах и считаем, что «дробное» воздействие произошло в том интервале, при отбрасывании которого получается наименьшее суммарное .
Конечно, если частота «дробных» воздействий высока (сравнима или чаще чем ), то описанный подход оказывается бесполезным. Однако, в этом случае воздействие по своему характеру будет подобно , только с другой матрицей . По этой причине, по крайней мере для наиболее типичных режимов внешней среды (отсутствие внешней среды, дождь, град) должны быть подобраны различные (т.е., обучены различные нейронные сети), и в каждый конкретный момент производится прогнозирование с помощью той, которая дает наименьшую среднюю ошибку прогноза.

comments powered by HyperComments
Поделиться.