Рассмотрим задачу синтеза оптимального управления стохастиче-
скими динамическими объектами [4–6].
Задана математическая модель объекта управления – модель нели-
нейной стохастической системы при воздействии на нее случайного
сигнала:
˙
x
=
f
(
x
) +
g
(
x
)
u
(
x
) +
k
(
x
)
w
(
t
);
y
=
h
(
x
)
,
(1)
где
f
(
x
)
,
g
(
x
)
,
k
(
x
)
,
h
(
x
)
— векторы, зависящие от параметров систе-
мы;
w
(
t
)
— случайный сигнал воздействующий на систему;
u
(
x
)
—
управление.
Требуется найти управление, доставляющее экстремум:
T
0
y
(
t
)
2
+
u
T
(
t
)
R
u
(
t
)
dt γ
2
T
0
w
T
(
t
)
P
w
(
t
)
dt,
(2)
где
γ
— коэффциент уровня воздействия случайного сигнала на систе-
му; R, P — корреляционные матрицы управления и случайного сигнала.
Начальная функция плотности вероятности состояния
W
(
t, x
)
, ко-
торая фиксирует состояние неопределенности в момент
t
= 0
, счита-
ется известной и равной
W
(0
, x
) =
W
0
(
x
)
.
Оптимальный закон управления имеет вид
u
∗
(
x
) =
−
1
2
R
−
1
g
т
(
x
)
∂V
∗
(
x
)
∂x
,
(3)
где
V
∗
(
x
)
— решение уравнения Гамильтона–Якоби–Беллмана–Айзекса
(ГЯБА) вида
∂V
т
∂x
f
+
h
т
h
+
1
4
∂V
т
∂x
1
2
γ
2
k
P
−
1
k
т
−
g
R
−
1
g
т
∂V
∂x
= 0
.
(4)
Перепишем (4) в обобщенном виде
∂V
т
∂x
(
f
+
gu
+
kw
) +
h
т
h
+
u
2
R
−
γ
2
w
2
P
= 0
.
(5)
Уравнение (5) описывает решение задач синтеза управления как
при полной, так и при ограниченной информации о возмущениях на
систему.
Отметим, что при сведении преобразованных нелинейных урав-
нений в частных производных к линейной задаче значение функции
V
∗
(
x
)
для оптимального закона управления может быть получено пу-
тем итерации по начальному значениюзакона управления
u
0
(
x
)
.
Разработка алгоритмов синтеза.
Пусть
u
0
(
x
)
— начальное зна-
чение закона управления для динамической системы (1). Найдем ите-
ративное решение уравнения (5).
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2012. № 3 31