Исследование задачи оптимизации в дискретной полумарковской модели управления непрерывным запасом - page 20

×
Z
U
˜
p
j
1
j
1
(
u
j
1
)
j
1
(
u
j
1
)
×
Z
U
˜
p
j
+1
j
+1
(
u
j
+1
)
j
+1
(
u
j
+1
)
×
. . .
×
×
Z
U
˜
p
N
1
N
1
(
u
N
1
)
N
1
(
u
N
1
) =
=
Z
. . .
U
(
N
1)
Z
ˆ
D
(
j
)
0
α
(
N
1)
,j
, u
0
, . . . , u
j
1
, u
j
+1
, . . . , u
N
1
N
1
Y
i
=0
i
6
=
j
i
(
u
i
)
.
(51)
Подставляя (51) в (49) и используя свойство линейности интеграла,
получаем утверждение теоремы.
I
С помощью формул (45)–(48) запишем выражение для стационар-
ного функционала, связанного с управляемым полумарковским про-
цессом, в аналитической форме. Рассмотрим стационарный показатель
качества управления в форме, аналогичной функционалу (1). Предпо-
ложим, что с рассматриваемым полумарковским процессом связан не-
который аддитивный функционал дохода, а показатель качества упра-
вления имеет вид
I
r
=
N
1
X
i
=1
r
i
π
i
N
1
X
i
=1
m
i
π
i
,
(52)
где
r
j
— математическое ожидание дохода за время пребывания в со-
стоянии
j, j
2
X
,
r
j
=
Z
U
r
j
(
u
j
)
j
(
u
j
) ;
(53)
m
j
— математическое ожидание времени пребывания в фиксированном
состоянии
j, j
2
X
,
m
j
=
Z
U
m
j
(
u
j
)
j
(
u
j
);
(54)
(
π
0
, π
1
, . . . , π
N
1
)
— вектор, представляющий собой стационарное
распределение вложенной цепи Маркова.
В соотношении (53)
r
j
(
u
j
)
— математическое ожидание дохода за
время пребывания в состоянии
j
при условии, что в момент перехода
в это состояние принято решение об управлении
u
j
2
U, j
2
X
. В
соотношении (54)
m
j
(
u
j
)
— математическое ожидание длительности
пребывания полумарковского процесса в состоянии
j
при условии, что
ISSN 1812-3368. Вестник МГТУ им. Н.Э. Баумана. Сер. “Естественные науки”. 2013. № 3
81
1...,10,11,12,13,14,15,16,17,18,19 21,22,23,24,25,26
Powered by FlippingBook