u
(1)
=
u
(1)
0
, . . . , u
(1)
(
N
0
−
1)
, то экстремум (максимум) соответствующе-
го функционала
I
d
G
(0)
i
(
∙
)
,
i
= 0
, N
0
−
1
существует и достигается
на вырожденных распределениях вида
G
(1)
i
(
x
) =
0
, x
≤
u
(1)
i
,
1
, x > u
(1)
i
,
i
= 0
, N
0
−
1
,
(42)
сосредоточенных в точках
u
(1)
0
, . . . , u
(1)
(
N
0
−
1)
.
Далее будут доказаны результаты о представлении стационарных
функционалов, связанных с управляемыми полумарковскими процес-
сами, в дробно-линейной форме. Идея такого представления была
сформулирована В.А. Каштановым [13, 14]. В данном исследовании
будет получено явное аналитическое выражение для основной функ-
ции рассматриваемого дробно-линейного функционала через извест-
ные характеристики управляемого полумарковского процесса.
7. Структура стационарных стоимостных функционалов.
Для
решения задачи управления полумарковским процессом необходимо
установить структуру стационарного функционала, характеризующе-
го качество управления. Поскольку полученные результаты относятся
к общей теории управления полумарковским процессом с конечным
множеством состояний, вначале кратко опишем математическую мо-
дель управления.
Пусть
ζ
(
t
)
— управляемый полумарковский процесс с конечным
множеством состояний
X
=
{
0
,
1
, . . . , N
−
1
}
,
N >
0
, есть задан-
ное целое положительное число. Процесс
ζ
(
t
)
управляется в моменты
t
n
, n
= 0
,
∞
,
t
0
= 0
, в которые происходят последовательные из-
менения состояний. Управление процессом представляет собой слу-
чайную величину
u
n
, принимающую значения из некоторого мно-
жества возможных управлений
U
. Под множеством
U
понимается
множество вещественных чисел или некоторое из его подмножеств,
на котором задана стандартная
σ
-алгебра борелевских множеств. За-
дадим на множестве
U
набор вероятностных мер (распределений)
ψ
0
(
∙
)
, ψ
1
(
∙
)
, . . . , ψ
N
−
1
(
∙
)
, которые будут определять принимаемые ре-
шения об управлении в моменты времени
t
n
при условии, что процесс
ζ
(
t
)
принимает фиксированное значение
ζ
(
t
n
+ 0) =
i
,
i
= 0
, N
−
1
.
Последовательность
{
ζ
n
=
ζ
(
t
n
+ 0)
}
∞
n
=0
образует управляемую
цепь Маркова, вложенную в полумарковский процесс
ζ
(
t
)
.
Предположим, что при стратегии управления, определяемой набо-
ром управляющих вероятностных мер
ψ
0
(
∙
)
, ψ
1
(
∙
)
, . . . , ψ
N
−
1
(
∙
)
, цепь
Маркова
{
ζ
n
}
∞
n
=0
, вложенная в полумарковский процесс
ζ
(
t
)
, имеет
ровно один класс возвратных положительных состояний. Известно,
78
ISSN 1812-3368. Вестник МГТУ им. Н.Э. Баумана. Сер. “Естественные науки”. 2013. № 3